WO2020004979A1 - 영상 부호화/복호화 방법 및 장치 - Google Patents

영상 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
WO2020004979A1
WO2020004979A1 PCT/KR2019/007821 KR2019007821W WO2020004979A1 WO 2020004979 A1 WO2020004979 A1 WO 2020004979A1 KR 2019007821 W KR2019007821 W KR 2019007821W WO 2020004979 A1 WO2020004979 A1 WO 2020004979A1
Authority
WO
WIPO (PCT)
Prior art keywords
block
partition
merge candidate
prediction
motion
Prior art date
Application number
PCT/KR2019/007821
Other languages
English (en)
French (fr)
Inventor
안용조
Original Assignee
디지털인사이트주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디지털인사이트주식회사 filed Critical 디지털인사이트주식회사
Priority to KR1020217002752A priority Critical patent/KR20210016634A/ko
Priority to CN202311703196.6A priority patent/CN117499637A/zh
Priority to CN201980043307.0A priority patent/CN112385231B/zh
Priority to CN202311708295.3A priority patent/CN117499639A/zh
Priority to CN202311703414.6A priority patent/CN117499638A/zh
Priority to US17/255,625 priority patent/US11490077B2/en
Priority to CA3141352A priority patent/CA3141352A1/en
Priority to CN202311703386.8A priority patent/CN117615128A/zh
Publication of WO2020004979A1 publication Critical patent/WO2020004979A1/ko
Priority to US17/858,929 priority patent/US20220394241A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to a method and apparatus for image encoding / decoding.
  • Video compression is largely composed of intra prediction (or intra prediction), inter prediction (or inter prediction), transform, quantization, entropy coding, and in-loop filter. Meanwhile, as the demand for high resolution video increases, the demand for stereoscopic video content also increases as a new video service. There is a discussion about a video compression technology for effectively providing high resolution and ultra high resolution stereoscopic image contents.
  • An object of the present invention is to provide an image encoding / decoding method and apparatus having improved efficiency.
  • Another object of the present invention is to provide a method and apparatus for adaptively constructing a merge candidate list of a current block.
  • An object of the present invention is to provide a method and apparatus for limiting a prediction direction of a block to which diagonal motion division is applied.
  • Another object of the present invention is to provide a weighted prediction method and apparatus for a block to which diagonal motion division is applied.
  • Another object of the present invention is to provide a method and apparatus for storing motion information of a block to which diagonal motion division is applied.
  • An image decoding method and apparatus construct a merge candidate list of a current block, derive motion information of the current block based on the merge candidate list and the merge candidate index, and based on the derived motion information. For example, inter prediction of the current block may be performed.
  • the current block may be divided into a first partition and a second partition based on a diagonal motion division.
  • At least one of the first partition and the second partition may have a triangular shape.
  • the merge candidate index may be signaled with respect to at least one of the first partition and the second partition.
  • the merge candidate index is signaled when a predetermined flag is a first value, and the flag indicates whether the current block performs motion compensation based on diagonal motion division. Can be represented.
  • the value of the flag may be derived from the decoding apparatus based on a predetermined encoding parameter.
  • the encoding parameter may include at least one of a slice type to which the current block belongs, an inter mode type of the current block, or a size of the current block.
  • the merge candidate list may include at least one of a spatial merge candidate, a temporal merge candidate, a combined merge candidate, or a merge candidate having zero motion vectors.
  • the motion information of the partition may be derived based on the motion information of the merge candidate specified by the merge candidate index.
  • the partition when the merge candidate has motion information of bidirectional prediction, the partition may be limited to have only motion information of unidirectional prediction.
  • the pixels of the current block may have predetermined weights m and n on pixels belonging to the reference block of the first partition and pixels belonging to the reference block of the second partition. Can be predicted by application.
  • m and n are any one of 0, 1, 2, 4, 6, 7, 8, 16, 28, 31, or 32, and the sum of m and n May be any one of 2, 8, or 32.
  • the weight may be determined based on a position of a pixel in the current block.
  • the coding / decoding efficiency can be improved through block division of various forms.
  • the present invention can improve the encoding / decoding efficiency of motion information by using an adaptive merge candidate list.
  • the present invention can efficiently reduce the memory bandwidth by limiting the prediction direction of a block to which diagonal motion division is applied.
  • the present invention can reduce artifacts near the partition boundary through weighted prediction of blocks to which diagonal motion partition is applied.
  • the accessibility of the motion information and the reliability as reference information can be improved through the motion information storage method according to the present invention.
  • a computer-readable recording medium for storing a bitstream generated by the video encoding method / apparatus according to the present invention can be provided.
  • FIG. 1 is a block diagram illustrating a video encoding apparatus according to the present invention.
  • FIG. 2 is a block diagram illustrating an image decoding apparatus according to the present invention.
  • 3 is an embodiment of a block partitioning method of any form using one line segment.
  • FIG. 4 is a diagram illustrating examples of various arbitrary block divisions that can be generated using square and rectangular block divisions and left and right diagonal segments.
  • FIG. 5 shows a method of dividing a square or non-square block into a triangular form using two types of diagonal lines proposed by the present invention.
  • FIG. 6 is a diagram illustrating a concept of a mask for segmentation in a circle or ellipse form among masks for mask-based motion prediction and compensation proposed in the present invention.
  • FIG. 7 is a diagram illustrating a form in which encoding information of a corresponding block is stored when diagonal motion division is used.
  • FIG. 8 illustrates a merge mode based inter prediction method according to an embodiment to which the present invention is applied.
  • FIG. 11 is a diagram illustrating a concept of limited mask-based motion prediction and compensation as an embodiment to which the present invention is applied.
  • FIGS. 12 and 13 are diagrams illustrating the concept of a method of performing prediction by dividing one coding block into two partitions using one straight line according to an embodiment to which the present invention is applied.
  • 14 to 17 illustrate a weighted prediction method for a diagonal motion-divided current block according to an embodiment to which the present invention is applied.
  • An image decoding method and apparatus construct a merge candidate list of a current block, derive motion information of the current block based on the merge candidate list and the merge candidate index, and based on the derived motion information. For example, inter prediction of the current block may be performed.
  • the current block may be divided into a first partition and a second partition based on a diagonal motion division.
  • At least one of the first partition and the second partition may have a triangular shape.
  • the merge candidate index may be signaled with respect to at least one of the first partition and the second partition.
  • the merge candidate index is signaled when a predetermined flag is a first value, and the flag indicates whether the current block performs motion compensation based on diagonal motion division. Can be represented.
  • the value of the flag may be derived from the decoding apparatus based on a predetermined encoding parameter.
  • the encoding parameter may include at least one of a slice type to which the current block belongs, an inter mode type of the current block, or a size of the current block.
  • the merge candidate list may include at least one of a spatial merge candidate, a temporal merge candidate, a combined merge candidate, or a merge candidate having zero motion vectors.
  • the motion information of the partition may be derived based on the motion information of the merge candidate specified by the merge candidate index.
  • the partition when the merge candidate has motion information of bidirectional prediction, the partition may be limited to have only motion information of unidirectional prediction.
  • the pixels of the current block may have predetermined weights m and n on pixels belonging to the reference block of the first partition and pixels belonging to the reference block of the second partition. Can be predicted by application.
  • m and n are any one of 0, 1, 2, 4, 6, 7, 8, 16, 28, 31, or 32, and the sum of m and n May be any one of 2, 8, or 32.
  • the weight may be determined based on a position of a pixel in the current block.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • some of the configuration of the apparatus or some of the steps of the method may be omitted.
  • the order of some of the components of the apparatus or some of the steps of the method may be changed.
  • other configurations or other steps may be inserted into part of the device or part of the steps of the method.
  • each component shown in the embodiments of the present invention are shown independently to represent different characteristic functions, and do not mean that each component is composed of separate hardware or one software unit. That is, each component is described by listing each component for convenience of description, and at least two of the components may be combined to form one component, or one component may be divided into a plurality of components to perform a function. The integrated and separated embodiments of each of these components are also included within the scope of the present invention without departing from the spirit of the invention.
  • the video decoding apparatus (Video Decoding Apparatus) to be described below is a civil security camera, civil security system, military security camera, military security system, personal computer (PC, Personal Computer), notebook computer, portable multimedia player (PMP, Portable MultimediaPlayer), It may be a device included in a server terminal such as a wireless communication terminal, a smart phone, a TV application server and a service server, and a communication modem for communicating with a user terminal such as various devices or a wired or wireless communication network. It may mean a variety of devices including a communication device such as an image, a memory for storing various programs and data for inter- or intra-prediction for decoding or decoding an image, a microprocessor for executing and operating a program, and the like. Can be.
  • the image encoded in the bitstream by the encoder is real-time or non-real-time through the wired or wireless communication network, such as the Internet, local area wireless communication network, wireless LAN network, WiBro network, mobile communication network or the like, cable, universal serial bus (USB, It can be transmitted to a video decoding apparatus through various communication interfaces such as a universal serial bus), decoded, reconstructed, and played back.
  • the bitstream generated by the encoder may be stored in the memory.
  • the memory may include both a volatile memory and a nonvolatile memory.
  • a memory may be represented as a recording medium storing a bitstream.
  • a video may be composed of a series of pictures, and each picture may be divided into a coding unit such as a block.
  • a coding unit such as a block.
  • FIG. 1 is a block diagram illustrating a video encoding apparatus according to the present invention.
  • the image encoding apparatus 100 may include a picture splitter 110, a predictor 120 and 125, a transformer 130, a quantizer 135, a realigner 160, and an entropy encoder. 165, an inverse quantizer 140, an inverse transformer 145, a filter 150, and a memory 155.
  • the picture dividing unit 110 may divide the input picture into at least one processing unit.
  • the processing unit may be a prediction unit (PU), a transform unit (TU), or a coding unit (CU).
  • a coding unit may be used as a unit for encoding or may be used as a unit for decoding.
  • the prediction unit may be split in the form of at least one square or rectangle having the same size in one coding unit, or the prediction unit of any one of the prediction units split in one coding unit is different from one another. It may be divided to have a different shape and / or size than the unit.
  • the intra prediction may be performed without splitting into a plurality of prediction units NxN.
  • the predictors 120 and 125 may include an inter predictor 120 that performs inter prediction or inter prediction, and an intra predictor 125 that performs intra prediction or intra prediction. Whether to use inter prediction or intra prediction on the prediction unit may be determined, and specific information (eg, an intra prediction mode, a motion vector, a reference picture, etc.) according to each prediction method may be determined.
  • the residual value (residual block) between the generated prediction block and the original block may be input to the transformer 130.
  • prediction mode information and motion vector information used for prediction may be encoded by the entropy encoder 165 together with the residual value and transmitted to the decoder.
  • a method of using a merge prediction region (MER) in consideration of parallel processing in merging motion information of adjacent blocks in a spatial or temporal manner is used. It can be applied to the predictors 120 and 125. That is, the present invention provides a parallel prediction region (PER: Parallel) for constructing spatially or temporally adjacent blocks of a current block in consideration of parallel processing in prediction techniques such as inter-screen prediction, intra-picture prediction, and inter-component prediction among video coding techniques.
  • PER Parallel
  • Estimation Region can be used.
  • the inter prediction unit 120 may predict the prediction unit based on the information of at least one of the previous picture or the next picture of the current picture. In some cases, the inter prediction unit 120 may predict the prediction unit based on the information of the partial region in which the encoding is completed in the current picture. You can also predict units.
  • the inter predictor 120 may include a reference picture interpolator, a motion predictor, and a motion compensator.
  • the reference picture interpolator may receive reference picture information from the memory 155 and generate pixel information of an integer pixel or less in the reference picture.
  • a DCT based 8-tap interpolation filter having different filter coefficients may be used to generate pixel information of integer pixels or less in units of 1/4 pixels.
  • a DCT-based interpolation filter having different filter coefficients may be used to generate pixel information of an integer pixel or less in units of 1/8 pixels.
  • the motion predictor may perform motion prediction based on the reference picture interpolated by the reference picture interpolator.
  • various methods such as a full search-based block matching algorithm (FBMA), a three step search (TSS), and a new three-step search algorithm (NTS) may be used.
  • the motion vector may have a motion vector value in units of 1/2 or 1/4 pixels based on the interpolated pixels.
  • the motion prediction unit may predict the current prediction unit by using a different motion prediction method.
  • various methods such as a skip method, a merge method, an advanced motion vector prediction (AMVP) method, an intra block copy method, and the like may be used.
  • AMVP advanced motion vector prediction
  • the intra predictor 125 may generate a prediction unit based on reference pixel information around the current block, which is pixel information in the current picture. If the neighboring block of the current prediction unit is a block that has performed inter prediction, and the reference pixel is a pixel that has performed inter prediction, the reference pixel of the block that has performed intra prediction around the reference pixel included in the block where the inter prediction has been performed Can be used as a substitute for information. That is, when the reference pixel is not available, the unavailable reference pixel information may be replaced with at least one reference pixel among the available reference pixels.
  • a residual block may include a prediction unit performing prediction based on the prediction units generated by the prediction units 120 and 125 and residual information including residual information that is a difference from an original block of the prediction unit.
  • the generated residual block may be input to the transformer 130.
  • the transform unit 130 converts the residual block including residual information of the original block and the prediction unit generated by the prediction units 120 and 125 into a discrete cosine transform (DCT), a discrete sine transform (DST), and a KLT. You can convert using the same conversion method. Whether to apply DCT, DST, or KLT to transform the residual block may be determined based on intra prediction mode information of the prediction unit used to generate the residual block.
  • DCT discrete cosine transform
  • DST discrete sine transform
  • KLT KLT
  • the quantization unit 135 may quantize the values converted by the transformer 130 into the frequency domain.
  • the quantization coefficient may change depending on the block or the importance of the image.
  • the value calculated by the quantization unit 135 may be provided to the inverse quantization unit 140 and the reordering unit 160.
  • the reordering unit 160 may reorder coefficient values with respect to the quantized residual value.
  • the reordering unit 160 may change the two-dimensional block shape coefficients into a one-dimensional vector form through a coefficient scanning method. For example, the reordering unit 160 may scan from DC coefficients to coefficients in the high frequency region by using a Zig-Zag scan method and change them into one-dimensional vectors.
  • a vertical scan that scans two-dimensional block shape coefficients in a column direction instead of a zig-zag scan may be used, and a horizontal scan that scans two-dimensional block shape coefficients in a row direction. That is, according to the size of the transform unit and the intra prediction mode, it is possible to determine which scan method among the zig-zag scan, the vertical scan, and the horizontal scan is used.
  • the entropy encoder 165 may perform entropy encoding based on the values calculated by the reordering unit 160.
  • Entropy coding may use various coding methods such as, for example, Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC).
  • CABAC Context-Adaptive Binary Arithmetic Coding
  • the entropy encoder 165 may encode residual value coefficient information of a coding unit from the reordering unit 160 and the predictors 120 and 125.
  • the inverse quantizer 140 and the inverse transformer 145 inverse quantize the quantized values in the quantizer 135 and inversely transform the transformed values in the transformer 130.
  • the residual value generated by the inverse quantizer 140 and the inverse transformer 145 is reconstructed by combining the prediction units predicted by the motion estimator, the motion compensator, and the intra predictor included in the predictors 120 and 125. You can create a Reconstructed Block.
  • the filter unit 150 may include at least one of a deblocking filter, an offset correction unit, and an adaptive loop filter (ALF).
  • the deblocking filter may remove block distortion caused by boundaries between blocks in the reconstructed picture.
  • the offset correction unit may correct the offset with respect to the original image on a pixel-by-pixel basis for the deblocking image.
  • the pixels included in the image are divided into a predetermined number of areas, and then, an area to be offset is determined, an offset is applied to the corresponding area, or offset considering the edge information of each pixel. You can use this method.
  • Adaptive Loop Filtering ALF
  • ALF Adaptive Loop Filtering
  • the memory 155 may store the reconstructed block or picture calculated by the filter unit 150, and the stored reconstructed block or picture may be provided to the predictors 120 and 125 when performing inter prediction.
  • FIG. 2 is a block diagram illustrating an image decoding apparatus according to the present invention.
  • the image decoder 200 includes an entropy decoder 210, a reordering unit 215, an inverse quantizer 220, an inverse transformer 225, a predictor 230, 235, and a filter unit ( 240, a memory 245 may be included.
  • the input bitstream may be decoded by a procedure opposite to that of the image encoder.
  • the entropy decoder 210 may perform entropy decoding in a procedure opposite to that of the entropy encoding performed by the entropy encoder of the image encoder. For example, various methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be applied to the method performed by the image encoder.
  • various methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be applied to the method performed by the image encoder.
  • the entropy decoder 210 may decode information related to intra prediction and inter prediction performed by the encoder.
  • the reordering unit 215 may reorder the entropy decoded bitstream by the entropy decoding unit 210 based on a method of rearranging the bitstream. Coefficients expressed in the form of a one-dimensional vector may be reconstructed by reconstructing the coefficients in a two-dimensional block form.
  • the inverse quantization unit 220 may perform inverse quantization based on the quantization parameter provided by the encoder and the coefficient values of the rearranged block.
  • the inverse transform unit 225 may perform an inverse transform, i.e., an inverse DCT, an inverse DST, and an inverse KLT, for a quantization result performed by the image encoder, that is, a DCT, DST, and KLT. Inverse transformation may be performed based on a transmission unit determined by the image encoder.
  • the inverse transform unit 225 of the image decoder may selectively perform a transform scheme (eg, DCT, DST, KLT) according to a plurality of pieces of information such as a prediction method, a size of a current block, and a prediction direction.
  • a transform scheme eg, DCT, DST, KLT
  • the prediction units 230 and 235 may generate the prediction block based on the prediction block generation related information provided by the entropy decoder 210 and previously decoded blocks or picture information provided by the memory 245.
  • the intra prediction when performing the intra prediction or the intra prediction in the same way as the operation of the image encoder, when the size of the prediction unit and the size of the transform unit are the same, the pixel existing on the left side and the pixel present on the upper left side
  • intra prediction is performed on a prediction unit based on the pixel present at the top, but the size of the prediction unit and the size of the transformation unit are different when performing the intra prediction, the intra prediction is performed using a reference pixel based on the transformation unit. You can make predictions.
  • intra prediction using NxN division may be used only for a minimum coding unit.
  • the predictors 230 and 235 may include a prediction unit determiner, an inter predictor, and an intra predictor.
  • the prediction unit determiner receives various information such as prediction unit information input from the entropy decoder 210, prediction mode information of the intra prediction method, and motion prediction related information of the inter prediction method, and distinguishes the prediction unit from the current coding unit, and predicts It may be determined whether the unit performs inter prediction or intra prediction.
  • a merge prediction region (MER) is used in consideration of parallel processing.
  • the method may be applied to the predictors 230 and 235. That is, the present invention provides a parallel prediction region (PER: Parallel) for constructing spatially or temporally adjacent blocks of a current block in consideration of parallel processing in prediction techniques such as inter-screen prediction, intra-picture prediction, and inter-component prediction among video coding techniques.
  • PER Parallel
  • the inter prediction unit 230 predicts the current prediction based on information included in at least one of a previous picture or a subsequent picture of the current picture including the current prediction unit by using information required for inter prediction of the current prediction unit provided by the image encoder. Inter prediction may be performed on a unit.
  • a motion prediction method of a prediction unit included in a coding unit based on a coding unit includes a skip mode, a merge mode, an AMVP mode, and an intra block copy mode. It can be determined whether or not it is a method.
  • the intra predictor 235 may generate a prediction block based on pixel information in the current picture.
  • intra prediction may be performed based on intra prediction mode information of the prediction unit provided by the image encoder.
  • the intra predictor 235 may include an adaptive intra smoothing (AIS) filter, a reference pixel interpolator, and a DC filter.
  • the AIS filter is a part of filtering the reference pixel of the current block and determines whether to apply the filter according to the prediction mode of the current prediction unit.
  • AIS filtering may be performed on the reference pixel of the current block by using the prediction mode and the AIS filter information of the prediction unit provided by the image encoder. If the prediction mode of the current block is a mode that does not perform AIS filtering, the AIS filter may not be applied.
  • the reference pixel interpolator may generate a reference pixel having an integer value or less by interpolating the reference pixel. If the prediction mode of the current prediction unit is a prediction mode for generating a prediction block without interpolating the reference pixel, the reference pixel may not be interpolated.
  • the DC filter may generate the prediction block through filtering when the prediction mode of the current block is the DC mode.
  • the reconstructed block or picture may be provided to the filter unit 240.
  • the filter unit 240 may include a deblocking filter, an offset correction unit, and an ALF.
  • Information about whether a deblocking filter is applied to a corresponding block or picture, and when the deblocking filter is applied to the corresponding block or picture, may be provided with information about whether a strong filter or a weak filter is applied.
  • the deblocking filter related information provided by the image encoder may be provided and the deblocking filtering of the corresponding block may be performed in the image decoder.
  • the offset correction unit may perform offset correction on the reconstructed image based on the type of offset correction and offset value information applied to the image during encoding.
  • the ALF may be applied to a coding unit based on ALF application information, ALF coefficient information, and the like provided from the encoder. Such ALF information may be provided included in a specific parameter set.
  • the memory 245 may store the reconstructed picture or block to use as a reference picture or reference block, and may provide the reconstructed picture to the output unit.
  • 3 is an embodiment of a block partitioning method of any form using one line segment.
  • FIG. 3 illustrates an embodiment of dividing a block into two different arbitrary block types using one line segment.
  • one block 300 may be configured as a square or non-square block.
  • the square or non-square block may be recursively divided into various tree shapes, quad-tree block partition, binary-tree block partition, and ternary-tree. -tree) can be partitioned using block partitioning.
  • One block shown in FIG. 3 may be divided into two different arbitrary block types using line segments having a specific angle and distance with respect to the origin of the block.
  • an angle and a distance which are parameters for representing a line segment, based on the origin of the block, may be signaled in units of blocks.
  • FIG. 4 is a diagram illustrating examples of various arbitrary block divisions that can be generated using square and rectangular block divisions and left and right diagonal segments.
  • FIG. 4 illustrates an example in which a block may be divided into various arbitrary forms using only left or right diagonal line segments in a block division structure using various tree types.
  • 400 blocks are divided into four blocks of 410, 420, 430, and 440 using the first quad-tree block partition.
  • 410 blocks which are the first blocks among the blocks divided by the quad-tree block division, do not use additional subtree block division, and are divided into two triangular blocks using diagonal line segments proposed by the present invention.
  • the block 410 indicates that the block is divided using a diagonal line connecting the upper right side and the lower left side of the block.
  • 420 blocks which are the second blocks among the blocks divided by the quad-tree block division, are divided into 421, 422, 423, and 424 blocks using quad-tree block division as an additional lower tree block division.
  • the 421 block which is the first lower block of the 420 block, shows an example of dividing into two triangular blocks using a diagonal line segment proposed in the present invention without using additional subtree block partitioning.
  • block 421 indicates that a block is divided using a diagonal line connecting an upper left end and a lower right end of the block.
  • the fourth block 424 of the lower blocks of the second block 420 is again divided into two non-square blocks 425 and 426 using binary-tree block partitioning.
  • block 425 represents an embodiment divided into two triangular blocks using a diagonal line segment proposed by the present invention, and shows that the block is divided by using a diagonal line connecting the upper left and lower right ends.
  • the 430 block which is the third block among the blocks divided by the quad-tree block partition, is divided into 431 and 432 blocks using binary-tree block partitioning as an additional lower tree block partition.
  • the 432 block which is the second lower block of the 430 block, represents an embodiment divided into two triangular blocks using a diagonal line segment proposed by the present invention, without using an additional lower tree block partition.
  • the block is divided using a diagonal line connecting the lower left corner with the lower left corner.
  • the 440 block which is the fourth block among the blocks divided by the quad-tree block division, is divided into 441 and 441 blocks using binary-tree block division as an additional lower tree block division.
  • 441 blocks which are the first sub-blocks of 440 blocks, are divided into 443 and 444 blocks using binary-tree block partitioning, and 443 blocks are divided into ternary-tree block partitioning. It is divided into 445, 446, and 447 blocks.
  • 447 blocks among the blocks partitioned using the ternary-tree block partition are shown by dividing the block into two triangular blocks using a diagonal line connecting the upper left and lower right ends.
  • the quad-tree block proposed in the present invention.
  • various block partitioning structures such as a partitioning structure, a binary-tree block partitioning structure, and a ternary-tree block partitioning structure, any block partitioning form using various angles and distances shown in FIG. It is possible to express the block division form of.
  • FIG. 5 shows a method of dividing a square or non-square block into a triangular form using two types of diagonal lines proposed by the present invention.
  • FIG. 5A illustrates an example of dividing a square or non-square block into two triangle blocks by using a diagonal line connecting the upper left and lower right ends of the block.
  • FIG. 5B illustrates an example of dividing a square or non-square block into two triangle blocks by using a diagonal line connecting a right upper end and a lower left end of the block.
  • Two triangular blocks divided in (a) and (b) of FIG. 5 may be referred to as a first partition and a second partition according to a position.
  • a diagonal line connecting an upper left end and a lower right end of a block may be expressed by Equation 1 using the upper left position of the block as an origin.
  • Equation 1 w means the width of the block, h means the height of the block.
  • a diagonal line connecting the upper right end and the lower left end of the block may be expressed by Equation 2 using the upper left position of the block as an origin.
  • Equation 2 w means the width of the block, h means the height of the block.
  • a flag indicating whether diagonal motion division is performed for one coding unit (CU) may be used. For example, when the flag is the first value, diagonal motion division may be performed. Otherwise, diagonal motion division may not be performed.
  • the flag may be encoded and signaled by the encoding apparatus or may be derived from the decoding apparatus based on a predetermined encoding parameter.
  • the encoding parameter may include a slice type, an inter mode type, a block size / type, a ratio of a width and a height of a block, and the like.
  • the flag may be set to the first value only when the slice type to which the current block belongs is a B slice.
  • the flag may be set to the first value only when the inter mode of the current block is the merge mode.
  • the flag may be set to the first value only when at least one of the width or height of the current block is greater than or equal to a predetermined threshold size.
  • the threshold size may be 4, 8, 16 or more.
  • the flag may be set to the first value only when the number W * H of the samples belonging to the current block is greater than or equal to a predetermined threshold number.
  • the threshold number may be 32, 64 or more.
  • the flag may be set to the first value only when the ratio of the width and height of the current block is smaller than a predetermined threshold.
  • the threshold value may be 4, 8 or more.
  • direction information of the diagonal motion division may be signaled.
  • the current block may be divided based on a diagonal line connecting the upper left and right lower ends, otherwise, the current block may be divided based on the diagonal line connecting the upper right and lower left ends.
  • the information for the diagonal motion division may not be signaled according to the mode information of the current block.
  • the mode information of the current block is an intra prediction mode, it is not signaled.
  • the information for the diagonal motion division may not be signaled according to the size information of the current block.
  • the size information of the current block may be defined as a width or height size, a ratio of width and height, a product of width and height, and the like. For example, if the width or height of the current block is less than 8, the current block may not use diagonal motion division.
  • the diagonal motion division may not be used.
  • This particular ratio means that if the ratio of width to height is greater than 1: 3 or 3: 1 (eg, 1: 4 or 4: 1, 1: 8 or 8: 1), then the current block does May not be used. In such a case, the diagonal motion partitioning information is not signaled and the syntax is not parsed.
  • FIG. 6 is a diagram illustrating a concept of a mask for segmentation in a circle or ellipse form among masks for mask-based motion prediction and compensation proposed in the present invention.
  • one block may be divided into two different regions using a mask including a part of a circle or an ellipse. It is shown.
  • the boundary may be smoothed by adjusting the weight at the boundary of the division, and the weighted prediction method described below may be applied in the same or similar manner.
  • a corresponding block in a reference picture is selected using motion information of a spatial or temporally adjacent block of the current block, and a shape of a mask is determined based on the pixel configuration of the corresponding block. You can decide.
  • using the pixel configuration of the corresponding block may mean configuring a mask to detect an edge inside the block and divide the block based on the edge.
  • FIG. 7 is a diagram illustrating a form in which encoding information of a corresponding block is stored when diagonal motion division is used.
  • encoding information may be stored by dividing the block into at least one of a horizontal direction and a vertical direction, rather than a diagonally divided form. .
  • the information in the encoding information of the corresponding block, the information may be stored in a diagonally divided form.
  • many video coding methods and apparatuses do not store encoding information in units of pixels, but store encoding information such as motion information in units of blocks having a specific size, such as 4x4 blocks or 8x8 blocks.
  • the encoded information stored as described above may be used as reference information of a block that is encoded / decoded after the current block.
  • the first partition may be referenced based on the upper right position of the current block, and the second partition may be referenced based on the lower left position of the current block.
  • the first partition may be referred to based on the upper left position of the current block, and the second partition may be referred to based on the lower right position of the current block.
  • an additional motion vector storing process may be included in storing the motion vectors of the first partition and the second partition in the motion vector buffer.
  • the process of extracting motion from the motion vector buffer may include a process of inferring a prediction direction.
  • each partition may have only a motion vector in the L0 or L1 direction.
  • the additional motion vector storing process may mean a process of constructing a motion vector for bidirectional prediction using the motion vector of each partition.
  • the motion vector for bidirectional prediction includes a motion vector in the L0 direction and a motion vector in the L1 direction.
  • a process of inferring the prediction direction of each partition from the signaling information for the motion vector prediction may be included.
  • the first partition may be forced to the motion vector in the L0 direction and the second partition may be forced to the motion vector in the L1 direction and stored in the motion vector buffer.
  • the first partition may be forced to the motion vector in the L1 direction and the second partition may be forced to the motion vector in the L0 direction and stored in the motion vector buffer.
  • Forcing to the motion vector in the L0 direction means changing the motion vector in the L1 direction to the motion vector in the L0 direction when the motion vector of the corresponding partition is in the L0 direction.
  • the change may include at least one of inverting a (x, y) coordinate value of a motion vector with respect to an origin or scaling using a predetermined coding parameter (eg, a reference picture index or POC information of a reference picture). It may include.
  • a predetermined coding parameter eg, a reference picture index or POC information of a reference picture.
  • the signaling information on the motion vector prediction may mean information on which motion vector prediction value mvp is used by the first partition and the second partition in which motion vector prediction list.
  • the signaling information for the motion vector prediction may include information transmitted in an index form, and may mean information on which prediction candidates are used by the first partition and the second partition in the motion vector prediction candidates.
  • the method may further include determining a partition type of the current block and a motion vector prediction candidate corresponding to both the first partition and the second partition using one index information.
  • a method of using the motion vector prediction candidate as it is by using the signaled index information may be used, and further signaling a motion vector difference between the signaled index information and the corresponding motion vector prediction candidate. The method can also be used.
  • a method of using the motion vector prediction candidate as it is may be referred to as a SKIP mode or a merge mode, and a method of additionally signaling a motion vector difference with the motion vector prediction candidate is a motion vector prediction mode (AMVP mode). May be referred to collectively.
  • AMVP mode motion vector prediction mode
  • the motion vector difference may be transmitted to the first partition and the second partition, respectively, or may be transmitted by configuring the first partition and the second partition as one bidirectional differential motion vector.
  • one block may be divided into two blocks.
  • the motion vector buffer corresponding to the current block may be divided into two parts in consideration of the size information of the current block, and the motion vectors of the first partition and the second partition may be stored in the divided partition. For example, by dividing the width and height of the motion vector buffer corresponding to the current block, the motion vector of the first partition may be stored in some buffers, and the motion vector of the second partition may be stored in some of the buffers.
  • the current block when the current block is a 16x8 block, the current block may be divided into two 8x8 blocks, and the motion vector of the first partition and the motion vector of the second partition may be stored in corresponding motion vector buffers, respectively. .
  • the sizes of N and M may be compared with respect to the NxM block. If N is large, N may be divided into two and the motion vector may be stored in a motion vector buffer corresponding to each partition. On the other hand, when M is large, M may be divided into two parts, and a motion vector may be stored in a motion vector buffer corresponding to each partition.
  • the current block may consist of a plurality of n * m subblocks.
  • the subblock may mean a unit for storing the motion vector.
  • n and m may be 4 or 8.
  • n and m may be fixed values pre-committed to the encoding / decoding apparatus, or may be determined depending on the size / type of the current block.
  • the sub-blocks may be square or non-square.
  • the current block includes a sub block belonging to only the first partition PART_0 (hereinafter referred to as a first region), a sub block belonging to only the second partition PART_1 (hereinafter referred to as a second region), and a sub located on a diagonal line. It may include a block (hereinafter referred to as a third region).
  • the motion vector of the first partition may be stored in the first region
  • the motion vector of the second partition may be stored in the second region.
  • each partition may have only a motion vector of unidirectional prediction.
  • motion vectors mvL0 and mvL1 of bidirectional prediction may be stored in the third region.
  • the motion vector of the bidirectional prediction may be generated by a combination of the motion vector mv1 of the first partition and the motion vector mv2 of the second partition.
  • a motion vector in the L0 direction among mv1 and mv2 may be assigned to mvL0
  • a motion vector in the L1 direction among mv1 and mv2 may be assigned to mvL1.
  • Example 1 when the prediction directions of the first partition and the second partition are the same, either of the motion vector mv1 of the first partition or the motion vector mv2 of the second partition is included in the third region. May optionally be stored.
  • either the motion vector mv1 of the first partition or the motion vector mv2 of the second partition may be selectively stored according to the partition type of the current block. That is, when the current block is divided diagonally, the motion vector mv1 of the first partition is stored in the third region, otherwise, the motion vector mv2 of the second partition is stored in the third region. Can be. Conversely, when the current block is divided diagonally to the left, the motion vector mv2 of the second partition is stored in the third region, otherwise, the motion vector mv1 of the first partition is stored in the third region. Can be.
  • only the motion vector mv1 of the first partition may be stored in the third area, or only the motion vector mv1 of the second partition may be stored.
  • the motion vector to be stored in the third region may be determined in consideration of at least one of encoding information of the first partition and / or the second partition or the partition type of the current block.
  • the encoding information may be a reference picture index, a merge candidate index, a size value of a vector, and the like.
  • the motion vector of the partition corresponding to the minimum value among the reference picture index refIdx1 of the first partition and the reference picture index refIdx2 of the second partition may be selectively stored.
  • a motion vector of a partition corresponding to the maximum value of two reference picture indices may be selectively stored.
  • a process of storing a motion vector of either the first partition or the second partition according to the diagonal division direction This can be done.
  • a process of selectively storing the encoded information using encoding information may be performed, such as case comparison between merge candidate indexes. have.
  • a process of converting the prediction direction may be further performed.
  • both the first partition and the second partition are L0 predictions
  • one of two L0 motion vectors may be allocated to mvL0 and the other may be allocated to mvL1.
  • both the first partition and the second partition are L1 prediction
  • one of two L1 motion vectors may be allocated to mvL1 and the other may be allocated to mvL0.
  • a motion vector for bidirectional prediction may be generated through the transformation of the prediction direction, and stored in the third region.
  • the motion compensation method of the aforementioned diagonal motion division will be described.
  • the following embodiment will be described on the premise that the current block is encoded in the merge mode, but this does not limit the type of the inter mode, and the same may be applied to the SKIP mode, the AMVP mode, the affine mode, and the like. .
  • FIG. 8 illustrates a merge mode based inter prediction method according to an embodiment to which the present invention is applied.
  • a merge candidate list of the current block may be configured (S800).
  • the current block may be determined through at least one of the block division methods described with reference to FIGS. 3 to 6.
  • the current block may have a square or non-square shape.
  • the current block can be divided into two partitions through diagonal partitioning. At least one of the two partitions may be a triangular partition.
  • the merge candidate list may include at least one of a spatial merge candidate or a temporal merge candidate of the current block.
  • the motion information of the spatial merge candidate may be derived from the motion information of the spatial neighboring block of the current block.
  • the spatial neighboring block is a block belonging to the same picture as the current block and may mean a block adjacent to the current block.
  • the spatial neighboring block may include a block adjacent to at least one of a left side, an upper end, an upper right end, a lower left end, or an upper left end of the current block.
  • the upper left neighboring block may be used only when at least one of the blocks adjacent to the left, the upper, the upper right and the lower left is not available.
  • the motion information of the temporal merge candidate may be derived from the motion information of the temporal neighboring block of the current block.
  • the temporal neighboring block is a block belonging to a picture different from the current block and may be defined as a block having the same position as the current block.
  • the block of the same position is at least one of a block BR adjacent to the lower right corner of the current block, a block CTR including the position of the center sample of the current block, or a block TL including the position of the upper left sample of the current block. It can mean one.
  • the block of the same position may mean a block including a position shifted by a predetermined disparity vector from the position of the upper left sample of the current block.
  • the disparity vector may be determined based on any one of the motion vectors of the spatial neighboring block described above.
  • the disparity vector may be set to the motion vector of the left neighboring block or may be set to the motion vector of the upper neighboring block.
  • the disparity vector may be determined based on a combination of at least two of the motion vectors of the spatial neighboring block described above. The combination may include a calculation process such as a maximum value, a minimum value, a median value, a weighted average value, and the like.
  • the disparity vector may be set to an intermediate value or an average value between the motion vector of the left neighboring block and the motion vector of the lower left neighboring block.
  • the motion vector and the reference picture index of the temporal merge candidate may be respectively derived from the motion vector and the reference picture index of the temporal neighboring block described above.
  • the motion vector of the temporal merge candidate is derived from the motion vector of the temporal neighboring block, and the reference picture index of the temporal merge candidate is set to a default value (eg, 0) pre-committed to the decoding apparatus regardless of the temporal neighboring block. Can be.
  • a method of generating a merge candidate list based on a spatial / temporal merge candidate will be described in detail with reference to FIGS. 9 and 10.
  • the merge candidate list may further include at least one of a combined merge candidate or a merge candidate having zero motion vectors.
  • the combination merge candidate may be derived by combining n merge candidates belonging to the pre-generated merge candidate list.
  • n may be an integer of 2, 3, 4 or more.
  • the number n of merge candidates to be combined may be a fixed value pre-committed to the encoding / decoding apparatus, or may be encoded and signaled by the encoding apparatus. The signaling may be performed in at least one unit of a sequence, a picture, a slice, a tile, a sub-tile (brick), or a predetermined block.
  • the number n of merge candidates to be combined may be variably determined based on the number of remaining merge candidates.
  • the number of residual merge candidates may mean a difference between the maximum number of merge candidates included in the merge candidate list and the current number of merge candidates included in the merge candidate list.
  • the maximum number may be a number pre-committed to the encoding / decoding apparatus, or may be encoded and signaled by the encoding apparatus.
  • the current number may mean the number of merge candidates configured before adding the combined merge candidate. For example, when the number of remaining merge candidates is 1, two merge candidates are used, and when the number of remaining merge candidates is larger than 1, three or more merge candidates may be used.
  • the n merge candidates may be determined in consideration of the prediction direction of each merge candidate in the merge candidate list. For example, among merge candidates included in the merge candidate list, only merge candidates that are bidirectional prediction may be selectively used, or only merge candidates that are unidirectional prediction may be selectively used.
  • the combined merge candidate may be derived using both the spatial merge candidate and the temporal merge candidate, or may be derived using only either the spatial merge candidate or the temporal merge candidate.
  • the combined merge candidate may be added after the spatial / temporal merge candidate in the merge candidate list. That is, the index of the combined merge candidate may be larger than the index of the spatial / temporal merge candidate.
  • the combined merge candidate may be added between the spatial merge candidate and the temporal merge candidate in the merge candidate list. That is, the index of the combined merge candidate may be larger than the index of the spatial merge candidate and smaller than the index of the temporal merge candidate.
  • the position of the combined merge candidate may be variably determined in consideration of the prediction direction of the combined merge candidate. Depending on whether the prediction direction of the combined merge candidate is bidirectional prediction, the positions of the combined merge candidates in the merge candidate list may be rearranged. For example, if the combined merge candidate is bidirectional prediction, an index smaller than the spatial or temporal merge candidate may be assigned, otherwise an index larger than the spatial or temporal merge candidate may be assigned.
  • the motion information of the combined merge candidate may be derived by weighted average of the motion information of the first merge candidate and the second merge candidate.
  • the reference picture index in the LX direction of the combined merge candidate may be derived as the reference picture index in the LX direction of either the first merge candidate or the second merge candidate.
  • the reference picture index in the LX direction of the combined merge candidate may be derived using only the reference picture index in the LX direction of the first merge candidate.
  • the first merge candidate may have a smaller index than the second merge candidate.
  • the weighted weighted average is [1: 1], [1: 2], [1: 3], or [2: 3], but is not limited thereto.
  • the weight may be pre-defined in the encoding / decoding apparatus or may be derived in the decoding apparatus. In this case, the weight may be derived in consideration of at least one of the distance between the current picture and the reference picture of the merge candidate or the prediction direction of the merge candidate.
  • the motion information in the L0 direction of the combined merge candidate may be derived from the motion information in the L0 direction of the first merge candidate, and the motion information in the L1 direction may be derived from the motion information in the L1 direction of the second merge candidate.
  • the motion information in the L0 direction of the combined merge candidate may be derived from the motion information in the L0 direction of the second merge candidate, and the motion information in the L1 direction may be derived from the motion information in the L1 direction of the first merge candidate.
  • the above-described motion information includes at least one of a prediction direction flag, a reference picture index, or a motion vector, and may be similarly interpreted in the following embodiments.
  • motion information of the current block may be derived from the merge candidate list (S810).
  • a merge index of the current block may be signaled.
  • the merge index may be information encoded to specify any one of a plurality of merge candidates included in the merge candidate list.
  • the merge index may be signaled based on a flag indicating whether motion compensation based on diagonal motion division is performed. For example, if the flag indicates that motion compensation based on diagonal motion partitioning is to be performed (ie, the flag is a first value), the merge index is signaled, otherwise the merge index will not be signaled. Can be.
  • the flag is as described with reference to FIG. 5, and a detailed description thereof will be omitted.
  • the merge index may be signaled for each of the first partition and the second partition of the current block (Example 1).
  • the motion information of the first partition may be derived using motion information of the merge candidate having the same index as the merge index mergeIdx1 of the signaled first partition.
  • mergeIdx2 mergeIdx2
  • one merge index mergeIdx may be signaled for the current block (Embodiment 2). That is, the first partition and the second partition belonging to the current block may share the signaled mergeIdx. Based on the motion information of the merge candidate specified by mergeIdx, motion information of the first and second partitions may be derived.
  • the merge candidate when the merge candidate specified by mergeIdx is bidirectional prediction, the merge candidate may have motion information in the L0 direction and motion information in the L1 direction.
  • the motion information of the first partition may be derived from one of the motion information in the L0 direction and the motion information in the L1 direction
  • the motion information of the second partition may be derived from the other.
  • the motion information of the first partition is derived to the motion information of the merge candidate specified by mergeIdx
  • the motion information of the second partition is (mergeIdx + k It can be derived to the motion information of the merge candidate specified by.
  • k may be an integer having an absolute value of 1, 2, 3, or more.
  • the motion information of the first and second partitions may be derived based on the motion information of the pre-committed merge candidate in the merge candidate list (Embodiment 3).
  • signaling of the merge index may be omitted.
  • the pre-committed merge candidate may be a merge candidate with an index of zero.
  • the motion information of the first and second partitions may be derived in consideration of whether a merge candidate having an index of 0 is bidirectional prediction, which is the same as that of the second embodiment.
  • the pre-committed merge candidate may be a merge candidate having the smallest index among the merge candidates that are bidirectional predictions.
  • the merge candidate that is bidirectional prediction may include at least one of a spatial / temporal merge candidate or a combined merge candidate.
  • the motion information of the first and second partitions is derived based on the motion information of the merge candidate, which is bidirectional prediction, as described above in the second embodiment.
  • the partition-specific motion information may be derived based on any one of the above-described embodiments 1 to 3, and the motion information for each partition may be derived based on a combination of at least two of the embodiments 1-3.
  • the partition may be forced to perform only one-way prediction (Example 4).
  • the motion information of the first partition is motion information in the L0 direction of the merge candidate corresponding to mergeIdx1. It can be derived using.
  • the merge candidate corresponding to mergeIdx1 may not have the motion information in the L0 direction.
  • motion information of the first partition may be derived using motion information of the merge candidate in the L1 direction.
  • the merge index (mergeIdx1) of the first partition is an odd number (eg, 1, 3, 5, etc.)
  • the motion information of the first partition is derived by using the motion information in the L1 direction of the merge candidate corresponding to mergeIdx1. Can be.
  • the merge candidate corresponding to mergeIdx1 may not have the motion information in the L1 direction.
  • motion information of the first partition may be derived using motion information in the L0 direction of the corresponding merge candidate.
  • the merge index mergeIdx1 may be encoded and signaled by the encoding apparatus, may be derived based on the signaled merge index, or may be pre-committed to the decoding apparatus.
  • the motion information of the second partition may be derived in the same manner as the above-described first partition, and a detailed description thereof will be omitted.
  • the motion information of the first partition may be obtained by using the motion information in the L1 direction of the merge candidate corresponding to mergeIdx1. If not, the motion information of the first partition may be derived using motion information in the L0 direction of the merge candidate corresponding to mergeIdx1.
  • the partition may be forced to perform only unidirectional prediction according to the position of the diagonal motion partitioned partition (Example 5).
  • the first partition of the current block is forced to refer only to motion information in the L0 direction of the merge candidate specified by the merge index mergeIdx1, and the second partition is configured to refer to the merge candidate specified by the merge index mergeIdx2. It may be forced to refer to only motion information in the L1 direction.
  • the merge candidate specified by mergeIdx1 does not have the motion information in the L0 direction (ie, L1 prediction)
  • the motion information in the L1 direction of the merge candidate may be referred to.
  • the merge candidate specified by mergeIdx2 does not have the motion information in the L1 direction (ie, L0 prediction)
  • the motion information in the L0 direction of the merge candidate may be referred to.
  • unidirectional prediction may be forced, which will be described in detail with reference to FIGS. 11 to 13.
  • inter prediction of the current block may be performed using the derived motion information (S820).
  • the prediction pixel of the current block is obtained using either the first reference block P P0 specified by the motion vector of the first partition or the second reference block P P1 specified by the motion vector of the second partition.
  • the prediction pixel may be obtained by applying a predetermined weight to the first pixel in the first reference block and the second pixel in the second reference block.
  • the first pixel and the second pixel may be at the same position as the prediction pixel.
  • the prediction block P CUR of the current block according to the present invention may be obtained as in Equation 3 below.
  • P P0 and P P1 mean prediction blocks predicted by different movements
  • MASK P0 (x, y) and MASK P1 (x, y) represent weights at coordinates (x, y)
  • MASK P0 ( The sum of x, y) and MASK P1 (x, y) should be equal to 2 shift .
  • the offset may be 0 or 2 (shift-1) .
  • the pixel P (x1, y1) positioned on the diagonal is predicted by weighting the pixel at the position (x1, y1) in the first partition and the pixel at the position (x1, y1) in the second partition.
  • the peripheral pixel P (x2, y2) of the pixel P (x1, y1) is predicted by weighting the pixel at the position (x2, y2) in the first partition and the pixel at the position (x2, y2) in the second partition.
  • the weighted prediction will be described in detail with reference to FIGS. 14 to 17.
  • the current block 900 is a block partitioned using left diagonal motion partitioning, and may include a first partitioning block 910 and a second partitioning block 920.
  • the first partition block 910 and the second partition block 920 may perform independent motion prediction and motion compensation, respectively, and generate one prediction block corresponding to the current block 900.
  • the first partition block 910 and the second partition block 920 may use the merge candidate list generated based on the square or non-square current block as shown in FIG. 8.
  • the first division block 910 and the second division block 920 have different movement characteristics, and therefore, the first division block 910 and the second division.
  • Block 920 may use different motion prediction and merge candidates.
  • the first partition block 910 may have low correlation with the left neighboring blocks A0 and A1 of the spatial neighboring blocks of the current block 900.
  • A0 and A1 may be excluded.
  • motion information of the temporal neighboring block C0 corresponding to the lower right position of the current block 900 and motion information of the temporal neighboring block C4 corresponding to the upper right position of the current block 900 may be used as additional merge candidates. Can be.
  • merge candidates included in the merge candidate list are combined to form an additional merge candidate list, and merge candidates having zero motion vectors are also used. You can create a list.
  • the second split block 920 may have a low correlation with the upper neighboring blocks B0 and B1 among the spatial neighboring blocks of the current block 900.
  • B0 and B1 may be excluded.
  • motion information of the temporal neighboring block C0 corresponding to the lower right position of the current block 900 and motion information of the temporal neighboring block C5 corresponding to the upper left position of the current block 900 may be used as additional merge candidates. Can be.
  • merge candidates included in the merge candidate list are combined to form an additional merge candidate list, and merge candidates having zero motion vectors are also used. You can create a list.
  • the current block 1000 is a block partitioned using right diagonal motion partitioning and may include a first partitioning block 1010 and a second partitioning block 1020.
  • the first divided block 1010 and the second divided block 1020 may perform independent motion prediction and motion compensation, respectively, and generate one prediction block corresponding to the current block 1000.
  • the first split block 1010 and the second split block 1020 may use the merge candidate list generated based on the square or non-square current block, as shown in FIG. 8.
  • the first division block 1010 and the second division block 1020 have different movement characteristics, and thus, the first division block 1010 and the second division.
  • Block 1020 may use different motion prediction and merge candidates.
  • the first partition block 1010 may have low correlation with the lower left neighboring block A0 and the upper right neighboring block B0 among the spatial neighboring blocks of the current block 1100.
  • the lower left and upper right neighboring blocks A0 and B0 may be excluded.
  • the merge candidate may further include motion information of the temporal neighboring block C2 located in the upper left corner based on the center position of the current block 1000 and motion information of the temporal neighboring block C3 corresponding to the upper left position of the current block 1000. Can be used as
  • merge candidates included in the merge candidate list are combined to form an additional merge candidate list, and merge candidates having zero motion vectors are also used. You can create a list.
  • the second partition block 1020 is different from the left neighboring block A1, the upper neighboring block B1, and the upper left neighboring block B2 among the spatial neighboring blocks of the current block 1000. It can be seen that the correlation is low. In this case, in constructing the merge candidate list of the second division block 1020, A1, B1, and B2 may be excluded. In addition, the motion information of the temporal neighboring block C0 corresponding to the lower right end position of the current block 1000, the temporal neighboring block C1 corresponding to the center position of the current block 1000, and the lower right end of the current block 1000. The motion information of the temporal neighboring block C6 corresponding to the position may be used as an additional merge candidate.
  • merge candidates included in the merge candidate list are combined to form an additional merge candidate list, and merge candidates having zero motion vectors are also used. You can create a list.
  • FIG. 11 is a diagram illustrating a concept of limited mask-based motion prediction and compensation as an embodiment to which the present invention is applied.
  • FIG. 11 illustrates a method of limiting prediction directions according to specific conditions in order to reduce memory bandwidth in performing mask-based motion prediction and compensation proposed by the present invention.
  • the prediction direction of the current block may be limited.
  • the threshold size may be 4, 8, 16 or more.
  • the prediction direction of the current block may be limited.
  • the predetermined inter mode may include at least one of a SKIP mode, a merge mode, an AMVP mode, or an affine mode.
  • the inter mode may be restricted according to each partition of the current block. For example, when the first partition PART_0 is coded in the merge mode, the second partition PART_1 may be restricted from being coded in the merge mode. However, when the first partition PART_0 is not coded in the merge mode, the second partition PART_1 may be coded in the merge mode.
  • the method of limiting the prediction direction may be applied.
  • At least one of the two pieces of motion information may be motion information for performing unidirectional prediction.
  • FIGS. 12 and 13 are diagrams illustrating the concept of a method of performing prediction by dividing one coding block into two partitions using one straight line according to an embodiment to which the present invention is applied.
  • FIG. 12 is a diagram illustrating triangulation of one square or non-square block based on a straight line connecting an upper right and a lower left in an embodiment in which one coding block is divided into two partitions using one straight line.
  • the present invention may include not only a triangular shape divided based on a straight line connecting the upper right and the lower left, but also a triangular shape divided based on a straight line connecting the upper left and the lower right.
  • the present invention includes a case in which one coding block is divided into two in the vertical / horizontal direction, wherein the two divided partitions may have the same width or height.
  • the present invention may include a case where one coding block is divided into two partitions based on an arbitrary straight line.
  • the current block 1201 is divided based on a straight line connecting the upper right and lower left.
  • each partition may perform bidirectional prediction or unidirectional prediction.
  • the present invention proposes a method and apparatus for performing prediction with reference to reference pictures in different directions, in case of being forced to use only unidirectional prediction. That is, when the first partition performs the L0 prediction, the second partition may essentially perform the L1 prediction. Referring to FIG. 12, a first partition performs prediction with reference to a reference picture in the L0 direction, and a second partition performs prediction in performing a prediction with reference to a reference picture in the L1 direction.
  • a first partition performs prediction with reference to a reference picture in the L1 direction
  • a second partition performs prediction with reference to a reference picture in the L0 direction.
  • first partition and the second partition refer to different reference picture lists.
  • the present invention may also include performing prediction by referring to a reference picture list in which the first partition and the second partition are the same.
  • 14 to 17 illustrate a weighted prediction method for a diagonal motion-divided current block according to an embodiment to which the present invention is applied.
  • a weight 2 may be applied to a pixel position belonging to a first partition, and a weight 1 may be applied to a pixel position positioned on a diagonal line.
  • a weight of 0 may be applied to the pixel position belonging to the second partition, the effect of not referring to the pixel of the corresponding position can be obtained.
  • the weight 2 may be applied to the pixel position belonging to the second partition, and the weight 1 may be applied to the pixel position positioned on the diagonal. However, a weight of 0 may be applied to pixel positions belonging to the first partition.
  • the two equally-positioned pixels to which the weight is applied may be summed and divided by the sum of the weights to obtain a final prediction pixel.
  • the aforementioned method may be referred to as a mask-based motion prediction and compensation method, and may be extended to various types of masks.
  • Equation 4 When the diagonal motion division shown in FIG. 14 is configured in the form of a mask, Equation 4 is obtained.
  • the MASK P0 refers to the weight of the first partition
  • the MASK P1 refers to the weight of the second partition.
  • Equation 5 The equation for generating the final prediction block using the weight of Equation 4 is shown in Equation 5.
  • P DMP (x, y) (P P0 (x, y) x MASK P0 (x, y) + P P1 (x, y) x MASK P1 (x, y)) >> shift
  • P DMP denotes a final square or non-square prediction block obtained by using diagonal motion division
  • P P0 (x, y) is a reference pixel corresponding to a position (x, y) in the first partition
  • P P1 ( x, y) means reference pixels corresponding to (x, y) positions in the second partition, respectively.
  • Shift is the final shift value according to the weight. Since the weight shown in FIG. 14 is 2, the shift value is 1.
  • the sum of the weights for each position of the mask generated by the diagonal proposed by the present invention is not limited to 2, and may be an exponential power of 2, such as 4, 8, 16, 32, and the like.
  • the adjacent region may include two pixels adjacent in the top or left direction and two pixels adjacent in the bottom or right direction from pixels positioned on a diagonal line.
  • pixels P (x1, y1) (hereinafter, referred to as a first region) positioned diagonally may include pixels at a position (x1, y1) in a reference block of the first partition and (x1, y1) in a reference block of the second partition.
  • y1) can be predicted by applying a weight of 4 to each pixel at position y1).
  • the upper or left neighboring pixel P (x2, y2) (hereinafter referred to as the second region) of the first region applies a weight of 6 to the pixel at the position (x2, y2) in the reference block of the first partition, and It can be predicted by applying the weight 2 to the pixel at the position (x2, y2) in the reference block of the two partitions.
  • the upper or left neighboring pixel P (x3, y3) (hereinafter referred to as the third region) of the second region applies a weight of 7 to the pixel at the position (x3, y3) in the reference block of the first partition, and It can be predicted by applying the weight 1 to the pixel at the position (x3, y3) in the reference block of the two partitions.
  • the remaining pixels P (x4, y4) except for the first to third regions are applied with a weight of 8 to the pixel at the position (x4, y4) in the reference block of the first partition, and It can be predicted by applying a weight of 0 to the pixel at the position (x4, y4) in the reference block.
  • the lower or right neighboring pixels P (x5, y5) (hereinafter referred to as a fourth region) of the first region apply weight 2 to the pixel at the position (x5, y5) in the reference block of the first partition. It can be predicted by applying the weight 6 to the pixel at the position (x5, y5) in the reference block of the second partition.
  • the lower or right neighboring pixel P (x6, y6) (hereinafter referred to as a fifth region) of the fourth region applies a weight of 1 to the pixel at the position (x6, y6) in the reference block of the first partition, and It can be predicted by applying a weight of 7 to the pixel at the position (x6, y6) in the reference block of the two partitions.
  • the remaining pixels P (x7, y7) except for the first region, the fourth region, and the fifth region apply a weight of 0 to the pixel at the position (x7, y7) in the reference block of the first partition, It can be predicted by applying a weight of 8 to the pixel at the position (x7, y7) in the reference block of the second partition.
  • FIG. 16 illustrates an embodiment in which the sum of weights applied to each pixel is 32 and may be used when the block is sharper than in the embodiment in which the sum of the weights shown in FIG. 15 is 8.
  • different weights may be applied to predetermined regions, which have been described in detail with reference to FIG. 15, and thus a detailed description thereof will be omitted.
  • the weight is any one of [32: 0], [31: 1], [28: 4], [16:16], [4:28], [31: 1], or [0:32]. It can be selectively used according to the position of the pixel.
  • the adjacent region may include one pixel adjacent in the top or left direction and one pixel adjacent in the bottom or right direction from the pixels positioned on the diagonal.
  • different weights may be applied to predetermined regions, which have been described in detail with reference to FIG. 15, and thus a detailed description thereof will be omitted.
  • the weight may be any one of [8: 0], [6: 2], [4: 4], [2: 6], or [0: 8], which may be selectively used according to the position of the pixel.
  • various embodiments of the present disclosure may be implemented by hardware, firmware, software, or a combination thereof.
  • one or more Application Specific Integrated Circuits (ASICs), Digital Signal Processors (DSPs), Digital Signal Processing Devices (DSPDs), Programmable Logic Devices (PLDs), Field Programmable Gate Arrays (FPGAs), General Purpose It may be implemented by a general processor, a controller, a microcontroller, a microprocessor, and the like.
  • scope of the disclosure include software or machine-executable instructions (eg, an operating system, an application, firmware, a program, etc.) to cause an operation in accordance with various embodiments of the method to be executed on an apparatus or a computer, and such software or Instructions, and the like, including non-transitory computer-readable media that are stored and executable on a device or computer.
  • software or machine-executable instructions eg, an operating system, an application, firmware, a program, etc.
  • the present invention can be used to encode / decode a video signal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 영상 부호화/복호화 장치는, 대각선 움직임 분할이 적용된 현재 블록의 머지 후보 리스트를 구성하고, 머지 후보 리스트 및 머지 후보 인덱스를 기반으로 현재 블록의 움직임 정보를 유도하며, 유도된 움직임 정보를 기반으로 현재 블록의 인터 예측을 수행할 수 있다.

Description

영상 부호화/복호화 방법 및 장치
본 발명은 영상 부호화/복호화 방법 및 장치에 관한 것이다.
고해상도 비디오에 대한 시장의 수요가 증가하고 있으며, 이에 따라 고해상도 영상을 효율적으로 압축할 수 있는 기술이 필요하다. 이러한 시장의 요구에 따라 ISO/IEC의 MPEG (Moving Picture Expert Group)과 ITU-T의 VCEG (Video Coding Expert Group)이 공동으로 JCT-VC (Joint Collaborative Team on Video Coding)를 결성하여, HEVC (High Efficiency Video Coding) 비디오 압축 표준을 2013년 1월에 개발을 완료했으며, 차세대 압축 표준에 대한 연구 및 개발을 활발히 진행해오고 있다.
동영상 압축은 크게 화면 내 예측 (또는 인트라 예측), 화면 간 예측(또는 인터 예측), 변환, 양자화, 엔트로피(Entropy coding) 부호화, 인루프 필터(In-loop filter)로 구성된다. 한편, 고해상도 영상에 대한 수요가 증가함과 함께, 새로운 영상 서비스로서 입체 영상 컨텐츠에 대한 수요도 함께 증가하고 있다. 고해상도 및 초고해상도의 입체 영상 콘텐츠를 효과적으로 제공하기 위한 비디오 압축 기술에 대하여 논의가 진행되고 있다.
본 발명은 효율이 향상된 영상 부호화/복호화 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 부호화 블록을 사각형, 삼각형 또는 임의의 형태를 가진 파티션으로 분할하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 현재 블록의 머지 후보 리스트를 적응적으로 구성하는 방법 및 장치를 제공하는 것을 목적으로 한다.
본 발명은 대각선 움직임 분할이 적용된 블록의 예측 방향을 제한하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 대각선 움직임 분할이 적용된 블록의 가중 예측 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 대각선 움직임 분할이 적용된 블록의 움직임 정보를 저장하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 상기 영상 부호화 방법/장치에 의해 생성된 비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체를 제공하는 것을 목적으로 한다.
본 발명에 따른 영상 복호화 방법 및 장치는, 현재 블록의 머지 후보 리스트를 구성하고, 상기 머지 후보 리스트 및 머지 후보 인덱스를 기반으로, 상기 현재 블록의 움직임 정보를 유도하며, 상기 유도된 움직임 정보를 기반으로, 상기 현재 블록의 인터 예측을 수행할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 현재 블록은, 대각선 움직임 분할에 기초하여 제1 파티션과 제2 파티션으로 분할될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 제1 파티션과 상기 제2 파티션 중 적어도 하나의 형태는 삼각형일 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 상기 제1 파티션과 상기 제2 파티션 중 적어도 하나에 대해서 시그날링될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 소정의 플래그가 제1 값인 경우에 시그날링되고, 상기 플래그는, 상기 현재 블록이 대각선 움직임 분할에 기반한 움직임 보상을 수행하는지 여부를 나타낼 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 플래그의 값은, 소정의 부호화 파라미터에 기초하여 복호화 장치에서 유도될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 부호화 파라미터는, 상기 현재 블록이 속한 슬라이스 타입, 상기 현재 블록의 인터 모드의 타입 또는 상기 현재 블록의 크기 중 적어도 하나를 포함할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 리스트는, 공간적 머지 후보, 시간적 머지 후보, 조합 머지 후보 또는 제로 움직임 벡터를 가진 머지 후보 중 적어도 하나를 포함할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 파티션의 움직임 정보는, 상기 머지 후보 인덱스에 의해 특정된 머지 후보의 움직임 정보에 기초하여 유도될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보가 양방향 예측의 움직임 정보를 가지는 경우, 상기 파티션은 단방향 예측의 움직임 정보만을 가지도록 제한될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 현재 블록의 화소는, 상기 제1 파티션의 참조 블록에 속한 화소와 상기 제2 파티션의 참조 블록에 속한 화소에 소정의 가중치(m 및 n)를 적용하여 예측될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 m과 n은, 0, 1, 2, 4, 6, 7, 8, 16, 28, 31 또는 32 중 어느 하나이며, 상기 m과 n의 합은, 2, 8 또는 32 중 어느 하나일 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 가중치는, 상기 현재 블록 내 화소의 위치에 기초하여 결정될 수 있다.
본 발명에 따르면, 다양항 형태의 블록 분할을 통해 부호화/복호화 효율을 향상시킬 수 있다.
또한, 본 발명은 적응적인 머지 후보 리스트를 이용함으로써, 움직임 정보의 부호화/복호화 효율을 향상시킬 수 있다.
본 발명은 대각선 움직임 분할이 적용된 블록의 예측 방향을 제한함으로써, 메모리 밴드폭을 효율적으로 줄일 수 있다.
또한, 본 발명은 대각선 움직임 분할이 적용된 블록의 가중 예측을 통해, 분할 경계 부근의 artifact를 줄일 수 있다.
또한, 본 발명에 따른 움직임 정보 저장 방법을 통해 움직임 정보의 접근성 및 참조 정보로서의 신뢰성을 향상시킬 수 있다.
또한, 본 발명에 따르면, 본 발명에 따른 영상 부호화 방법/장치에 의해 생성된 비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체가 제공될 수 있다.
도 1은 본 발명에 따른 영상 부호화 장치를 나타낸 블록도이다.
도 2는 본 발명에 따른 영상 복호화 장치를 나타낸 블록도이다.
도 3은 하나의 선분을 이용한 임의 형태의 블록 분할 방법의 일 실시예이다.
도 4는 정방형 및 직방형 블록 분할과 좌, 우 대각선 선분을 이용하여 생성 가능한 다양한 임의 블록 분할의 예제를 나타낸 도면이다.
도 5는 본 발명에서 제안하는 두 종류의 대각선을 이용하여 정방형 혹은 비정방형 블록을 삼각형 형태로 분할하는 방법을 보여준다.
도 6은 본 발명에서 제안하는 마스크 기반 움직임 예측 및 보상을 위한 마스크의 일 실시예 중에서 원 혹은 타원 형태의 분할에 관한 마스크의 개념을 도시한 도면이다.
도 7은, 대각선 움직임 분할을 사용하는 경우 해당 블록의 부호화 정보를 저장하는 형태를 도시한 도면이다.
도 8은 본 발명이 적용되는 일실시예로서, 머지 모드 기반의 인터 예측 방법을 도시한 것이다.
도 9는 좌측 대각선 움직임 분할을 사용하는 블록의 머지 후보를 도시한 것이다.
도 10은 우측 대각선 움직임 분할을 사용하는 블록의 머지 후보를 도시한 것이다.
도 11은 본 발명이 적용되는 일실시예로서, 제한적인 마스크 기반의 움직임 예측 및 보상의 개념을 도시한 도면이다.
도 12 및 도 13은 본 발명이 적용되는 일실시예로서, 하나의 직선을 이용하여 하나의 부호화 블록을 2개의 파티션으로 분할하여 예측을 수행하는 방법의 개념을 도시한 도면이다.
도 14 내지 도 17은 본 발명이 적용되는 일실시예로서, 대각 움직임 분할된 현재 블록에 대한 가중 예측 방법을 도시한 것이다.
본 발명에 따른 영상 복호화 방법 및 장치는, 현재 블록의 머지 후보 리스트를 구성하고, 상기 머지 후보 리스트 및 머지 후보 인덱스를 기반으로, 상기 현재 블록의 움직임 정보를 유도하며, 상기 유도된 움직임 정보를 기반으로, 상기 현재 블록의 인터 예측을 수행할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 현재 블록은, 대각선 움직임 분할에 기초하여 제1 파티션과 제2 파티션으로 분할될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 제1 파티션과 상기 제2 파티션 중 적어도 하나의 형태는 삼각형일 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 상기 제1 파티션과 상기 제2 파티션 중 적어도 하나에 대해서 시그날링될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 소정의 플래그가 제1 값인 경우에 시그날링되고, 상기 플래그는, 상기 현재 블록이 대각선 움직임 분할에 기반한 움직임 보상을 수행하는지 여부를 나타낼 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 플래그의 값은, 소정의 부호화 파라미터에 기초하여 복호화 장치에서 유도될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 부호화 파라미터는, 상기 현재 블록이 속한 슬라이스 타입, 상기 현재 블록의 인터 모드의 타입 또는 상기 현재 블록의 크기 중 적어도 하나를 포함할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보 리스트는, 공간적 머지 후보, 시간적 머지 후보, 조합 머지 후보 또는 제로 움직임 벡터를 가진 머지 후보 중 적어도 하나를 포함할 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 파티션의 움직임 정보는, 상기 머지 후보 인덱스에 의해 특정된 머지 후보의 움직임 정보에 기초하여 유도될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 머지 후보가 양방향 예측의 움직임 정보를 가지는 경우, 상기 파티션은 단방향 예측의 움직임 정보만을 가지도록 제한될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 현재 블록의 화소는, 상기 제1 파티션의 참조 블록에 속한 화소와 상기 제2 파티션의 참조 블록에 속한 화소에 소정의 가중치(m 및 n)를 적용하여 예측될 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 m과 n은, 0, 1, 2, 4, 6, 7, 8, 16, 28, 31 또는 32 중 어느 하나이며, 상기 m과 n의 합은, 2, 8 또는 32 중 어느 하나일 수 있다.
본 발명에 따른 영상 복호화 방법 및 장치에 있어서, 상기 가중치는, 상기 현재 블록 내 화소의 위치에 기초하여 결정될 수 있다.
본 명세서에 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다.
또한, 본 명세서 전체에서 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
또한, 본 명세서에서 설명되는 장치 및 방법에 관한 실시예에 있어서, 장치의 구성 일부 또는 방법의 단계 일부는 생략될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부의 순서가 변경될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부에 다른 구성 또는 다른 단계가 삽입될 수 있다.
또한, 본 발명의 제1 실시예의 일부 구성 또는 일부 단계는 본 발명의 제2 실시예에 부가되거나, 제2 실시예의 일부 구성 또는 일부 단계를 대체할 수 있다.
덧붙여, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.
먼저, 본 출원에서 사용되는 용어를 간략히 설명하면 다음과 같다.
이하에서 후술할 복호화 장치(Video Decoding Apparatus)는 민간 보안 카메라, 민간 보안 시스템, 군용 보안 카메라, 군용 보안 시스템, 개인용 컴퓨터(PC, Personal Computer), 노트북 컴퓨터, 휴대형 멀티미디어 플레이어(PMP, Portable MultimediaPlayer), 무선 통신 단말기(Wireless Communication Terminal), 스마트 폰(Smart Phone), TV 응용 서버와 서비스 서버 등 서버 단말기에 포함된 장치일 수 있으며, 각종 기기 등과 같은 사용자 단말기, 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 복호화하거나 복호화를 위해 화면 간 또는 화면 내 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.
또한, 부호화기에 의해 비트스트림(bitstream)으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB, Universal Serial Bus)등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 복호화되어 영상으로 복원되고 재생될 수 있다. 또는 부호화기에 의해 생성된 비트스트림은 메모리에 저장될 수 있다. 상기 메모리는 휘발성 메모리와 비휘발성 메모리를 모두 포함할 수 있다. 본 명세서에서 메모리는 비트스트림을 저장한 기록 매체로 표현될 수 있다.
통상적으로 동영상은 일련의 픽쳐(Picture)들로 구성될 수 있으며, 각 픽쳐들은 블록(Block)과 같은 코딩 유닛(coding unit)으로 분할될 수 있다. 또한, 이하에 기재된 픽쳐라는 용어는 영상(Image), 프레임(Frame) 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있을 것이다. 그리고 코딩 유닛이라는 용어는 단위 블록, 블록 등과 같은 동등한 의미를 갖는 다른 용어로 대치되어 사용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있을 것이다.
이하, 첨부한 도면들을 참조하여, 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명에 따른 영상 부호화 장치를 나타낸 블록도이다.
도 1을 참조하면, 영상 부호화 장치(100)는 픽쳐 분할부(110), 예측부(120, 125), 변환부(130), 양자화부(135), 재정렬부(160), 엔트로피 부호화부(165), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함할 수 있다.
픽쳐 분할부(110)는 입력된 픽쳐를 적어도 하나의 처리 단위로 분할할 수 있다. 이때, 처리 단위는 예측 단위(Prediction Unit: PU)일 수도 있고, 변환 단위(Transform Unit: TU)일 수도 있으며, 부호화 단위(Coding Unit: CU)일 수도 있다. 이하, 본 발명의 실시예에서는 부호화 단위는 부호화를 수행하는 단위의 의미로 사용할 수도 있고, 복호화를 수행하는 단위의 의미로 사용할 수도 있다.
예측 단위는 하나의 부호화 단위 내에서 동일한 크기의 적어도 하나의 정사각형 또는 직사각형 등의 형태를 가지고 분할된 것일 수도 있고, 하나의 부호화 단위 내에서 분할된 예측 단위 중 어느 하나의 예측 단위가 다른 하나의 예측 단위와 상이한 형태 및/또는 크기를 가지도록 분할된 것일 수도 있다. 부호화 단위를 기초로 인트라 예측을 수행하는 예측 단위를 생성시 최소 부호화 단위가 아닌 경우, 복수의 예측 단위 NxN 으로 분할하지 않고 인트라 예측을 수행할 수 있다.
예측부(120, 125)는 인터 예측 또는 화면 간 예측을 수행하는 인터 예측부(120)와 인트라 예측 또는 화면 내 예측을 수행하는 인트라 예측부(125)를 포함할 수 있다. 예측 단위에 대해 인터 예측을 사용할 것인지 또는 인트라 예측을 수행할 것인지를 결정하고, 각 예측 방법에 따른 구체적인 정보(예컨대, 인트라 예측 모드, 움직임 벡터, 참조 픽쳐 등)를 결정할 수 있다. 생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록)은 변환부(130)로 입력될 수 있다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 잔차값과 함께 엔트로피 부호화부(165)에서 부호화되어 복호화기에 전달될 수 있다.
전술한 본 발명의 블록 머지 기술을 적용시, 현재 블록을 공간적 혹은 시간적으로 인접한 블록의 움직임 정보를 머지하여 사용함에 있어 병렬처리를 고려하여 머지 예측 영역 (MER: Merge Estimation Region)을 사용하는 방식을 예측부(120, 125)에 적용할 수 있다. 즉, 본 발명은 비디오 코딩 기술 중 화면 간 예측, 화면 내 예측, 성분 간 예측 등의 예측 기술에서 병렬처리를 고려하여 현재 블록의 공간적 혹은 시간적으로 인접한 블록을 구성하기 위한 병렬 예측 영역 (PER: Parallel Estimation Region)을 활용 할 수 있다.
인터 예측부(120)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측 단위를 예측할 수도 있고, 경우에 따라서는 현재 픽쳐 내의 부호화가 완료된 일부 영역의 정보를 기초로 예측 단위를 예측할 수도 있다. 인터 예측부(120)는 참조 픽쳐 보간부, 움직임 예측부, 움직임 보상부를 포함할 수 있다.
참조 픽쳐 보간부에서는 메모리(155)로부터 참조 픽쳐 정보를 제공받고 참조 픽쳐에서 정수 화소 이하의 화소 정보를 생성할 수 있다. 휘도 화소의 경우, 1/4 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 8탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다. 색차 신호의 경우 1/8 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 4탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다.
움직임 예측부는 참조 픽쳐 보간부에 의해 보간된 참조 픽쳐를 기초로 움직임 예측을 수행할 수 있다. 움직임 벡터를 산출하기 위한 방법으로 FBMA(Full search-based Block Matching Algorithm), TSS(Three Step Search), NTS(New Three-Step Search Algorithm) 등 다양한 방법이 사용될 수 있다. 움직임 벡터는 보간된 화소를 기초로 1/2 또는 1/4 화소 단위의 움직임 벡터값을 가질 수 있다. 움직임 예측부에서는 움직임 예측 방법을 다르게 하여 현재 예측 단위를 예측할 수 있다. 움직임 예측 방법으로 스킵(Skip) 방법, 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법, 인트라 블록 카피(Intra Block Copy) 방법 등 다양한 방법이 사용될 수 있다.
인트라 예측부(125)는 현재 픽쳐 내의 화소 정보인 현재 블록 주변의 참조 픽셀 정보를 기초로 예측 단위를 생성할 수 있다. 현재 예측 단위의 주변 블록이 인터 예측을 수행한 블록이어서, 참조 픽셀이 인터 예측을 수행한 픽셀일 경우, 인터 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 인트라 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수 있다. 즉, 참조 픽셀이 가용하지 않는 경우, 가용하지 않은 참조 픽셀 정보를 가용한 참조 픽셀 중 적어도 하나의 참조 픽셀로 대체하여 사용할 수 있다.
또한, 예측부(120, 125)에서 생성된 예측 단위를 기초로 예측을 수행한 예측 단위와 예측 단위의 원본 블록과 차이값인 잔차값(Residual) 정보를 포함하는 잔차 블록이 생성될 수 있다. 생성된 잔차 블록은 변환부(130)로 입력될 수 있다.
변환부(130)에서는 원본 블록과 예측부(120, 125)를 통해 생성된 예측 단위의 잔차값(residual)정보를 포함한 잔차 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT와 같은 변환 방법을 사용하여 변환시킬 수 있다. 잔차 블록을 변환하기 위해 DCT를 적용할지, DST를 적용할지 또는 KLT를 적용할지는 잔차 블록을 생성하기 위해 사용된 예측 단위의 인트라 예측 모드 정보를 기초로 결정할 수 있다.
양자화부(135)는 변환부(130)에서 주파수 영역으로 변환된 값들을 양자화할 수 있다. 블록에 따라 또는 영상의 중요도에 따라 양자화 계수는 변할 수 있다. 양자화부(135)에서 산출된 값은 역양자화부(140)와 재정렬부(160)에 제공될 수 있다.
재정렬부(160)는 양자화된 잔차값에 대해 계수값의 재정렬을 수행할 수 있다.
재정렬부(160)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원의 블록 형태 계수를 1차원의 벡터 형태로 변경할 수 있다. 예를 들어, 재정렬부(160)에서는 지그-재그 스캔(Zig-Zag Scan)방법을 이용하여 DC 계수부터 고주파수 영역의 계수까지 스캔하여 1차원 벡터 형태로 변경시킬 수 있다. 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔 대신 2차원의 블록 형태 계수를 열 방향으로 스캔하는 수직 스캔, 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔이 사용될 수도 있다. 즉, 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔, 수직 방향 스캔 및 수평 방향 스캔 중 어떠한 스캔 방법이 사용될지 여부를 결정할 수 있다.
엔트로피 부호화부(165)는 재정렬부(160)에 의해 산출된 값들을 기초로 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 사용할 수 있다. 관련하여, 엔트로피 부호화부(165)는 재정렬부(160) 및 예측부(120, 125)로부터 부호화 단위의 잔차값 계수 정보를 부호화 할 수 있다. 또한, 본 발명에 따라 움직임 정보를 디코더 측면에서 유도하여 사용함을 지시하는 정보 및 움직임 정보 유도에 사용된 기법에 대한 정보를 시그널링(signaling)하여 전송하는 것이 가능하다.
역양자화부(140) 및 역변환부(145)에서는 양자화부(135)에서 양자화된 값들을 역양자화하고 변환부(130)에서 변환된 값들을 역변환한다. 역양자화부(140) 및 역변환부(145)에서 생성된 잔차값(Residual)은 예측부(120, 125)에 포함된 움직임 추정부, 움직임 보상부 및 인트라 예측부를 통해서 예측된 예측 단위와 합쳐져 복원 블록(Reconstructed Block)을 생성할 수 있다.
필터부(150)는 디블록킹 필터, 오프셋 보정부, ALF(Adaptive Loop Filter)중 적어도 하나를 포함할 수 있다. 디블록킹 필터는 복원된 픽쳐에서 블록간의 경계로 인해 생긴 블록 왜곡을 제거할 수 있다. 오프셋 보정부는 디블록킹을 수행한 영상에 대해 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 픽쳐에 대한 오프셋 보정을 수행하기 위해 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후 오프셋을 수행할 영역을 결정하고 해당 영역에 오프셋을 적용하는 방법 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법을 사용할 수 있다. ALF(Adaptive Loop Filtering)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다.
메모리(155)는 필터부(150)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있고, 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행 시 예측부(120, 125)에 제공될 수 있다.
도 2는 본 발명에 따른 영상 복호화 장치를 나타낸 블록도이다.
도 2를 참조하면, 영상 복호화기(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230, 235), 필터부(240), 메모리(245)가 포함될 수 있다.
영상 부호화기에서 영상 비트스트림이 입력된 경우, 입력된 비트스트림은 영상 부호화기와 반대의 절차로 복호화될 수 있다.
엔트로피 복호화부(210)는 영상 부호화기의 엔트로피 부호화부에서 엔트로피 부호화를 수행한 것과 반대의 절차로 엔트로피 복호화를 수행할 수 있다. 예를 들어, 영상 부호화기에서 수행된 방법에 대응하여 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 방법이 적용될 수 있다.
엔트로피 복호화부(210)에서는 부호화기에서 수행된 인트라 예측 및 인터 예측에 관련된 정보를 복호화할 수 있다.
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 부호화부에서 재정렬한 방법을 기초로 재정렬을 수행할 수 있다. 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다.
역양자화부(220)는 부호화기에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
역변환부(225)는 영상 부호화기에서 수행한 양자화 결과에 대해 변환부에서 수행한 변환 즉, DCT, DST, 및 KLT에 대해 역변환 즉, 역 DCT, 역 DST 및 역 KLT를 수행할 수 있다. 역변환은 영상 부호화기에서 결정된 전송 단위를 기초로 수행될 수 있다. 영상 복호화기의 역변환부(225)에서는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 변환 기법(예를 들어, DCT, DST, KLT)이 선택적으로 수행될 수 있다.
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다.
전술한 바와 같이 영상 부호화기에서의 동작과 동일하게 인트라 예측 또는 화면 내 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 동일할 경우, 예측 단위의 좌측에 존재하는 픽셀, 좌측 상단에 존재하는 픽셀, 상단에 존재하는 픽셀을 기초로 예측 단위에 대한 인트라 예측을 수행하지만, 인트라 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 상이할 경우, 변환 단위를 기초로 한 참조 픽셀을 이용하여 인트라 예측을 수행할 수 있다. 또한, 최소 부호화 단위에 대해서만 NxN 분할을 사용하는 인트라 예측을 사용할 수도 있다.
예측부(230, 235)는 예측 단위 판별부, 인터 예측부 및 인트라 예측부를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 인트라 예측 방법의 예측 모드 정보, 인터 예측 방법의 움직임 예측 관련 정보 등 다양한 정보를 입력 받고 현재 부호화 단위에서 예측 단위를 구분하고, 예측 단위가 인터 예측을 수행하는지 아니면 인트라 예측을 수행하는지 여부를 판별할 수 있다.
또한, 전술한 본 발명의 블록 머지 기술을 적용시, 현재 블록을 공간적 혹은 시간적으로 인접한 블록의 움직임 정보를 머지하여 사용함에 있어 병렬처리를 고려하여 머지 예측 영역 (MER: Merge Estimation Region)을 사용하는 방식을 예측부(230, 235)에 적용할 수 있다. 즉, 본 발명은 비디오 코딩 기술 중 화면 간 예측, 화면 내 예측, 성분 간 예측 등의 예측 기술에서 병렬처리를 고려하여 현재 블록의 공간적 혹은 시간적으로 인접한 블록을 구성하기 위한 병렬 예측 영역 (PER: Parallel Estimation Region)을 활용할 수 있다.
인터 예측부(230)는 영상 부호화기에서 제공된 현재 예측 단위의 인터 예측에 필요한 정보를 이용해 현재 예측 단위가 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 단위에 대한 인터 예측을 수행할 수 있다. 인터 예측을 수행하기 위해 부호화 단위를 기준으로 해당 부호화 단위에 포함된 예측 단위의 움직임 예측 방법이 스킵 모드(Skip Mode), 머지 모드(Merge 모드), AMVP 모드(AMVP Mode), 인트라 블록 카피 모드 중 어떠한 방법인지 여부를 판단할 수 있다.
인트라 예측부(235)는 현재 픽쳐 내의 화소 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 인트라 예측을 수행한 예측 단위인 경우, 영상 부호화기에서 제공된 예측 단위의 인트라 예측 모드 정보를 기초로 인트라 예측을 수행할 수 있다. 인트라 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 영상 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 화소에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.
참조 화소 보간부는 예측 단위의 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 정수값 이하의 화소 단위의 참조 화소를 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다.
복원된 블록 또는 픽쳐는 필터부(240)로 제공될 수 있다. 필터부(240)는 디블록킹 필터, 오프셋 보정부, ALF를 포함할 수 있다.
영상 부호화기로부터 해당 블록 또는 픽쳐에 디블록킹 필터를 적용하였는지 여부에 대한 정보 및 디블록킹 필터를 적용하였을 경우, 강한 필터를 적용하였는지 또는 약한 필터를 적용하였는지에 대한 정보를 제공받을 수 있다. 영상 복호화기의 디블록킹 필터에서는 영상 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고 영상 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다. ALF는 부호화기로부터 제공된 ALF 적용 여부 정보, ALF 계수 정보 등을 기초로 부호화 단위에 적용될 수 있다. 이러한 ALF 정보는 특정한 파라메터 셋에 포함되어 제공될 수 있다.
메모리(245)는 복원된 픽쳐 또는 블록을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽쳐를 출력부로 제공할 수 있다.
도 3은 하나의 선분을 이용한 임의 형태의 블록 분할 방법의 일 실시예이다.
도 3은 하나의 선분을 이용하여 하나의 블록을 2개의 서로 다른 임의 형태의 블록으로 분할하는 일 실시예를 도시한다.
도 3에서 하나의 블록(300)은 정방형 혹은 비정방형 블록으로 구성될 수 있다. 이때, 상기 정방형 혹은 비정방형 블록은 재귀적으로 다양한 트리 형태로 분할될 수 있으며, 쿼드-트리(Quad-tree) 블록 분할, 바이너리-트리(Binary-tree) 블록 분할, 및 터너리-트리(Ternary-tree) 블록 분할을 사용하여 분할될 수 있다.
도 3에서 도시한 하나의 블록은 블록의 원점을 기준으로 특정한 각도와 거리를 가지는 선분을 이용하여 서로 다른 2개의 임의 형태의 블록들로 분할될 수 있다. 이때, 블록의 원점을 기준으로 선분을 나타내기 위한 파라미터인 각도와 거리를 블록 단위로 시그널링할 수 있다.
도 4는 정방형 및 직방형 블록 분할과 좌, 우 대각선 선분을 이용하여 생성 가능한 다양한 임의 블록 분할의 예제를 나타낸 도면이다.
도 4에서는 다양한 트리 타입을 이용하는 블록 분할 구조에서, 좌 또는 우 대각선 선분만을 이용하여 다양한 임의의 형태로 블록을 분할 할 수 있는 예시를 도시한다.
도 4에서 400 블록은 최초 쿼드-트리 블록 분할을 이용하여 410, 420, 430, 440 블록으로 4분할된다. 이후, 쿼드-트리 블록 분할로 분할된 블록 중 제 1블록인 410 블록은 추가적인 하위 트리 블록 분할을 사용하지 않고, 본 발명에서 제안하는 대각선 선분을 이용하여 2개의 삼각형 형태의 블록으로 분할된 예시를 나타낸다. 이때, 410 블록은 블록의 우측 상단과 좌측 하단을 잇는 대각선을 이용하여 블록이 분할됨을 나타낸다.
도 4에서는 쿼드-트리 블록 분할로 분할된 블록 중 제2 블록인 420 블록은 추가적인 하위 트리 블록 분할로 쿼드-트리 블록 분할을 이용하여 421, 422, 423, 424 블록으로 4분할 된다. 이때, 420 블록의 제1 하위 블록인 421 블록은 추가적인 하위 트리 블록 분할을 사용하지 않고, 본 발명에서 제안하는 대각선 선분을 이용하여 2개의 삼각형 형태의 블록으로 분할된 예시를 나타낸다. 이때, 421 블록은 블록의 좌상단과 우하단을 잇는 대각선을 이용하여 블록이 분할됨을 나타낸다.
상기 제2 블록인 420 블록의 하위 블록 중 제4 블록인 424 블록은 다시 바이너리-트리 블록 분할을 이용하여 2개의 비정방형 블록들(425, 426)으로 분할됨을 나타낸다. 이때, 425 블록은 본 발명에서 제안하는 대각선 선분을 이용하여 2개의 삼각형 형태의 블록으로 분할된 일 실시예를 나타내며, 좌상단과 우하단을 잇는 대각선을 이용하여 블록이 분할됨을 보인다.
도 4에서 쿼드-트리 블록 분할로 분할된 블록 중 제3 블록인 430 블록은 추가적인 하위 트리 블록 분할로 바이너리-트리 블록 분할을 이용하여 431, 432 블록으로 2분할 된다.
이 중, 430 블록의 제2 하위 블록인 432 블록은 추가적인 하위 트리 블록 분할을 사용하지 않고, 본 발명에서 제안하는 대각선 선분을 이용하여 2개의 삼각형 형태의 블록으로 분할된 일 실시예를 나타내며, 우상단과 좌하단을 잇는 대각선을 이용하여 블록이 분할됨을 보인다.
도 4에서 쿼드-트리 블록 분할로 분할된 블록 중 제4 블록인 440 블록은 추가적인 하위 트리 블록 분할로 바이너리-트리 블록 분할을 이용하여 441, 441 블록으로 2분할 된다. 이 중, 440 블록의 제1 하위 블록인 441 블록은 추가적인 하위 트리 블록 분할로 바이너리-트리 블록 분할을 이용하여 443, 444 블록으로 분할되고, 이 중 443 블록은 터너리-트리 블록 분할을 이용하여 445, 446, 447 블록으로 분할됨을 보인다. 이때, 터너리-트리 블록 분할을 이용하여 분할된 블록 중 447 블록에서는 좌상단과 우하단을 잇는 대각선을 이용하여 블록이 2개의 삼각형 형태의 블록으로 분할된 예시를 나타낸다.
도 4에서 도시한 일 실시예를 바탕으로 설명한 바와 같이, 본 발명에서 제안하는 좌상단과 우하단을 잇는 대각선과 우상단과 좌하단을 잇는 대각선으로 구성되는 두 종류의 대각선만을 이용하더라도, 쿼드-트리 블록 분할 구조, 바이너리-트리 블록 분할 구조, 및 터너리-트리 블록 분할 구조와 같이 다양한 블록 분할 구조가 함께 사용되는 경우, 도 3에서 도시한 다양한 각도와 거리를 사용하는 임의의 블록 분할 형태와 같이 임의의 블록 분할 형태를 표현하는 것이 가능하다.
도 5는 본 발명에서 제안하는 두 종류의 대각선을 이용하여 정방형 혹은 비정방형 블록을 삼각형 형태로 분할하는 방법을 보여준다.
도 5의 (a)는 블록의 좌상단과 우하단을 잇는 대각선을 이용하여 정방형 혹은 비정방형 블록을 2개의 삼각형 블록으로 분할하는 예시를 도시한다.
도 5의 (b)는 블록의 우상단과 좌하단을 잇는 대각선을 이용하여 정방형 혹은 비정방형 블록을 2개의 삼각형 블록으로 분할하는 예시를 도시한다.
도 5의 (a)와 (b)에서 분할된 2개의 삼각형 블록들은 위치에 따라 제1 파티션과 제2 파티션으로 지칭될 수 있다.
도 5의 (a)에서, 블록의 좌상단과 우하단을 잇는 대각선은, 블록의 좌상단 위치를 원점으로 하여 수학식 1과 같이 표현될 수 있다.
[수학식 1]
f(x,y) = w*y - h*x
수학식 1에서, w는 block의 width, h는 block의 height를 의미한다.
도 5의 (b)에서, 블록의 우상단과 좌하단을 잇는 대각선은, 블록의 좌상단 위치를 원점으로 하여 수학식 2와 같이 표현될 수 있다.
[수학식 2]
f(x,y) = w*(h-y) - h*x
수학식 2에서 w는 block의 width, h는 block의 height를 의미한다.
전술한 대각선 움직임 분할을 위해, 하나의 부호화 유닛(CU: coding unit)에 대하여 대각선 움직임 분할이 수행되는지를 나태는 플래그가 이용될 수 있다. 예를 들어, 상기 플래그가 제1 값인 경우, 대각선 움직임 분할이 수행되고, 그렇지 않은 경우, 대각선 움직임 분할이 수행되지 않을 수 있다.
상기 플래그는 부호화 장치에서 부호화되어 시그날링되거나, 소정의 부호화 파라미터에 기반하여 복호화 장치에서 유도될 수 있다. 여기서, 부호화 파라미터는, 슬라이스 타입, 인터 모드의 타입, 블록 크기/형태, 블록의 너비와 높이의 비(ratio) 등을 포함할 수 있다.
예를 들어, 현재 블록이 속한 슬라이스 타입이 B 슬라이스인 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 또는, 현재 블록의 인터 모드가 머지 모드인 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 또는, 현재 블록의 너비 또는 높이 중 적어도 하나가 소정의 문턱크기보다 크거나 같은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱크기는, 4, 8, 16 또는 그 이상일 수 있다. 또는, 현재 블록에 속한 샘플의 개수(W*H)가 소정의 문턱개수보다 크거나 같은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱개수는, 32, 64 또는 그 이상일 수 있다. 또는, 현재 블록의 너비와 높이의 비가 소정의 문턱값보다 작은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱값은, 4, 8 또는 그 이상일 수 있다.
상기 플래그가 대각선 움직임 분할이 수행됨을 나타내는 경우, 대각선 움직임 분할의 방향 정보가 시그널링될 수 있다. 상기 방향 정보가 제1 값인 경우, 현재 블록은 좌상단과 우하단을 잇는 대각선을 기반으로 분할되고, 그렇지 않은 경우, 현재 블록은 우상단과 좌하단을 잇는 대각선을 기반으로 분할될 수 있다.
상기 대각선 움직임 분할을 위한 정보는 현재 블록의 모드 정보에 따라 시그널링되지 않을 수도 있다. 이때, 상기 현재 블록의 모드 정보가 인트라 예측 모드인 경우에는 시그널링되지 않는 것을 포함한다.
또한, 상기 대각선 움직임 분할을 위한 정보는 현재 블록의 크기 정보에 따라 시그널링되지 않을 수 있다. 상기 현재 블록의 크기 정보는 너비 또는 높이의 크기, width와 height의 비율, 너비와 높이의 곱 등으로 정의될 수 있다. 예를 들어, 현재 블록의 너비 또는 높이가 8보다 작은 경우, 현재 블록은 대각선 움직임 분할을 사용하지 않을 수 있다.
또는, 추가적인 실시예로, 현재 블록의 너비 또는 높이가 8보다 작거나 현재 블록의 너비와 높이의 비율이 특정한 비율 이상인 경우에는 대각선 움직임 분할을 사용하지 않을 수 있다. 상기 특정한 비율이라 함은, 너비와 높이의 비율이 1:3 혹은 3:1 보다 큰 경우(e.g., 1:4 또는 4:1, 1:8 또는 8:1), 현재 블록은 대각선 움직임 분할을 사용하지 않을 수 있다. 그러한 경우에는 대각선 움직임 분할 정보가 시그널링되지 않으며, 해당 syntax를 파싱하지도 않는다.
도 6은 본 발명에서 제안하는 마스크 기반 움직임 예측 및 보상을 위한 마스크의 일 실시예 중에서 원 혹은 타원 형태의 분할에 관한 마스크의 개념을 도시한 도면이다.
도 6에서는 본 발명에서 제안하는 마스크 기반 움직임 예측 및 보상을 위한 마스크의 일 실시예로서, 원 혹은 타원의 일부가 포함된 형태의 마스크를 이용하여 하나의 블록을 2개의 서로 다른 영역으로 분할할 수 있음을 도시한다.
상기 원 혹은 타원 형태의 분할의 경우, 분할의 경계에서 가중치를 조절하여 경계를 스무딩할 수 있으며, 후술하는 가중 예측 방법이 동일/유사하게 적용될 수 있다.
본 발명의 일 실시예에 따르면, 현재 블록의 공간적 혹은 시간적으로 인접한 블록의 움직임 정보를 이용하여 참조 픽쳐 내 대응 블록(corresponding block)을 선정하고, 해당 대응 블록의 화소 구성을 기반으로 마스크의 형태를 결정할 수 있다.
이때, 상기 대응 블록의 화소 구성을 이용하는 것은, 블록 내부의 엣지를 검출하고, 엣지를 기준으로 블록을 분할하도록 마스크를 구성하는 것을 의미할 수 있다.
도 7은, 대각선 움직임 분할을 사용하는 경우 해당 블록의 부호화 정보를 저장하는 형태를 도시한 도면이다.
도 7을 참조하면, 대각선 움직임 분할을 사용하는 경우, 해당 블록의 부호화 정보를 저장함에 있어서, 대각선으로 분할된 형태가 아닌, 수평 방향 또는 수직 방향 중 적어도 하나로 블록을 분할하여 부호화 정보를 저장할 수 있다.
또는, 대각선 움직임 분할을 사용하는 경우, 해당 블록의 부호화 정보를 저장함에 있어서 대각선으로 분할된 형태로 저장할 수도 있다. 하지만, 다수의 비디오 코딩 방법 및 장치에서는, 부호화 정보를 화소 단위로 저장하지 않고, 4x4 블록 혹은 8x8 블록과 같이 특정한 크기의 블록 단위로 움직임 정보 등의 부호화 정보를 저장한다. 이와 같이 저장된 부호화 정보는 현재 블록 이후에 부호화/복호화되는 블록의 참조 정보로 사용될 수 있다.
또한, 좌측 대각선(좌상단과 우하단을 잇는 대각선)을 이용한 분할의 경우, 제1 파티션은 현재 블록의 우상단 위치를 기반으로 참조되고, 제2 파티션은 현재 블록의 좌하단 위치를 기반으로 참조될 수 있다.
반면, 우측 대각선(우상단과 좌하단을 잇는 대각선)을 이용한 분할의 경우, 제1 파티션은 현재 블록의 좌상단 위치를 기반으로 참조되고, 제2 파티션은 현재 블록의 우하단 위치를 기반으로 참조될 수 있다.
본 발명의 일 실시 예에 따르면, 제1 파티션과 제2 파티션의 움직임 벡터를 움직임 벡터 버퍼에 저장함에 있어서, 추가적인 움직임 벡터 저장 과정을 포함할 수 있다. 또한, 움직임 벡터 버퍼에서 움직임을 추출하는 과정에서는 예측 방향을 유추하는 과정이 포함될 수 있다.
제1 파티션과 제2 파티션이 각각 단방향 예측을 수행한 경우, 각 파티션은 L0 혹은 L1 방향의 움직임 벡터만을 가질 수 있다. 이때, 상기 추가적인 움직임 벡터 저장 과정이라 함은, 각 파티션의 움직임 벡터를 이용하여 양방향 예측을 위한 움직임 벡터를 구성하는 과정을 의미할 수 있다. 양방향 예측을 위한 움직임 벡터는, L0 방향의 움직임 벡터와 L1 방향의 움직임 벡터를 포함한다. 이때, 움직임 벡터 예측에 대한 시그널링 정보로부터 각 파티션의 예측 방향을 유추하는 과정이 포함될 수 있다.
제1 파티션과 제2 파티션이 동일한 예측 방향을 가진 경우, 제1 파티션은 L0 방향의 움직임 벡터로 강제하고, 제2 파티션은 L1 방향의 움직임 벡터로 강제하여 움직임 벡터 버퍼에 저장할 수 있다. 또는, 역으로, 제1 파티션은 L1 방향의 움직임 벡터로 강제하고, 제2 파티션은 L0 방향의 움직임 벡터로 강제하여 움직임 벡터 버퍼에 저장할 수 있다. L0 방향의 움직임 벡터로 강제하는 것이라 함은, 해당 파티션의 움직임 벡터가 L0 방향인 경우에는 그대로 사용하고, 그렇지 않은 경우에는 L1 방향의 움직임 벡터를 L0 방향의 움직임 벡터로 변경하는 것을 의미한다. 상기 변경은, 움직임 벡터의 (x,y) 좌표 값을 원점을 기준으로 반전시키는 과정 또는 소정의 부호화 파라미터(e.g., 참조 픽쳐 인덱스, 참조 픽쳐의 POC 정보)를 이용하여 스케일링하는 과정 중 적어도 하나를 포함할 수 있다. 단, 상기 양방향 움직임 벡터로 강제함에 있어서, 현재 슬라이스가 양방향 예측을 지원하지 않는 슬라이스인 경우, 후술하는 단방향 움직임 벡터 정보 저장 방법을 사용할 수 있다.
상기 움직임 벡터 예측에 대한 시그널링 정보라 함은, 어떠한 움직임 벡터 예측 리스트에서 제1 파티션과 제2 파티션이 어떠한 움직임 벡터 예측치(mvp)를 이용하는지에 대한 정보를 의미할 수 있다. 상기 움직임 벡터 예측에 대한 시그널링 정보는 인덱스 형태로 전송되는 정보를 포함할 수 있으며, 움직임 벡터 예측 후보들에서 제1 파티션과 제2 파티션이 어떤 예측 후보를 이용하는지에 대한 정보를 의미할 수 있다. 또한, 하나의 인덱스 정보를 이용하여 현재 블록의 분할 형태와 제1 파티션과 제2 파티션 모두에 대응하는 움직임 벡터 예측 후보를 결정하는 것을 포함한다. 이와 더불어, 시그널링된 하나의 인덱스 정보를 이용하여 상기 움직임 벡터 예측 후보를 그대로 사용하는 방법이 사용될 수 있으며, 시그널링된 하나의 인덱스 정보와 이에 대응하는 움직임 벡터 예측 후보와의 움직임 벡터 차분을 추가로 시그널링하는 방법 또한 사용될 수 있다.
상기 움직임 벡터 예측 후보를 그대로 사용하는 방법은, SKIP 모드 혹은 머지 모드를 포괄하여 지칭할 수 있으며, 상기 움직임 벡터 예측 후보와의 움직임 벡터 차분을 추가로 시그널링하는 방법은 움직임 벡터 예측 모드(AMVP 모드)를 포괄하여 지칭할 수 있다.
이때, 상기 움직임 벡터 차분은 제1 파티션과 제2 파티션에 대하여 각각 전송되거나, 혹은 제1 파티션과 제2 파티션을 하나의 양방향 차분 움직임 벡터로 구성하여 전송할 수도 있다.
상기 제1 파티션과 제2 파티션의 움직임 벡터를 저장함에 있어서, 현재 슬라이스가 양방향 예측을 허용하지 않는 슬라이스인 경우에는 하나의 블록을 이분할하여 저장할 수 있다. 이때, 현재 블록의 크기 정보를 고려하여 현재 블록에 대응하는 움직임 벡터 버퍼를 이분할하고, 이분할된 버퍼에 제1 파티션과 제2 파티션의 움직임 벡터를 각각 저장할 수 있다. 예를 들어, 현재 블록에 대응하는 움직임 벡터 버퍼의 너비와 높이를 이분할하여 일부 버퍼에는 제1 파티션의 움직임 벡터를 저장하고, 나머지 일부 버퍼에는 제2 파티션의 움직임 벡터를 저장할 수 있다. 본 발명의 일 실시예로 현재 블록이 16x8 블록의 경우, 현재 블록을 2개의 8x8 블록으로 분할하고, 제1 파티션의 움직임 벡터와 제2 파티션의 움직임 벡터를 대응하는 움직임 벡터 버퍼에 각각 저장할 수 있다. 상기 일 실시예와 같이, NxM 블록에 대하여 N과 M의 크기를 비교할 수 있다. N이 큰 경우에는 N을 이분할하고, 각 파티션에 대응하는 움직임 벡터 버퍼에 움직임 벡터를 저장할 수 있다. 반면, M이 큰 경우에는 M을 이분할하고, 각 파티션에 대응하는 움직임 벡터 버퍼에 움직임 벡터를 저장할 수 있다.
또는, 현재 블록은 복수의 n*m 서브 블록으로 구성될 수 있다. 여기서, 서브 블록은 움직임 벡터를 저장하는 단위를 의미할 수 있다. n과 m은 4 또는 8일 수 있다. n과 m은 부호화/복호화 장치에 기-약속된 고정된 값일 수도 있고, 현재 블록의 크기/형태에 종속적으로 결정될 수도 있다. 상기 서브 블록은 정방형일 수도 있고, 비정방형일 수도 있다. 상기 현재 블록은, 제1 파티션(PART_0)에만 속하는 서브 블록(이하, 제1 영역이라 함), 제2 파티션(PART_1)에만 속하는 서브 블록(이하, 제2 영역이라 함) 및 대각선 상에 위치한 서브 블록(이하, 제3 영역이라 함)을 포함할 수 있다.
이때, 상기 제1 영역에는 제1 파티션의 움직임 벡터가 저장되고, 상기 제2 영역에는 제2 파티션의 움직임 벡터가 저장될 수 있다. 전술한 바와 같이, 각 파티션은 단방향 예측의 움직임 벡터만을 가질 수 있다.
한편, 상기 제3 영역에는 양방향 예측의 움직임 벡터(mvL0, mvL1)가 저장될 수 있다. 여기서, 양방향 예측의 움직임 벡터는, 제1 파티션의 움직임 벡터(mv1)와 제2 파티션의 움직임 벡터(mv2)의 조합으로 생성될 수 있다. 예를 들어, mv1와 mv2 중 L0 방향의 움직임 벡터를 mvL0에 할당하고, mv1와 mv2 중 L1 방향의 움직임 벡터를 mvL1에 할당할 수 있다. 다만, 이는 제1 파티션과 제2 파티션의 예측 방향이 서로 상이한 경우를 전제로 한다.
(실시예 1) 다만, 제1 파티션과 제2 파티션의 예측 방향이 서로 동일한 경우, 상기 제3 영역에는 제1 파티션의 움직임 벡터(mv1) 또는 제2 파티션의 움직임 벡터(mv2) 중 어느 하나가 선택적으로 저장될 수 있다.
예를 들어, 현재 블록의 분할 타입에 따라 제1 파티션의 움직임 벡터(mv1) 또는 제2 파티션의 움직임 벡터(mv2) 중 어느 하나가 선택적으로 저장될 수 있다. 즉, 현재 블록이 좌측 대각선으로 분할되는 경우, 상기 제3 영역에는 제1 파티션의 움직임 벡터(mv1)가 저장되고, 그렇지 않은 경우, 상기 제3 영역에는 제2 파티션의 움직임 벡터(mv2)가 저장될 수 있다. 역으로 현재 블록이 좌측 대각선으로 분할되는 경우, 상기 제3 영역에는 제2 파티션의 움직임 벡터(mv2)가 저장되고, 그렇지 않은 경우, 상기 제3 영역에는 제1 파티션의 움직임 벡터(mv1)가 저장될 수 있다.
또는, 현재 블록의 분할 타입에 관계없이, 상기 제3 영역에는 제1 파티션의 움직임 벡터(mv1)만이 저장되도록 강제되거나, 제2 파티션의 움직임 벡터(mv1)만이 저장되도록 강제될 수도 있다.
또는, 제1 파티션 및/또는 제2 파티션의 부호화 정보 또는 현재 블록의 분할 타입 중 적어도 하나를 고려하여 상기 제3 영역에 저장하는 움직임 벡터를 결정할 수도 있다. 이때, 상기 부호화 정보는 참조 픽쳐 인덱스, 병합 후보 인덱스, 벡터의 크기 값 등일 수 있다.
예를 들어, 제1 파티션의 참조 픽쳐 인덱스(refIdx1)과 제2 파티션의 참조 픽쳐 인덱스(refIdx2) 중 최소값에 대응하는 파티션의 움직임 벡터를 선택적으로 저장할 수 있다. 역으로 두 참조 픽쳐 인덱스 중 최대값에 대응하는 파티션의 움직임 벡터가 선택적으로 저장될 수 있다. 이때, 제1 파티션의 참조 픽쳐 인덱스(refIdx1)과 제2 파티션의 참조 픽쳐 인덱스(refIdx2)가 동일한 경우에는 상기 대각선 분할 방향에 따라 제1 파티션 또는 제2 파티션 중 어느 하나의 움직임 벡터를 저장하는 과정이 수행될 수 있다. 또한, 제1 파티션의 참조 픽쳐 인덱스(refIdx1)과 제2 파티션의 참조 픽쳐 인덱스(refIdx2)가 동일한 경우, 병합 후보 인덱스의 대소 비교 등과 같이, 부호화 정보를 이용하여 선택적으로 저장하는 과정이 수행될 수도 있다.
(실시예 2) 제1 파티션과 제2 파티션의 예측 방향이 서로 동일한 경우, 예측 방향을 변환하는 과정이 더 수행될 수 있다. 예를 들어, 제1 파티션과 제2 파티션 둘다 L0 예측인 경우, 2개의 L0 방향의 움직임 벡터 중 어느 하나를 mvL0에 할당하고, 다른 하나를 mvL1에 할당할 수 있다. 또는, 제1 파티션과 제2 파티션 둘다 L1 예측인 경우, 2개의 L1 방향의 움직임 벡터 중 어느 하나를 mvL1에 할당하고, 다른 하나를 mvL0에 할당할 수 있다. 이와 같이, 각 파티션의 예측 방향이 동일한 경우에도, 예측 방향의 변환을 통해 양방향 예측을 위한 움직임 벡터를 생성하고, 이를 제3 영역에 저장할 수 있다.
이하, 전술한 대각선 움직임 분할의 움직임 보상 방법에 대해서 살펴 보기로 한다. 후술하는 실시예는 현재 블록이 머지 모드로 부호화된 경우를 전제로 설명하나, 이는 인터 모드의 타입을 한정하는 것은 아니며, 이는 SKIP 모드, AMVP 모드, 어파인 모드 등에서도 동일/유사하게 적용될 수 있다.
도 8은 본 발명이 적용되는 일실시예로서, 머지 모드 기반의 인터 예측 방법을 도시한 것이다.
도 8을 참조하면, 현재 블록의 머지 후보 리스트를 구성할 수 있다(S800).
현재 블록은 도 3 내지 도 6에서 살펴본 블록 분할 방법 중 적어도 하나를 통해 결정될 수 있다. 현재 블록은 정방형 또는 비정방형의 형태를 가질 수 있다. 현재 블록은 대각 분할을 통해 2개의 파티션으로 분할될 수 있다. 2개의 파티션 중 적어도 하나는 삼각 파티션(triangular partition)일 수 있다.
머지 후보 리스트(merge candidate list)는, 현재 블록의 공간적 머지 후보 또는 시간적 머지 후보 중 적어도 하나를 포함할 수 있다.
공간적 머지 후보의 움직임 정보는, 현재 블록의 공간적 이웃 블록의 움직임 정보로부터 유도될 수 있다. 여기서, 공간적 이웃 블록은, 현재 블록과 동일한 픽쳐에 속하는 블록으로서, 현재 블록에 인접한 블록을 의미할 수 있다. 공간적 이웃 블록은, 현재 블록의 좌측, 상단, 우상단, 좌하단 또는 좌상단 중 적어도 하나에 인접한 블록을 포함할 수 있다. 좌상단 이웃 블록은, 좌측, 상단, 우상단 및 좌하단에 인접한 블록 중 적어도 하나가 가용하지 않은 경우에 한하여 이용될 수 있다.
시간적 머지 후보의 움직임 정보는, 현재 블록의 시간적 이웃 블록의 움직임 정보로부터 유도될 수 있다. 시간적 이웃 블록은, 현재 블록과 다른 픽쳐에 속하는 블록으로서, 현재 블록과 동일 위치의 블록으로 정의될 수 있다. 여기서, 동일 위치의 블록은, 현재 블록의 우하단 코너에 인접한 블록(BR), 현재 블록의 중앙 샘플의 위치를 포함한 블록(CTR) 또는 현재 블록의 좌상단 샘플의 위치를 포함한 블록(TL) 중 적어도 하나를 의미할 수 있다.
또는, 동일 위치의 블록은, 현재 블록의 좌상단 샘플의 위치에서 소정의 변이 벡터(disparity vector)만큼 쉬프트된 위치를 포함한 블록을 의미할 수도 있다. 여기서, 변이 벡터는, 전술한 공간적 이웃 블록의 움직임 벡터 중 어느 하나에 기초하여 결정될 수 있다. 예를 들어, 변이 벡터는, 좌측 이웃 블록의 움직임 벡터로 설정될 수도 있고, 상단 이웃 블록의 움직임 벡터로 설정될 수도 있다. 또는, 변이 벡터는, 전술한 공간적 이웃 블록의 움직임 벡터 중 적어도 2개의 조합에 기초하여 결정될 수 있다. 상기 조합은, 최대값, 최소값, 중간값, 가중 평균값 등의 연산 과정을 포함할 수 있다. 예를 들어, 변이 벡터는, 좌측 이웃 블록의 움직임 벡터와 좌하단 이웃 블록의 움직임 벡터 간의 중간값 또는 평균값으로 설정될 수 있다.
시간적 머지 후보의 움직임 벡터와 참조 픽쳐 인덱스는, 전술한 시간적 이웃 블록의 움직임 벡터와 참조 픽쳐 인덱스로 각각 유도될 수 있다. 또는, 시간적 머지 후보의 움직임 벡터는 시간적 이웃 블록의 움직임 벡터로 유도되고, 시간적 머지 후보의 참조 픽쳐 인덱스는 시간적 이웃 블록과 관계없이 복호화 장치에 기-약속된 디폴트 값(e.g., 0)으로 설정될 수 있다.
공간적/시간적 머지 후보를 기반으로 머지 후보 리스트를 생성하는 방법에 대해서는 도 9 및 도 10을 참조하여 자세히 살펴 보기로 한다.
머지 후보 리스트는, 조합 머지 후보(combined merge candidate) 또는 제로 움직임 벡터를 가진 머지 후보 중 적어도 하나를 더 포함할 수 있다.
조합 머지 후보는, 기-생성된 머지 후보 리스트에 속한 n개의 머지 후보를 조합하여 유도될 수 있다. 여기서, n은 2, 3, 4 또는 그 이상의 정수일 수 있다. 조합 대상인 머지 후보의 개수(n)는 부호화/복호화 장치에 기-약속된 고정된 값일 수도 있고, 부호화 장치에서 부호화되어 시그날링될 수도 있다. 상기 시그날링은, 시퀀스, 픽쳐, 슬라이스, 타일, 서브-타일(브릭, brick) 또는 소정의 블록 중 적어도 하나의 단위에서 수행될 수 있다. 조합 대상인 머지 후보의 개수(n)는, 잔여 머지 후보의 개수에 기반하여 가변적으로 결정될 수도 있다. 여기서, 잔여 머지 후보의 개수는, 머지 후보 리스트에 포함 가능한 머지 후보의 최대 개수와 머지 후보 리스트에 속한 머지 후보의 현재 개수 간의 차이를 의미할 수 있다. 상기 최대 개수는 부호화/복호화 장치에 기-약속된 개수이거나, 부호화 장치에서 부호화되어 시그날링될 수 있다. 상기 현재 개수는, 조합 머지 후보를 추가하기 전까지 구성된 머지 후보의 개수를 의미할 수 있다. 예를 들어, 잔여 머지 후보의 개수가 1인 경우, 2개의 머지 후보가 이용되고, 잔여 머지 후보의 개수가 1보다 큰 경우, 3개 또는 그 이상의 머지 후보가 이용될 수 있다.
상기 n개의 머지 후보의 위치는, 머지 후보 리스트에서 기-결정된 위치일 수 있다. 예를 들어, 머지 후보 리스트에 속한 머지 후보 별로 인덱스(0 내지 (k-1))가 할당될 수 있다. 여기서, k는 머지 후보 리스트에 속한 머지 후보의 총 개수를 의미할 수 있다. 이때, n개의 머지 후보의 위치는, 머지 후보 리스트에서 인덱스 0 내지 인덱스 (n-1)에 대응될 수 있다. 예를 들어, n=2인 경우, 조합 대상인 머지 후보는 머지 후보 리스트에서 첫번째 머지 후보(인덱스=0)와 두번째 머지 후보(인덱스=1)만을 이용하여 유도될 수 있다.
또는, 상기 n개의 머지 후보는, 머지 후보 리스트에 속한 각 머지 후보의 예측 방향을 고려하여 결정될 수 있다. 예를 들어, 머지 후보 리스트에 속한 머지 후보 중에서, 양방향 예측인 머지 후보만을 선택적으로 이용하거나, 단방향 예측인 머지 후보만을 선택적으로 이용할 수 있다.
조합 머지 후보는, 공간적 머지 후보와 시간적 머지 후보를 모두 이용하여 유도될 수도 있고, 공간적 머지 후보 또는 시간적 머지 후보 중 어느 하나만을 이용하여 유도될 수도 있다.
상기 조합 머지 후보는, 머지 후보 리스트에서 공간적/시간적 머지 후보 이후에 추가될 수 있다. 즉, 조합 머지 후보의 인덱스는 공간적/시간적 머지 후보의 인덱스보다 클 수 있다. 또는, 상기 조합 머지 후보는, 머지 후보 리스트에서 공간적 머지 후보와 시간적 머지 후보 사이에 추가될 수도 있다. 즉, 조합 머지 후보의 인덱스는 공간적 머지 후보의 인덱스보다 크고, 시간적 머지 후보의 인덱스보다 작을 수 있다. 또는, 조합 머지 후보의 위치는, 조합 머지 후보의 예측 방향을 고려하여 가변적으로 결정될 수도 있다. 조합 머지 후보의 예측 방향이 양방향 예측인지 여부에 따라, 머지 후보 리스트 내에서 조합 머지 후보의 위치가 재배열될 수 있다. 예를 들어, 조합 머지 후보가 양방향 예측인 경우, 공간적 또는 시간적 머지 후보보다 작은 인덱스가 할당될 수 있고, 그렇지 않은 경우, 공간적 또는 시간적 머지 후보보다 큰 인덱스가 할당될 수 있다.
이하, 설명의 편의를 위해 2개의 머지 후보를 기반으로 조합 머지 후보를 유도하는 방법을 살펴 보기로 한다.
조합 머지 후보의 움직임 정보는, 제1 머지 후보와 제2 머지 후보의 움직임 정보를 가중 평균하여 유도될 수 있다. 예를 들어, 조합 머지 후보의 LX 방향의 움직임 정보는, 제1 머지 후보의 LX 방향의 움직임 정보와 제2 머지 후보의 LX 방향의 움직임 정보를 가중 평균하여 유도될 수 있다(X=0 또는 1). 다만, 조합 머지 후보의 LX 방향의 참조 픽쳐 인덱스는 제1 머지 후보 또는 제2 머지 후보 중 어느 하나의 LX 방향의 참조 픽쳐 인덱스로 유도될 수 있다. 예를 들어, 조합 머지 후보의 LX 방향의 참조 픽쳐 인덱스는 제1 머지 후보의 LX 방향의 참조 픽쳐 인덱스만을 이용하여 유도될 수 있다. 여기서, 제1 머지 후보는 제2 머지 후보보다 작은 인덱스를 가진 것일 수 있다.
상기 가중 평균의 가중치는 [1:1], [1:2], [1:3] 또는 [2:3]이나, 이에 한정되지 아니한다. 상기 가중치는, 부호화/복호화 장치에 기-정의된 것일 수도 있고, 복호화 장치에서 유도될 수도 있다. 이때, 가중치는, 현재 픽쳐와 머지 후보의 참조 픽쳐 간의 거리 또는 머지 후보의 예측 방향 중 적어도 하나를 고려하여 유도될 수 있다.
또는, 조합 머지 후보의 L0 방향의 움직임 정보는 제1 머지 후보의 L0 방향의 움직임 정보로부터, L1 방향의 움직임 정보는 제2 머지 후보의 L1 방향의 움직임 정보로부터 각각 유도될 수 있다. 역으로, 조합 머지 후보의 L0 방향의 움직임 정보는 제2 머지 후보의 L0 방향의 움직임 정보로부터, L1 방향의 움직임 정보는 제1 머지 후보의 L1 방향의 움직임 정보로부터 각각 유도될 수도 있다.
본 실시예에서, 전술한 움직임 정보는, 예측 방향 플래그, 참조 픽쳐 인덱스 또는 움직임 벡터 중 적어도 하나를 포함하며, 후술하는 실시예에서도 동일하게 해석될 수 있다.
도 8을 참조하면, 머지 후보 리스트로부터 현재 블록의 움직임 정보가 유도될 수 있다(S810).
구체적으로, 현재 블록의 머지 인덱스(merge index)가 시그날링될 수 있다. 머지 인덱스는, 머지 후보 리스트에 속한 복수의 머지 후보 중 어느 하나를 특정하기 위해 부호화된 정보일 수 있다. 상기 머지 인덱스는, 대각선 움직임 분할 기반의 움직임 보상이 수행되는지 여부를 나타내는 플래그에 기초하여 시그날링될 수 있다. 예를 들어, 상기 플래그가 대각선 움직임 분할 기반의 움직임 보상이 수행됨을 나타내는 경우(즉, 플래그가 제1 값인 경우), 상기 머지 인덱스가 시그날링되고, 그렇지 않은 경우, 상기 머지 인덱스는 시그날링되지 않을 수 있다. 상기 플래그는, 도 5에서 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.
상기 머지 인덱스는, 현재 블록의 제1 파티션과 제2 파티션 각각에 대해서 시그날링될 수 있다(실시예 1). 시그날링된 제1 파티션의 머지 인덱스(mergeIdx1)와 동일한 인덱스를 가진 머지 후보의 움직임 정보를 이용하여 제1 파티션의 움직임 정보가 유도될 수 있다. 시그날링된 제2 파티션의 머지 인덱스(mergeIdx2)가 mergeIdx1보다 작은 경우, mergeIdx2와 동일한 인덱스를 가진 머지 후보의 움직임 정보를 이용하여 제2 파티션의 움직임 정보가 유도될 수 있다. 반면, mergeIdx2가 mergeIdx1보다 크거나 같은 경우, (mergeIdx2+1)과 동일한 인덱스를 가진 머지 후보의 움직임 정보를 이용하여 제2 파티션의 움직임 정보가 유도될 수 있다.
또는, 현재 블록에 대해서 하나의 머지 인덱스(mergeIdx)가 시그날링될 수도 있다(실시예 2). 즉, 현재 블록의 속한 제1 파티션과 제2 파티션은 시그날링된 mergeIdx를 공유할 수 있다. mergeIdx에 의해 특정된 머지 후보의 움직임 정보에 기초하여, 제1 및 제2 파티션의 움직임 정보가 유도될 수 있다.
예를 들어, mergeIdx에 의해 특정된 머지 후보가 양방향 예측인 경우, 해당 머지 후보는 L0 방향의 움직임 정보와 L1 방향의 움직임 정보를 가질 수 있다. 이 경우, 제1 파티션의 움직임 정보는, L0 방향의 움직임 정보와 L1 방향의 움직임 정보 중 어느 하나로 유도되고, 제2 파티션의 움직임 정보는 다른 하나로 유도될 수 있다. 반면, mergeIdx에 의해 특정된 머지 후보가 양방향 예측이 아닌 경우, 제1 파티션의 움직임 정보는, mergeIdx에 의해 특정된 머지 후보의 움직임 정보로 유도되고, 제2 파티션의 움직임 정보는, (mergeIdx+k)에 의해 특정된 머지 후보의 움직임 정보로 유도될 수 있다. 여기서, k는 1, 2, 3, 또는 그 이상의 절대값을 가진 정수일 수 있다.
또는, 제1 및 제2 파티션의 움직임 정보는, 머지 후보 리스트 내 기-약속된 머지 후보의 움직임 정보에 기초하여 유도될 수 있다(실시예 3). 이 경우, 머지 인덱스의 시그날링이 생략될 수 있다. 기-약속된 머지 후보는, 인덱스가 0인 머지 후보일 수 있다. 제1 및 제2 파티션의 움직임 정보는, 인덱스가 0인 머지 후보가 양방향 예측인지 여부를 고려하여 유도될 수 있으며, 이는 전술한 실시예 2에서 살펴본 바와 같다. 또는, 기-약속된 머지 후보는, 양방향 예측인 머지 후보 중 가장 작은 인덱스를 가진 머지 후보일 수 있다. 양방향 예측인 머지 후보는, 공간적/시간적 머지 후보 또는 조합 머지 후보 중 적어도 하나를 포함할 수 있다. 제1 및 제2 파티션의 움직임 정보는, 양방향 예측인 머지 후보의 움직임 정보에 기초하여 유도되며, 이 역시 전술한 실시예 2에서 살펴본 바와 같다.
전술한 실시예 1 내지 3 중 어느 하나에 기초하여 파티션 별 움직임 정보가 유도될 수도 있고, 실시예 1 내지 3 중 적어도 2개의 조합에 기초하여 파티션 별 움직임 정보가 유도될 수도 있다.
대각선 움직임 분할의 경우, 메모리 대역폭을 감소시키기 위하여 단방향 예측만을 수행하도록 제한될 수 있다.
대각 움직임 분할된 파티션의 머지 인덱스가 짝수인지 아니면 홀수인지를 고려하여, 해당 파티션이 단방향 예측만을 수행하도록 강제할 수 있다(실시예 4).
예를 들어, 제1 파티션의 머지 인덱스(mergeIdx1)가 짝수(e.g., 0, 2, 4, 6 등)인 경우, 제1 파티션의 움직임 정보는, mergeIdx1에 대응하는 머지 후보의 L0 방향의 움직임 정보를 이용하여 유도될 수 있다. 다만, mergeIdx1에 대응하는 머지 후보가 L0 방향의 움직임 정보를 가지고 있지 않을 수 있다. 이 경우, 제1 파티션의 움직임 정보는 해당 머지 후보의 L1 방향의 움직임 정보를 이용하여 유도될 수 있다. 반면, 제1 파티션의 머지 인덱스(mergeIdx1)가 홀수(e.g., 1, 3, 5 등)인 경우, 제1 파티션의 움직임 정보는, mergeIdx1에 대응하는 머지 후보의 L1 방향의 움직임 정보를 이용하여 유도될 수 있다. 다만, mergeIdx1에 대응하는 머지 후보가 L1 방향의 움직임 정보를 가지고 있지 않을 수 있다. 이 경우, 제1 파티션의 움직임 정보는 해당 머지 후보의 L0 방향의 움직임 정보를 이용하여 유도될 수 있다. 상기 머지 인덱스(mergeIdx1)는 부호화 장치에서 부호화되어 시그날링된 것일 수도 있고, 시그날링된 머지 인덱스에 기반하여 유도되거나, 복호화 장치에 기-약속된 것일 수도 있다. 제2 파티션의 움직임 정보는, 전술한 제1 파티션과 동일한 방법으로 유도될 수 있으며, 자세한 설명은 생략하기로 한다.
또는, 제1 파티션의 머지 인덱스(mergeIdx1)가 짝수(e.g., 0, 2, 4, 6 등)인 경우, 제1 파티션의 움직임 정보는 mergeIdx1에 대응하는 머지 후보의 L1 방향의 움직임 정보를 이용하여 유도되고, 그렇지 않은 경우, 제1 파티션의 움직임 정보는 mergeIdx1에 대응하는 머지 후보의 L0 방향의 움직임 정보를 이용하여 유도될 수도 있다.
또는, 대각선 움직임 분할된 파티션의 위치에 따라, 해당 파티션이 단방향 예측만을 수행하도록 강제할 수 있다(실시예 5).
예를 들어, 현재 블록의 제1 파티션은 머지 인덱스(mergeIdx1)에 의해 특정된 머지 후보의 L0 방향의 움직임 정보만을 참조하도록 강제되고, 제2 파티션은 머지 인덱스(mergeIdx2)에 의해 특정된 머지 후보의 L1 방향의 움직임 정보만을 참조하도록 강제될 수 있다. 다만, mergeIdx1에 의해 특정된 머지 후보가 L0 방향의 움직임 정보를 가지고 있지 않은 경우(즉, L1 예측인 경우), 해당 머지 후보의 L1 방향의 움직임 정보를 참조할 수 있다. 마찬가지로, mergeIdx2에 의해 특정된 머지 후보가 L1 방향의 움직임 정보를 가지고 있지 않은 경우(즉, L0 예측인 경우), 해당 머지 후보의 L0 방향의 움직임 정보를 참조할 수 있다.
전술한 실시예 4 또는 5 중 적어도 하나에 기초하여, 단방향 예측이 강제될 수 있으며, 이에 대해서는 도 11 내지 도 13을 참조하여 자세히 살펴 보도록 한다.
도 8을 참조하면, 유도된 움직임 정보를 이용하여 현재 블록의 인터 예측을 수행할 수 있다(S820).
현재 블록의 예측 화소는, 제1 파티션의 움직임 벡터에 의해 특정된 제1 참조 블록(PP0) 또는 제2 파티션의 움직임 벡터에 의해 특정된 제2 참조 블록(PP1) 중 하나를 이용하여 획득될 수 있다. 이때, 상기 예측 화소는, 제1 참조 블록 내 제1 화소와 제2 참조 블록 내 제2 화소에 소정의 가중치를 적용하여 획득될 수 있다. 여기서, 제1 화소와 제2 화소는 상기 예측 화소와 동일한 위치일 수 있다.
예를 들어, 본 발명에 따른 현재 블록의 예측 블록(PCUR)은 다음 수학식 3과 같이 획득할 수 있다.
[수학식 3]
PCUR(x,y) = (PP0(x,y) x MASKP0(x,y) + PP1(x,y) x MASKP1(x,y) + offset) >> shift
상기 PP0와 PP1은 서로 다른 움직임으로 예측된 예측 블록을 의미하고, MASKP0(x,y)와 MASKP1(x,y)는 (x,y) 좌표에서의 가중치를 나타내며, MASKP0(x,y)와 MASKP1(x,y)의 합은 2shift와 동일하여야 한다. offset은 0이거나, 2(shift-1)일 수 있다.
한편, 대각선 움직임 분할의 경우, 대각선 상에 위치한 화소 P(x1,y1)는, 제1 파티션 내 (x1,y1) 위치의 화소와 제2 파티션 내 (x1,y1) 위치의 화소를 가중합하여 예측될 수 있다. 마찬가지로, 상기 화소 P(x1,y1)의 주변 화소 P(x2,y2)는, 제1 파티션 내 (x2,y2) 위치의 화소와 제2 파티션 내 (x2,y2) 위치의 화소를 가중합하여 예측될 수 있다. 상기 가중 예측에 대해서는 도 14 내지 도 17을 참조하여 자세히 살펴 보기로 한다.
도 9는 좌측 대각선 움직임 분할을 사용하는 블록의 머지 후보를 도시한 것이다.
도 9에서는 좌측 대각선 움직임 분할을 사용하는 현재 블록 및 현재 블록에 공간적/시간적으로 인접한 블록을 도시한다. 도 9에서 현재 블록(900)은 좌측 대각선 움직임 분할을 사용하여 분할된 블록으로서, 제1 분할 블록(910)과 제2 분할 블록(920)으로 구성될 수 있다. 상기 제1 분할 블록(910)과 제2 분할 블록 (920)은 각각 독립적인 움직임 예측 및 움직임 보상을 수행하고, 현재 블록(900)에 대응하는 하나의 예측 블록을 생성할 수 있다.
상기 제1 분할 블록(910)과 제2 분할 블록(920)은 정방형 또는 비정방형의 현재 블록을 기준으로 생성된 머지 후보 리스트를 동일하게 사용할 수 있으며, 이는 도 8에서 살펴본 바와 같다.
또한, 현재 블록에 대각선 움직임 분할이 적용되는 경우, 상기 제1 분할 블록(910)과 제2 분할 블록(920)은 서로 다른 움직임 특성을 가지므로, 상기 제1 분할 블록(910)과 제2 분할 블록(920)은 서로 다른 움직임 예측 및 머지 후보를 사용할 수도 있다.
상기 제1 분할 블록(910)은 도 9에 도시된 바와 같이, 현재 블록(900)의 공간적 이웃 블록 중 좌측 이웃 블록(A0, A1)과는 상관성이 낮음을 확인할 수 있다. 이 경우, 제1 분할 블록(910)의 머지 후보 리스트를 구성함에 있어 A0, A1을 제외할 수 있다. 또한, 현재 블록(900)의 우하단 위치에 대응하는 시간적 이웃 블록(C0)의 움직임 정보와 현재 블록(900)의 우상단 위치에 대응하는 시간적 이웃 블록(C4)의 움직임 정보를 추가적인 머지 후보로 사용할 수 있다.
머지 후보 리스트를 구성함에 있어, 머지 후보의 최대 개수를 만족시키지 못하는 경우, 머지 후보 리스트에 포함된 머지 후보들을 조합하여 추가적인 머지 후보 리스트를 구성하고, 제로 움직임 벡터를 가진 머지 후보 또한 사용하여 머지 후보 리스트를 생성할 수 있다.
상기 제2 분할 블록(920)은 도 9에 도시된 바와 같이, 현재 블록(900)의 공간적 이웃 블록 중 상단 이웃 블록(B0, B1)과는 상관성이 낮음을 확인할 수 있다. 이 경우, 제2 분할 블록(920)의 머지 후보 리스트를 구성함에 있어 B0, B1을 제외할 수 있다. 또한, 현재 블록(900)의 우하단 위치에 대응하는 시간적 이웃 블록(C0)의 움직임 정보와 현재 블록(900)의 좌상단 위치에 대응하는 시간적 이웃 블록(C5)의 움직임 정보를 추가적인 머지 후보로 사용할 수 있다.
머지 후보 리스트를 구성함에 있어, 머지 후보의 최대 개수를 만족시키지 못하는 경우, 머지 후보 리스트에 포함된 머지 후보들을 조합하여 추가적인 머지 후보 리스트를 구성하고, 제로 움직임 벡터를 가진 머지 후보 또한 사용하여 머지 후보 리스트를 생성할 수 있다.
도 10은 우측 대각선 움직임 분할을 사용하는 블록의 머지 후보를 도시한 것이다.
도 10에서는 우측 대각선 움직임 분할을 사용하는 현재 블록 및 현재 블록에 공간적/시간적으로 인접한 블록을 도시한다. 도 10에서 현재 블록(1000)은 우측 대각선 움직임 분할을 사용하여 분할된 블록으로서, 제1 분할 블록 (1010)과 제2 분할 블록(1020)으로 구성될 수 있다. 상기 제1 분할 블록(1010)과 제2 분할 블록 (1020)은 각각 독립적인 움직임 예측 및 움직임 보상을 수행하고, 현재 블록 (1000)에 대응하는 하나의 예측 블록을 생성할 수 있다.
상기 제1 분할 블록(1010)과 제2 분할 블록(1020)은 정방형 또는 비정방형의 현재 블록을 기준으로 생성된 머지 후보 리스트를 동일하게 사용할 수 있으며, 이는 도 8에서 살펴본 바와 같다.
또한, 현재 블록에 대각선 움직임 분할이 적용되는 경우, 상기 제1 분할 블록(1010)과 제2 분할 블록(1020)은 서로 다른 움직임 특성을 가지므로, 상기 제1 분할 블록(1010)과 제2 분할 블록(1020)은 서로 다른 움직임 예측 및 머지 후보를 사용할 수도 있다.
상기 제1 분할 블록(1010)은 도 10에 도시된 바와 같이, 현재 블록(1100)의 공간적 이웃 블록 중 좌하단 이웃 블록(A0) 및 우상단 이웃 블록(B0)와는 상관성이 낮음을 확인할 수 있다. 이 경우, 제1 분할 블록(1010)의 머지 후보 리스트를 구성함에 있어 좌하단 및 우상단 이웃 블록(A0, B0)을 제외할 수 있다. 또한, 현재 블록(1000)의 중심 위치를 기준으로 좌상단에 위치한 시간적 이웃 블록(C2)의 움직임 정보와 현재 블록(1000)의 좌상단 위치에 대응하는 시간적 이웃 블록(C3)의 움직임 정보를 추가적인 머지 후보로 사용할 수 있다.
머지 후보 리스트를 구성함에 있어, 머지 후보의 최대 개수를 만족시키지 못하는 경우, 머지 후보 리스트에 포함된 머지 후보들을 조합하여 추가적인 머지 후보 리스트를 구성하고, 제로 움직임 벡터를 가진 머지 후보 또한 사용하여 머지 후보 리스트를 생성할 수 있다.
상기 제2 분할 블록(1020)은 도 10에 도시된 바와 같이, 현재 블록(1000)의 공간적 이웃 블록 중 좌측 이웃 블록(A1), 상단 이웃 블록(B1), 및 좌상단 이웃 블록(B2)과는 상관성이 낮음을 확인할 수 있다. 이 경우, 제2 분할 블록(1020)의 머지 후보 리스트를 구성함에 있어 A1, B1, 및 B2를 제외할 수 있다. 또한, 현재 블록(1000)의 우하단 위치에 대응하는 시간적 이웃 블록(C0)의 움직임 정보, 현재 블록(1000)의 중심 위치에 대응하는 시간적 이웃 블록(C1) 및 현재 블록(1000)의 우하단 위치에 대응하는 시간적 이웃 블록(C6)의 움직임 정보를 추가적인 머지 후보로 사용할 수 있다.
머지 후보 리스트를 구성함에 있어, 머지 후보의 최대 개수를 만족시키지 못하는 경우, 머지 후보 리스트에 포함된 머지 후보들을 조합하여 추가적인 머지 후보 리스트를 구성하고, 제로 움직임 벡터를 가진 머지 후보 또한 사용하여 머지 후보 리스트를 생성할 수 있다.
도 11은 본 발명이 적용되는 일실시예로서, 제한적인 마스크 기반의 움직임 예측 및 보상의 개념을 도시한 도면이다.
특히, 도 11은 본 발명에서 제안하는 마스크 기반의 움직임 예측 및 보상을 수행함에 있어서, 메모리 대역폭을 감소시키기 위하여 특정한 조건에 따라 예측 방향을 제한하는 방법을 도시한 도면이다.
현재 블록의 너비 또는 높이가 소정의 문턱크기 이하인 경우에 현재 블록의 예측 방향이 제한될 수 있다. 여기서, 문턱크기는, 4, 8, 16 또는 그 이상일 수 있다.
또는, 현재 블록이 소정의 인터 모드인 경우에 현재 블록의 예측 방향이 제한될 수 있다. 여기서, 소정의 인터 모드는, SKIP 모드, 머지 모드, AMVP 모드 또는 어파인 모드 중 적어도 하나를 포함할 수 있다. 예를 들어, 머지 모드인 경우에는 양방향 예측이 가능하고, AMVP 모드인 경우에는 단방향 예측만 가능할 수 있다. 이와 더불어, 현재 블록의 각 파티션에 따라 인터 모드를 제한할 수 있다. 예를 들어, 첫번째 파티션(PART_0)이 머지 모드로 코딩된 경우에는 두번째 파티션(PART_1)은 머지 모드로 코딩될 수 없도록 제한할 수 있다. 하지만, 첫번째 파티션(PART_0)이 머지 모드로 코딩되지 않은 경우에는 두번째 파티션(PART_1)은 머지 모드로 코딩될 수 있다.
또한, 하나의 블록이 대각선 움직임 분할을 통해 2개의 파티션으로 분할되고, 하나의 인덱스로 2개의 파티션에 대한 움직임 정보를 전송하는 경우에도, 상기 예측 방향을 제한하는 방법이 적용될 수 있다.
2개의 파티션에 대한 2개 움직임 정보를 하나의 인덱스로 전송하는 경우, 2개의 움직임 정보 중 적어도 하나 이상은 단방향 예측을 수행하는 움직임 정보일 수 있다.
도 12 및 도 13은 본 발명이 적용되는 일실시예로서, 하나의 직선을 이용하여 하나의 부호화 블록을 2개의 파티션으로 분할하여 예측을 수행하는 방법의 개념을 도시한 도면이다.
도 12는, 하나의 부호화 블록을 하나의 직선을 이용하여 2개의 파티션으로 분할한 일 실시예 중에서, 우측 상단과 좌측 하단을 잇는 직선을 기반으로 하나의 정방형 또는 비정방형 블록을 삼각형 모양으로 분할한 일 실시예를 나타낸다. 본 발명에서는 우측 상단과 좌측 하단을 잇는 직선을 기반으로 분할된 삼각형 형태 뿐만 아니라, 좌측 상단과 우측 하단을 잇는 직선을 기반으로 분할된 삼각형 형태 또한 포함할 수 있다. 또한, 본 발명은 하나의 부호화 블록을 수직/수평 방향으로 2분할하는 경우를 포함하며, 이때 2분할된 파티션은 너비 또는 높이가 동일할 수 있다. 또한, 본 발명은 하나의 부호화 블록을 임의의 직선을 기반으로 2개의 파티션으로 분할하는 경우를 포함할 수 있다.
도 12에 도시된 바와 같이, 현재 블록(1201)은 우측 상단과 좌측 하단을 잇는 직선을 기반으로 분할된다. 이때, 각 파티션은 양방향 예측 또는 단방향 예측을 수행할 수 있다. 하지만, 메모리 대역폭을 감소시키기 위하여 필수적으로 단방향 예측만을 수행하도록 제한할 수 있다. 이때, 단방향 예측만을 사용하도록 강제되는 경우에 대하여, 본 발명에서는 각 파티션이 반드시 서로 다른 방향의 참조 픽쳐를 참조하여 예측을 수행하는 방법 및 장치를 제안한다. 즉, 첫번째 파티션이 L0 예측을 수행하는 경우에는 두번째 파티션은 필수적으로 L1 예측을 수행할 수 있다. 도 12를 참조하면, 첫번째 파티션은 L0 방향의 참조 픽쳐를 참조하여 예측을 수행하고, 두번째 파티션은 L1 방향의 참조 픽쳐를 참조하여 예측을 수행에서 예측을 수행한다.
도 13을 참조하면, 첫번째 파티션은 L1 방향의 참조 픽쳐를 참조하여 예측을 수행하고, 두번째 파티션은 L0 방향의 참조 픽쳐를 참조하여 예측을 수행한다.
본 발명에서는 상기 첫번째 파티션과 두번째 파티션이 서로 다른 참조 픽쳐 리스트를 참조하는 실시예를 도 12와 도 13에서 도시하였다. 다만, 본 발명은, 첫번째 파티션과 두번째 파티션이 서로 동일한 참조 픽쳐 리스트를 참조하여 예측을 수행하는 것 또한 포함할 수 있다.
도 14 내지 도 17은 본 발명이 적용되는 일실시예로서, 대각 움직임 분할된 현재 블록에 대한 가중 예측 방법을 도시한 것이다.
도 14를 참조하면, 제1 파티션에 속하는 화소 위치에는 가중치 2를 적용하고, 대각선 상에 위치한 화소 위치에는 가중치 1을 적용할 수 있다. 단, 제2 파티션에 속하는 화소 위치에는 가중치 0을 적용함으로써, 실제 해당 위치의 화소를 참조하지 않는 효과를 얻을 수 있다.
마찬가지로, 제2 파티션에 속하는 화소 위치에는 가중치 2를 적용하고, 대각선 상에 위치한 화소 위치에는 가중치 1을 적용할 수 있다. 단, 제1 파티션에 속하는 화소 위치에는 가중치를 0을 적용할 수 있다.
상기 가중치가 적용된 2개의 동일 위치 화소를 합산하고, 이를 해당 가중치의 합으로 나누어 최종 예측 화소를 획득할 수 있다.
전술한 방법을 마스크 기반의 움직임 예측 및 보상 방법이라고 지칭하고, 다양한 형태의 마스크 형태로 확장하여 사용할 수 있다. 도 14에서 도시한 대각선 움직임 분할을 마스크 형태로 구성하면, 수학식 4와 같다.
[수학식 4]
MASKP0 = 2 (if f(x,y)>0), 1 (if f(x,y)=0), 0 (otherwise)
MASKP1 = 0 (if f(x,y)>0), 1 (if f(x,y)=0), 2 (otherwise)
상기 MASKP0는 제1 파티션의 가중치를 의미하고, MASKP1은 제2 파티션의 가중치를 의미한다.
상기 수학식 4의 가중치를 이용하여, 최종 예측 블록을 생성하는 수식은 수학식 5와 같다.
[수학식 5]
PDMP(x,y) = (PP0(x,y) x MASKP0(x,y) + PP1(x,y) x MASKP1(x,y)) >> shift
상기 PDMP은 대각선 움직임 분할을 이용하여 획득한 최종 정방형 또는 비정방형 예측 블록을 의미하고, PP0(x,y)는 제1 파티션 내 (x,y) 위치에 대응하는 참조 화소, PP1(x,y)는 제2 파티션 내 (x,y) 위치에 대응하는 참조 화소를 각각 의미한다. Shift는 가중치에 따른 최종 shift 값으로서, 도 14에서 도시한 가중치는 2이므로, shift 값은 1이다.
이때, 본 발명에서 제안하는, 대각선을 이용하여 생성한 마스크의 각 위치 별 가중치의 합은 2에 국한되지 않으며, 4, 8, 16, 32 등 2의 지수승 값일 수 있다.
도 15는, 화소 별 적용되는 가중치의 합이 8인 실시예를 나타낸다. 도 15를 참조하면, 현재 블록의 대각선 상에 위치한 화소 뿐만 아니라, 대각선에 인접한 영역의 화소에 서로 다른 가중치를 적용함으로써, 대각선 움직임 분할의 경계에서 발생할 수 있는 경계 열화를 감소시킬 수 있다. 상기 인접한 영역은, 대각선 상에 위치한 화소에서 상단 또는 좌측 방향으로 인접한 2개의 화소 및 하단 또는 우측 방향으로 인접한 2개의 화소를 포함할 수 있다.
구체적으로, 대각선에 위치한 화소 P(x1, y1)(이하, 제1 영역이라 함)는, 제1 파티션의 참조 블록 내 (x1,y1) 위치의 화소와 제2 파티션의 참조 블록 내 (x1,y1) 위치의 화소에 각각 가중치 4를 적용하여 예측될 수 있다. 상기 제1 영역의 상단 또는 좌측 이웃 화소 P(x2, y2)(이하, 제2 영역이라 함)는, 제1 파티션의 참조 블록 내 (x2,y2) 위치의 화소에 가중치 6을 적용하고, 제2 파티션의 참조 블록 내 (x2,y2) 위치의 화소에 가중치 2를 적용하여 예측될 수 있다. 상기 제2 영역의 상단 또는 좌측 이웃 화소 P(x3, y3)(이하, 제3 영역이라 함)는, 제1 파티션의 참조 블록 내 (x3,y3) 위치의 화소에 가중치 7을 적용하고, 제2 파티션의 참조 블록 내 (x3,y3) 위치의 화소에 가중치 1을 적용하여 예측될 수 있다. 제1 파티션에서 상기 제1 영역 내지 제3 영역을 제외한 나머지 화소 P(x4,y4)는, 제1 파티션의 참조 블록 내 (x4,y4) 위치의 화소에 가중치 8을 적용하고, 제2 파티션의 참조 블록 내 (x4,y4) 위치의 화소에 가중치 0을 적용하여 예측될 수 있다.
한편, 상기 제1 영역의 하단 또는 우측 이웃 화소 P(x5, y5)(이하, 제4 영역이라 함)는, 제1 파티션의 참조 블록 내 (x5,y5) 위치의 화소에 가중치 2를 적용하고, 제2 파티션의 참조 블록 내 (x5,y5) 위치의 화소에 가중치 6을 적용하여 예측될 수 있다. 상기 제4 영역의 하단 또는 우측 이웃 화소 P(x6, y6)(이하, 제5 영역이라 함)는, 제1 파티션의 참조 블록 내 (x6,y6) 위치의 화소에 가중치 1을 적용하고, 제2 파티션의 참조 블록 내 (x6,y6) 위치의 화소에 가중치 7을 적용하여 예측될 수 있다. 제2 파티션에서 상기 제1 영역, 제4 영역 및 제5 영역을 제외한 나머지 화소 P(x7,y7)는, 제1 파티션의 참조 블록 내 (x7,y7) 위치의 화소에 가중치 0을 적용하고, 제2 파티션의 참조 블록 내 (x7,y7) 위치의 화소에 가중치 8을 적용하여 예측될 수 있다.
도 16은, 화소 별 적용되는 가중치의 합이 32인 일 실시예를 나타내며, 도 15에서 도시한 가중치의 합이 8인 일 실시예에 비하여 보다 sharp하게 블록을 분할하는 경우에 사용될 수 있다. 도 16에 도시된 바와 같이, 소정의 영역 별로 상이한 가중치가 적용될 수 있으며, 이는 도 15에서 자세한 살펴보았는바 자세한 설명은 생략하기로 한다. 여기서 가중치는 [32:0], [31:1], [28:4], [16:16], [4:28], [31:1] 또는 [0:32] 중 어느 하나이며, 이는 화소의 위치에 따라 선택적으로 이용될 수 있다.
도 17은, 화소 별 적용되는 가중치의 합이 8인 실시예를 나타낸다. 도 17을 참조하면, 현재 블록의 대각선 상에 위치한 화소 뿐만 아니라, 대각선에 인접한 영역의 화소에 서로 다른 가중치를 적용함으로써, 대각선 움직임 분할의 경계에서 발생할 수 있는 경계 열화를 감소시킬 수 있다. 상기 인접한 영역은, 대각선 상에 위치한 화소에서 상단 또는 좌측 방향으로 인접한 1개의 화소 및 하단 또는 우측 방향으로 인접한 1개의 화소를 포함할 수 있다. 도 17에 도시된 바와 같이, 소정의 영역 별로 상이한 가중치가 적용될 수 있으며, 이는 도 15에서 자세한 살펴보았는바 자세한 설명은 생략하기로 한다. 여기서 가중치는 [8:0], [6:2], [4:4], [2:6] 또는 [0:8] 중 어느 하나이며, 이는 화소의 위치에 따라 선택적으로 이용될 수 있다.
본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.
또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.
본 발명은 비디오 신호를 부호화/복호화하기 위해 이용될 수 있다.

Claims (10)

  1. 현재 블록의 머지 후보 리스트를 구성하는 단계;
    상기 머지 후보 리스트 및 머지 후보 인덱스를 기반으로, 상기 현재 블록의 움직임 정보를 유도하는 단계; 및
    상기 유도된 움직임 정보를 기반으로, 상기 현재 블록의 인터 예측을 수행하는 단계를 포함하되,
    상기 현재 블록은, 대각선 움직임 분할에 기초하여 제1 파티션과 제2 파티션으로 분할되고,
    상기 제1 파티션과 상기 제2 파티션 중 적어도 하나의 형태는 삼각형인, 영상 복호화 방법.
  2. 제1항에 있어서,
    상기 머지 후보 인덱스는, 상기 제1 파티션과 상기 제2 파티션 중 적어도 하나에 대해서 시그날링되는, 영상 복호화 방법.
  3. 제2항에 있어서,
    상기 머지 후보 인덱스는, 소정의 플래그가 제1 값인 경우에 시그날링되고,
    상기 플래그는, 상기 현재 블록이 대각선 움직임 분할에 기반한 움직임 보상을 수행하는지 여부를 나타내는, 영상 복호화 방법.
  4. 제3항에 있어서,
    상기 플래그의 값은, 소정의 부호화 파라미터에 기초하여 복호화 장치에서 유도되고,
    상기 부호화 파라미터는, 상기 현재 블록이 속한 슬라이스 타입, 상기 현재 블록의 인터 모드의 타입 또는 상기 현재 블록의 크기 중 적어도 하나를 포함하는, 영상 복호화 방법.
  5. 제1항에 있어서,
    상기 머지 후보 리스트는, 공간적 머지 후보, 시간적 머지 후보, 조합 머지 후보 또는 제로 움직임 벡터를 가진 머지 후보 중 적어도 하나를 포함하는, 영상 복호화 방법.
  6. 제1항에 있어서,
    상기 파티션의 움직임 정보는, 상기 머지 후보 인덱스에 의해 특정된 머지 후보의 움직임 정보에 기초하여 유도되는, 영상 복호화 방법.
  7. 제6항에 있어서,
    상기 머지 후보가 양방향 예측의 움직임 정보를 가지는 경우, 상기 파티션은 단방향 예측의 움직임 정보만을 가지도록 제한되는, 영상 복호화 방법.
  8. 제1항에 있어서,
    상기 현재 블록의 화소는, 상기 제1 파티션의 참조 블록에 속한 화소와 상기 제2 파티션의 참조 블록에 속한 화소에 소정의 가중치(m 및 n)를 적용하여 예측되는, 영상 복호화 방법.
  9. 제8항에 있어서,
    상기 m과 n은, 0, 1, 2, 4, 6, 7, 8, 16, 28, 31 또는 32 중 어느 하나이며,
    상기 m과 n의 합은, 2, 8 또는 32 중 어느 하나인, 영상 복호화 방법.
  10. 제9항에 있어서,
    상기 가중치는, 상기 현재 블록 내 화소의 위치에 기초하여 결정되는, 영상 복호화 방법.
PCT/KR2019/007821 2018-06-27 2019-06-27 영상 부호화/복호화 방법 및 장치 WO2020004979A1 (ko)

Priority Applications (9)

Application Number Priority Date Filing Date Title
KR1020217002752A KR20210016634A (ko) 2018-06-27 2019-06-27 영상 부호화/복호화 방법 및 장치
CN202311703196.6A CN117499637A (zh) 2018-06-27 2019-06-27 对图像进行编码/解码的方法和发送比特流的方法
CN201980043307.0A CN112385231B (zh) 2018-06-27 2019-06-27 图像编码/解码方法和装置
CN202311708295.3A CN117499639A (zh) 2018-06-27 2019-06-27 图像编码/解码方法和用于发送图像信息的数据的方法
CN202311703414.6A CN117499638A (zh) 2018-06-27 2019-06-27 对图像进行编码/解码的方法和发送比特流的方法
US17/255,625 US11490077B2 (en) 2018-06-27 2019-06-27 Image encoding/decoding method and apparatus involving merge candidate list and triangular shape partitions
CA3141352A CA3141352A1 (en) 2018-06-27 2019-06-27 Video encoding/decoding method and apparatus
CN202311703386.8A CN117615128A (zh) 2018-06-27 2019-06-27 对图像进行编码/解码的方法和发送比特流的方法
US17/858,929 US20220394241A1 (en) 2018-06-27 2022-07-06 Image encoding/decoding method and apparatus involving merge candidate list and triangular shape partitions

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
KR20180074255 2018-06-27
KR10-2018-0074255 2018-06-27
KR10-2018-0079891 2018-07-10
KR20180079891 2018-07-10
US201862697982P 2018-07-13 2018-07-13
US62/697,982 2018-07-13
KR10-2018-0082348 2018-07-16
KR20180082348 2018-07-16
KR10-2018-0120959 2018-10-11
KR20180120959 2018-10-11

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US17/255,625 A-371-Of-International US11490077B2 (en) 2018-06-27 2019-06-27 Image encoding/decoding method and apparatus involving merge candidate list and triangular shape partitions
US17/858,929 Continuation US20220394241A1 (en) 2018-06-27 2022-07-06 Image encoding/decoding method and apparatus involving merge candidate list and triangular shape partitions

Publications (1)

Publication Number Publication Date
WO2020004979A1 true WO2020004979A1 (ko) 2020-01-02

Family

ID=68987347

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/007821 WO2020004979A1 (ko) 2018-06-27 2019-06-27 영상 부호화/복호화 방법 및 장치

Country Status (5)

Country Link
US (2) US11490077B2 (ko)
KR (1) KR20210016634A (ko)
CN (5) CN112385231B (ko)
CA (1) CA3141352A1 (ko)
WO (1) WO2020004979A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012147344A1 (ja) 2011-04-27 2012-11-01 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、及び動画像復号プログラム
TWI526056B (zh) * 2011-04-27 2016-03-11 Jvc Kenwood Corp A moving picture coding apparatus, a motion picture coding method, a motion picture coding program, a transmission apparatus, a transmission method, a transmission program, a video decoding apparatus, a video decoding method, a video decoding program, a reception device, a reception method, Receiving program
US11350118B2 (en) * 2018-05-30 2022-05-31 Digitalinsights Inc. Image encoding/decoding method and device
EP3811611A4 (en) 2018-06-22 2022-06-15 OP Solutions, LLC BLOCK LEVEL GEOMETRIC PARTITIONING
KR102332528B1 (ko) * 2018-10-10 2021-12-01 삼성전자주식회사 움직임 벡터 차분값을 이용한 비디오 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치
KR20210118154A (ko) 2019-01-28 2021-09-29 오피 솔루션즈, 엘엘씨 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측
WO2020184979A1 (ko) * 2019-03-11 2020-09-17 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2023208131A1 (en) * 2022-04-29 2023-11-02 Mediatek Inc. Efficient geometric partitioning mode video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013070001A1 (ko) * 2011-11-08 2013-05-16 한국전자통신연구원 후보 리스트 공유 방법 및 이러한 방법을 사용하는 장치
KR20140064944A (ko) * 2011-09-09 2014-05-28 엘지전자 주식회사 인터 예측 방법 및 그 장치
KR20160143583A (ko) * 2015-06-05 2016-12-14 인텔렉추얼디스커버리 주식회사 움직임 벡터 후보 선택 방법 및 이를 이용하는 영상 부호화/복호화 방법
WO2017183751A1 (ko) * 2016-04-22 2017-10-26 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009051668A2 (en) * 2007-10-12 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometrically partitioned bi-predictive mode partitions
KR102219985B1 (ko) * 2010-05-04 2021-02-25 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US10264283B2 (en) * 2011-10-18 2019-04-16 Kt Corporation Method and apparatus for decoding a video signal using adaptive transform
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US9591312B2 (en) * 2012-04-17 2017-03-07 Texas Instruments Incorporated Memory bandwidth reduction for motion compensation in video coding
WO2015152503A1 (ko) * 2014-03-31 2015-10-08 인텔렉추얼디스커버리 주식회사 영상 복호화 장치 및 그 방법
EP3202143B8 (en) * 2014-11-18 2019-09-25 MediaTek Inc. Method of bi-prediction video coding based on motion vectors from uni-prediction and merge candidate
KR20170058838A (ko) * 2015-11-19 2017-05-29 한국전자통신연구원 화면간 예측 향상을 위한 부호화/복호화 방법 및 장치
CN116489348A (zh) * 2015-11-20 2023-07-25 韩国电子通信研究院 对图像进行编/解码的方法和装置
WO2020184979A1 (ko) * 2019-03-11 2020-09-17 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
US20230254477A1 (en) * 2022-02-07 2023-08-10 Tencent America LLC Sub-block based constraint on bi-prediction for out-of-boundary conditions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140064944A (ko) * 2011-09-09 2014-05-28 엘지전자 주식회사 인터 예측 방법 및 그 장치
WO2013070001A1 (ko) * 2011-11-08 2013-05-16 한국전자통신연구원 후보 리스트 공유 방법 및 이러한 방법을 사용하는 장치
KR20160143583A (ko) * 2015-06-05 2016-12-14 인텔렉추얼디스커버리 주식회사 움직임 벡터 후보 선택 방법 및 이를 이용하는 영상 부호화/복호화 방법
WO2017183751A1 (ko) * 2016-04-22 2017-10-26 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YONGJO AHN: "Diagonal motion partitions on top of QTBT block structure", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3, 25 October 2017 (2017-10-25), Macao, CN, pages 1 - 6, Retrieved from the Internet <URL:http://phenix.int-evry.fr/jvet> *

Also Published As

Publication number Publication date
US20220394241A1 (en) 2022-12-08
CN117615128A (zh) 2024-02-27
KR20210016634A (ko) 2021-02-16
CN112385231B (zh) 2024-01-02
CA3141352A1 (en) 2020-01-02
CN112385231A (zh) 2021-02-19
US20210274162A1 (en) 2021-09-02
CN117499639A (zh) 2024-02-02
CN117499638A (zh) 2024-02-02
CN117499637A (zh) 2024-02-02
US11490077B2 (en) 2022-11-01

Similar Documents

Publication Publication Date Title
WO2018070790A1 (ko) 영상의 부호화/복호화 방법 및 장치
WO2020004979A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2017222325A1 (ko) 비디오 신호 처리 방법 및 장치
WO2020009419A1 (ko) 병합 후보를 사용하는 비디오 코딩 방법 및 장치
WO2018212577A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018066959A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018106047A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016175549A1 (ko) 비디오 신호의 처리 방법 및 이를 위한 장치
WO2018174593A1 (ko) 적응적인 화소 분류 기준에 따른 인루프 필터링 방법
WO2013002557A2 (ko) 움직임 정보의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2018236028A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2019194568A1 (ko) 어파인 모델 기반의 영상 부호화/복호화 방법 및 장치
WO2018008905A1 (ko) 비디오 신호 처리 방법 및 장치
WO2011021838A2 (en) Method and apparatus for encoding video, and method and apparatus for decoding video
WO2019078581A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2020096425A1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2016085231A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017082443A1 (ko) 영상 코딩 시스템에서 임계값을 이용한 적응적 영상 예측 방법 및 장치
WO2016159610A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018044089A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018062880A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2019231206A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2016048092A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018182184A1 (ko) 부호화 트리 유닛 및 부호화 유닛의 처리를 수행하는 영상 처리 방법, 그를 이용한 영상 복호화, 부호화 방법 및 그 장치
WO2019245261A1 (ko) 영상 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19825092

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20217002752

Country of ref document: KR

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 19825092

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3141352

Country of ref document: CA