WO2018128239A1 - 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치 - Google Patents

영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치 Download PDF

Info

Publication number
WO2018128239A1
WO2018128239A1 PCT/KR2017/008717 KR2017008717W WO2018128239A1 WO 2018128239 A1 WO2018128239 A1 WO 2018128239A1 KR 2017008717 W KR2017008717 W KR 2017008717W WO 2018128239 A1 WO2018128239 A1 WO 2018128239A1
Authority
WO
WIPO (PCT)
Prior art keywords
split
target block
partition
flag
information
Prior art date
Application number
PCT/KR2017/008717
Other languages
English (en)
French (fr)
Inventor
남정학
임재현
장형문
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of WO2018128239A1 publication Critical patent/WO2018128239A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to an image coding technique, and more particularly, to an image decoding method and apparatus according to a block division structure in an image coding system.
  • the demand for high resolution and high quality images such as high definition (HD) images and ultra high definition (UHD) images is increasing in various fields.
  • the higher the resolution and the higher quality of the image data the more information or bit rate is transmitted than the existing image data. Therefore, the image data can be transmitted by using a medium such as a conventional wired / wireless broadband line or by using a conventional storage medium. In the case of storage, the transmission cost and the storage cost are increased.
  • a high efficiency image compression technique is required to effectively transmit, store, and reproduce high resolution, high quality image information.
  • An object of the present invention is to provide a method and apparatus for improving image coding efficiency.
  • Another technical problem of the present invention is to provide an inter prediction method and apparatus for dividing a picture through various partitioning structures.
  • Another technical problem of the present invention is to provide a method and apparatus for dividing a picture into non-square blocks, and decoding based on each non-square block.
  • an image decoding method performed by a decoding apparatus.
  • the method may include obtaining first split information about a first target block, and when the first split information indicates that the first target block is split, the first target block may be assigned to the first subblocks. Dividing into; obtaining second splitting information and additional splitting information for a second target block, which is one of the first sub-blocks of the first target block, wherein the second target block is the second target block; Splitting the second target block into second subblocks based on the additional partitioning information, if not split based on the second partitioning information for, and decoding the second subblocks;
  • the second subblocks may be non-square blocks.
  • a decoding apparatus for performing image decoding.
  • the decoding apparatus obtains first split information about a first target block through a bitstream, second splitting information about a second target block which is one of first subblocks of the first target block, and An entropy decoding unit for acquiring additional splitting information, when the first splitting information for the first target block indicates that the first target block is to be divided, split the first target block into the first subblocks, If the second split information on the second target block indicates that the second target block is not split, the picture splitter divides the second target block into second subblocks based on the additional split information. And a prediction unit to decode the second sub blocks, wherein the second sub blocks are non-square blocks.
  • a video encoding method performed by an encoding apparatus includes dividing a first target block into first subblocks, dividing a second target block that is one of the first subblocks into second subblocks, and decoding the second subblocks. And generating, encoding, and outputting first partitioning information for the first target block, second partitioning information for the second target block, and additional partitioning information, wherein the second subblocks are non-existent. It is characterized in that the square blocks.
  • a video encoding apparatus divides a first target block into first subblocks, a picture divider that splits a second target block, which is one of the first subblocks, into second subblocks, and the second subblocks.
  • the sub blocks are characterized in that they are non-square blocks.
  • a picture may be divided into various types of blocks, and thus, prediction efficiency may be improved and overall coding efficiency may be improved.
  • a picture may be divided into various types of blocks, and accordingly, transform efficiency may be improved and overall coding efficiency may be improved.
  • FIG. 1 is a diagram schematically illustrating a configuration of a video encoding apparatus to which the present invention may be applied.
  • FIG. 2 is a diagram schematically illustrating a configuration of a video decoding apparatus to which the present invention may be applied.
  • QTBT quad tree binary tree
  • 5 exemplarily shows a syntax of a CU partitioned through the QTGP structure and the QTGP structure.
  • 6a to 6d exemplarily show a segmentation boundary derived based on information about a segmentation angle and / or a distance from a midpoint of a CU.
  • FIG. 7 shows an example in which syntaxes of the QTGP structure for a target CU are transmitted.
  • 10 exemplarily shows a syntax of a CU partitioned through the QTGPBT structure and the QTGPBT structure.
  • FIG. 11 shows an example in which syntaxes of the QTGPBT structure for a target CU are transmitted.
  • FIG. 13 shows an example in which syntaxes of the QTBTGP structure for a target CU are transmitted.
  • FIG. 16 schematically shows a video encoding method by an encoding device according to the present invention.
  • FIG. 17 schematically illustrates a video decoding method by a decoding apparatus according to the present invention.
  • each configuration in the drawings described in the present invention are shown independently for the convenience of description of the different characteristic functions, it does not mean that each configuration is implemented by separate hardware or separate software.
  • two or more of each configuration may be combined to form one configuration, or one configuration may be divided into a plurality of configurations.
  • Embodiments in which each configuration is integrated and / or separated are also included in the scope of the present invention without departing from the spirit of the present invention.
  • a picture generally refers to a unit representing one image of a specific time zone
  • a slice is a unit constituting a part of a picture in coding.
  • One picture may be composed of a plurality of slices, and if necessary, the picture and the slice may be mixed with each other.
  • a pixel or a pel may refer to a minimum unit constituting one picture (or image). Also, 'sample' may be used as a term corresponding to a pixel.
  • a sample may generally represent a pixel or a value of a pixel, and may only represent pixel / pixel values of the luma component, or only pixel / pixel values of the chroma component.
  • a unit represents the basic unit of image processing.
  • the unit may include at least one of a specific region of the picture and information related to the region.
  • the unit may be used interchangeably with terms such as block or area in some cases.
  • an M ⁇ N block may represent a set of samples or transform coefficients composed of M columns and N rows.
  • FIG. 1 is a diagram schematically illustrating a configuration of a video encoding apparatus to which the present invention may be applied.
  • the video encoding apparatus 100 may include a picture divider 105, a predictor 110, a subtractor 115, a transformer 120, a quantizer 125, a reordering unit 130,
  • the entropy encoding unit 135, the residual processing unit 140, the adding unit 150, the filter unit 155, and the memory 160 may be included.
  • the residual processor 140 may include an inverse quantizer 141 and an inverse transform unit 142.
  • the picture divider 105 may divide the input picture into at least one processing unit.
  • the processing unit may be called a coding unit (CU).
  • the coding unit may be recursively split from the largest coding unit (LCU) according to a quad-tree binary-tree (QTBT) structure.
  • LCU largest coding unit
  • QTBT quad-tree binary-tree
  • one coding unit may be divided into a plurality of coding units of a deeper depth based on a quad tree structure and / or a binary tree structure.
  • the quad tree structure may be applied first and the binary tree structure may be applied later.
  • the binary tree structure may be applied first.
  • the coding procedure according to the present invention may be performed based on the final coding unit that is no longer split.
  • the maximum coding unit may be used as the final coding unit immediately based on coding efficiency according to the image characteristic, or if necessary, the coding unit is recursively divided into coding units of lower depths and optimized.
  • a coding unit of size may be used as the final coding unit.
  • the coding procedure may include a procedure of prediction, transform, and reconstruction, which will be described later.
  • the processing unit may include a coding unit (CU) prediction unit (PU) or a transform unit (TU).
  • the coding unit may be split from the largest coding unit (LCU) into coding units of deeper depths along the quad tree structure.
  • LCU largest coding unit
  • the maximum coding unit may be used as the final coding unit immediately based on coding efficiency according to the image characteristic, or if necessary, the coding unit is recursively divided into coding units of lower depths and optimized.
  • a coding unit of size may be used as the final coding unit. If a smallest coding unit (SCU) is set, the coding unit may not be split into smaller coding units than the minimum coding unit.
  • the final coding unit refers to a coding unit that is the basis of partitioning or partitioning into a prediction unit or a transform unit.
  • the prediction unit is a unit partitioning from the coding unit and may be a unit of sample prediction. In this case, the prediction unit may be divided into sub blocks.
  • the transform unit may be divided along the quad tree structure from the coding unit, and may be a unit for deriving a transform coefficient and / or a unit for deriving a residual signal from the transform coefficient.
  • a coding unit may be called a coding block (CB)
  • a prediction unit is a prediction block (PB)
  • a transform unit may be called a transform block (TB).
  • a prediction block or prediction unit may mean a specific area in the form of a block within a picture, and may include an array of prediction samples.
  • a transform block or a transform unit may mean a specific area in a block form within a picture, and may include an array of transform coefficients or residual samples.
  • the prediction unit 110 may perform a prediction on a block to be processed (hereinafter, referred to as a current block) and generate a predicted block including prediction samples of the current block.
  • the unit of prediction performed by the prediction unit 110 may be a coding block, a transform block, or a prediction block.
  • the prediction unit 110 may determine whether intra prediction or inter prediction is applied to the current block. As an example, the prediction unit 110 may determine whether intra prediction or inter prediction is applied on a CU basis.
  • the prediction unit 110 may derive a prediction sample for the current block based on reference samples outside the current block in the picture to which the current block belongs (hereinafter, referred to as the current picture). In this case, the prediction unit 110 may (i) derive the prediction sample based on the average or interpolation of neighboring reference samples of the current block, and (ii) the neighbor reference of the current block.
  • the prediction sample may be derived based on a reference sample present in a specific (prediction) direction with respect to the prediction sample among the samples. In case of (i), it may be called non-directional mode or non-angle mode, and in case of (ii), it may be called directional mode or angular mode.
  • the prediction mode may have, for example, 33 directional prediction modes and at least two non-directional modes.
  • the non-directional mode may include a DC prediction mode and a planner mode (Planar mode).
  • the prediction unit 110 may determine the prediction mode applied to the current block by using the prediction mode applied to the neighboring block.
  • the prediction unit 110 may derive the prediction sample for the current block based on the sample specified by the motion vector on the reference picture.
  • the prediction unit 110 may apply one of a skip mode, a merge mode, and a motion vector prediction (MVP) mode to derive a prediction sample for the current block.
  • the prediction unit 110 may use the motion information of the neighboring block as the motion information of the current block.
  • the skip mode unlike the merge mode, the difference (residual) between the prediction sample and the original sample is not transmitted.
  • the MVP mode the motion vector of the current block may be derived using the motion vector of the neighboring block as a motion vector predictor.
  • the neighboring block may include a spatial neighboring block existing in the current picture and a temporal neighboring block present in the reference picture.
  • a reference picture including the temporal neighboring block may be called a collocated picture (colPic).
  • the motion information may include a motion vector and a reference picture index.
  • Information such as prediction mode information and motion information may be encoded (entropy) and output in the form of a bitstream.
  • the highest picture on the reference picture list may be used as the reference picture.
  • Reference pictures included in a reference picture list may be sorted based on a difference in a picture order count (POC) between a current picture and a corresponding reference picture.
  • POC picture order count
  • the subtraction unit 115 generates a residual sample which is a difference between the original sample and the prediction sample.
  • residual samples may not be generated as described above.
  • the transform unit 120 generates a transform coefficient by transforming the residual sample in units of transform blocks.
  • the transform unit 120 may perform the transformation according to the size of the transform block and the prediction mode applied to the coding block or the prediction block that spatially overlaps the transform block. For example, if intra prediction is applied to the coding block or the prediction block that overlaps the transform block, and the transform block is a 4 ⁇ 4 residual array, the residual sample uses a discrete sine transform (DST). In other cases, the residual sample may be transformed by using a discrete cosine transform (DCT).
  • DST discrete sine transform
  • DCT discrete cosine transform
  • the quantization unit 125 may quantize the transform coefficients to generate quantized transform coefficients.
  • the reordering unit 130 rearranges the quantized transform coefficients.
  • the reordering unit 130 may reorder the quantized transform coefficients in the form of a block into a one-dimensional vector form through a coefficient scanning method. Although the reordering unit 130 has been described in a separate configuration, the reordering unit 130 may be part of the quantization unit 125.
  • the entropy encoding unit 135 may perform entropy encoding on the quantized transform coefficients.
  • Entropy encoding may include, for example, encoding methods such as exponential Golomb, context-adaptive variable length coding (CAVLC), context-adaptive binary arithmetic coding (CABAC), and the like.
  • the entropy encoding unit 135 may encode information necessary for video reconstruction other than the quantized transform coefficients (for example, a value of a syntax element) together or separately. Entropy encoded information may be transmitted or stored in units of network abstraction layer (NAL) units in the form of bitstreams.
  • NAL network abstraction layer
  • the inverse quantization unit 141 inverse quantizes the quantized values (quantized transform coefficients) in the quantization unit 125, and the inverse transform unit 142 inverse transforms the inverse quantized values in the inverse quantization unit 141 to generate a residual sample.
  • the adder 150 reconstructs the picture by combining the residual sample and the predictive sample.
  • the residual sample and the predictive sample may be added in units of blocks to generate a reconstructed block.
  • the adder 150 may be part of the predictor 110.
  • the adder 150 may be called a restoration unit or a restoration block generation unit.
  • the filter unit 155 may apply a deblocking filter and / or a sample adaptive offset to the reconstructed picture. Through deblocking filtering and / or sample adaptive offset, the artifacts of the block boundaries in the reconstructed picture or the distortion in the quantization process can be corrected.
  • the sample adaptive offset may be applied on a sample basis and may be applied after the process of deblocking filtering is completed.
  • the filter unit 155 may apply an adaptive loop filter (ALF) to the reconstructed picture. ALF may be applied to the reconstructed picture after the deblocking filter and / or sample adaptive offset is applied.
  • ALF adaptive loop filter
  • the memory 160 may store reconstructed pictures (decoded pictures) or information necessary for encoding / decoding.
  • the reconstructed picture may be a reconstructed picture after the filtering process is completed by the filter unit 155.
  • the stored reconstructed picture may be used as a reference picture for (inter) prediction of another picture.
  • the memory 160 may store (reference) pictures used for inter prediction.
  • pictures used for inter prediction may be designated by a reference picture set or a reference picture list.
  • FIG. 2 is a diagram schematically illustrating a configuration of a video decoding apparatus to which the present invention may be applied.
  • the video decoding apparatus 200 may include an entropy decoding unit 210, a residual processor 220, a predictor 230, an adder 240, a filter 250, and a memory 260. It may include.
  • the residual processor 220 may include a reordering unit 221, an inverse quantization unit 222, and an inverse transform unit 223.
  • the video decoding apparatus 200 may reconstruct the video in response to a process in which the video information is processed in the video encoding apparatus.
  • the video decoding apparatus 200 may perform video decoding using a processing unit applied in the video encoding apparatus.
  • the processing unit block of video decoding may be, for example, a coding unit, and in another example, a coding unit, a prediction unit, or a transform unit.
  • the coding unit may be split along the quad tree structure and / or binary tree structure from the largest coding unit.
  • the prediction unit and the transform unit may be further used in some cases, in which case the prediction block is a block derived or partitioned from the coding unit and may be a unit of sample prediction. At this point, the prediction unit may be divided into subblocks.
  • the transform unit may be divided along the quad tree structure from the coding unit, and may be a unit for deriving a transform coefficient or a unit for deriving a residual signal from the transform coefficient.
  • the entropy decoding unit 210 may parse the bitstream and output information necessary for video reconstruction or picture reconstruction. For example, the entropy decoding unit 210 decodes information in a bitstream based on a coding method such as exponential Golomb coding, CAVLC, or CABAC, quantized values of syntax elements necessary for video reconstruction, and residual coefficients. Can be output.
  • a coding method such as exponential Golomb coding, CAVLC, or CABAC, quantized values of syntax elements necessary for video reconstruction, and residual coefficients. Can be output.
  • the CABAC entropy decoding method receives a bin corresponding to each syntax element in a bitstream, and decodes syntax element information and decoding information of neighboring and decoding target blocks or information of symbols / bins decoded in a previous step.
  • the context model may be determined using the context model, the probability of occurrence of a bin may be predicted according to the determined context model, and arithmetic decoding of the bin may be performed to generate a symbol corresponding to the value of each syntax element. have.
  • the CABAC entropy decoding method may update the context model by using the information of the decoded symbol / bin for the context model of the next symbol / bean after determining the context model.
  • the information related to the prediction among the information decoded by the entropy decoding unit 210 is provided to the prediction unit 230, and the residual value on which the entropy decoding has been performed by the entropy decoding unit 210, that is, the quantized transform coefficient, is used as a reordering unit ( 221 may be input.
  • the reordering unit 221 may rearrange the quantized transform coefficients in a two-dimensional block form.
  • the reordering unit 221 may perform reordering in response to coefficient scanning performed by the encoding apparatus.
  • the rearrangement unit 221 has been described in a separate configuration, but the rearrangement unit 221 may be part of the inverse quantization unit 222.
  • the inverse quantization unit 222 may dequantize the quantized transform coefficients based on the (inverse) quantization parameter and output the transform coefficients.
  • information for deriving a quantization parameter may be signaled from the encoding apparatus.
  • the inverse transform unit 223 may inversely transform transform coefficients to derive residual samples.
  • the prediction unit 230 may perform prediction on the current block and generate a predicted block including prediction samples for the current block.
  • the unit of prediction performed by the prediction unit 230 may be a coding block, a transform block, or a prediction block.
  • the prediction unit 230 may determine whether to apply intra prediction or inter prediction based on the information about the prediction.
  • a unit for determining which of intra prediction and inter prediction is to be applied and a unit for generating a prediction sample may be different.
  • the unit for generating a prediction sample in inter prediction and intra prediction may also be different.
  • whether to apply inter prediction or intra prediction may be determined in units of CUs.
  • a prediction mode may be determined and a prediction sample may be generated in PU units
  • intra prediction a prediction mode may be determined in PU units and a prediction sample may be generated in TU units.
  • the prediction unit 230 may derive the prediction sample for the current block based on the neighbor reference samples in the current picture.
  • the prediction unit 230 may derive the prediction sample for the current block by applying the directional mode or the non-directional mode based on the neighbor reference samples of the current block.
  • the prediction mode to be applied to the current block may be determined using the intra prediction mode of the neighboring block.
  • the prediction unit 230 may derive the prediction sample for the current block based on the sample specified on the reference picture by the motion vector on the reference picture.
  • the prediction unit 230 may apply any one of a skip mode, a merge mode, and an MVP mode to derive a prediction sample for the current block.
  • motion information required for inter prediction of the current block provided by the video encoding apparatus for example, information about a motion vector, a reference picture index, and the like may be obtained or derived based on the prediction information.
  • the motion information of the neighboring block may be used as the motion information of the current block.
  • the neighboring block may include a spatial neighboring block and a temporal neighboring block.
  • the prediction unit 230 may construct a merge candidate list using motion information of available neighboring blocks, and may use information indicated by the merge index on the merge candidate list as a motion vector of the current block.
  • the merge index may be signaled from the encoding device.
  • the motion information may include a motion vector and a reference picture. When the motion information of the temporal neighboring block is used in the skip mode and the merge mode, the highest picture on the reference picture list may be used as the reference picture.
  • the difference (residual) between the prediction sample and the original sample is not transmitted.
  • the motion vector of the current block may be derived using the motion vector of the neighboring block as a motion vector predictor.
  • the neighboring block may include a spatial neighboring block and a temporal neighboring block.
  • a merge candidate list may be generated by using a motion vector of a reconstructed spatial neighboring block and / or a motion vector corresponding to a Col block, which is a temporal neighboring block.
  • the motion vector of the candidate block selected from the merge candidate list is used as the motion vector of the current block.
  • the information about the prediction may include a merge index indicating a candidate block having an optimal motion vector selected from candidate blocks included in the merge candidate list.
  • the prediction unit 230 may derive the motion vector of the current block by using the merge index.
  • a motion vector predictor candidate list may be generated using a motion vector of a reconstructed spatial neighboring block and / or a motion vector corresponding to a Col block which is a temporal neighboring block.
  • the prediction information may include a prediction motion vector index indicating an optimal motion vector selected from the motion vector candidates included in the list.
  • the prediction unit 230 may select the predicted motion vector of the current block from the motion vector candidates included in the motion vector candidate list using the motion vector index.
  • the prediction unit of the encoding apparatus may obtain a motion vector difference (MVD) between the motion vector of the current block and the motion vector predictor, and may encode the output vector in a bitstream form. That is, MVD may be obtained by subtracting the motion vector predictor from the motion vector of the current block.
  • the prediction unit 230 may obtain a motion vector difference included in the information about the prediction, and derive the motion vector of the current block by adding the motion vector difference and the motion vector predictor.
  • the prediction unit may also obtain or derive a reference picture index or the like indicating a reference picture from the information about the prediction.
  • the adder 240 may reconstruct the current block or the current picture by adding the residual sample and the predictive sample.
  • the adder 240 may reconstruct the current picture by adding the residual sample and the predictive sample in block units. Since the residual is not transmitted when the skip mode is applied, the prediction sample may be a reconstruction sample.
  • the adder 240 has been described in a separate configuration, the adder 240 may be part of the predictor 230. On the other hand, the adder 240 may be called a restoration unit or a restoration block generation unit.
  • the filter unit 250 may apply the deblocking filtering sample adaptive offset, and / or ALF to the reconstructed picture.
  • the sample adaptive offset may be applied in units of samples and may be applied after deblocking filtering.
  • ALF may be applied after deblocking filtering and / or sample adaptive offset.
  • the memory 260 may store reconstructed pictures (decoded pictures) or information necessary for decoding.
  • the reconstructed picture may be a reconstructed picture after the filtering process is completed by the filter unit 250.
  • the memory 260 may store pictures used for inter prediction.
  • pictures used for inter prediction may be designated by a reference picture set or a reference picture list.
  • the reconstructed picture can be used as a reference picture for another picture.
  • the memory 260 may output the reconstructed picture in an output order.
  • the coding may be performed based on one processing unit.
  • the processing unit may be referred to as a coding unit (CU).
  • CU coding unit
  • conversion efficiency may be improved, thereby improving overall coding efficiency.
  • prediction accuracy may be improved, thereby improving overall coding efficiency.
  • QT quad tree
  • splitting the CUs to include exactly similar information may be limited. For example, information representing a specific object in the picture may be widely located in a diagonal direction.
  • the present invention proposes a method of dividing an input picture into a square CU and a non-square CU by applying another division structure together with the quad tree structure. Through this, the picture may be divided into various types of CUs according to the information in the picture, and coding may be performed more efficiently.
  • QTBT quad tree binary tree
  • the QTBT structure may indicate a structure in which a CU (or CTU) is divided through a QT structure and divided through a binary tree (BT) structure. That is, the QTBT may represent a partition structure formed by combining the QT structure and the BT structure, and when a picture is coded in units of CTU, the CTU may be split through the QT structure, Leaf nodes may be additionally partitioned through the BT structure.
  • the leaf node may represent a CU that is no longer split in the QT structure, and the leaf node may be called an end node.
  • the QT structure may indicate a structure in which a 2N ⁇ 2N size CU (or CTU) is divided into four N ⁇ N size sub-CUs, and the BT structure indicates that a 2N ⁇ 2N size CU is two N ⁇ 2N size CUs or In this case, the structure may be divided into two 2N ⁇ N sized sub-CUs.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and in addition, a specific CU among the square CUs may have non-square CUs having a lower depth through a BT structure. It can be divided into
  • the solid line shown in (b) of FIG. 3 may represent a QT structure, and the dotted line may represent a BT structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the fourth from the top The numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the BT structure.
  • a QT segmentation flag indicating whether a CU is partitioned through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • information about the BT structure may be transmitted for an end node that is no longer split in the QT structure. That is, information about the BT structure for the CU corresponding to the end node in the QT structure may be transmitted.
  • the information including the information on the BT structure may be referred to as additional partition information.
  • a BT partition flag indicating whether the CU is partitioned through the BT structure, that is, whether the BT structure is applied to the CU may be transmitted.
  • BT_split_flag may indicate a syntax element for the BT split flag.
  • the CU when the value for the BT split flag is 1, the CU may be split into two sub-CUs, and when the value for the BT split flag is 0, the CU may not be split.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the BT structure may be transmitted to adjust the BT structure for the input image.
  • Information about the above-described BT structure may be transmitted for each slice type or may be transmitted for each of the image components.
  • the CU When the CU is divided through the BT structure, the CU may be divided in a horizontal or vertical direction.
  • the CU of 2N ⁇ 2N size may be divided into subCUs of 2N ⁇ N size, or the CU of 2N ⁇ 2N size may be divided into subCUs of N ⁇ 2N size.
  • a BT partition mode index indicating the partition type of the CU may be transmitted.
  • BT_split_mode may indicate a syntax element for the BT split mode index.
  • the CU when the value of the BT split mode index is 1, the CU may be split into sub-CUs in a vertical direction, that is, Nx2N size, and when the value of the BT split mode index is 0, The CU may be divided into sub-CUs having a horizontal direction, that is, 2N ⁇ N size.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag of the target CU when the value of the QT_split_flag of the target CU is 1, that is, the QT_split_flag indicates that the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the target CU may be divided into the sub CUs.
  • the QT_split_flag for the sub-CUs may be transmitted. That is, the target CU is divided into CUs of lower depths rather than coding recursively so that CUs of end nodes that are no longer split can be derived.
  • the QT_split_flag for the target CU of the terminal node is 0, that is, the QT_split_flag indicates that the target CU is not divided into sub-CUs having the size of half the height and half the width of the target CU
  • the BT_split_flag for the target CU may be transmitted.
  • the BT_split_flag may indicate whether the target CU is divided through the BT structure as described above. That is, the BT_split_flag may indicate, for example, whether the target CU having a 2Nx2N size is divided into sub CUs having an Nx2N size or a 2NxN size.
  • shapes of CUs divided from the target CU may be determined according to the BT_split_flag and BT_split_mode values.
  • the target CU may be divided into sub-CUs having an Nx2N size or 2NxN size, and when the value of the BT_split_flag is 0, the target CU may not be split.
  • the BT_split_flag indicates that the target CU is split through the BT structure
  • BT_split_mode for the target CU may be transmitted.
  • the BT_split_mode may indicate in which direction the target CU is split, that is, the split type of the target CU.
  • the CU when the value of the BT_split_mode is 1, the CU may be divided into sub-CUs in a vertical direction, that is, an Nx2N size, and when the value of the BT_split_mode is 0, the CU is in a horizontal direction, that is, 2NxN It can be divided into sub-CUs of size.
  • syntax of the QTBT structure can be represented as the following table.
  • QT_split_flag may indicate a syntax element of the above-described QT splitting flag
  • BT_split_flag may indicate a syntax element of the above-mentioned BT splitting flag
  • BT_split_mode may indicate a syntax element of the above-described BT splitting mode index.
  • the CU in the picture may be partitioned through the QTBT structure described above, or may be partitioned through a quad tree geometry partition (QTGP) structure.
  • QTGP quad tree geometry partition
  • 5 exemplarily shows a syntax of a CU partitioned through the QTGP structure and the QTGP structure.
  • the QTGP structure may indicate a structure in which a CU (or CTU) is divided through a QT structure and divided through a geometry partition (GP) structure.
  • the GP structure may be referred to as a geometry tree (GT) structure. That is, the QTGP structure may represent a partition structure formed by combining the QT structure and the GP structure.
  • GT geometry tree
  • the QTGP structure may represent a partition structure formed by combining the QT structure and the GP structure.
  • the CTU may be split through the QT structure, and the QT structure
  • the leaf node of may be additionally divided through the GP structure.
  • the GP structure may indicate a structure in which the CU is divided into various non-square sub-CUs. That is, as shown in (a) of FIG.
  • various types of sub-CUs may be derived in addition to the N ⁇ 2N or 2N ⁇ N sized sub-CUs derived through the BT structure.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and in addition, a specific CU among the square CUs may have a non-square CU having a lower depth through the GP structure.
  • the solid line shown in (b) of FIG. 5 may represent a QT structure, and the dotted line may represent a GP structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the fourth from the top The numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the GP structure.
  • a QT segmentation flag indicating whether a CU is partitioned through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • information about a GP structure may be transmitted for an end node that is no longer split in the QT structure. That is, the information on the GP structure for the CU corresponding to the end node in the QT structure can be transmitted.
  • the information including the information on the GP structure may be referred to as additional partition information.
  • a GP splitting flag indicating whether the CU is split through the GP structure, that is, whether the GP structure is applied to the CU may be transmitted.
  • GP_split_flag (or GT_split_flag) may indicate a syntax element for the GP split flag. Specifically, when the value for the GP splitting flag is 1, the CU may be split into two sub-CUs, and when the value for the GP splitting flag is 0, the CU may not be split.
  • the GP splitting flag for the CU indicates that the GP structure is applied to the CU, the splitting angle and / or from the center of the CU to derive the split type through the GP structure.
  • Information about the distance may be transmitted. That is, information about the division boundary line for the CU may be transmitted, and the CU may be divided based on the division boundary line derived based on the information.
  • 6A to 6D exemplarily show a division boundary derived based on the information on the division angle and / or the distance from the center of the CU.
  • an angle of a direction (or boundary line) in which the CU is divided may be derived based on the information on the split angle, and the boundary of the boundary line in which the CU is divided based on information about a distance from the midpoint.
  • the location can be derived.
  • the dividing boundary line is the The midpoint of the CU may pass vertically, and the CU of 2N ⁇ 2N size may be divided in the same way as the type divided into sub-CUs of N ⁇ 2N size in the BT structure. Further, when the value of the dividing angle derived based on the information on the dividing angle is 90 degrees, and the distance from the midpoint derived from the information on the distance from the midpoint is 0, the dividing boundary line is defined by the CU.
  • the midpoint may pass horizontally, and the CU of 2N ⁇ 2N size may be divided in the same manner as the type divided into subCUs of 2N ⁇ N size in the BT structure.
  • the division angle for the CU may be selectively used depending on the degree of division, such as 11.25 degrees, 25 degrees, 45 degrees, or 90 degrees, and 360 degrees. It may be divided evenly in the angular range or unevenly about a specific angle.
  • one unit, two samples, four samples, or the like may be selectively used as a unit of distance from the midpoint, or a distance unit adaptively derived according to the size of the CU may be used.
  • a distance unit adaptively derived according to the size of the CU may be used.
  • the size of the CU is 4x4 size
  • the unit of the distance from the midpoint for the CU can be derived by one sample
  • the size of the CU is 8x8 size
  • the midpoint for the CU The unit of distance from can be derived with two samples.
  • a distance from the midpoint for the CU can be derived.
  • the unit of the distance is 1 If the sample, the distance from the midpoint may be derived as x. If the unit of the distance is two samples, the distance from the midpoint may be derived as 2x. In addition, when the size of the CU is 16x16 size, the unit of the distance from the midpoint can be derived with 4 samples. Meanwhile, the greater the distance from the center of the CU, the greater the unit may be applied.
  • a distance of one sample unit may be used, and the value of the distance from the midpoint is If more than 4 or less than 8, a distance of 2 sample units may be used, and if the value of the distance from the midpoint is more than 8, a distance of 4 sample units may be used.
  • a syntax element for the information representing the division angle and / or the distance from the midpoint may be transmitted to the decoding apparatus through a bitstream to indicate the division information of the CU.
  • specific partition types through the GP structure may be preset, and an index indicating one of the specific partition types may be transmitted.
  • the syntax element representing the index may be referred to as GP_mode (or GT_mode).
  • the index may be referred to as a GP split index.
  • the partition type of the CU may be derived based on the index, and the CU may be divided into non-square sub-CUs based on the partition type. For example, (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type and 2Nx (N / 2), 2Nx (N / 4) types may be preset to the specific division types.
  • the index may indicate one of the types.
  • the CU When the index indicates an nNx2N type, the CU may be divided into an nNx2N size subCU and a (2-n) Nx2N size subCU. In addition, when the index indicates a 2NxnN type, the CU may be divided into a 2NxnN sized sub CU and a 2Nx (2-n) N sized CU.
  • FIG. 7 shows an example in which syntaxes of the QTGP structure for a target CU are transmitted.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag of the target CU when the value of the QT_split_flag of the target CU is 1, that is, the QT_split_flag indicates that the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the target CU may be divided into the sub CUs.
  • the QT_split_flag for the sub-CUs may be transmitted. That is, the target CU is divided into CUs of lower depths rather than coding recursively so that CUs of end nodes that are no longer split can be derived.
  • the QT_split_flag indicates that the target CU is not divided into sub-CUs having the size of half the height and half the width of the target CU GP_split_flag for the target CU may be transmitted.
  • the GP_split_flag may indicate whether the target CU is split through the GP structure as described above. That is, the GP_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into various non-square sub-CUs.
  • shapes of CUs divided from the target CU may be determined according to the GP_split_flag and GP_mode values.
  • the target CU may be split into a split type indicated by the GP_mode, and when the value of the GP_split_flag is 0, the split type of the target CU may be derived as a 2N ⁇ 2N type. have. In other words, when the value of the GP_split_flag is 0, the target CU having a size of 2N ⁇ 2N may not be divided.
  • the GP_split_flag indicates that the target CU is split through the GP structure, the GP_mode for the target CU may be transmitted.
  • the GP_mode may indicate in which direction the target CU is divided, that is, the division type of the target CU.
  • syntax of the QTGP structure can be represented as the following table.
  • QT_split_flag may indicate a syntax element of the above-described QT splitting flag
  • GP_split_flag may indicate a syntax element of the above-mentioned GP splitting flag
  • GP_mode may indicate a syntax element of the above-mentioned GP splitting mode index.
  • a CU in a picture may be partitioned through a quad tree binary tree geometry partition (QTBTGP) structure.
  • QTBTGP quad tree binary tree geometry partition
  • the QTBTGP structure may indicate a structure in which a CU (or CTU) is divided through a QT structure and divided through a BT structure and a geometry partition (GP) structure. That is, the QTBTGP structure may represent a partition structure formed of a combination of the QT structure, the BT structure, and the GP structure. For example, when a picture is coded in units of CTU, the CTU may be split through the QT structure, and the leaf node of the QT structure may be further split through the BT structure or the GP structure. Referring to FIG.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and in addition, a specific CU among the square CUs may have a lower depth through the BT structure or the GP structure. It can be divided into non-square CU of.
  • the solid line shown in FIG. 8B may represent a QT structure, and the dotted line may represent a BT structure and a GP structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the BT structure and the GP structure.
  • a QT splitting flag indicating whether a CU is split through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • the information on the BT structure or the information on the GP structure may be transmitted to an end node that is no longer split in the QT structure. That is, information about the BT structure or information about the GP structure may be transmitted for the CU corresponding to the end node in the QT structure.
  • the information including the information on the BT structure or the information on the GP structure may be referred to as additional partition information.
  • a BTGP partition flag indicating whether the CU is partitioned through the BT structure or the GP structure, that is, whether the BT structure or the GP structure is applied to the CU may be transmitted.
  • BTGP_split_flag may indicate a syntax element for the BTGP split flag. Specifically, when the value for the BTGP split flag is 1, the CU may be split into two sub-CUs, and when the value for the BTGP split flag is 0, the CU may not be split.
  • the BTGP partition flag for the CU indicates that the BT structure or the GP structure is applied to the CU
  • information indicating whether the CU is divided according to which of the BT structure and the GP structure may be transmitted.
  • Information representing one of the BT structure and the GP structure may be referred to as BTGP mode information.
  • the syntax element for the BTGP mode information may be referred to as BTGP_mode.
  • the partition structure of the CU may be derived based on the BTGP mode information, and the CU may be divided into non-square sub-CUs through the derived partition structure.
  • the CU when the value of the BTGP mode information is 1, the CU may be split into the BT structure, and when the value of the BTGP mode information is 0, the CU may be split through the GP structure. . Also, as another example, when the value of the BTGP mode information is 0, the CU may be split into the BT structure, and when the value of the BTGP mode information is 1, the CU may be split through the GP structure. have.
  • information on the maximum CU size, the minimum CU size, the maximum depth, etc. in the BT structure may be transmitted.
  • Information about the above-described BT structure may be transmitted for each slice type or may be transmitted for each of the image components.
  • the CU When the BTGP mode information for the CU indicates a BT structure, that is, when the CU is split through the BT structure, the CU may be split in a horizontal or vertical direction.
  • the CU of 2N ⁇ 2N size may be divided into subCUs of 2N ⁇ N size
  • the CU of 2N ⁇ 2N size may be divided into subCUs of N ⁇ 2N size.
  • BT_split_mode may indicate a syntax element for the BT split mode index.
  • the CU when the value of the BT split mode index is 1, the CU may be split into sub-CUs in a vertical direction, that is, Nx2N size, and when the value of the BT split mode index is 0, The CU may be divided into sub-CUs having a horizontal direction, that is, 2N ⁇ N size.
  • the BTGP mode information for the CU indicates a GP structure, that is, when the CU is split through the GP structure, a split angle and / or to derive a split type through the GP structure.
  • Information about the distance from the center of the CU may be transmitted.
  • An angle in a direction in which the CU is split may be derived based on the information on the split angle, and a position of a boundary line at which the CU is split may be derived based on information about a distance from the midpoint.
  • N may be partitioned in the same manner as a type partitioned into N ⁇ 2N sub-CUs.
  • the value of the split angle derived based on the information on the split angle is 90 degrees, and the distance from the midpoint derived from the information on the distance from the midpoint is 0, the CU of 2N ⁇ 2N size is determined.
  • it may be partitioned in the same manner as the type divided into sub CUs having a size of 2N ⁇ N.
  • the BTGP mode information for the CU indicates a GP structure
  • specific partition types through the GP structure may be preset, and the specific partition type An index pointing to one of these may be transmitted.
  • the syntax element representing the index may be referred to as GP_mode.
  • the partition type of the CU may be derived based on the index, and the CU may be divided into non-square sub-CUs based on the partition type.
  • the index may be referred to as a GP split index.
  • (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type and 2Nx (N / 2), 2Nx (N / 4) types may be preset to the specific division types.
  • the index may indicate one of the types.
  • the CU may be divided into an nNx2N size subCU and a (2-n) Nx2N size subCU.
  • the CU when the index indicates a 2NxnN type, the CU may be divided into a 2NxnN sized sub CU and a 2Nx (2-n) N sized CU.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag of the target CU when the value of the QT_split_flag of the target CU is 1, that is, the QT_split_flag indicates that the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the target CU may be divided into the sub CUs.
  • the QT_split_flag for the sub-CUs may be transmitted. That is, the target CU is divided into CUs of lower depths rather than coding recursively so that CUs of end nodes that are no longer split can be derived.
  • the QT_split_flag for the target CU of the terminal node when the value of the QT_split_flag for the target CU of the terminal node is 0, that is, the QT_split_flag indicates that the target CU is not divided into sub-CUs having the size of half the height and half the width of the target CU
  • the BTGP_split_flag for the target CU may be transmitted.
  • the BTGP_split_flag may indicate whether the target CU is split through the BT structure or the GP structure as described above. That is, the BTGP_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into non-square sub-CUs.
  • the BTGP_mode for the target CU may be transmitted.
  • the BTGP_mode may indicate a partition structure applied to the target CU among the BT structure and the GP structure.
  • the partition structure of the target CU may be derived as the BT structure
  • the partition structure of the target CU is derived as the GP structure. Can be.
  • the GP_mode for the target CU may be transmitted.
  • the GP_mode may indicate in which direction the target CU is divided, that is, the division type of the target CU.
  • the BT_split_mode when the value of the BTGP_mode is 1, that is, when the BTGP_mode indicates that the target CU is divided through the BT structure, the BT_split_mode for the target CU may be transmitted.
  • the BT_split_mode may indicate a split type of the target CU among an Nx2N type and a 2NxN type.
  • the Nx2N type may be referred to as a vertical partition
  • the 2NxN type may be referred to as a horizontal partition.
  • the CU when the value of the BT_split_mode is 1, the CU may be divided into sub-CUs in a vertical direction, that is, an Nx2N size, and when the value of the BT_split_mode is 0, the CU is in a horizontal direction, that is, 2NxN It can be divided into sub-CUs of size.
  • the target CU when the target CU is split through the BT structure, the target CU may be split into CUs of lower depths more recursively through the BT structure.
  • syntax of the QTBTGP structure can be represented as the following table.
  • QT_split_flag may represent a syntax element of the above-described QT splitting flag
  • BTGP_split_flag may represent a syntax element of whether the above-described BT structure or GP structure is split
  • BTGP_mode is a syntax element of the above-described BT structure or GP structure recognition splitting. Can be represented.
  • a CU in a picture may be partitioned through a quad tree geometry partition binary tree (QTGPBT) structure.
  • QTGPBT quad tree geometry partition binary tree
  • 10 exemplarily shows a syntax of a CU partitioned through the QTGPBT structure and the QTGPBT structure.
  • the QTGPBT structure may indicate a partition structure in which the QT structure, the BT structure, and the GP structure are combined. That is, a CU (or CTU) may be divided through a QT structure, some of the derived CUs may be split through a GP structure, and a CU that is not split into a GP structure may be split through a BT structure. For example, when a picture is coded in units of CTU, the CTU may be split through the QT structure, and the leaf node of the QT structure may be further split through the GP structure, and the GP structure Leaf nodes not partitioned through may be additionally partitioned through the BT structure. Referring to FIG.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and a specific CU among the square CUs may be divided into the GP structure.
  • CUs other than the CU may be divided into non-square CUs of a lower depth through the BT structure.
  • FIG. 10B illustrates an example in which the syntax of the QTGPBT structure is transmitted.
  • the solid line shown in (b) of FIG. 10 may represent a QT structure, and the dotted line may represent a BT structure and a GP structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the BT structure and the GP structure.
  • a QT segmentation flag indicating whether a CU is partitioned through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • information on a GP structure may be transmitted for an end node that is no longer divided in the QT structure. That is, the information on the GP structure for the CU corresponding to the end node in the QT structure can be transmitted.
  • the information including the information on the GP structure may be referred to as additional partition information.
  • a GP splitting flag indicating whether the CU is split through the GP structure that is, whether the GP structure is applied to the CU may be transmitted.
  • GP_split_flag may indicate a syntax element for the GP split flag. Specifically, when the value for the GP splitting flag is 1, the CU may be split into two sub-CUs, and when the value for the GP splitting flag is 0, the CU is split through the BT structure. Can be.
  • a split angle and / or midpoint of the CU to derive a split type through the GP structure as described above Information about the distance from the center may be transmitted.
  • An angle in a direction in which the CU is split may be derived based on the information on the split angle, and a position of a boundary line at which the CU is split may be derived based on information about a distance from the midpoint.
  • specific partition types through the GP structure may be preset, and an index indicating one of the specific partition types may be transmitted.
  • the syntax element representing the index may be referred to as GP_mode.
  • the partition type of the CU may be derived based on the index, and the CU may be divided into non-square sub-CUs based on the partition type.
  • the index may be referred to as a GP split index.
  • BT_split_flag may indicate a syntax element for the BT split flag. Specifically, when the value for the BT split flag is 1, the CU may be split into two sub-CUs, and when the value for the BT split flag is 0, the CU may not be split. In addition, information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the BT structure may be transmitted to adjust the BT structure for the input image.
  • Information about the above-described BT structure may be transmitted for each slice type or may be transmitted for each of the image components.
  • the CU When the CU is divided through the BT structure, the CU may be divided in a horizontal or vertical direction. In other words, the CU of 2N ⁇ 2N size may be divided into subCUs of 2N ⁇ N size, or the CU of 2N ⁇ 2N size may be divided into subCUs of N ⁇ 2N size.
  • a BT partition mode index indicating the partition type of the CU may be transmitted.
  • BT_split_mode may indicate a syntax element for the BT split mode index.
  • the CU when the value of the BT split mode index is 1, the CU may be split into sub-CUs in a vertical direction, that is, Nx2N size, and when the value of the BT split mode index is 0, The CU may be divided into sub-CUs having a horizontal direction, that is, 2N ⁇ N size.
  • FIG. 11 shows an example in which syntaxes of the QTGPBT structure for a target CU are transmitted.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag when the value of QT_split_flag for the target CU of the terminal node is 0, that is, the QT_split_flag is divided into sub-CUs in which the target CU has a size of half height and half width of the target CU If not, GP_split_flag for the target CU may be transmitted.
  • the GP_split_flag may indicate whether the target CU is split through the GP structure as described above. That is, the GP_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into various non-square sub-CUs.
  • the GP_mode for the target CU may be transmitted, and the shapes of CUs divided from the target CU may be determined according to the GP_split_flag and GP_mode values as described above.
  • BT_split_flag when the value of the GP_split_flag is 0, that is, when the GP_split_flag indicates that the target CU is not divided through the GP structure, BT_split_flag for the target CU may be transmitted.
  • the BT_split_flag may indicate whether the target CU is divided through the BT structure as described above. That is, the BT_split_flag may indicate, for example, whether the target CU having a 2Nx2N size is divided into sub CUs having an Nx2N size or a 2NxN size.
  • shapes of CUs divided from the target CU may be determined according to the BT_split_flag and BT_split_mode values.
  • the target CU may be divided into sub-CUs having an Nx2N size or 2NxN size, and when the value of the BT_split_flag is 0, the target CU may not be split.
  • the BT_split_flag indicates that the target CU is split through the BT structure
  • BT_split_mode for the target CU may be transmitted.
  • the BT_split_mode may indicate in which direction the target CU is split, that is, the split type of the target CU.
  • the CU when the value of the BT_split_mode is 1, the CU may be divided into sub-CUs in a vertical direction, that is, an Nx2N size, and when the value of the BT_split_mode is 0, the CU is in a horizontal direction, that is, 2NxN It can be divided into sub-CUs of size. Meanwhile, when the target CU is split through the BT structure, BT_split_flag for the sub CU of the target CU may be transmitted and split recursively.
  • syntax of the QTGPBT structure can be represented as the following table.
  • QT_split_flag may indicate a syntax element of the above-described QT splitting flag
  • GP_split_flag may indicate a syntax element of the above-mentioned GP splitting flag
  • GP_mode may indicate a syntax element of the above-mentioned GP splitting mode index.
  • a CU in a picture may be partitioned through a quad tree binary tree geometry partition (QTBTGP) structure.
  • QTBTGP quad tree binary tree geometry partition
  • the QTBTGP structure described below may represent an embodiment different from the QTBTGP structure described above.
  • the QTBTGP structure may indicate a partition structure in which the QT structure, the BT structure, and the GP structure are combined. That is, a CU (or CTU) may be divided through a QT structure, some of the derived CUs may be split through a BT structure, and a CU not split into a BT structure may be divided through a GP structure. For example, when a picture is coded in units of CTU, the CTU may be divided through the QT structure, and the leaf node of the QT structure may be additionally divided through the BT structure, and the BT structure Leaf nodes that are not partitioned through may be additionally partitioned through the GP structure. Referring to (a) of FIG.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and a specific CU among the square CUs may be divided into the BT structure, and the specific CU may be divided into the BT structure.
  • CUs other than the CU may be divided into non-square CUs of a lower depth through the GP structure.
  • the solid line shown in (b) of FIG. 12 may represent a QT structure, and the dotted line may represent a BT structure and a GP structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the BT structure and the GP structure.
  • a QT partition flag indicating whether a CU is partitioned through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • information about the BT structure may be transmitted for an end node that is no longer split in the QT structure. That is, information about the BT structure for the CU corresponding to the end node in the QT structure may be transmitted.
  • the information including the information on the BT structure may be referred to as additional partition information.
  • a BT partition flag indicating whether the CU is partitioned through the BT structure, that is, whether the BT structure is applied to the CU may be transmitted.
  • BT_split_flag may indicate a syntax element for the BT split flag.
  • the CU when the value for the BT partition flag is 1, the CU may be divided into two sub-CUs, and when the value for the BT partition flag is 0, the CU is partitioned through the GP structure. Can be.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the BT structure may be transmitted to adjust the BT structure for the input image.
  • Information about the above-described BT structure may be transmitted for each slice type or may be transmitted for each of the image components.
  • the CU When the CU is divided through the BT structure, the CU may be divided in a horizontal or vertical direction.
  • the CU of 2N ⁇ 2N size may be divided into subCUs of 2N ⁇ N size, or the CU of 2N ⁇ 2N size may be divided into subCUs of N ⁇ 2N size.
  • a BT partition mode index indicating the partition type of the CU may be transmitted.
  • BT_split_mode may indicate a syntax element for the BT split mode index.
  • the CU when the value of the BT split mode index is 1, the CU may be split into sub-CUs in a vertical direction, that is, Nx2N size, and when the value of the BT split mode index is 0, The CU may be divided into sub-CUs having a horizontal direction, that is, 2N ⁇ N size.
  • the CU split flag when the value for the BT split flag is 0, that is, when the BT split flag for the CU indicates that the BT structure is not applied to the CU, the CU split flag is applied to the CU.
  • a GP splitting flag indicating whether the GP structure is applied to the GP structure may be transmitted.
  • GP_split_flag may indicate a syntax element for the GP split flag. Specifically, when the value for the GP splitting flag is 1, the CU may be split into two sub-CUs, and when the value for the GP splitting flag is 0, the CU may not be split.
  • a split angle and / or a midpoint of the CU may be used to derive a split type through the GP structure as described above.
  • Information about the distance from the center may be transmitted.
  • An angle in a direction in which the CU is split may be derived based on the information on the split angle, and a position of a boundary line at which the CU is split may be derived based on information about a distance from the midpoint.
  • specific partition types through the GP structure may be preset, and an index indicating one of the specific partition types may be transmitted.
  • the syntax element representing the index may be referred to as GP_mode.
  • the partition type of the CU may be derived based on the index, and the CU may be divided into non-square sub-CUs based on the partition type.
  • the index may be referred to as a GP split index.
  • FIG. 13 shows an example in which syntaxes of the QTBTGP structure for a target CU are transmitted.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag for the target CU of the terminal node is 0, that is, the QT_split_flag is divided into sub-CUs in which the target CU has a size of half height and half width of the target CU If not, BT_split_flag for the target CU may be transmitted.
  • the BT_split_flag may indicate whether the target CU is divided through the BT structure as described above. That is, the BT_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into non-square sub-CUs.
  • shapes of CUs divided from the target CU may be determined according to the BT_split_flag and BT_split_mode values as described above.
  • the BT_split_mode may indicate a split type of the target CU among an Nx2N type and a 2NxN type.
  • the Nx2N type may be referred to as a vertical partition
  • the 2NxN type may be referred to as a horizontal partition.
  • the CU when the value of the BT_split_mode is 1, the CU may be divided into sub-CUs in a vertical direction, that is, an Nx2N size, and when the value of the BT_split_mode is 0, the CU is in a horizontal direction, that is, 2NxN It can be divided into sub-CUs of size.
  • the target CU when the target CU is split through the BT structure, the target CU may be split into CUs of lower depths more recursively through the BT structure.
  • the GP_split_flag may indicate whether the target CU is split through the GP structure as described above. That is, the GP_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into various non-square sub-CUs.
  • the GP_mode for the target CU may be transmitted, and the shapes of CUs divided from the target CU may be determined according to the GP_split_flag and GP_mode values as described above.
  • syntax of the QTBTGP structure can be represented as the following table.
  • QT_split_flag may indicate a syntax element of the above-described QT splitting flag
  • BT_split_flag may indicate a syntax element of the above-mentioned BT splitting flag
  • BT_split_mode may indicate a syntax element of the above-described BT splitting mode index
  • GP_split_flag may indicate a syntax element of the above-described GP splitting flag
  • GP_mode may indicate a syntax element of the above-described GP splitting mode index.
  • the CU in the picture may be divided through the QTBTGP structure of the embodiment different from the above-described QTBTGP structure.
  • the QTBTGP structure may indicate a partition structure in which the QT structure, the BT structure, and the GP structure are combined. That is, a CU (or CTU) may be divided through a QT structure, some of the derived CUs may be split through a BT structure, and a CU not split into a BT structure may be divided through a GP structure. For example, when a picture is coded in units of CTU, the CTU may be divided through the QT structure, and the leaf node of the QT structure may be additionally divided through the BT structure, and the BT structure Leaf nodes that are not partitioned through may be additionally partitioned through the GP structure. Referring to (a) of FIG.
  • a CU may be divided into square CUs having a lower depth through a QT structure, and a particular CU among the square CUs may be divided into the BT structure, and the specific CU may be divided into the BT structure.
  • CUs other than the CU may be divided into non-square CUs of a lower depth through the GP structure.
  • the solid line shown in FIG. 14B may represent a QT structure, and the dotted line may represent a BT structure and a GP structure.
  • the syntax for the CU of the lower depth may be indicated in the upper depth from the top to the bottom.
  • the syntax for the upper left, upper right, lower left and lower right CUs may be indicated in a left to right direction.
  • the uppermost number may represent the syntax for a CU of n depth
  • the numbers in the second position from the top are CUs of n + 1 depth
  • the numbers in the location may indicate the syntax for CUs of n + 3 depth.
  • numbers indicated in bold may indicate values of syntaxes for the QT structure
  • numbers not indicated in bold may indicate values of syntaxes for the BT structure and the GP structure.
  • a QT splitting flag indicating whether a CU is split through the QT structure may be transmitted. That is, a flag indicating whether the 2N ⁇ 2N size CU is divided into four N ⁇ N size CUs may be transmitted.
  • QT_split_flag may indicate a syntax element for the QT split flag. For example, when the value of the QT splitting flag for the CU is 1, the CU may be divided into 4 sub-CUs, and when the value of the QT splitting flag for the CU is 0, the CU May not be divided.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the QT structure may be transmitted to adjust the QT structure for the input image.
  • Information about the above-described QT structure may be transmitted for each slice type, or may be transmitted for each of image components (luminance component, chroma component, etc.).
  • information on the BT structure may be transmitted for an end node that is no longer split in the QT structure. That is, information about the BT structure for the CU corresponding to the end node in the QT structure may be transmitted.
  • the information including the information on the BT structure may be referred to as additional partition information.
  • a BT partition flag indicating whether the CU is partitioned through the BT structure, that is, whether the BT structure is applied to the CU may be transmitted.
  • BT_split_flag may indicate a syntax element for the BT split flag.
  • the CU when the value for the BT partition flag is 1, the CU may be divided into two sub-CUs, and when the value for the BT partition flag is 0, the CU is partitioned through the GP structure. Can be.
  • information about a maximum CU size, a minimum CU size, a maximum depth, etc. in the BT structure may be transmitted to adjust the BT structure for the input image.
  • Information about the above-described BT structure may be transmitted for each slice type or may be transmitted for each of the image components.
  • the CU When the CU is divided through the BT structure, the CU may be divided in a horizontal or vertical direction.
  • the CU of 2N ⁇ 2N size may be divided into subCUs of 2N ⁇ N size, or the CU of 2N ⁇ 2N size may be divided into subCUs of N ⁇ 2N size.
  • a BT partition mode index indicating the partition type of the CU may be transmitted.
  • BT_split_mode may indicate a syntax element for the BT split mode index.
  • the CU when the value of the BT split mode index is 1, the CU may be split into sub-CUs in a vertical direction, that is, Nx2N size, and when the value of the BT split mode index is 0, The CU may be divided into sub-CUs having a horizontal direction, that is, 2N ⁇ N size.
  • BT_split_flag for the sub-CU of the CU can be transmitted, the BT_split_flag is determined whether the sub-CU is split through the BT structure or through the GP structure It may indicate whether it is divided.
  • BT_split_flag for the sub CU indicating whether the sub CU is split through the BT structure or the GP structure may be additionally transmitted. It may be recursively partitioned through the BT structure or the GP structure.
  • the CU partition flag when the value for the BT partition flag is 0, that is, when the BT partition flag for the CU indicates that the BT structure is not applied to the CU, the CU partition flag is applied to the CU.
  • a GP splitting flag indicating whether the GP structure is applied to the GP structure may be transmitted.
  • GP_split_flag may indicate a syntax element for the GP split flag. Specifically, when the value for the GP splitting flag is 1, the CU may be split into two sub-CUs, and when the value for the GP splitting flag is 0, the split type of the target CU is 2Nx2N type. Can be derived.
  • the target CU may be split into a 2N ⁇ 2N size, and thus, the target CU having a 2N ⁇ 2N size may not be split.
  • a split angle and / or a midpoint of the CU may be used to derive a split type through the GP structure as described above.
  • Information about the distance from the center may be transmitted.
  • An angle in a direction in which the CU is split may be derived based on the information on the split angle, and a position of a boundary line at which the CU is split may be derived based on information about a distance from the midpoint.
  • specific partition types through the GP structure may be preset, and an index indicating one of the specific partition types may be transmitted.
  • the syntax element representing the index may be referred to as GP_mode.
  • the partition type of the CU may be derived based on the index, and the CU may be divided into non-square sub-CUs based on the partition type.
  • the index may be referred to as a GP split index.
  • QT_split_flag for a target CU may be transmitted.
  • the QT_split_flag may indicate whether the target CU is split through the QT structure as described above. That is, the QT_split_flag may indicate whether the target CU is divided into sub-CUs having a size of half height and half width of the target CU.
  • the QT_split_flag for the target CU of the terminal node when the value of the QT_split_flag for the target CU of the terminal node is 0, that is, the QT_split_flag is divided into sub-CUs in which the target CU has a size of half height and half width of the target CU If not, BT_split_flag for the target CU may be transmitted.
  • the BT_split_flag may indicate whether the target CU is divided through the BT structure as described above. That is, the BT_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into non-square sub-CUs.
  • shapes of CUs divided from the target CU may be determined according to the BT_split_flag and BT_split_mode values as described above.
  • the BT_split_mode may indicate a split type of the target CU among an Nx2N type and a 2NxN type.
  • the Nx2N type may be referred to as a vertical partition
  • the 2NxN type may be referred to as a horizontal partition.
  • the CU when the value of the BT_split_mode is 1, the CU may be divided into sub-CUs in a vertical direction, that is, an Nx2N size, and when the value of the BT_split_mode is 0, the CU is in a horizontal direction, that is, 2NxN It can be divided into sub-CUs of size.
  • the target CU when the target CU is split through the BT structure, the target CU may be split into CUs of lower depths more recursively through the BT structure.
  • the GP_split_flag may indicate whether the target CU is split through the GP structure as described above. That is, the GP_split_flag may indicate, for example, whether the target CU having a 2N ⁇ 2N size is divided into various non-square sub-CUs.
  • the GP_mode for the target CU may be transmitted, and the shapes of CUs divided from the target CU may be determined according to the GP_split_flag and GP_mode values as described above.
  • BT_split_flag for an additional sub-CU is additionally transmitted and can be split into CUs of lower depth recursively through the BT structure or the GP structure. .
  • syntax of the QTBTGP structure can be represented as the following table.
  • QT_split_flag may indicate a syntax element of the above-described QT splitting flag
  • BT_split_flag may indicate a syntax element of the above-mentioned BT splitting flag
  • BT_split_mode may indicate a syntax element of the above-described BT splitting mode index
  • GP_split_flag may indicate a syntax element of the above-described GP splitting flag
  • GP_mode may indicate a syntax element of the above-described GP splitting mode index.
  • FIG. 16 schematically shows a video encoding method by an encoding device according to the present invention.
  • the method disclosed in FIG. 16 may be performed by the encoding apparatus disclosed in FIG. 1.
  • S1600 to S1610 of FIG. 16 may be performed by the picture division unit of the encoding apparatus
  • S1620 may be performed by the prediction unit of the encoding apparatus
  • S1630 may be entropy encoding of the encoding apparatus. Can be performed by wealth.
  • the encoding apparatus divides the first target block into first subblocks (S1600).
  • the encoding apparatus may split the first target block into the first subblocks through a quad tree (QT) structure.
  • QT quad tree
  • the encoding apparatus may divide the first target block into four first subblocks.
  • the first sub blocks may have sizes of half height and half width of the target block.
  • the encoding apparatus may generate a quad tree (QT) split flag for the first target block.
  • the QT splitting flag may indicate whether a block is divided into sub-blocks having a size of half height and half width of the block.
  • the encoding apparatus divides the second target block, which is one of the first subblocks, into second subblocks (S1610).
  • the second target block may not be split through the QT structure. If the second target block is not split through the QT structure, the encoding apparatus may split the second target block into second subblocks.
  • the second sub blocks may be non-square blocks.
  • the second target block may be divided into the second sub blocks through a binary tree (BT) structure.
  • BT binary tree
  • the second target block may be divided into the second subblocks of the 2N ⁇ N size.
  • the second target block may be divided into the second sub blocks of the N ⁇ 2N size.
  • the second target block may be divided into the second sub blocks through a geometry partition (GP) structure.
  • the second target block may be divided into the second sub blocks, which are various square blocks. That is, the second target block may be divided into the second sub blocks having different sizes.
  • the second target block may be divided into the second sub-blocks based on one partition type among preset partition types.
  • the division types may include, for example, (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type, and 2Nx (N / 2), 2Nx (N / 4) type.
  • the second target block When nNx2N type is applied to the second target block, the second target block may be divided into a second subblock of size nNx2N and a second subblock of size (2-n) Nx2N.
  • the second target block when the 2NxnN type is applied to the second target block, the second target block may be divided into a second subblock having a 2NxnN size and a second subblock having a 2Nx (2-n) N size.
  • the second target block may be divided into the second sub blocks based on a specific boundary line.
  • information representing an angle of the specific boundary line or information representing a distance from a midpoint of the second target block of the specific boundary line may be generated.
  • the encoding apparatus decodes the second subblocks (S1620).
  • the encoding apparatus may perform a procedure such as transform intra / inter prediction for the second sub block, and generate a reconstruction sample for the second sub block, based on the procedure.
  • the reconstructed picture may be generated.
  • the encoding apparatus generates, encodes, and outputs first partition information on the first target block, second partition information on the second target block, and additional partition information (S1630).
  • the encoding apparatus may generate the first partitioning information for the first target block and the second partitioning information for the second target block.
  • the first partitioning information may include a quad tree (QT) partition flag for the first target block
  • the second partitioning information may include a QT partitioning flag for the second target block.
  • the QT splitting flag may indicate whether a block is divided into sub-blocks having a size of half height and half width of the block.
  • the encoding apparatus may generate the additional partition information for the second target block.
  • the additional split information may be generated when the second target block is not split based on the QT split flag for the second target block. That is, the second target block may be generated when the second target block is not divided through the QT structure.
  • the additional partition information may include a BT partition flag for the second target block.
  • the BT split flag may indicate whether the second target block is divided into the second subblocks having one of 2NxN size and Nx2N size when the size of the second target block is 2Nx2N.
  • the value of the BT split flag is 1, that is, the BT split flag indicates that the second target block is split into the second sub blocks having one of 2NxN size and Nx2N size.
  • the information may include a BT partition index for the second target block, and the BT partition index may indicate one of the 2NxN size and the Nx2N size as the sizes of the second subblocks.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block, and the GP partition flag is partitioned into the second sub blocks having different sizes. It can indicate whether or not.
  • the additional splitting information is divided into a plurality of preset pieces. It may include a GP partition index indicating one of the partition types.
  • the division types include (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type and 2Nx (N / 2), 2Nx (N / 4) type, for example.
  • the GP partition index may indicate one of the types.
  • the additional splitting information is a specific boundary line. Information indicating an angle of or a distance from the midpoint of the second target block of the specific boundary line may be included.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block, and the GP partition flag may include the second sub blocks having different sizes. It may indicate whether or not divided into. If the value of the GP splitting flag is 1, that is, the GP splitting flag indicates that the second target block is split into the second subblocks having different sizes, the additional splitting information is an angle of a specific boundary line. information indicating an angle or information indicating a distance from a midpoint of the second target block of the specific boundary line. That is, based on the GP splitting flag (when the value of the splitting flag is 1), the second target block is not perpendicular to any boundary of the second target block, but specific across the second target block. It can be divided along the boundary line.
  • GP geometry partition
  • the specific boundary line may include a straight line or a curve.
  • the additional splitting information is preset. It may include a GP partition index indicating one of the plurality of partition types.
  • the additional splitting information is determined by the first splitting information. It may include a binary tree (BT) splitting flag for two target blocks.
  • the BT split flag may indicate whether the second target block is divided into second subblocks having one of a 2NxN size and an Nx2N size when the size of the second target block is 2Nx2N.
  • the additional partition information may include a BT partition index for the second target block, and the BT partition index is one of the 2N ⁇ N size and the Nx2N size. It can be represented by the size of the sub-blocks.
  • the additional partition information may include a binary tree geometry partition (BTGP) partition flag for the second target block, and the BTGP partition flag may include the second sub block in which the second target block is non-square blocks. It can indicate whether or not divided into.
  • the additional partition information may include BTGP mode information for the second target block. The BTGP mode information indicates whether the second target block is divided into the second subblocks having one of 2NxN size and Nx2N size, or divided into the second subblocks having different sizes. Can be.
  • BTGP binary tree geometry partition
  • the additional partition information indicates a BT partitioning index for the second target block. It may include. Further, when the BTGP mode information indicates that the second target block is divided into the second subblocks having different sizes, the additional division information may include information indicating an angle of a specific boundary line or information of the specific boundary line. Information indicating the distance from the midpoint of the second target block may be included. Alternatively, when the BTGP mode information indicates that the second target block is divided into the second subblocks having different sizes, the additional partition information indicates a GP partition index indicating one of a plurality of preset partition types. It may include.
  • the second sub-blocks may be divided into sub-blocks of a lower depth than the recursively through the BT structure or the GP structure.
  • a BT partition flag for the second sub blocks may be generated and encoded, the BT partition index for the second sub blocks, information representing an angle of the specific boundary line, and the specific boundary line.
  • Information indicating a distance from the midpoint of the second target block of, or the GP partition index, may be generated and encoded.
  • FIG. 17 schematically illustrates a video decoding method by a decoding apparatus according to the present invention.
  • the method disclosed in FIG. 17 may be performed by the decoding apparatus disclosed in FIG. 2.
  • S1700 and S1720 of FIG. 17 may be performed by an entropy decoding unit of the decoding apparatus
  • S1710 and 1730 may be performed by a picture divider of the decoding apparatus
  • S1740 may be the decoding apparatus. It may be performed by the prediction unit of.
  • the decoding apparatus obtains first split information about the first target block through the bitstream (S1700).
  • the decoding apparatus may obtain the first partitioning information for the first target block through a bitstream.
  • the first information may include a quad tree (QT) split flag for the first target block.
  • the QT splitting flag may indicate whether a block is divided into sub-blocks having a size of half height and half width of the block.
  • the decoding apparatus splits the first target block into the first subblocks (S1710).
  • the decoding apparatus may split the first target block into the first subblocks.
  • the first target block may be divided into four first subblocks, and the first subblock may have a half height and a half width of the first target block. It may be subblocks of size.
  • the decoding apparatus obtains second partitioning information and additional partitioning information on a second target block, which is one of the first subblocks of the first target block, through the bitstream (S1720).
  • the decoding apparatus may obtain the second partitioning information and the additional partitioning information for the second target block through a bitstream.
  • the second partitioning information may include a QT partitioning flag for the second target block.
  • the additional splitting information may include: splitting the QT splitting flag for the second target block into subblocks having a size of half height and half width of the second target block; May be obtained in the case of not indicating. That is, the additional split information may be obtained when the second target block is not split based on the QT split flag for the second target block.
  • the additional partition information may include a BT partition flag for the second target block.
  • the BT split flag may indicate whether the second target block is divided into the second subblocks having one of 2NxN size and Nx2N size when the size of the second target block is 2Nx2N.
  • the value of the BT split flag is 1, that is, the BT split flag indicates that the second target block is split into the second sub blocks having one of 2NxN size and Nx2N size.
  • the information may include a BT partition index for the second target block, and the BT partition index may indicate one of the 2NxN size and the Nx2N size as the sizes of the second subblocks.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block, and the GP partition flag is partitioned into the second sub blocks having different sizes. It can indicate whether or not.
  • the value of the GP splitting flag is 1, that is, when the GP splitting flag indicates that the second target block is split into the second subblocks having different sizes, the additional splitting information is divided into a plurality of preset pieces.
  • a GP partition index indicating one of partition types and the second target block may be partitioned into the second sub blocks based on the partition type indicated by the GP partition index.
  • the division types include (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type and 2Nx (N / 2), 2Nx (N / 4) type, for example.
  • the GP partition index may indicate one of the types.
  • the second target block may be divided into a second subblock of nNx2N size and a second subblock of (2-n) Nx2N size.
  • the second target block may be divided into a 2NxnN sized second subblock and a 2Nx (2-n) N sized second subblock.
  • the additional splitting information is a specific boundary line.
  • Information indicating an angle of or a distance from the midpoint of the second target block of the specific boundary line may be included.
  • the specific boundary line may be derived based on the information representing the angle or the information representing the distance from the midpoint, and the second target block may be divided into the second sub blocks based on the specific boundary line.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block, and the GP partition flag may include the second sub blocks having different sizes. It may indicate whether or not divided into. If the value of the GP splitting flag is 1, that is, the GP splitting flag indicates that the second target block is split into the second subblocks having different sizes, the additional splitting information is an angle of a specific boundary line. information indicating an angle or information indicating a distance from a midpoint of the second target block of the specific boundary line. That is, based on the GP splitting flag (when the value of the splitting flag is 1), the second target block is not perpendicular to any boundary of the second target block, but specific across the second target block. It can be divided along the boundary line.
  • GP geometry partition
  • the specific boundary line may include a straight line or a curve.
  • the additional splitting information is preset. It may include a GP partition index indicating one of the plurality of partition types.
  • the additional splitting information is determined by the first splitting information. It may include a binary tree (BT) splitting flag for two target blocks.
  • the BT split flag may indicate whether the second target block is divided into second subblocks having one of a 2NxN size and an Nx2N size when the size of the second target block is 2Nx2N.
  • the additional partition information may include a BT partition index for the second target block, and the BT partition index is one of the 2N ⁇ N size and the Nx2N size. It can be represented by the size of the sub-blocks.
  • the additional partition information may include a binary tree geometry partition (BTGP) partition flag for the second target block, and the BTGP partition flag may include the second sub block in which the second target block is non-square blocks. It can indicate whether or not divided into.
  • the additional partition information may include BTGP mode information for the second target block. The BTGP mode information indicates whether the second target block is divided into the second subblocks having one of 2NxN size and Nx2N size, or divided into the second subblocks having different sizes. Can be.
  • BTGP binary tree geometry partition
  • the additional partition information indicates a BT partitioning index for the second target block. It may include. Further, when the BTGP mode information indicates that the second target block is divided into the second subblocks having different sizes, the additional division information may include information indicating an angle of a specific boundary line or information of the specific boundary line. Information indicating the distance from the midpoint of the second target block may be included. Alternatively, when the BTGP mode information indicates that the second target block is divided into the second subblocks having different sizes, the additional partition information indicates a GP partition index indicating one of a plurality of preset partition types. It may include.
  • a BT splitting flag for the second subblocks may be transmitted, whereby the second subblocks may include the BT splitting index, information representing an angle of the specific boundary, and the first boundary of the specific boundary.
  • the information may be divided into subblocks of a lower depth than the recursively based on the information indicating the distance from the midpoint of the target block, or the GP split index.
  • the decoding apparatus divides the second target block into second subblocks based on the additional partitioning information ( S1730).
  • the additional partition information may include a binary tree (BT) partition flag for the second target block.
  • the additional partition information may include a BT partition index for the second target block.
  • the BT partition index indicates the 2N ⁇ N size
  • the second target block may be divided into the second subblocks having the 2N ⁇ N size.
  • the BT partition index indicates the Nx2N size
  • the second target block may be divided into the second subblocks of the Nx2N size.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block.
  • GP geometry partition
  • the second target block may be divided into the second sub blocks, which are various square blocks.
  • the second sub blocks may be non-square blocks of different sizes.
  • the second target block may not be split.
  • the additional splitting information may include a GP splitting index indicating one of a plurality of preset splitting types, and the second target block may be used. It may be divided into the second subblocks based on the partition type indicated by the GP partition index.
  • the division types may include, for example, (N / 4) x2N type, (N / 2) x2N type, Nx2N type, 2NxN type and 2Nx (N / 2), 2Nx (N / 4) type,
  • the GP partition index may indicate one of the types.
  • the second target block may be divided into a second subblock of nNx2N size and a second subblock of (2-n) Nx2N size.
  • the second target block may be divided into a 2NxnN sized second subblock and a 2Nx (2-n) N sized second subblock.
  • the additional splitting information indicates information indicating an angle of the specific boundary line or a distance from a midpoint of the second target block of the specific boundary line. May contain information.
  • the specific boundary line may be derived based on the information representing the angle or the information representing the distance from the midpoint, and the second target block may be divided into the second sub blocks based on the specific boundary line.
  • the additional partition information may include a geometry partition (GP) partition flag for the second target block. If the value of the GP splitting flag is 1, that is, the GP splitting flag indicates that the second target block is split into the second subblocks having different sizes, the additional splitting information is an angle of a specific boundary line. information indicating an angle or information indicating a distance from a midpoint of the second target block of the specific boundary line. In this case, the specific boundary line may be derived based on the information representing the angle or the information representing the distance from the midpoint, and the second target block may be divided into the second sub-blocks based on the specific boundary line. Can be.
  • GP geometry partition
  • the additional splitting information is preset. It may include a GP partition index indicating one of the plurality of partition types. The second target block may be divided into the second sub blocks based on the partition type indicated by the GP partition index.
  • the additional split information is It may include a binary tree (BT) partition flag for the second target block.
  • the additional partition information may include a BT partition index for the second target block.
  • the BT partition index indicates the 2N ⁇ N size
  • the second target block may be divided into the second subblocks having the 2N ⁇ N size.
  • the BT partition index indicates the Nx2N size
  • the second target block may be divided into the second subblocks of the Nx2N size.
  • the additional partition information may include a binary tree geometry partition (BTGP) partition flag for the second target block.
  • the additional partition information may include BTGP mode information for the second target block. If the BTGP mode information indicates that the second target block is partitioned into the second subblocks having one of a 2NxN size and an Nx2N size, the additional partition information indicates a BT partitioning index for the second target block. It may include.
  • the BT partition index indicates the 2N ⁇ N size
  • the second target block may be divided into the second subblocks having the 2N ⁇ N size.
  • the BT partition index indicates the Nx2N size
  • the second target block may be divided into the second subblocks of the Nx2N size.
  • the additional division information may include information indicating an angle of a specific boundary line or information of the specific boundary line.
  • Information indicating the distance from the midpoint of the second target block may be included.
  • the specific boundary line may be derived based on the information representing the angle or the information representing the distance from the midpoint, and the second target block may be divided into the second sub-blocks based on the specific boundary line. Can be.
  • the additional partition information indicates a GP partition index indicating one of a plurality of preset partition types. It may include.
  • the second target block may be divided into the second sub blocks based on the partition type indicated by the GP partition index.
  • the decoding device decodes the second subblocks (S1740).
  • the decoding apparatus may decode the second subblocks.
  • the decoding apparatus may generate an intra or inter prediction on the second sub block to generate a prediction sample of the second sub block, and based on the prediction sample, the second sub block may be generated.
  • a reconstructed sample may be generated for the block, and a reconstructed picture may be generated based on the reconstructed sample.
  • the decoding apparatus may directly use the prediction sample as a reconstruction sample according to a prediction mode, or generate a reconstruction sample by adding a residual sample to the prediction sample.
  • the decoding apparatus may receive information about the residual for the target block, and the information about the residual may be included in the information about the face.
  • the information about the residual may include transform coefficients regarding the residual sample.
  • the decoding apparatus may derive the residual sample (or residual sample array) for the target block based on the residual information.
  • the decoding apparatus may generate a reconstructed sample based on the prediction sample and the residual sample, and may derive a reconstructed block or a reconstructed picture based on the reconstructed sample.
  • the decoding apparatus may apply an in-loop filtering procedure, such as a deblocking filtering and / or SAO procedure, to the reconstructed picture in order to improve subjective / objective picture quality as necessary.
  • a picture may be divided into various types of blocks, and accordingly, transform efficiency may be improved and overall coding efficiency may be improved.
  • the above-described method according to the present invention may be implemented in software, and the encoding device and / or the decoding device according to the present invention may perform image processing of, for example, a TV, a computer, a smartphone, a set-top box, a display device, and the like. It can be included in the device.
  • the above-described method may be implemented as a module (process, function, etc.) for performing the above-described function.
  • the module may be stored in memory and executed by a processor.
  • the memory may be internal or external to the processor and may be coupled to the processor by various well known means.
  • the processor may include application-specific integrated circuits (ASICs), other chipsets, logic circuits, and / or data processing devices.
  • the memory may include read-only memory (ROM), random access memory (RAM), flash memory, memory card, storage medium and / or other storage device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 디코딩 장치에 의하여 수행되는 영상 디코딩 방법은 제1 대상 블록에 대한 제1 분할 정보를 획득하는 단계, 상기 제1 분할 정보가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할하는 단계, 상기 제1 대상 블록의 상기 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득하는 단계, 상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 제2 분할 정보를 기반으로 분할되지 않는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할하는 단계, 및 상기 제2 서브 블록들을 디코딩하는 단계를 포함함을 특징으로 하되, 상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 한다.

Description

영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치
본 발명은 영상 코딩 기술에 관한 것으로서 보다 상세하게는 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치에 관한 것이다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 전송되는 정보량 또는 비트량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 영상 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가된다.
이에 따라, 고해상도, 고품질 영상의 정보를 효과적으로 전송하거나 저장하고, 재생하기 위해 고효율의 영상 압축 기술이 요구된다.
본 발명의 기술적 과제는 영상 코딩 효율을 높이는 방법 및 장치를 제공함에 있다.
본 발명의 다른 기술적 과제는 픽처를 다양한 분할 구조를 통하여 분할하는 인터 예측 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 기술적 과제는 픽처를 비정방형 블록들로 분할하고, 각 비정방형 블록들을 기반으로 디코딩하는 방법 및 장치를 제공함에 있다.
본 발명의 일 실시예에 따르면, 디코딩 장치에 의하여 수행되는 영상 디코딩 방법이 제공된다. 상기 방법은 제1 대상 블록에 대한 제1 분할(split) 정보를 획득하는 단계, 상기 제1 분할 정보가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할하는 단계, 상기 제1 대상 블록의 상기 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득하는 단계, 상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 제2 분할 정보를 기반으로 분할되지 않는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할하는 단계, 및 상기 제2 서브 블록들을 디코딩하는 단계를 포함함을 특징으로 하되, 상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 한다.
본 발명의 다른 일 실시예에 따르면, 영상 디코딩을 수행하는 디코딩 장치가 제공된다. 상기 디코딩 장치는 비트스트림을 통하여 제1 대상 블록에 대한 제1 분할(split) 정보를 획득하고, 상기 제1 대상 블록의 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득하는 엔트로피 디코딩부, 상기 제1 대상 블록에 대한 상기 제1 분할 정보가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할하고, 상기 제2 대상 블록에 대한 상기 제2 분할 정보가 상기 제2 대상 블록이 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할하는 픽처 분할부, 및 상기 제2 서브 블록들을 디코딩하는 예측부를 포함하되, 상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 한다.
본 발명의 또 다른 일 실시예에 따르면, 인코딩 장치에 의하여 수행되는 비디오 인코딩 방법을 제공한다. 상기 방법은 제1 대상 블록을 제1 서브 블록들로 분할하는 단계, 상기 제1 서브 블록들 중 하나인 제2 대상 블록을 제2 서브 블록들로 분할하는 단계, 상기 제2 서브 블록들을 디코딩하는 단계, 및 상기 제1 대상 블록에 대한 제1 분할 정보, 및 상기 제2 대상 블록에 대한 제2 분할 정보, 추가 분할 정보를 생성하고 인코딩하여 출력하는 단계를 포함하되, 상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 한다.
본 발명의 또 다른 일 실시예에 따르면, 비디오 인코딩 장치를 제공한다. 상기 인코딩 장치는 제1 대상 블록을 제1 서브 블록들로 분할하고, 상기 제1 서브 블록들 중 하나인 제2 대상 블록을 제2 서브 블록들로 분할하는 픽처 분할부, 상기 제2 서브 블록들을 디코딩하는 예측부, 및 상기 제1 대상 블록에 대한 제1 분할 정보, 및 상기 제2 대상 블록에 대한 제2 분할 정보, 추가 분할 정보를 생성하고 인코딩하여 출력하는 엔트로피 인코딩부를 포함하되, 상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 한다.
본 발명에 따르면 픽처를 다양한 형태의 블록들로 분할할 수 있고, 이를 통하여, 예측 효율을 향상시킬 수 있고 전반적인 코딩 효율을 향상시킬 수 있다.
본 발명에 따르면 픽처를 다양한 형태의 블록들로 분할할 수 있고, 이를 통하여, 변환(transform) 효율을 향상시킬 수 있고 전반적인 코딩 효율을 향상시킬 수 있다.
도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 2는 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 3은 QTBT(Quad Tree Binary Tree) 구조를 통하여 분할된 CU 및 상기 QTBT 구조의 신텍스를 예시적으로 나타낸다.
도 4는 대상 CU에 대한 상기 QTBT 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 5는 상기 QTGP 구조를 통하여 분할된 CU 및 상기 QTGP 구조의 신텍스를 예시적으로 나타낸다.
도 6a 내지 6d는 분할 각도 및/또는 CU의 중점으로부터의 거리에 대한 정보를 기반으로 도출되는 분할 경계선을 예시적으로 나타낸다.
도 7은 대상 CU에 대한 상기 QTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 8은 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
도 9는 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 10은 상기 QTGPBT 구조를 통하여 분할된 CU 및 상기 QTGPBT 구조의 신텍스를 예시적으로 나타낸다.
도 11은 대상 CU에 대한 상기 QTGPBT 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 12는 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
도 13은 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 14는 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
도 15는 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 16은 본 발명에 따른 인코딩 장치에 의한 비디오 인코딩 방법을 개략적으로 나타낸다.
도 17은 본 발명에 따른 디코딩 장치에 의한 비디오 디코딩 방법을 개략적으로 나타낸다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정 실시예에 한정하려고 하는 것이 아니다. 본 명세서에서 상용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 도는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명에서 설명되는 도면상의 각 구성들은 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.
본 명세서에서 픽처(picture)는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, 슬라이스(slice)는 코딩에 있어서 픽처의 일부를 구성하는 단위이다. 하나의 픽처는 복수의 슬라이스로 구성될 수 있으며, 필요에 따라서 픽처 및 슬라이스는 서로 혼용되어 사용될 수 있다.
픽셀(pixel) 또는 펠(pel)은 하나의 픽처(또는 영상)을 구성하는 최소의 단위를 의미할 수 있다. 또한, 픽셀에 대응하는 용어로서 '샘플(sample)'이 사용될 수 있다. 샘플은 일반적으로 픽셀 또는 픽셀의 값을 나타낼 수 있으며, 휘도(luma) 성분의 픽셀/픽셀값만을 나타낼 수도 있고, 채도(chroma) 성분의 픽셀/픽셀 값만을 나타낼 수도 있다.
유닛(unit)은 영상 처리의 기본 단위를 나타낸다. 유닛은 픽처의 특정 영역 및 해당 영역에 관련된 정보 중 적어도 하나를 포함할 수 있다. 유닛은 경우에 따라서 블록(block) 또는 영역(area) 등의 용어와 혼용하여 사용될 수 있다. 일반적인 경우, MxN 블록은 M개의 열과 N개의 행으로 이루어진 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타낼 수 있다.
도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 1을 참조하면, 비디오 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 감산부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 인코딩부(135), 레지듀얼 처리부(140), 가산부(150), 필터부(155) 및 메모리(160)을 포함할 수 있다. 레지듀얼 처리부(140)는 역양자화부(141) 및 역변환부(142)를 포함할 수 있다.
픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 유닛(processing unit)으로 분할할 수 있다.
일 예로, 처리 유닛은 코딩 유닛(coding unit, CU)이라고 불릴 수 있다. 이 경우 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 QTBT (Quad-tree binary-tree) 구조에 따라 재귀적으로(recursively) 분할될 수 있다. 예를 들어, 하나의 코딩 유닛은 쿼드 트리 구조 및/또는 바이너리 트리 구조를 기반으로 하위(deeper) 뎁스의 복수의 코딩 유닛들로 분할될 수 있다. 이 경우 예를 들어 쿼드 트리 구조가 먼저 적용되고 바이너리 트리 구조가 나중에 적용될 수 있다. 또는 바이너리 트리 구조가 먼저 적용될 수도 있다. 더 이상 분할되지 않는 최종 코딩 유닛을 기반으로 본 발명에 따른 코딩 절차가 수행될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 여기서 코딩 절차라 함은 후술하는 예측, 변환, 및 복원 등의 절차를 포함할 수 있다.
다른 예로, 처리 유닛은 코딩 유닛(coding unit, CU) 예측 유닛(prediction unit, PU) 또는 변환 유닛(transform unit, TU)을 포함할 수도 있다. 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 쿼드 트리 구조를 따라서 하위(deeper) 뎁스의 코딩 유닛들로 분할(split)될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 최소 코딩 유닛(smallest coding unit, SCU)이 설정된 경우 코딩 유닛은 최소 코딩 유닛보다 더 작은 코딩 유닛으로 분할될 수 없다. 여기서 최종 코딩 유닛이라 함은 예측 유닛 또는 변환 유닛으로 파티셔닝 또는 분할되는 기반이 되는 코딩 유닛을 의미한다. 예측 유닛은 코딩 유닛으로부터 파티셔닝(partitioning)되는 유닛으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록(sub block)으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 및/또는 변환 계수로부터 레지듀얼 신호(residual signal)를 유도하는 유닛일 수 있다. 이하, 코딩 유닛은 코딩 블록(coding block, CB), 예측 유닛은 예측 블록(prediction block, PB), 변환 유닛은 변환 블록(transform block, TB) 으로 불릴 수 있다. 예측 블록 또는 예측 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 예측 샘플의 어레이(array)를 포함할 수 있다. 또한, 변환 블록 또는 변환 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 변환 계수 또는 레지듀얼 샘플의 어레이를 포함할 수 있다.
예측부(110)는 처리 대상 블록(이하, 현재 블록이라 함)에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(110)에서 수행되는 예측의 단위는 코딩 블록일 수 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.
예측부(110)는 현재 블록에 인트라 예측이 적용되는지 인터 예측이 적용되는지를 결정할 수 있다. 일 예로, 예측부(110)는 CU 단위로 인트라 예측 또는 인터 예측이 적용되는지를 결정할 수 있다.
인트라 예측의 경우에, 예측부(110)는 현재 블록이 속하는 픽처(이하, 현재 픽처) 내의 현재 블록 외부의 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 예측부(110)는 (i) 현재 블록의 주변(neighboring) 참조 샘플들의 평균(average) 혹은 인터폴레이션(interpolation)을 기반으로 예측 샘플을 유도할 수 있고, (ii) 현재 블록의 주변 참조 샘플들 중 예측 샘플에 대하여 특정 (예측) 방향에 존재하는 참조 샘플을 기반으로 상기 예측 샘플을 유도할 수도 있다. (i)의 경우는 비방향성 모드 또는 비각도 모드, (ii)의 경우는 방향성(directional) 모드 또는 각도(angular) 모드라고 불릴 수 있다. 인트라 예측에서 예측 모드는 예를 들어 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar 모드)를 포함할 수 있다. 예측부(110)는 주변 블록에 적용된 예측 모드를 이용하여, 현재 블록에 적용되는 예측 모드를 결정할 수도 있다.
인터 예측의 경우에, 예측부(110)는 참조 픽처 상에서 움직임 벡터에 의해 특정되는 샘플을 기반으로, 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(110)는 스킵(skip) 모드, 머지(merge) 모드, 및 MVP(motion vector prediction) 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 스킵 모드와 머지 모드의 경우에, 예측부(110)는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차(레지듀얼)가 전송되지 않는다. MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(Motion Vector Predictor)로 이용하여 현재 블록의 움직임 벡터 예측자로 이용하여 현재 블록의 움직임 벡터를 유도할 수 있다.
인터 예측의 경우에, 주변 블록은 현재 픽처 내에 존재하는 공간적 주변 블록(spatial neighboring block)과 참조 픽처(reference picture)에 존재하는 시간적 주변 블록(temporal neighboring block)을 포함할 수 있다. 상기 시간적 주변 블록을 포함하는 참조 픽처는 동일 위치 픽처(collocated picture, colPic)라고 불릴 수도 있다. 움직임 정보(motion information)는 움직임 벡터와 참조 픽처 인덱스를 포함할 수 있다. 예측 모드 정보와 움직임 정보 등의 정보는 (엔트로피) 인코딩되어 비트스트림 형태로 출력될 수 있다.
스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트(reference picture list) 상의 최상위 픽처가 참조 픽처로서 이용될 수도 있다. 참조 픽처 리스트(Picture Order Count)에 포함되는 참조 픽처들은 현재 픽처와 해당 참조 픽처 간의 POC(Picture order count) 차이 기반으로 정렬될 수 있다. POC는 픽처의 디스플레이 순서에 대응하며, 코딩 순서와 구분될 수 있다.
감산부(115)는 원본 샘플과 예측 샘플 간의 차이인 레지듀얼 샘플을 생성한다. 스킵 모드가 적용되는 경우에는, 상술한 바와 같이 레지듀얼 샘플을 생성하지 않을 수 있다.
변환부(120)는 변환 블록 단위로 레지듀얼 샘플을 변환하여 변환 계수(transform coefficient)를 생성한다. 변환부(120)는 해당 변환 블록의 사이즈와, 해당 변환 블록과 공간적으로 겹치는 코딩 블록 또는 예측 블록에 적용된 예측 모드에 따라서 변환을 수행할 수 있다. 예컨대, 상기 변환 블록과 겹치는 상기 코딩 블록 또는 상기 예측 블록에 인트라 예측이 적용되었고, 상기 변환 블록이 4×4의 레지듀얼 어레이(array)라면, 레지듀얼 샘플은 DST(Discrete Sine Transform)를 이용하여 변환되고, 그 외의 경우라면 레지듀얼 샘플은 DCT(Discrete Cosine Transform)를 이용하여 변환할 수 있다.
양자화부(125)는 변환 계수들을 양자화하여, 양자화된 변환 계수를 생성할 수 있다.
재정렬부(130)는 양자화된 변환 계수를 재정렬한다. 재정렬부(130)는 계수들 스캐닝(scanning) 방법을 통해 블록 형태의 양자화된 변환 계수들을 1차원 벡터 형태로 재정렬할 수 있다. 여기서 재정렬부(130)는 별도의 구성으로 설명하였으나, 재정렬부(130)는 양자화부(125)의 일부일 수 있다.
엔트로피 인코딩부(135)는 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩은 예를 들어 지수 골롬(exponential Golomb), CAVLC(context-adaptive variable length coding), CABAC(context-adaptive binary arithmetic coding) 등과 같은 인코딩 방법을 포함할 수 있다. 엔트로피 인코딩부(135)는 양자화된 변환 계수 외 비디오 복원에 필요한 정보들(예컨대 신택스 요소(syntax element)의 값 등)을 함께 또는 별도로 인코딩할 수도 있다. 엔트로피 인코딩된 정보들은 비트스트림 형태로 NAL(network abstraction layer) 유닛 단위로 전송 또는 저장될 수 있다.
역양자화부(141)는 양자화부(125)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(142)는 역양자화부(141)에서 역양자화된 값들을 역변환하여 레지듀얼 샘플을 생성한다.
가산부(150)는 레지듀얼 샘플과 예측 샘플을 합쳐서 픽처를 복원한다. 레지듀얼 샘플과 예측 샘플은 블록 단위로 더해져서 복원 블록이 생성될 수 있다. 여기서 가산부(150)는 별도의 구성으로 설명하였으나, 가산부(150)는 예측부(110)의 일부일 수 있다. 한편, 가산부(150)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.
복원된 픽처(reconstructed picture)에 대하여 필터부(155)는 디블록킹 필터 및/또는 샘플 적응적 오프셋(sample adaptive offset)을 적용할 수 있다. 디블록킹 필터링 및/또는 샘플 적응적 오프셋을 통해, 복원 픽처 내 블록 경계의 아티팩트나 양자화 과정에서의 왜곡이 보정될 수 있다. 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링의 과정이 완료된 후 적용될 수 있다. 필터부(155)는 ALF(Adaptive Loop Filter)를 복원된 픽처에 적용할 수도 있다. ALF는 디블록킹 필터 및/또는 샘플 적응적 오프셋이 적용된 후의 복원된 픽처에 대하여 적용될 수 있다.
메모리(160)는 복원 픽처(디코딩된 픽처) 또는 인코딩/디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(155)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 상기 저장된 복원 픽처는 다른 픽처의 (인터) 예측을 위한 참조 픽처로 활용될 수 있다. 예컨대, 메모리(160)는 인터 예측에 사용되는 (참조) 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트(reference picture set) 혹은 참조 픽처 리스트(reference picture list)에 의해 지정될 수 있다.
도 2는 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 2를 참조하면, 비디오 디코딩 장치(200)는 엔트로피 디코딩부(210), 레지듀얼 처리부(220), 예측부(230), 가산부(240), 필터부(250) 및 메모리(260)을 포함할 수 있다. 여기서 레지듀얼 처리부(220)은 재정렬부(221), 역양자화부(222), 역변환부(223)을 포함할 수 있다.
비디오 정보를 포함하는 비트스트림이 입력되면, 비디오 디코딩 장치는(200)는 비디오 인코딩 장치에서 비디오 정보가 처리된 프로세스에 대응하여 비디오를 복원할 수 있다.
예컨대, 비디오 디코딩 장치(200)는 비디오 인코딩 장치에서 적용된 처리 유닛을 이용하여 비디오 디코딩을 수행할 수 있다. 따라서 비디오 디코딩의 처리 유닛 블록은 일 예로 코딩 유닛일 수 있고, 다른 예로 코딩 유닛, 예측 유닛 또는 변환 유닛일 수 있다. 코딩 유닛은 최대 코딩 유닛으로부터 쿼드 트리 구조 및/또는 바이너리 트리 구조를 따라서 분할될 수 있다.
예측 유닛 및 변환 유닛이 경우에 따라 더 사용될 수 있으며, 이 경우 예측 블록은 코딩 유닛으로부터 도출 또는 파티셔닝되는 블록으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 또는 변환 계수로부터 레지듀얼 신호를 유도하는 유닛일 수 있다.
엔트로피 디코딩부(210)는 비트스트림을 파싱하여 비디오 복원 또는 픽처 복원에 필요한 정보를 출력할 수 있다. 예컨대, 엔트로피 디코딩부(210)는 지수 골롬 부호화, CAVLC 또는 CABAC 등의 코딩 방법을 기초로 비트스트림 내 정보를 디코딩하고, 비디오 복원에 필요한 신택스 엘리먼트의 값, 레지듀얼에 관한 변환 계수의 양자화된 값 들을 출력할 수 있다.
보다 상세하게, CABAC 엔트로피 디코딩 방법은, 비트스트림에서 각 구문 요소에 해당하는 빈을 수신하고, 디코딩 대상 구문 요소 정보와 주변 및 디코딩 대상 블록의 디코딩 정보 혹은 이전 단계에서 디코딩된 심볼/빈의 정보를 이용하여 문맥(context) 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 디코딩(arithmetic decoding)를 수행하여 각 구문 요소의 값에 해당하는 심볼을 생성할 수 있다. 이때, CABAC 엔트로피 디코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.
엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측에 관한 정보는 예측부(230)로 제공되고, 엔트로피 디코딩부(210)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(221)로 입력될 수 있다.
재정렬부(221)는 양자화되어 있는 변환 계수들을 2차원의 블록 형태로 재정렬할 수 있다. 재정렬부(221)는 인코딩 장치에서 수행된 계수 스캐닝에 대응하여 재정렬을 수행할 수 있다. 여기서 재정렬부(221)는 별도의 구성으로 설명하였으나, 재정렬부(221)는 역양자화부(222)의 일부일 수 있다.
역양자화부(222)는 양자화되어 있는 변환 계수들을 (역)양자화 파라미터를 기반으로 역양자화하여 변환 계수를 출력할 수 있다. 이 때, 양자화 파라미터를 유도하기 위한 정보는 인코딩 장치로부터 시그널링될 수 있다.
역변환부(223)는 변환 계수들을 역변환하여 레지듀얼 샘플들을 유도할 수 있다.
예측부(230)는 현재 블록에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(230)에서 수행되는 예측의 단위는 코딩 블록일 수도 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.
예측부(230)는 상기 예측에 관한 정보를 기반으로 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 결정할 수 있다. 이 때, 인트라 예측과 인터 예측 중 어느 것을 적용할 것인지를 결정하는 단위와 예측 샘플을 생성하는 단위는 상이할 수 있다. 아울러, 인터 예측과 인트라 예측에 있어서 예측 샘플을 생성하는 단위 또한 상이할 수 있다. 예를 들어, 인터 예측과 인트라 예측 중 어느 것을 적용할 것인지는 CU 단위로 결정할 수 있다. 또한 예를 들어, 인터 예측에 있어서 PU 단위로 예측 모드를 결정하고 예측 샘플을 생성할 수 있고, 인트라 예측에 있어서 PU 단위로 예측 모드를 결정하고 TU 단위로 예측 샘플을 생성할 수도 있다.
인트라 예측의 경우에, 예측부(230)는 현재 픽처 내의 주변 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 현재 블록의 주변 참조 샘플을 기반으로 방향성 모드 또는 비방향성 모드를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 주변 블록의 인트라 예측 모드를 이용하여 현재 블록에 적용할 예측 모드가 결정될 수도 있다.
인터 예측의 경우에, 예측부(230)는 참조 픽처 상에서 움직임 벡터에 의해 참조 픽처 상에서 특정되는 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 스킵(skip) 모드, 머지(merge) 모드 및 MVP 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 상기 예측에 관한 정보를 기반으로 획득 또는 유도될 수 있다
스킵 모드와 머지 모드의 경우에, 주변 블록의 움직임 정보가 현재 블록의 움직임 정보로 이용될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.
예측부(230)는 가용한 주변 블록의 움직임 정보로 머지 후보 리스트를 구성하고, 머지 인덱스가 머지 후보 리스트 상에서 지시하는 정보를 현재 블록의 움직임 벡터로 사용할 수 있다. 머지 인덱스는 인코딩 장치로부터 시그널링될 수 있다. 움직임 정보는 움직임 벡터와 참조 픽처를 포함할 수 있다. 스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트 상의 최상위 픽처가 참조 픽처로서 이용될 수 있다.
스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차이(레지듀얼)이 전송되지 않는다.
MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(motion vector predictor)로 이용하여 현재 블록의 움직임 벡터가 유도될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.
일 예로, 머지 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 머지 후보 리스트가 생성될 수 있다. 머지 모드에서는 머지 후보 리스트에서 선택된 후보 블록의 움직임 벡터가 현재 블록의 움직임 벡터로 사용된다. 상기 예측에 관한 정보는 상기 머지 후보 리스트에 포함된 후보 블록들 중에서 선택된 최적의 움직임 벡터를 갖는 후보 블록을 지시하는 머지 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 머지 인덱스를 이용하여, 현재 블록의 움직임 벡터를 도출할 수 있다.
다른 예로, MVP(Motion Vector Prediction) 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 움직임 벡터 예측자 후보 리스트가 생성될 수 있다. 즉, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터는 움직임 벡터 후보로 사용될 수 있다. 상기 예측에 관한 정보는 상기 리스트에 포함된 움직임 벡터 후보 중에서 선택된 최적의 움직임 벡터를 지시하는 예측 움직임 벡터 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 움직임 벡터 인덱스를 이용하여, 움직임 벡터 후보 리스트에 포함된 움직임 벡터 후보 중에서, 현재 블록의 예측 움직임 벡터를 선택할 수 있다. 인코딩 장치의 예측부는 현재 블록의 움직임 벡터와 움직임 벡터 예측자 간의 움직임 벡터 차분(MVD)을 구할 수 있고, 이를 인코딩하여 비트스트림 형태로 출력할 수 있다. 즉, MVD는 현재 블록의 움직임 벡터에서 상기 움직임 벡터 예측자를 뺀 값으로 구해질 수 있다. 이 때, 예측부(230)는 상기 예측에 관한 정보에 포함된 움직임 벡터 차분을 획득하고, 상기 움직임 벡터 차분과 상기 움직임 벡터 예측자의 가산을 통해 현재 블록의 상기 움직임 벡터를 도출할 수 있다. 예측부는 또한 참조 픽처를 지시하는 참조 픽처 인덱스 등을 상기 예측에 관한 정보로부터 획득 또는 유도할 수 있다.
가산부(240)는 레지듀얼 샘플과 예측 샘플을 더하여 현재 블록 혹은 현재 픽처를 복원할 수 있다. 가산부(240)는 레지듀얼 샘플과 예측 샘플을 블록 단위로 더하여 현재 픽처를 복원할 수도 있다. 스킵 모드가 적용된 경우에는 레지듀얼이 전송되지 않으므로, 예측 샘플이 복원 샘플이 될 수 있다. 여기서는 가산부(240)를 별도의 구성으로 설명하였으나, 가산부(240)는 예측부(230)의 일부일 수도 있다. 한편, 가산부(240)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.
필터부(250)는 복원된 픽처에 디블록킹 필터링 샘플 적응적 오프셋, 및/또는 ALF 등을 적용할 수 있다. 이 때, 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링 이후 적용될 수도 있다. ALF는 디블록킹 필터링 및/또는 샘플 적응적 오프셋 이후 적용될 수도 있다.
메모리(260)는 복원 픽처(디코딩된 픽처) 또는 디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(250)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 예컨대, 메모리(260)는 인터 예측에 사용되는 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트 혹은 참조 픽처 리스트에 의해 지정될 수도 있다. 복원된 픽처는 다른 픽처에 대한 참조 픽처로서 이용될 수 있다. 또한, 메모리(260)는 복원된 픽처를 출력 순서에 따라서 출력할 수도 있다.
상술한 내용과 같이 입력된 픽처에 대한 코딩이 수행되는 경우, 하나의 처리 유닛을 기반으로 상기 코딩이 수행될 수 있다. 상기 처리 유닛은 코딩 유닛(coding unit, CU)으로 나타낼 수 있다. 한편, 상기 픽처 내 유사한 정보를 포함하는 영역 단위로 코딩이 수행될수록 변환 효율이 향상될 수 있고, 이를 통하여 전반적인 코딩 효율이 향상될 수 있다. 또한, 상기 픽처 내 유사한 정보를 포함하는 영역 단위로 코딩이 수행될수록 예측 정확도가 향상될 수 있고, 이를 통하여 전반적인 코딩 효율이 향상될 수 있다. 하지만, 쿼드 트리(quad tree, QT) 구조만이 적용되어 상기 픽처가 정방형의 CU들로만 분할되는 경우, 상기 CU들이 정확하게 유사한 정보만을 포함하도록 분할하는 것은 한계가 있을 수 있다. 예를 들어, 상기 픽처 내 특정 객체를 나타내는 정보가 대각선 방향으로 넓게 위치할 수 있고, 이 경우, 하나의 CU로 상기 특정 객체를 나타내는 정보를 포함하면, 상기 특정 객체를 나타내는 정보 이외의 정보를 많이 포함하게 될 수 있고, 복수의 정방형 CU들로 상기 특정 객체를 나타내는 정보를 포함하면, 상기 복수의 CU들 각각에 대하여 코딩이 수행되어야 하는바, 코딩 효율이 저하될 수 있다. 이러한 경우, 상기 픽처를 상기 특정 객체를 나타내는 정보를 포함하는 비정방형 CU로 분할되도록 하는 것이 보다 코딩 효율을 향상시킬 수 있다. 이에, 본 발명은 상기 쿼드 트리 구조와 함께 다른 분할 구조를 적용하여 입력된 픽처를 정방형 CU 및 비정방형 CU로 분할하는 방법을 제안한다. 이를 통하여, 상기 픽처는 상기 픽처 내 정보들에 따라 다양한 형태의 CU들로 분할될 수 있으며, 보다 효율적으로 코딩이 수행될 수 있다.
도 3은 QTBT(Quad Tree Binary Tree) 구조를 통하여 분할된 CU 및 상기 QTBT 구조의 신텍스를 예시적으로 나타낸다.
상기 QTBT 구조는 CU(또는 CTU)가 QT 구조를 통하여 분할되고, 바이너리 트리(binary tree, BT) 구조를 통하여 분할되는 구조를 나타낼 수 있다. 즉, 상기 QTBT는 상기 QT 구조와 상기 BT 구조가 결합된 형태로 구성된 분할 구조를 나타낼 수 있고, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 BT 구조를 통하여 분할될 수 있다. 여기서, 상기 리프 노드는 상기 QT 구조에서 더 이상 분할되지 않는 CU를 나타낼 수 있고, 상기 리프 노드는 말단 노드라고 불릴 수도 있다. 또한, 상기 QT 구조는 2Nx2N 사이즈의 CU(또는 CTU)가 4개의 NxN 사이즈의 서브 CU들로 분할되는 구조를 나타낼 수 있고, 상기 BT 구조는 2Nx2N 사이즈의 CU가 2개의 Nx2N 사이즈의 서브 CU들 또는, 2개의 2NxN 사이즈의 서브 CU들로 분할되는 구조를 나타낼 수 있다. 도 3의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 BT 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 3의 (b)는 상기 QTBT 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 3의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 BT 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 BT 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 3의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 3의 (b)를 참조하면 BT 구조에 대한 정보는 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 BT 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 BT 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 BT 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 BT 구조의 적용 여부를 나타내는 BT 분할 플래그가 전송될 수 있다. BT_split_flag 는 상기 BT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 BT 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 BT 분할 플래그에 대한 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 BT 구조를 조절하기 위해서 BT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 BT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들 각각에 대하여 전송될 수 있다. 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU는 가로 또는 세로 방향으로 분할될 수 있다. 다시 말해, 2Nx2N 사이즈의 상기 CU는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 또는 상기 2Nx2N 사이즈의 상기 CU는 Nx2N 사이즈의 서브 CU들로 분할될 수 있다. 상기 CU가 어떤 방향으로 분할되는지, 즉, 상기 CU의 분할 타입을 나타내는 BT 분할 모드 인덱스가 전송될 수 있다. BT_split_mode 는 상기 BT 분할 모드 인덱스에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 모드 인덱스의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT 분할 모드 인덱스의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다.
도 4는 대상 CU에 대한 상기 QTBT 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 4를 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
구체적으로, 예를 들어, 상기 대상 CU의 상기 QT_split_flag의 값이 1인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할됨을 나타내는 경우, 상기 대상 CU는 상기 서브 CU들로 분할될 수 있다. 이 경우, 상기 서브 CU들에 대한 상기 QT_split_flag가 전송될 수 있다. 즉, 상기 대상 CU는 코딩 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할되어 더 이상 분할되지 않는 말단 노드의 CU들이 도출될 수 있다.
한편, 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 BT_split_flag 가 전송될 수 있다. 상기 BT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 BT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 BT_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 Nx2N 사이즈 또는 2NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 BT 구조가 적용되는 경우, 상기 BT_split_flag와 BT_split_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다.
구체적으로, 상기 BT_split_flag의 값이 1인 경우, 상기 대상 CU는 상기 Nx2N 사이즈 또는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 상기 BT_split_flag의 값이 0인 경우, 상기 대상 CU는 분할되지 않을 수 있다. 상기 BT_split_flag가 상기 대상 CU가 상기 BT 구조를 통하여 분할됨을 나타내는 경우, 상기 대상 CU에 대한 BT_split_mode 가 전송될 수 있다. 상기 BT_split_mode는 상기 대상 CU가 어떤 방향으로 분할되는지, 즉, 상기 대상 CU의 분할 타입을 나타낼 수 있다. 예를 들어, 상기 BT_split_mode의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT_split_mode의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다.
또한, 상기 QTBT 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000001
Figure PCTKR2017008717-appb-I000001
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_flag는 상술한 BT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_mode는 상술한 BT 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다.
한편, 픽처 내 CU는 상술한 QTBT 구조를 통하여 분할될 수 있으나, QTGP(Quad Tree geometry partition) 구조를 통하여 분할될 수도 있다.
도 5는 상기 QTGP 구조를 통하여 분할된 CU 및 상기 QTGP 구조의 신텍스를 예시적으로 나타낸다.
상기 QTGP 구조는 CU(또는 CTU)가 QT 구조를 통하여 분할되고, GP(geometry partition) 구조를 통하여 분할되는 구조를 나타낼 수 있다. 상기 GP 구조는 GT(geometry tree) 구조라고 불릴 수도 있다. 즉, 상기 QTGP 구조는 상기 QT 구조와 상기 GP 구조가 결합된 형태로 구성된 분할 구조를 나타낼 수 있고, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 GP 구조를 통하여 분할될 수 있다. 여기서, 상기 GP 구조는 상기 CU가 다양한 형태의 비정방형 서브 CU들로 분할되는 구조를 나타낼 수 있다. 즉, 도 5의 (a)에 도시된 것과 같이 상기 BT 구조를 통하여 도출되는 Nx2N 또는 2NxN 사이즈의 서브 CU들이외에 다양한 형태의 서브 CU들이 도출될 수 있다. 도 5의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 상기 GP 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 5의 (b)는 상기 QTGP 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 5의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 GP 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 GP 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 5의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 5의 (b)를 참조하면 GP 구조에 대한 정보는 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 GP 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 GP 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 GP 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 GP 구조의 적용 여부를 나타내는 GP 분할 플래그가 전송될 수 있다. GP_split_flag(또는 GT_split_flag) 는 상기 GP 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 GP 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 GP 분할 플래그에 대한 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다.
한편, 상기 CU에 대한 GP 분할 플래그가 상기 CU에 상기 GP 구조가 적용됨을 나타내는 경우, 상기 GP 구조를 통한 분할 타입을 도출하기 위하여 분할 각도(angle) 및/또는 상기 CU의 중점(center)으로부터의 거리(distance) 에 대한 정보가 전송될 수 있다. 즉, 상기 CU에 대한 분할 경계선에 대한 정보가 전송될 수 있고, 상기 CU는 상기 정보를 기반으로 도출된 분할 경계선을 기준으로 분할될 수 있다.
도 6a 내지 6d는 상기 분할 각도 및/또는 상기 CU의 중점으로부터의 거리에 대한 정보를 기반으로 도출되는 분할 경계선을 예시적으로 나타낸다. 도 6a를 참조하면 상기 분할 각도에 대한 정보를 기반으로 상기 CU가 분할되는 방향(또는 경계선)의 각도가 도출될 수 있고, 상기 중점으로부터의 거리에 대한 정보를 기반으로 상기 CU가 분할되는 경계선의 위치가 도출될 수 있다.
예를 들어, 상기 분할 각도에 대한 정보를 기반으로 도출된 분할 각도의 값이 0도이고, 상기 중점으로부터의 거리에 대한 정보로부터 도출된 상기 중점으로부터의 거리가 0인 경우, 상기 분할 경계선은 상기 CU의 중점을 수직으로 지날 수 있고, 2Nx2N 사이즈의 상기 CU는 상기 BT 구조에서 Nx2N 사이즈의 서브 CU들로 분할되는 타입과 동일하게 분할될 수 있다. 또한, 상기 분할 각도에 대한 정보를 기반으로 도출된 분할 각도의 값이 90도이고, 상기 중점으로부터의 거리에 대한 정보로부터 도출된 상기 중점으로부터의 거리가 0인 경우, 상기 분할 경계선은 상기 CU의 중점을 수평으로 지날 수 있고, 2Nx2N 사이즈의 상기 CU는 상기 BT 구조에서 2NxN 사이즈의 서브 CU들로 분할되는 타입과 동일하게 분할될 수 있다. 또한, 도 6b 내지 6d의 (a) 내지 (e)를 참조하면 상기 CU에 대한 상기 분할 각도는 분할 정도에 따라서 11.25도, 25도, 45도 또는 90도 등이 선택적으로 사용될 수 있으며, 360도 각도 범위에서 균등하게 분할되거나 특정 각도를 중심으로 비균등하게 분할될 수도 있다.
또한, 상기 중점으로부터의 거리의 단위는 분할 정도에 따라서 1샘플, 2샘플, 또는 4샘플 등이 선택적으로 사용될 수 있으며, 또는 상기 CU의 사이즈에 따라서 적응적으로 도출되는 거리 단위가 사용될 수도 있다. 예를 들어, 상기 CU의 사이즈가 4x4 사이즈인 경우, 상기 CU에 대한 상기 중점으로부터의 거리의 단위는 1샘플로 도출될 수 있고, 상기 CU의 사이즈가 8x8 사이즈인 경우, 상기 CU에 대한 상기 중점으로부터의 거리의 단위는 2샘플로 도출될 수 있다. 이를 통하여 상기 CU에 대한 상기 중점으로부터의 거리가 도출될 수 있는바, 예를 들어, 비트스트림을 통하여 획득된 상기 중점으로부터의 거리를 나타내는 분할 정보의 값이 x인 경우, 상기 거리의 단위가 1샘플이면 상기 중점으로부터의 거리는 x로 도출될 수 있고, 상기 거리의 단위가 2샘플이면 상기 중점으로부터의 거리는 2x로 도출될 수 있다. 또한, 상기 CU의 사이즈가 16x16 사이즈인 경우, 상기 중점으로부터의 거리의 단위는 4샘플로 도출될 수 있다. 한편, 상기 CU의 중점에서 거리가 멀어질수록 상기 단위가 크게 적용될 수도 있다. 구체적으로, 예를 들어, 상기 CU의 사이즈가 32x32 사이즈인 경우, 상기 CU는 상기 중점으로부터의 거리의 값이 4 이하인 경우에는 1 샘플 단위의 거리가 사용될 수 있고, 상기 중점으로부터의 거리의 값이 4 초과 8 이하인 경우에는 2 샘플 단위의 거리가 사용될 수 있고, 상기 중점으로부터의 거리의 값이 8을 초과하는 경우에는 4 샘플 단위의 거리가 사용될 수 있다.
상기 분할 각도 및/또는 상기 중점으로부터의 거리를 나타내는 정보에 대한 신텍스 요소는 상기 CU의 분할 정보를 나타내기 위해서 비트스트림을 통하여 디코딩 장치로 전송될 수 있다.
또한, 상기 GP 구조를 통한 특정 분할 타입들이 기설정될 수 있고, 상기 특정 분할 타입들 중 하나를 가리키는 인덱스가 전송될 수 있다. 상기 인덱스를 나타내는 신텍스 요소는 GP_mode(또는 GT_mode) 라고 나타낼 수 있다. 상기 인덱스는 GP 분할 인덱스라고 불릴 수 있다. 이 경우, 상기 인덱스를 기반으로 상기 CU의 분할 타입이 도출될 수 있고, 상기 분할 타입을 기반으로 상기 CU는 비정방형 서브 CU들로 분할될 수 있다. 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입이 상기 특정 분할 타입들로 기설정될 수 있고, 상기 인덱스는 상기 타입들 중 하나를 나타낼 수 있다. 상기 인덱스가 nNx2N 타입을 나타내는 경우, 상기 CU는 nNx2N 사이즈의 서브 CU와 (2-n)Nx2N 사이즈의 서브 CU로 분할될 수 있다. 또한, 상기 인덱스가 2NxnN 타입을 나타내는 경우, 상기 CU는 2NxnN 사이즈의 서브 CU와 2Nx(2-n)N 사이즈의 서브 CU로 분할될 수 있다.
도 7은 대상 CU에 대한 상기 QTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 7을 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
구체적으로, 예를 들어, 상기 대상 CU의 상기 QT_split_flag의 값이 1인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할됨을 나타내는 경우, 상기 대상 CU는 상기 서브 CU들로 분할될 수 있다. 이 경우, 상기 서브 CU들에 대한 상기 QT_split_flag가 전송될 수 있다. 즉, 상기 대상 CU는 코딩 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할되어 더 이상 분할되지 않는 말단 노드의 CU들이 도출될 수 있다.
한편, 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 GP_split_flag 가 전송될 수 있다. 상기 GP_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 GP_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 다양한 형태의 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 GP 구조가 적용되는 경우, 상기 GP_split_flag와 GP_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다.
구체적으로, 상기 GP_split_flag의 값이 1인 경우, 상기 대상 CU는 상기 GP_mode 가 나타내는 분할 타입으로 분할될 수 있고, 상기 GP_split_flag의 값이 0인 경우, 상기 대상 CU의 분할 타입은 2Nx2N 타입으로 도출될 수 있다. 다시 말해, 상기 GP_split_flag의 값이 0인 경우, 2Nx2N 사이즈인 상기 대상 CU는 분할되지 않을 수 있다. 상기 GP_split_flag가 상기 대상 CU가 상기 GP 구조를 통하여 분할됨을 나타내는 경우, 상기 대상 CU에 대한 GP_mode 가 전송될 수 있다. 상기 GP_mode는 상기 대상 CU가 어떤 방향으로 분할되는지, 즉, 상기 대상 CU의 분할 타입을 나타낼 수 있다.
또한, 상기 QTGP 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000002
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_split_flag는 상술한 GP 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_mode는 상술한 GP 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다.
한편, 픽처 내 CU는 상술한 구조들 이외에도 QTBTGP(Quad Tree Binary Tree Geometry Partition) 구조를 통하여 분할될 수도 있다.
도 8은 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
상기 QTBTGP 구조는 CU(또는 CTU)가 QT 구조를 통하여 분할되고, BT 구조 및 GP(geometry partition) 구조를 통하여 분할되는 구조를 나타낼 수 있다. 즉, 상기 QTBTGP 구조는 상기 QT 구조와 상기 BT 구조 및 GP 구조가 결합된 형태로 구성된 분할 구조를 나타낼 수 있다. 예를 들어, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 BT 구조 또는 GP 구조를 통하여 분할될 수 있다. 도 8의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 상기 BT 구조 또는 상기 GP 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 8의 (b)는 상기 QTBTGP 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 8의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 BT 구조 및 GP 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 BT 구조 및 GP 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 8의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 8의 (b)를 참조하면 상기 BT 구조에 대한 정보 또는 상기 GP 구조에 대한 정보는 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 BT 구조에 대한 정보 또는 상기 GP 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 BT 구조에 대한 정보 또는 GP 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 BT 구조 또는 상기 GP 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 BT 구조 또는 상기 GP 구조의 적용 여부를 나타내는 BTGP 분할 플래그가 전송될 수 있다. BTGP_split_flag 는 상기 BTGP 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 BTGP 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 BTGP 분할 플래그에 대한 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다.
한편, 상기 CU에 대한 BTGP 분할 플래그가 상기 CU에 상기 BT 구조 또는 상기 GP 구조가 적용됨을 나타내는 경우, 상기 BT 구조 및 상기 GP 구조 중 어느 구조에 따라서 상기 CU가 분할되는지를 나타내는 정보가 전송될 수 있다. 상기 BT 구조 및 상기 GP 구조 중 하나의 구조를 나타내는 정보는 BTGP 모드 정보라고 불릴 수 있다. 상기 BTGP 모드 정보에 대한 신텍스 요소는 BTGP_mode 라고 나타낼 수 있다. 이 경우, 상기 BTGP 모드 정보를 기반으로 상기 CU의 분할 구조가 도출될 수 있고, 상기 CU는 상기 도출된 분할 구조를 통하여 비정방형 서브 CU들로 분할될 수 있다. 예를 들어, 상기 BTGP 모드 정보의 값이 1인 경우, 상기 CU는 상기 BT 구조로 분할될 수 있고, 상기 BTGP 모드 정보의 값이 0인 경우, 상기 CU는 상기 GP 구조를 통하여 분할될 수 있다. 또한, 다른 예로, 상기 BTGP 모드 정보의 값이 0인 경우, 상기 CU는 상기 BT 구조로 분할될 수 있고, 상기 BTGP 모드 정보의 값이 1인 경우, 상기 CU는 상기 GP 구조를 통하여 분할될 수 있다.
한편, 입력 영상에 대한 상기 BT 구조를 조절하기 위해서 BT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 BT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들 각각에 대하여 전송될 수 있다.
상기 CU에 대한 상기 BTGP 모드 정보가 BT 구조를 나타내는 경우, 즉, 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU는 가로 또는 세로 방향으로 분할될 수 있다. 다시 말해, 2Nx2N 사이즈의 상기 CU는 2NxN 사이즈의 서브 CU들로 분할 될 수 있고, 상기 2Nx2N 사이즈의 상기 CU는 Nx2N 사이즈의 서브 CU들로 분할 될 수 있다. 이에, 상기 CU가 어떤 방향으로 분할되는지, 즉, 상기 CU의 분할 타입을 나타내는 BT 분할 모드 인덱스가 전송될 수 있다. BT_split_mode 는 상기 BT 분할 모드 인덱스에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 모드 인덱스의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT 분할 모드 인덱스의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다.
한편, 상기 CU에 대한 상기 BTGP 모드 정보가 GP 구조를 나타내는 경우, 즉, 상기 CU가 상기 GP 구조를 통하여 분할되는 경우, 상기 GP 구조를 통한 분할 타입을 도출하기 위하여 분할 각도(angle) 및/또는 상기 CU의 중점(center)으로부터의 거리(distance) 에 대한 정보가 전송될 수 있다. 상기 분할 각도에 대한 정보를 기반으로 상기 CU가 분할되는 방향의 각도가 도출될 수 있고, 상기 중점으로부터의 거리에 대한 정보를 기반으로 상기 CU가 분할되는 경계선의 위치가 도출될 수 있다. 예를 들어, 상기 분할 각도에 대한 정보를 기반으로 도출된 분할 각도의 값이 0도이고, 상기 중점으로부터의 거리에 대한 정보로부터 도출된 상기 중점으로부터의 거리가 0인 경우, 2Nx2N 사이즈의 상기 CU는 상기 BT 구조에서 Nx2N 사이즈의 서브 CU들로 분할되는 타입과 동일하게 분할될 수 있다. 또한, 상기 분할 각도에 대한 정보를 기반으로 도출된 분할 각도의 값이 90도이고, 상기 중점으로부터의 거리에 대한 정보로부터 도출된 상기 중점으로부터의 거리가 0인 경우, 2Nx2N 사이즈의 상기 CU는 상기 BT 구조에서 2NxN 사이즈의 서브 CU들로 분할되는 타입과 동일하게 분할될 수 있다.
또한, 상기 CU에 대한 상기 BTGP 모드 정보가 GP 구조를 나타내는 경우, 즉, 상기 CU가 상기 GP 구조를 통하여 분할되는 경우, 상기 GP 구조를 통한 특정 분할 타입들이 기설정될 수 있고, 상기 특정 분할 타입들 중 하나를 가리키는 인덱스가 전송될 수 있다. 상기 인덱스를 나타내는 신텍스 요소는 GP_mode 라고 나타낼 수 있다. 이 경우, 상기 인덱스를 기반으로 상기 CU의 분할 타입이 도출될 수 있고, 상기 분할 타입을 기반으로 상기 CU는 비정방형 서브 CU들로 분할될 수 있다. 상기 인덱스는 GP 분할 인덱스라고 불릴 수 있다. 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입이 상기 특정 분할 타입들로 기설정될 수 있고, 상기 인덱스는 상기 타입들 중 하나를 나타낼 수 있다. 상기 인덱스가 nNx2N 타입을 나타내는 경우, 상기 CU는 nNx2N 사이즈의 서브 CU와 (2-n)Nx2N 사이즈의 서브 CU로 분할될 수 있다. 또한, 상기 인덱스가 2NxnN 타입을 나타내는 경우, 상기 CU는 2NxnN 사이즈의 서브 CU와 2Nx(2-n)N 사이즈의 서브 CU로 분할될 수 있다.
도 9는 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 9를 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
구체적으로, 예를 들어, 상기 대상 CU의 상기 QT_split_flag의 값이 1인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할됨을 나타내는 경우, 상기 대상 CU는 상기 서브 CU들로 분할될 수 있다. 이 경우, 상기 서브 CU들에 대한 상기 QT_split_flag가 전송될 수 있다. 즉, 상기 대상 CU는 코딩 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할되어 더 이상 분할되지 않는 말단 노드의 CU들이 도출될 수 있다.
한편, 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 BTGP_split_flag 가 전송될 수 있다. 상기 BTGP_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 BT 구조 또는 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 BTGP_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
구체적으로, 상기 BTGP_split_flag의 값이 1인 경우, 상기 대상 CU에 대한 BTGP_mode가 전송될 수 있다. 상기 BTGP_mode는 상기 BT 구조 및 상기 GP 구조 중 상기 대상 CU에 적용되는 분할 구조를 나타낼 수 있다. 예를 들어, 상기 BTGP_mode의 값이 1인 경우, 상기 대상 CU의 분할 구조는 상기 BT 구조로 도출될 수 있고, 상기 BTGP_mode의 값이 0인 경우, 상기 대상 CU의 분할 구조는 상기 GP 구조로 도출될 수 있다.
상기 BTGP_mode의 값이 0인 경우, 즉, 상기 BTGP_mode가 상기 대상 CU가 상기 GP 구조를 통하여 분할됨을 나타내는 경우, 상기 대상 CU에 대한 GP_mode 가 전송될 수 있다. 상기 GP_mode는 상기 대상 CU가 어떤 방향으로 분할되는지, 즉, 상기 대상 CU의 분할 타입을 나타낼 수 있다.
또한, 상기 BTGP_mode의 값이 1인 경우, 즉, 상기 BTGP_mode가 상기 대상 CU가 상기 BT 구조를 통하여 분할됨을 나타내는 경우, 상기 대상 CU에 대한 BT_split_mode 가 전송될 수 있다. 상기 BT_split_mode 는 Nx2N 타입 및 2NxN 타입 중 상기 대상 CU의 분할 타입을 나타낼 수 있다. 여기서, 상기 Nx2N 타입은 vertical 분할(partition)이라고 나타낼 수 있고, 상기 2NxN 타입은 horizontal 분할(partition)이라고 나타낼 수 있다. 예를 들어, 상기 BT_split_mode의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT_split_mode의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다. 또한, 상기 대상 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 BT 구조를 통하여 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할될 수 있다.
또한, 상기 QTBTGP 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000003
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BTGP_split_flag는 상술한 BT 구조 또는 GP 구조 분할 여부의 신텍스 요소를 나타낼 수 있고, BTGP_mode는 상술한 BT 구조 인지 GP 구조 인지 분할의 신텍스 요소를 나타낼 수 있다.
한편, 픽처 내 CU는 상술한 구조들 이외에도 QTGPBT(Quad Tree Geometry Partition Binary Tree) 구조를 통하여 분할될 수도 있다.
도 10은 상기 QTGPBT 구조를 통하여 분할된 CU 및 상기 QTGPBT 구조의 신텍스를 예시적으로 나타낸다.
상기 QTGPBT 구조는 상기 QT 구조, BT 구조 및 GP 구조가 결합된 분할 구조를 나타낼 수 있다. 즉, CU(또는 CTU)가 QT 구조를 통하여 분할되고, 도출된 CU들 중 일부는 GP 구조를 통하여 분할되고, GP 구조로 분할되지 않은 CU는 BT 구조를 통하여 분할되는 구조를 나타낼 수 있다. 예를 들어, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 상기 GP 구조를 통하여 분할될 수 있고, 상기 GP 구조를 통하여 분할되지 않은 리프 노드는 추가적으로 상기 BT 구조를 통하여 분할될 수 있다. 도 10의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 상기 GP 구조로 분할될 수 있고, 상기 특정 CU 이외의 CU는 상기 BT 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 10의 (b)는 상기 QTGPBT 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 10의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 BT 구조 및 GP 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 BT 구조 및 GP 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 10의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 10의 (b)를 참조하면 GP 구조에 대한 정보는 상기 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 GP 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 GP 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 GP 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 GP 구조의 적용 여부를 나타내는 GP 분할 플래그가 전송될 수 있다. GP_split_flag 는 상기 GP 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 GP 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 GP 분할 플래그에 대한 값이 0인 경우, 상기 CU는 상기 BT 구조를 통하여 분할될 수 있다.
한편, 상기 CU에 대한 GP 분할 플래그가 상기 CU에 상기 GP 구조가 적용됨을 나타내는 경우, 상술한 내용과 같이 상기 GP 구조를 통한 분할 타입을 도출하기 위하여 분할 각도(angle) 및/또는 상기 CU의 중점(center)으로부터의 거리(distance) 에 대한 정보가 전송될 수 있다. 상기 분할 각도에 대한 정보를 기반으로 상기 CU가 분할되는 방향의 각도가 도출될 수 있고, 상기 중점으로부터의 거리에 대한 정보를 기반으로 상기 CU가 분할되는 경계선의 위치가 도출될 수 있다. 또한, 상술한 내용과 같이 상기 GP 구조를 통한 특정 분할 타입들이 기설정될 수 있고, 상기 특정 분할 타입들 중 하나를 가리키는 인덱스가 전송될 수 있다. 상기 인덱스를 나타내는 신텍스 요소는 GP_mode 라고 나타낼 수 있다. 이 경우, 상기 인덱스를 기반으로 상기 CU의 분할 타입이 도출될 수 있고, 상기 분할 타입을 기반으로 상기 CU는 비정방형 서브 CU들로 분할될 수 있다. 상기 인덱스는 GP 분할 인덱스라고 불릴 수 있다.
한편, 상기 GP 분할 플래그에 대한 값이 0인 경우, 즉, 상기 CU에 대한 GP 분할 플래그가 상기 CU에 상기 GP 구조가 적용되지 않음을 나타내는 경우, 상기 CU에 대한 상기 BT 구조의 적용 여부를 나타내는 BT 분할 플래그가 전송될 수 있다. BT_split_flag 는 상기 BT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 BT 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 BT 분할 플래그에 대한 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 BT 구조를 조절하기 위해서 BT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 BT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들 각각에 대하여 전송될 수 있다. 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU는 가로 또는 세로 방향으로 분할될 수 있다. 다시 말해, 2Nx2N 사이즈의 상기 CU는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 또는 상기 2Nx2N 사이즈의 상기 CU는 Nx2N 사이즈의 서브 CU들로 분할될 수 있다. 상기 CU가 어떤 방향으로 분할되는지, 즉, 상기 CU의 분할 타입을 나타내는 BT 분할 모드 인덱스가 전송될 수 있다. BT_split_mode 는 상기 BT 분할 모드 인덱스에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 모드 인덱스의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT 분할 모드 인덱스의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다.
도 11은 대상 CU에 대한 상기 QTGPBT 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 11을 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
또한, 도 11을 참조하면 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 GP_split_flag 가 전송될 수 있다. 상기 GP_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 GP_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 다양한 형태의 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 GP 구조가 적용되는 경우, 상기 대상 CU에 대한 GP_mode 가 전송될 수 있고, 상술한 내용과 같이 상기 GP_split_flag와 GP_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다.
또한, 도 11을 참조하면 상기 GP_split_flag의 값이 0인 경우, 즉, 상기 GP_split_flag가 상기 대상 CU가 상기 GP 구조를 통하여 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 BT_split_flag 가 전송될 수 있다. 상기 BT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 BT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 BT_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 Nx2N 사이즈 또는 2NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 BT 구조가 적용되는 경우, 상기 BT_split_flag와 BT_split_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다.
구체적으로, 상기 BT_split_flag의 값이 1인 경우, 상기 대상 CU는 상기 Nx2N 사이즈 또는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 상기 BT_split_flag의 값이 0인 경우, 상기 대상 CU는 분할되지 않을 수 있다. 상기 BT_split_flag가 상기 대상 CU가 상기 BT 구조를 통하여 분할됨을 나타내는 경우, 상기 대상 CU에 대한 BT_split_mode 가 전송될 수 있다. 상기 BT_split_mode는 상기 대상 CU가 어떤 방향으로 분할되는지, 즉, 상기 대상 CU의 분할 타입을 나타낼 수 있다. 예를 들어, 상기 BT_split_mode의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT_split_mode의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다. 한편, 상기 대상 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 대상 CU의 서브 CU에 대한 BT_split_flag가 전송되어 재귀적으로 분할될 수 있다.
또한, 상기 QTGPBT 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000004
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_split_flag는 상술한 GP 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_mode는 상술한 GP 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다. 상술한 표 4를 참조하면 QTGPBT 구조가 적용되는 상기 대상 CU에 대한 GP_split_flag가 0인 경우, 상기 대상 CU의 하위 뎁스(depth)의 서브 CU는 상술한 BT 구조를 가질 수 있다.
한편, 픽처 내 CU는 상술한 구조들 이외에도 QTBTGP(Quad Tree Binary Tree Geometry Partition) 구조를 통하여 분할될 수도 있다. 후술하는 QTBTGP 구조는 상술한 QTBTGP 구조와는 다른 실시예를 나타낼 수 있다.
도 12는 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
상기 QTBTGP 구조는 상기 QT 구조, BT 구조 및 GP 구조가 결합된 분할 구조를 나타낼 수 있다. 즉, CU(또는 CTU)가 QT 구조를 통하여 분할되고, 도출된 CU들 중 일부는 BT 구조를 통하여 분할되고, BT 구조로 분할되지 않은 CU는 GP 구조를 통하여 분할되는 구조를 나타낼 수 있다. 예를 들어, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 상기 BT 구조를 통하여 분할될 수 있고, 상기 BT 구조를 통하여 분할되지 않은 리프 노드는 추가적으로 상기 GP 구조를 통하여 분할될 수 있다. 도 12의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 상기 BT 구조로 분할될 수 있고, 상기 특정 CU 이외의 CU는 상기 GP 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 12의 (b)는 상기 QTBTGP 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 12의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 BT 구조 및 GP 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 BT 구조 및 GP 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 12의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 12의 (b)를 참조하면 BT 구조에 대한 정보는 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 BT 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 BT 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 BT 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 BT 구조의 적용 여부를 나타내는 BT 분할 플래그가 전송될 수 있다. BT_split_flag 는 상기 BT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 BT 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 BT 분할 플래그에 대한 값이 0인 경우, 상기 CU는 상기 GP 구조를 통하여 분할될 수 있다. 또한, 입력 영상에 대한 상기 BT 구조를 조절하기 위해서 BT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 BT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들 각각에 대하여 전송될 수 있다. 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU는 가로 또는 세로 방향으로 분할될 수 있다. 다시 말해, 2Nx2N 사이즈의 상기 CU는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 또는 상기 2Nx2N 사이즈의 상기 CU는 Nx2N 사이즈의 서브 CU들로 분할될 수 있다. 상기 CU가 어떤 방향으로 분할되는지, 즉, 상기 CU의 분할 타입을 나타내는 BT 분할 모드 인덱스가 전송될 수 있다. BT_split_mode 는 상기 BT 분할 모드 인덱스에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 모드 인덱스의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT 분할 모드 인덱스의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다.
한편, 도 12의 (b)를 참조하면 상기 BT 분할 플래그에 대한 값이 0인 경우, 즉, 상기 CU에 대한 BT 분할 플래그가 상기 CU에 상기 BT 구조가 적용되지 않음을 나타내는 경우, 상기 CU에 대한 상기 GP 구조의 적용 여부를 나타내는 GP 분할 플래그가 전송될 수 있다. GP_split_flag 는 상기 GP 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 GP 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 GP 분할 플래그에 대한 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 상기 CU에 대한 상기 GP 분할 플래그가 상기 CU에 상기 GP 구조가 적용됨을 나타내는 경우, 상술한 내용과 같이 상기 GP 구조를 통한 분할 타입을 도출하기 위하여 분할 각도(angle) 및/또는 상기 CU의 중점(center)으로부터의 거리(distance) 에 대한 정보가 전송될 수 있다. 상기 분할 각도에 대한 정보를 기반으로 상기 CU가 분할되는 방향의 각도가 도출될 수 있고, 상기 중점으로부터의 거리에 대한 정보를 기반으로 상기 CU가 분할되는 경계선의 위치가 도출될 수 있다. 또한, 상술한 내용과 같이 상기 GP 구조를 통한 특정 분할 타입들이 기설정될 수 있고, 상기 특정 분할 타입들 중 하나를 가리키는 인덱스가 전송될 수 있다. 상기 인덱스를 나타내는 신텍스 요소는 GP_mode 라고 나타낼 수 있다. 이 경우, 상기 인덱스를 기반으로 상기 CU의 분할 타입이 도출될 수 있고, 상기 분할 타입을 기반으로 상기 CU는 비정방형 서브 CU들로 분할될 수 있다. 상기 인덱스는 GP 분할 인덱스라고 불릴 수 있다.
도 13은 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 13을 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
또한, 도 13을 참조하면 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 BT_split_flag 가 전송될 수 있다. 상기 BT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 BT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 BT_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 BT 구조가 적용되는 경우, 상술한 내용과 같이 상기 BT_split_flag와 BT_split_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다. 상기 BT_split_mode 는 Nx2N 타입 및 2NxN 타입 중 상기 대상 CU의 분할 타입을 나타낼 수 있다. 여기서, 상기 Nx2N 타입은 vertical 분할(partition)이라고 나타낼 수 있고, 상기 2NxN 타입은 horizontal 분할(partition)이라고 나타낼 수 있다. 예를 들어, 상기 BT_split_mode의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT_split_mode의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다. 또한, 상기 대상 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 BT 구조를 통하여 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할될 수 있다.
한편, 도 13을 참조하면 상기 BT_split_flag의 값이 0인 경우, 즉, 상기 BT_split_flag가 상기 대상 CU가 상기 BT 구조를 통하여 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 GP_split_flag 가 전송될 수 있다. 상기 GP_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 GP_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 다양한 형태의 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 GP 구조가 적용되는 경우, 상기 대상 CU에 대한 GP_mode 가 전송될 수 있고, 상술한 내용과 같이 상기 GP_split_flag와 GP_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다.
또한, 상기 QTBTGP 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000005
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_flag는 상술한 BT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_mode는 상술한 BT 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다. GP_split_flag는 상술한 GP 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_mode는 상술한 GP 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다. 상술한 표 5를 참조하면 상술한 QTBTGP 구조가 적용되는 경우, 상기 QT 구조의 리프 노드는 상기 GP 구조가 적용될 수 있다.
한편, 픽처 내 CU는 상술한 QTBTGP 구조와는 다른 실시예의 QTBTGP 구조를 통하여 분할될 수 있다.
도 14는 상기 QTBTGP 구조를 통하여 분할된 CU 및 상기 QTBTGP 구조의 신텍스를 예시적으로 나타낸다.
상기 QTBTGP 구조는 상기 QT 구조, BT 구조 및 GP 구조가 결합된 분할 구조를 나타낼 수 있다. 즉, CU(또는 CTU)가 QT 구조를 통하여 분할되고, 도출된 CU들 중 일부는 BT 구조를 통하여 분할되고, BT 구조로 분할되지 않은 CU는 GP 구조를 통하여 분할되는 구조를 나타낼 수 있다. 예를 들어, 픽처가 CTU 단위로 코딩되는 경우, CTU는 상기 QT 구조를 통하여 분할될 수 있고, 상기 QT 구조의 리프 노드(leaf node)는 추가적으로 상기 BT 구조를 통하여 분할될 수 있고, 상기 BT 구조를 통하여 분할되지 않은 리프 노드는 추가적으로 상기 GP 구조를 통하여 분할될 수 있다. 도 14의 (a)를 참조하면 CU는 QT 구조를 통하여 하위 뎁스(depth)의 정방형 CU들로 분할될 수 있고, 추가적으로 상기 정방형 CU들 중 특정 CU는 상기 BT 구조로 분할될 수 있고, 상기 특정 CU 이외의 CU는 상기 GP 구조를 통하여 하위 뎁스의 비정방형 CU들로 분할될 수 있다.
도 14의 (b)는 상기 QTBTGP 구조의 신텍스가 전송되는 일 예를 나타낼 수 있다. 도 14의 (b)에 도시된 실선은 QT 구조를 나타낼 수 있고, 점선은 BT 구조 및 GP 구조를 나타낼 수 있다. 또한, 위에서 아래로 갈수록 상위 뎁스(depth)에서 하위 뎁스의 CU에 대한 신텍스를 나타낼 수 있다. 또한, 좌에서 우로의 방향으로 좌상측, 우상측, 좌하측, 우하측 CU에 대한 신텍스를 나타낼 수 있다. 구체적으로, 가장 위의 숫자는 n 뎁스의 CU에 대한 신텍스를 나타낼 수 있고, 위에서 두번째 위치의 숫자들은 n+1 뎁스의 CU들, 위에서 세번째 위치의 숫자들은 n+2 뎁스의 CU들, 위에서 네번째 위치의 숫자들은 n+3 뎁스의 CU들에 대한 신텍스를 나타낼 수 있다. 또한, 볼드체로 표시된 숫자들은 QT 구조에 대한 신텍스들의 값들을 나타낼 수 있고, 볼드체로 표시되지 않은 숫자들은 BT 구조 및 GP 구조에 대한 신텍스들의 값들을 나타낼 수 있다.
도 14의 (b)를 참조하면 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타내는 QT 분할 플래그가 전송될 수 있다. 즉, 상기 2Nx2N 사이즈의 CU가 4개의 NxN 사이즈의 서브 CU들로 분할되는지 여부를 나타내는 플래그가 전송될 수 있다. QT_split_flag 는 상기 QT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 예를 들어, 상기 CU에 대한 상기 QT 분할 플래그의 값이 1인 경우, 상기 CU는 4개의 서브 CU들로 분할 될 수 있고, 상기 CU에 대한 상기 QT 분할 플래그의 값이 0인 경우, 상기 CU는 분할되지 않을 수 있다. 또한, 입력 영상에 대한 상기 QT 구조를 조절하기 위하여 상기 QT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 QT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들(휘도 성분, 채도 성분 등) 각각에 대하여 전송될 수 있다.
도 14의 (b)를 참조하면 BT 구조에 대한 정보는 QT 구조에서 더 이상 분할되지 않는 말단 노드에 대하여 전송될 수 있다. 즉, 상기 QT 구조에서 말단 노드에 해당하는 CU에 대한 상기 BT 구조에 대한 정보가 전송될 수 있다. 여기서, 상기 BT 구조에 대한 정보를 포함하는 정보는 추가 분할 정보라고 불릴 수 있다. 예를 들어, 상기 CU의 상기 BT 구조를 통한 분할 여부, 즉, 상기 CU에 대한 상기 BT 구조의 적용 여부를 나타내는 BT 분할 플래그가 전송될 수 있다. BT_split_flag 는 상기 BT 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 BT 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 BT 분할 플래그에 대한 값이 0인 경우, 상기 CU는 상기 GP 구조를 통하여 분할될 수 있다. 또한, 입력 영상에 대한 상기 BT 구조를 조절하기 위해서 BT 구조에서의 최대 CU 사이즈, 최소 CU 사이즈, 최대 뎁스 등에 대한 정보가 전송될 수 있다. 상술한 BT 구조에 대한 정보들은 슬라이스 타입들 각각에 대하여 전송될 수 있고, 또는 영상 성분들 각각에 대하여 전송될 수 있다. 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU는 가로 또는 세로 방향으로 분할될 수 있다. 다시 말해, 2Nx2N 사이즈의 상기 CU는 2NxN 사이즈의 서브 CU들로 분할될 수 있고, 또는 상기 2Nx2N 사이즈의 상기 CU는 Nx2N 사이즈의 서브 CU들로 분할될 수 있다. 상기 CU가 어떤 방향으로 분할되는지, 즉, 상기 CU의 분할 타입을 나타내는 BT 분할 모드 인덱스가 전송될 수 있다. BT_split_mode 는 상기 BT 분할 모드 인덱스에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 모드 인덱스의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT 분할 모드 인덱스의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다. 한편, 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 CU의 서브 CU에 대한 BT_split_flag가 전송될 수 있는바, 상기 BT_split_flag는 상기 서브 CU가 상기 BT 구조를 통하여 분할되는지, 또는 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 서브 CU가 상기 BT 구조 또는 상기 GP 구조를 통하여 분할되는지 여부를 나타내는 상기 서브 CU에 대한 BT_split_flag가 추가적으로 전송될 수 있고, 이에 상기 서브 CU는 BT 구조 또는 GP 구조를 통하여 재귀적으로 분할될 수 있다.
한편, 도 14의 (b)를 참조하면 상기 BT 분할 플래그에 대한 값이 0인 경우, 즉, 상기 CU에 대한 BT 분할 플래그가 상기 CU에 상기 BT 구조가 적용되지 않음을 나타내는 경우, 상기 CU에 대한 상기 GP 구조의 적용 여부를 나타내는 GP 분할 플래그가 전송될 수 있다. GP_split_flag 는 상기 GP 분할 플래그에 대한 신텍스 요소를 나타낼 수 있다. 구체적으로, 상기 GP 분할 플래그에 대한 값이 1인 경우, 상기 CU는 2개의 서브 CU들로 분할될 수 있고, 상기 GP 분할 플래그에 대한 값이 0인 경우, 상기 대상 CU의 분할 타입은 2Nx2N 타입으로 도출될 수 있다. 즉, 상기 GP_split_flag의 값이 0인 경우, 상기 대상 CU는 2Nx2N 사이즈로 분할될 수 있는바, 2Nx2N 사이즈인 상기 대상 CU는 분할되지 않을 수 있다. 상기 CU에 대한 상기 GP 분할 플래그가 상기 CU에 상기 GP 구조가 적용됨을 나타내는 경우, 상술한 내용과 같이 상기 GP 구조를 통한 분할 타입을 도출하기 위하여 분할 각도(angle) 및/또는 상기 CU의 중점(center)으로부터의 거리(distance) 에 대한 정보가 전송될 수 있다. 상기 분할 각도에 대한 정보를 기반으로 상기 CU가 분할되는 방향의 각도가 도출될 수 있고, 상기 중점으로부터의 거리에 대한 정보를 기반으로 상기 CU가 분할되는 경계선의 위치가 도출될 수 있다. 또한, 상술한 내용과 같이 상기 GP 구조를 통한 특정 분할 타입들이 기설정될 수 있고, 상기 특정 분할 타입들 중 하나를 가리키는 인덱스가 전송될 수 있다. 상기 인덱스를 나타내는 신텍스 요소는 GP_mode 라고 나타낼 수 있다. 이 경우, 상기 인덱스를 기반으로 상기 CU의 분할 타입이 도출될 수 있고, 상기 분할 타입을 기반으로 상기 CU는 비정방형 서브 CU들로 분할될 수 있다. 상기 인덱스는 GP 분할 인덱스라고 불릴 수 있다.
도 15는 대상 CU에 대한 상기 QTBTGP 구조의 신텍스들이 전송되는 일 예를 나타낸다.
도 15를 참조하면 대상 CU에 대한 QT_split_flag가 전송될 수 있다. 상기 QT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 QT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 QT_split_flag는 상기 대상 CU가 상기 대상 CU의 절반 높이(height) 및 절반 폭(width)의 사이즈를 갖는 서브 CU들로 분할되는지 여부를 나타낼 수 있다.
또한, 도 15를 참조하면 상기 말단 노드의 대상 CU에 대한 QT_split_flag의 값은 0인 경우, 즉, 상기 QT_split_flag가 상기 대상 CU가 상기 대상 CU의 절반 높이 및 절반 폭의 사이즈를 갖는 서브 CU들로 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 BT_split_flag 가 전송될 수 있다. 상기 BT_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 BT 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 BT_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 BT 구조가 적용되는 경우, 상술한 내용과 같이 상기 BT_split_flag와 BT_split_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다. 상기 BT_split_mode 는 Nx2N 타입 및 2NxN 타입 중 상기 대상 CU의 분할 타입을 나타낼 수 있다. 여기서, 상기 Nx2N 타입은 vertical 분할(partition)이라고 나타낼 수 있고, 상기 2NxN 타입은 horizontal 분할(partition)이라고 나타낼 수 있다. 예를 들어, 상기 BT_split_mode의 값이 1인 경우, 상기 CU는 수직 방향, 즉, Nx2N 사이즈의 서브 CU들로 분할 될 수 있고, 상기 BT_split_mode의 값이 0 경우, 상기 CU는 수평 방향, 즉, 2NxN 사이즈의 서브 CU들로 분할 될 수 있다. 또한, 상기 대상 CU가 상기 BT 구조를 통하여 분할되는 경우, 상기 BT 구조를 통하여 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할될 수 있다.
한편, 도 15를 참조하면 상기 BT_split_flag의 값이 0인 경우, 즉, 상기 BT_split_flag가 상기 대상 CU가 상기 BT 구조를 통하여 분할되지 않음을 나타내는 경우, 상기 대상 CU에 대한 GP_split_flag 가 전송될 수 있다. 상기 GP_split_flag는 상술한 바와 같이 상기 대상 CU가 상기 GP 구조를 통하여 분할되는지 여부를 나타낼 수 있다. 즉, 상기 GP_split_flag는 예를 들어, 2Nx2N 사이즈의 상기 대상 CU가 다양한 형태의 비정방형 서브 CU들로 분할되는지 여부를 나타낼 수 있다. 상기 대상 CU에 상기 GP 구조가 적용되는 경우, 상기 대상 CU에 대한 GP_mode 가 전송될 수 있고, 상술한 내용과 같이 상기 GP_split_flag와 GP_mode 값에 따라서 상기 대상 CU로부터 분할된 CU들의 모양이 결정될 수 있다. 한편, 상기 대상 CU가 상기 BT 구조를 통하여 분할되는 경우, 추가적으로 서브 CU에 대한 BT_split_flag 가 전송되어 상기 BT 구조 또는 상기 GP 구조를 통하여 재귀적으로(recursively) 보다 하위 뎁스의 CU들로 분할될 수 있다.
또한, 상기 QTBTGP 구조의 신텍스들은 다음의 표와 같이 나타낼 수 있다.
Figure PCTKR2017008717-appb-T000006
Figure PCTKR2017008717-appb-I000002
여기서, QT_split_flag는 상술한 QT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_flag는 상술한 BT 분할 플래그의 신텍스 요소를 나타낼 수 있고, BT_split_mode는 상술한 BT 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다. GP_split_flag는 상술한 GP 분할 플래그의 신텍스 요소를 나타낼 수 있고, GP_mode는 상술한 GP 분할 모드 인덱스의 신텍스 요소를 나타낼 수 있다. 상술한 표 5를 참조하면 상술한 QTBTGP 구조가 적용되는 경우, 상기 BT 구조가 적용되지 않는 리프 노드는 상기 GP 구조가 적용될 수 있다.
도 16은 본 발명에 따른 인코딩 장치에 의한 비디오 인코딩 방법을 개략적으로 나타낸다. 도 16에서 개시된 방법은 도 1에서 개시된 인코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, 도 16의 S1600 내지 S1610은 상기 인코딩 장치의 픽처 분할부에 의하여 수행될 수 있고, S1620은 상기 인코딩 장치의 예측부에 의하여 수행될 수 있고, S1630은 상기 인코딩 장치의 엔트로피 인코딩부에 의하여 수행될 수 있다.
인코딩 장치는 제1 대상 블록을 제1 서브 블록들로 분할한다(S1600). 인코딩 장치는 상기 제1 대상 블록을 QT(Quad Tree) 구조를 통하여 상기 제1 서브 블록들로 분할할 수 있다. 구체적으로, 예를 들어, 인코딩 장치는 상기 제1 대상 블록을 4개의 상기 제1 서브 블록들로 분할할 수 있다. 상기 제1 서브 블록들은 상기 대상 블록의 절반 높이 및 절반 폭의 사이즈를 가질 수 있다. 한편, 인코딩 장치는 상기 제1 대상 블록에 대한 QT(Quad Tree) 분할(split) 플래그를 생성할 수 있다. 상기 QT 분할 플래그는 블록이 상기 블록의 절반 높이(half height) 및 절반 폭(half width)의 사이즈의 서브 블록들로 분할되는지 여부를 나타낼 수 있다.
인코딩 장치는 상기 제1 서브 블록들 중 하나인 제2 대상 블록을 제2 서브 블록들로 분할한다(S1610). 상기 제2 대상 블록은 상기 QT 구조를 통하여 분할되지 않을 수 있다. 인코딩 장치는 상기 제2 대상 블록이 상기 QT 구조를 통하여 분할되지 않는 경우, 상기 제2 대상 블록을 제2 서브 블록들로 분할할 수 있다. 상기 제2 서브 블록들은 비정방형 블록들일 수 있다.
일 예로, 상기 제2 대상 블록은 BT(Binary Tree) 구조를 통하여 상기 제2 서브 블록들로 분할될 수 있다. 구체적으로, 예를 들어, 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록은 상기 2NxN 사이즈의 상기 제2 서브 블록들로 분할될 수 있다. 또는, 상기 제2 대상 블록은 상기 Nx2N 사이즈의 상기 제2 서브 블록들로 분할될 수 있다.
또한, 다른 예로, 상기 제2 대상 블록은 GP(geometry Partition) 구조를 통하여 상기 제2 서브 블록들로 분할될 수 있다. 이 경우, 상기 제2 대상 블록은 다양한 형태의 비정방형 블록들인 상기 제2 서브 블록들로 분할될 수 있다. 즉, 상기 제2 대상 블록은 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할될 수 있다. 구체적으로, 예를 들어, 상기 제2 대상 블록은 기설정된 분할 타입들 중 하나의 분할 타입을 기반으로 상기 제2 서브 블록들로 분할될 수 있다. 상기 분할 타입들은 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입을 포함할 수 있다. 상기 제2 대상 블록에 대하여 nNx2N 타입이 적용되는 경우, 상기 제2 대상 블록은 nNx2N 사이즈의 제2 서브 블록과 (2-n)Nx2N 사이즈의 제2 서브 블록으로 분할될 수 있다. 또는, 상기 제2 대상 블록에 대하여 2NxnN 타입이 적용되는 경우, 상기 제2 대상 블록은 2NxnN 사이즈의 제2 서브 블록과 2Nx(2-n)N 사이즈의 제2 서브 블록으로 분할될 수 있다.
또한, 예를 들어, 상기 제2 대상 블록은 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할될 수 있다. 이 경우, 상기 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보가 생성될 수 있다.
인코딩 장치는 상기 제2 서브 블록들을 디코딩한다(S1620). 인코딩 장치는 상기 제2 서브 블록에 대한 변환(transform) 인트라(intra)/인터(inter) 예측, 등의 절차를 수행하고, 상기 제2 서브 블록에 대한 복원 샘플을 생성할 수 있고, 이를 기반으로 복원 픽처를 생성할 수 있다.
인코딩 장치는 상기 제1 대상 블록에 대한 제1 분할 정보, 및 상기 제2 대상 블록에 대한 제2 분할 정보, 추가 분할 정보를 생성하고 인코딩하여 출력한다(S1630). 인코딩 장치는 상기 제1 대상 블록에 대한 상기 제1 분할 정보 및 상기 제2 대상 블록에 대한 상기 제2 분할 정보를 생성할 수 있다. 상기 제1 분할 정보는 상기 제1 대상 블록에 대한 QT(Quad Tree) 분할 플래그를 포함할 수 있고, 상기 제2 분할 정보는 상기 제2 대상 블록에 대한 QT 분할 플래그를 포함할 수 있다. 상기 QT 분할 플래그는 블록이 상기 블록의 절반 높이(half height) 및 절반 폭(half width)의 사이즈의 서브 블록들로 분할되는지 여부를 나타낼 수 있다.
또한, 인코딩 장치는 상기 제2 대상 블록에 대한 상기 추가 분할 정보를 생성할 수 있다. 상기 추가 분할 정보는 상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 QT 분할 플래그를 기반으로 분할되지 않는 경우에 생성될 수 있다. 즉, 상기 제2 대상 블록이 상기 QT 구조를 통하여 분할되지 않는 경우에 생성될 수 있다.
예를 들어, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 플래그를 포함할 수 있다. 상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BT 분할 플래그의 값이 1인 경우, 즉, 상기 BT 분할 플래그가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있고, 상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타낼 수 있다.
또한, 상기 BT 분할 플래그의 값이 0인 경우, 즉, 상기 BT 분할 플래그가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있고, 상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다. 예를 들어, 상기 분할 타입들은 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입을 포함할 수 있고, 상기 GP 분할 인덱스는 상기 타입들 중 하나를 나타낼 수 있다.
또는, 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있고, 상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 즉, 상기 GP 분할 플래그를 기반으로(상기 분할 플래그의 값이 1인 경우), 상기 제2 대상 블록은 상기 제2 대상 블록의 임의의 경계에 수직하지 않고, 상기 제2 대상 블록을 가로지르는 특정 경계선을 따라서 분할될 수 있다. 상기 특정 경계선은 직선 또는 곡선을 포함할 수 있다. 또는, 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다.
상기 GP 분할 플래그의 값이 0인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함할 수 있다. 상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있고, 상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타낼 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP(Binary Tree Geometry Partition) 분할 플래그를 포함할 수 있고, 상기 BTGP 분할 플래그는 상기 제2 대상 블록이 비정방형 블록들인 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BTGP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP 모드 정보를 포함할 수 있다. 상기 BTGP 모드 정보는 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지, 또는 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BTGP 모드 정보가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있다. 또한, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 또는, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다.
한편, 상기 제2 서브 블록들이 상기 BT 구조 또는 상기 GP 구조를 통하여 재귀적으로(recursively) 보다 하위 뎁스(depth)의 서브 블록들로 분할될 수 있다. 이 경우, 상기 제2 서브 블록들에 대한 BT 분할 플래그가 생성되어 인코딩될 수 있고, 상기 제2 서브 블록들에 대한 상기 BT 분할 인덱스, 상기 특정 경계선의 각도(angle)를 나타내는 정보, 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보, 또는 상기 GP 분할 인덱스가 생성되어 인코딩될 수 있다.
도 17은 본 발명에 따른 디코딩 장치에 의한 비디오 디코딩 방법을 개략적으로 나타낸다. 도 17에서 개시된 방법은 도 2에서 개시된 디코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, 도 17의 S1700 및 S1720은 상기 디코딩 장치의 엔트로피 디코딩부에 의하여 수행될 수 있고, S1710 및 1730은 상기 디코딩 장치의 픽처 분할부에 의하여 수행될 수 있고, S1740은 상기 디코딩 장치의 예측부에 의하여 수행될 수 있다.
디코딩 장치는 비트스트림을 통하여 제1 대상 블록에 대한 제1 분할 정보를 획득한다(S1700). 디코딩 장치는 비트스트림을 통하여 상기 제1 대상 블록에 대한 상기 제1 분할 정보를 획득할 수 있다. 상기 제1 정보는 상기 제1 대상 블록에 대한 QT(Quad Tree) 분할 플래그를 포함할 수 있다. 상기 QT 분할 플래그는 블록이 상기 블록의 절반 높이(half height) 및 절반 폭(half width)의 사이즈의 서브 블록들로 분할되는지 여부를 나타낼 수 있다.
디코딩 장치는 상기 제1 분할 정보가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할한다(S1710). 상기 제1 분할 정보에 포함된 상기 QT 분할 플래그가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 디코딩 장치는 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할할 수 있다. 예를 들어, 상기 제1 대상 블록은 4개의 상기 제1 서브 블록들로 분할될 수 있고, 상기 제1 서브 블록은 상기 제1 대상 블록의 절반 높이(half height) 및 절반 폭(half width)의 사이즈의 서브 블록들일 수 있다.
디코딩 장치는 상기 비트스트림을 통하여 상기 제1 대상 블록의 상기 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득한다(S1720). 디코딩 장치는 비트스트림을 통하여 상기 제2 대상 블록에 대한 상기 제2 분할 정보 및 추가 분할 정보를 획득할 수 있다. 상기 제2 분할 정보는 상기 제2 대상 블록에 대한 QT 분할 플래그를 포함할 수 있다. 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 상기 QT 분할 플래그가 상기 제2 대상 블록이 상기 제2 대상 블록의 절반 높이(half height) 및 절반 폭(half width)의 사이즈의 서브 블록들로 분할되지 않음을 나타내는 경우에 획득될 수 있다. 즉, 상기 추가 분할 정보는 상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 QT 분할 플래그를 기반으로 분할되지 않는 경우에 획득될 수 있다.
한편, 예를 들어, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 플래그를 포함할 수 있다. 상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BT 분할 플래그의 값이 1인 경우, 즉, 상기 BT 분할 플래그가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있고, 상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타낼 수 있다.
또한, 상기 BT 분할 플래그의 값이 0인 경우, 즉, 상기 BT 분할 플래그가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있고, 상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있고, 상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할될 수 있다. 예를 들어, 상기 분할 타입들은 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입을 포함할 수 있고, 상기 GP 분할 인덱스는 상기 타입들 중 하나를 나타낼 수 있다. 상기 GP 분할 인덱스가 nNx2N 타입을 나타내는 경우, 상기 제2 대상 블록은 nNx2N 사이즈의 제2 서브 블록과 (2-n)Nx2N 사이즈의 제2 서브 블록으로 분할될 수 있다. 또는, 상기 GP 분할 인덱스가 2NxnN 타입을 나타내는 경우, 상기 제2 대상 블록은 2NxnN 사이즈의 제2 서브 블록과 2Nx(2-n)N 사이즈의 제2 서브 블록으로 분할될 수 있다.
또는, 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 상기 특정 경계선은 상기 각도를 나타내는 정보 또는 상기 중점으로부터의 거리를 나타내는 정보를 기반으로 도출될 수 있고, 상기 제2 대상 블록은 상기 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할될 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있고, 상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 즉, 상기 GP 분할 플래그를 기반으로(상기 분할 플래그의 값이 1인 경우), 상기 제2 대상 블록은 상기 제2 대상 블록의 임의의 경계에 수직하지 않고, 상기 제2 대상 블록을 가로지르는 특정 경계선을 따라서 분할될 수 있다. 상기 특정 경계선은 직선 또는 곡선을 포함할 수 있다. 또는, 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다.
상기 GP 분할 플래그의 값이 0인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함할 수 있다. 상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있고, 상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타낼 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP(Binary Tree Geometry Partition) 분할 플래그를 포함할 수 있고, 상기 BTGP 분할 플래그는 상기 제2 대상 블록이 비정방형 블록들인 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BTGP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP 모드 정보를 포함할 수 있다. 상기 BTGP 모드 정보는 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지, 또는 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타낼 수 있다. 상기 BTGP 모드 정보가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있다. 또한, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 또는, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다.
한편, 상기 제2 서브 블록들에 대한 BT 분할 플래그가 전송될 수 있고, 이를 통하여 상기 제2 서브 블록들은 상기 BT 분할 인덱스, 상기 특정 경계선의 각도(angle)를 나타내는 정보, 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보, 또는 상기 GP 분할 인덱스를 기반으로 상기 재귀적으로(recursively) 보다 하위 뎁스(depth)의 서브 블록들로 분할될 수 있다.
디코딩 장치는 상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 QT 분할 플래그를 기반으로 분할되지 않는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할한다(S1730).
일 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함할 수 있다. 구체적으로, 예를 들어, 상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있다. 상기 BT 분할 인덱스가 상기 2NxN 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 2NxN 사이즈의 상기 제2 서브 블록들로 분할될 수 있다. 또한, 상기 BT 분할 인덱스가 상기 Nx2N 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 Nx2N 사이즈의 상기 제2 서브 블록들로 분할될 수 있다.
또한, 상기 BT 분할 플래그의 값이 0인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 상기 제2 대상 블록은 다양한 형태의 비정방형 블록들인 상기 제2 서브 블록들로 분할될 수 있다. 상기 제2 서브 블록들은 서로 다른 사이즈의 비정방형 블록들일 수 있다. 상기 GP 분할 플래그의 값이 0인 경우, 상기 제2 대상 블록은 분할되지 않을 수 있다.
구체적으로, 예를 들어, 상기 GP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있고, 상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할될 수 있다. 상기 분할 타입들은 예를 들어, (N/4)x2N 타입, (N/2)x2N 타입, Nx2N 타입, 2NxN 타입 및 2Nx(N/2), 2Nx(N/4) 타입을 포함할 수 있고, 상기 GP 분할 인덱스는 상기 타입들 중 하나를 나타낼 수 있다. 상기 GP 분할 인덱스가 nNx2N 타입을 나타내는 경우, 상기 제2 대상 블록은 nNx2N 사이즈의 제2 서브 블록과 (2-n)Nx2N 사이즈의 제2 서브 블록으로 분할될 수 있다. 또는, 상기 GP 분할 인덱스가 2NxnN 타입을 나타내는 경우, 상기 제2 대상 블록은 2NxnN 사이즈의 제2 서브 블록과 2Nx(2-n)N 사이즈의 제2 서브 블록으로 분할될 수 있다.
또한, 예를 들어, 상기 GP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 상기 특정 경계선은 상기 각도를 나타내는 정보 또는 상기 중점으로부터의 거리를 나타내는 정보를 기반으로 도출될 수 있고, 상기 제2 대상 블록은 상기 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할될 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함할 수 있다. 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 이 경우, 상기 특정 경계선은 상기 각도를 나타내는 정보 또는 상기 중점으로부터의 거리를 나타내는 정보를 기반으로 도출될 수 있고, 상기 제2 대상 블록은 상기 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할될 수 있다.
또는, 상기 GP 분할 플래그의 값이 1인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다. 상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할될 수 있다.
또한, 상기 GP 분할 플래그의 값이 0인 경우, 즉, 상기 GP 분할 플래그가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함할 수 있다. 상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있다. 상기 BT 분할 인덱스가 상기 2NxN 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 2NxN 사이즈의 상기 제2 서브 블록들로 분할될 수 있다. 또한, 상기 BT 분할 인덱스가 상기 Nx2N 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 Nx2N 사이즈의 상기 제2 서브 블록들로 분할될 수 있다.
다른 예로, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP(Binary Tree Geometry Partition) 분할 플래그를 포함할 수 있다. 상기 BTGP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP 모드 정보를 포함할 수 있다. 상기 BTGP 모드 정보가 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함할 수 있다. 상기 BT 분할 인덱스가 상기 2NxN 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 2NxN 사이즈의 상기 제2 서브 블록들로 분할될 수 있다. 또한, 상기 BT 분할 인덱스가 상기 Nx2N 사이즈를 나타내는 경우, 상기 제2 대상 블록은 상기 Nx2N 사이즈의 상기 제2 서브 블록들로 분할될 수 있다.
또한, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함할 수 있다. 이 경우, 상기 특정 경계선은 상기 각도를 나타내는 정보 또는 상기 중점으로부터의 거리를 나타내는 정보를 기반으로 도출될 수 있고, 상기 제2 대상 블록은 상기 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할될 수 있다.
또는, 상기 BTGP 모드 정보가 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할됨을 나타내는 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함할 수 있다. 상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할될 수 있다.
디코딩 장치는 상기 제2 서브 블록들을 디코딩한다(S1740). 디코딩 장치는 상기 제2 서브 블록들을 디코딩할 수 있다. 구체적으로, 디코딩 장치는 상기 제2 서브 블록에 인트라(intra) 또는 인터(inter) 예측 등을 수행하여 상기 제2 서브 블록의 예측 샘플을 생성할 수 있고, 상기 예측 샘플을 기반으로 상기 제2 서브 블록에 대한 복원 샘플을 생성할 수 있고, 이를 기반으로 복원 픽처를 생성할 수 있다.
한편, 비록 도면에서 도시되지는 않았으나 디코딩 장치는 예측 모드에 따라 상기 예측 샘플을 바로 복원 샘플로 이용할 수도 있고, 또는 상기 예측 샘플에 레지듀얼 샘플을 더하여 복원 샘플을 생성할 수도 있다. 디코딩 장치는 상기 대상 블록에 대한 레지듀얼 샘플이 존재하는 경우, 상기 대상 블록에 대한 레지듀얼에 관한 정보를 수신할 수 있고, 상기 레지듀얼에 관한 정보는 상기 페이스에 대한 정보에 포함될 수 있다. 상기 레지듀얼에 관한 정보는 상기 레지듀얼 샘플에 관한 변환 계수를 포함할 수 있다. 디코딩 장치는 상기 레지듀얼 정보를 기반으로 상기 대상 블록에 대한 상기 레지듀얼 샘플(또는 레지듀얼 샘플 어레이)을 도출할 수 있다. 디코딩 장치는 상기 예측 샘플과 상기 레지듀얼 샘플을 기반으로 복원 샘플을 생성할 수 있고, 상기 복원 샘플을 기반으로 복원 블록 또는 복원 픽처를 도출할 수 있다. 이후 디코딩 장치는 필요에 따라 주관적/객관적 화질을 향상시키기 위하여 디블록킹 필터링 및/또는 SAO 절차와 같은 인루프 필터링 절차를 상기 복원 픽처에 적용할 수 있음은 상술한 바와 같다.
상술한 본 발명에 따르면 픽처를 다양한 형태의 블록들로 분할할 수 있고, 이를 통하여, 예측 효율을 향상시킬 수 있고 전반적인 코딩 효율을 향상시킬 수 있다.
또한, 본 발명에 따르면 픽처를 다양한 형태의 블록들로 분할할 수 있고, 이를 통하여, 변환(transform) 효율을 향상시킬 수 있고 전반적인 코딩 효율을 향상시킬 수 있다.
상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당업자라면 순서도에 나타내어진 단계들이 배타적이지 않고, 다른 단계가 포함되거나 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.
상술한 본 발명에 따른 방법은 소프트웨어 형태로 구현될 수 있으며, 본 발명에 따른 인코딩 장치 및/또는 디코딩 장치는 예를 들어 TV, 컴퓨터, 스마트폰, 셋톱박스, 디스플레이 장치 등의 영상 처리를 수행하는 장치에 포함될 수 있다.
본 발명에서 실시예들이 소프트웨어로 구현될 때, 상술한 방법은 상술한 기능을 수행하는 모듈(과정, 기능 등)로 구현될 수 있다. 모듈은 메모리에 저장되고, 프로세서에 의해 실행될 수 있다. 메모리는 프로세서 내부 또는 외부에 있을 수 있고, 잘 알려진 다양한 수단으로 프로세서와 연결될 수 있다. 프로세서는 ASIC(application-specific integrated circuit), 다른 칩셋, 논리 회로 및/또는 데이터 처리 장치를 포함할 수 있다. 메모리는 ROM(read-only memory), RAM(random access memory), 플래쉬 메모리, 메모리 카드, 저장 매체 및/또는 다른 저장 장치를 포함할 수 있다.

Claims (15)

  1. 디코딩 장치에 의하여 수행되는 비디오 디코딩 방법에 있어서,
    비트스트림을 통하여 제1 대상 블록에 대한 제1 분할(split) 정보를 획득하는 단계;
    상기 제1 분할 플래그가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할하는 단계;
    상기 비트스트림을 통하여 상기 제1 대상 블록의 상기 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득하는 단계;
    상기 제2 대상 블록이 상기 제2 대상 블록에 대한 상기 제2 분할 정보를 기반으로 분할되지 않는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할하는 단계; 및
    상기 제2 서브 블록들을 디코딩하는 단계를 포함함을 특징으로 하되,
    상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 하는 영상 디코딩 방법.
  2. 제1항에 있어서,
    상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함하되,
    상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  3. 제2항에 있어서,
    상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함하되,
    상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  4. 제2항에 있어서,
    상기 BT 분할 플래그의 값이 0인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함하되,
    상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  5. 제4항에 있어서,
    상기 GP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함하고,
    상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할되는 것을 특징으로 하는 영상 디코딩 방법.
  6. 제1항에 있어서,
    상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함하되,
    상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  7. 제6항에 있어서,
    상기 GP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 특정 경계선의 각도(angle)를 나타내는 정보 또는 상기 특정 경계선의 상기 제2 대상 블록의 중점으로부터의 거리를 나타내는 정보를 포함하고,
    상기 특정 경계선은 상기 각도를 나타내는 정보 또는 상기 중점으로부터의 거리를 나타내는 정보를 기반으로 도출되고,
    상기 제2 대상 블록은 상기 특정 경계선을 기준으로 상기 제2 서브 블록들로 분할되는 것을 특징으로 하는 영상 디코딩 방법.
  8. 제6항에 있어서,
    상기 GP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 기설정된 복수의 분할 타입들 중 하나를 나타내는 GP 분할 인덱스를 포함하고,
    상기 제2 대상 블록은 상기 GP 분할 인덱스가 나타내는 분할 타입을 기반으로 상기 제2 서브 블록들로 분할되는 것을 특징으로 하는 영상 디코딩 방법.
  9. 제6항에 있어서,
    상기 GP 분할 플래그의 값이 0인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함하되,
    상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  10. 제9항에 있어서,
    상기 BT 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT 분할 인덱스를 포함하되,
    상기 BT 분할 인덱스는 상기 2NxN 사이즈 및 상기 Nx2N 사이즈 중 하나를 상기 제2 서브 블록들의 사이즈로 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  11. 제1항에 있어서,
    상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP(Binary Tree Geometry Partition) 분할 플래그를 포함하고,
    상기 BTGP 분할 플래그는 상기 제2 대상 블록이 비정방형 블록들인 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  12. 제11항에 있어서,
    상기 BTGP 분할 플래그의 값이 1인 경우, 상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BTGP 모드 정보를 포함하고,
    상기 BTGP 모드 정보는 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지, 또는 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 영상 디코딩 방법.
  13. 영상 디코딩을 수행하는 디코딩 장치에 있어서,
    비트스트림을 통하여 제1 대상 블록에 대한 제1 분할(split) 정보를 획득하고, 상기 제1 대상 블록의 제1 서브 블록들 중 하나인 제2 대상 블록에 대한 제2 분할 정보 및 추가 분할 정보를 획득하는 엔트로피 디코딩부;
    상기 제1 대상 블록에 대한 상기 제1 분할 정보가 상기 제1 대상 블록이 분할됨을 나타내는 경우, 상기 제1 대상 블록을 상기 제1 서브 블록들로 분할하고, 상기 제2 대상 블록에 대한 상기 제2 분할 정보가 상기 제2 대상 블록이 분할되지 않음을 나타내는 경우, 상기 추가 분할 정보를 기반으로 상기 제2 대상 블록을 제2 서브 블록들로 분할하는 픽처 분할부; 및
    상기 제2 서브 블록들을 디코딩하는 예측부를 포함하되,
    상기 제2 서브 블록들은 비정방형 블록들인 것을 특징으로 하는 디코딩 장치.
  14. 제13항에 있어서,
    상기 추가 분할 정보는 상기 제2 대상 블록에 대한 BT(Binary Tree) 분할 플래그를 포함하되,
    상기 BT 분할 플래그는 상기 제2 대상 블록의 사이즈가 2Nx2N 사이즈인 경우, 상기 제2 대상 블록이 2NxN 사이즈 및 Nx2N 사이즈 중 하나의 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 디코딩 장치.
  15. 제13항에 있어서,
    상기 추가 분할 정보는 상기 제2 대상 블록에 대한 GP(geometry partition) 분할 플래그를 포함하되,
    상기 GP 분할 플래그는 상기 제2 대상 블록이 서로 다른 사이즈를 갖는 상기 제2 서브 블록들로 분할되는지 여부를 나타내는 것을 특징으로 하는 디코딩 장치.
PCT/KR2017/008717 2017-01-03 2017-08-11 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치 WO2018128239A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762441590P 2017-01-03 2017-01-03
US62/441,590 2017-01-03

Publications (1)

Publication Number Publication Date
WO2018128239A1 true WO2018128239A1 (ko) 2018-07-12

Family

ID=62791358

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/008717 WO2018128239A1 (ko) 2017-01-03 2017-08-11 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치

Country Status (1)

Country Link
WO (1) WO2018128239A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020094079A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Block size dependent storage of motion information
CN114630132A (zh) * 2020-12-10 2022-06-14 脸萌有限公司 视频编解码的基于神经网络的环路内滤波器中的模型选择

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120096458A (ko) * 2009-06-26 2012-08-30 톰슨 라이센싱 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치
US20130136180A1 (en) * 2011-11-29 2013-05-30 Futurewei Technologies, Inc. Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding
KR20160003593A (ko) * 2009-12-17 2016-01-11 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
US20160261870A1 (en) * 2015-03-06 2016-09-08 Qualcomm Incorporated Fast video encoding method with block partitioning
US20160373766A1 (en) * 2015-06-22 2016-12-22 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120096458A (ko) * 2009-06-26 2012-08-30 톰슨 라이센싱 적응형 기하학적 분할을 이용한 비디오 인코딩 및 디코딩 방법 및 장치
KR20160003593A (ko) * 2009-12-17 2016-01-11 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
US20130136180A1 (en) * 2011-11-29 2013-05-30 Futurewei Technologies, Inc. Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding
US20160261870A1 (en) * 2015-03-06 2016-09-08 Qualcomm Incorporated Fast video encoding method with block partitioning
US20160373766A1 (en) * 2015-06-22 2016-12-22 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020094079A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Block size dependent storage of motion information
US11265541B2 (en) 2018-11-06 2022-03-01 Beijing Bytedance Network Technology Co., Ltd. Position dependent storage of motion information
US11431973B2 (en) 2018-11-06 2022-08-30 Beijing Bytedance Network Technology Co., Ltd. Motion candidates for inter prediction
US11665344B2 (en) 2018-11-06 2023-05-30 Beijing Bytedance Network Technology Co., Ltd. Multiple merge lists and orders for inter prediction with geometric partitioning
CN114630132A (zh) * 2020-12-10 2022-06-14 脸萌有限公司 视频编解码的基于神经网络的环路内滤波器中的模型选择
US11716469B2 (en) 2020-12-10 2023-08-01 Lemon Inc. Model selection in neural network-based in-loop filter for video coding
CN114630132B (zh) * 2020-12-10 2023-12-19 脸萌有限公司 视频编解码的基于神经网络的环路内滤波器中的模型选择

Similar Documents

Publication Publication Date Title
WO2018212578A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018212577A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018008904A2 (ko) 비디오 신호 처리 방법 및 장치
WO2017039256A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017188652A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2017209328A1 (ko) 영상 코딩 시스템에서 인트라 예측 방법 및 장치
WO2018066959A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018044088A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016052977A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017014412A1 (ko) 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
WO2017052009A1 (ko) 영상 코딩 시스템에서 amvr 기반한 영상 코딩 방법 및 장치
WO2017164441A1 (ko) 비디오 코딩 시스템에서 인터 예측 방법 및 장치
WO2019117639A1 (ko) 변환에 기반한 영상 코딩 방법 및 그 장치
WO2018008905A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018044087A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019177429A1 (ko) 인트라 예측 기반 영상/비디오 코딩 방법 및 그 장치
WO2013154366A1 (ko) 블록 정보에 따른 변환 방법 및 이러한 방법을 사용하는 장치
WO2017082443A1 (ko) 영상 코딩 시스템에서 임계값을 이용한 적응적 영상 예측 방법 및 장치
WO2017188565A1 (ko) 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
WO2016159610A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016114583A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018216862A1 (ko) 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
WO2018044089A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017061671A1 (ko) 영상 코딩 시스템에서 적응적 변환에 기반한 영상 코딩 방법 및 장치
WO2018021585A1 (ko) 영상 코딩 시스템에서 인트라 예측 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17890727

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17890727

Country of ref document: EP

Kind code of ref document: A1