WO2021015523A1 - 비디오 신호 처리 방법 및 장치 - Google Patents

비디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
WO2021015523A1
WO2021015523A1 PCT/KR2020/009562 KR2020009562W WO2021015523A1 WO 2021015523 A1 WO2021015523 A1 WO 2021015523A1 KR 2020009562 W KR2020009562 W KR 2020009562W WO 2021015523 A1 WO2021015523 A1 WO 2021015523A1
Authority
WO
WIPO (PCT)
Prior art keywords
syntax
sps
value
flag
gci
Prior art date
Application number
PCT/KR2020/009562
Other languages
English (en)
French (fr)
Inventor
김동철
고건중
정재홍
손주형
곽진삼
Original Assignee
주식회사 윌러스표준기술연구소
(주)휴맥스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 윌러스표준기술연구소, (주)휴맥스 filed Critical 주식회사 윌러스표준기술연구소
Priority to EP24162423.8A priority Critical patent/EP4358514A3/en
Priority to EP20843700.4A priority patent/EP4002848A4/en
Priority to CN202080052114.4A priority patent/CN114128266A/zh
Priority to KR1020227002238A priority patent/KR20220032565A/ko
Priority to JP2022503869A priority patent/JP7379655B2/ja
Publication of WO2021015523A1 publication Critical patent/WO2021015523A1/ko
Priority to US17/578,381 priority patent/US20220141495A1/en
Priority to JP2023188022A priority patent/JP2023181461A/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to a video signal processing method and apparatus, and more particularly, to a video signal processing method and apparatus for encoding or decoding a video signal.
  • Compression coding refers to a series of signal processing techniques for transmitting digitized information through a communication line or storing it in a format suitable for a storage medium.
  • Targets for compression encoding include audio, video, and text, and in particular, a technique for performing compression encoding on an image is referred to as video image compression.
  • Compression coding of a video signal is performed by removing redundant information in consideration of spatial correlation, temporal correlation, and probabilistic correlation.
  • a more efficient method and apparatus for processing a video signal is required.
  • An object of the present invention is to improve the coding efficiency of a video signal.
  • the present invention has an object to increase video signal coding efficiency by configuring general constraint information.
  • the present specification provides a video signal processing method using quadratic transformation.
  • the video signal decoding apparatus comprising a processor, the processor, General Constraint Information (GCI) syntax included in a bitstream of the video signal, and decodes the GCI Based on the decoding result of the syntax, the bitstream is decoded, and the GCI syntax is a decoding parameter set (DPS) RBSP (Raw Byte Sequence Payload) syntax, a sequence parameter set (SPS) RBSP Included in at least one of syntax and video parameter set (VPS) RBSP syntax, the DPS RBSP syntax and the VPS RBSP syntax are higher level syntax of the GCI syntax, and a syntax element for video decoding is included.
  • DPS decoding parameter set
  • VPS video parameter set
  • the SPS RBSP syntax is a higher level syntax of the GCI syntax, and includes a syntax element related to a sequence that is a set of pictures, and the GCI syntax is a palette mode included in the SPS RBSP syntax.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether or not to use intra prediction with multiple reference lines included in the SPS RBSP syntax. Including, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with multiple reference lines is not used. It is characterized by being.
  • the GCI syntax includes an SPS syntax element that sets a value of a syntax element indicating whether to use intra prediction with subpartitions using subpartitions included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with subpartitions using the subpartitions is not used.
  • the GCI syntax includes a GCI syntax element for setting a value of an SPS syntax element indicating whether to use matrix-based intra prediction included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that the matrix-based intra prediction is not used.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether to use a low-frequency non-separable transform included in the SPS RBSP syntax. Including, and, when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a low-frequency non-separable transform is not used. It features.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether to use a merge mode with motion vector difference using a motion vector difference included in the SPS RBSP syntax. Including, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a merge mode with motion vector difference is not used. It features.
  • the GCI syntax element included in the GCI syntax sets a value of an SPS syntax element indicating whether to use a symmetric motion vector difference included in the SPS RBSP syntax, and the When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a symmetric motion vector difference is not used.
  • the GCI syntax element included in the GCI syntax sets a value of the SPS syntax element indicating whether to use luma mapping with chroma scaling included in the SPS RBSP syntax. And, when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that luma mapping with chroma scaling is not used. .
  • the apparatus includes a processor, wherein the processor acquires a general constraint information (GCI) syntax and encodes a bitstream including the GCI syntax.
  • GCI syntax is a decoding parameter set (DPS) RBSP (Raw Byte Sequence Payload) syntax, a sequence parameter set (SPS) RBSP syntax and a video parameter set (VPS) RBSP
  • DPS RBSP syntax and the VPS RBSP syntax are high-level syntax of the GCI syntax and include a syntax element for video decoding, and the SPS RBSP syntax is of the GCI syntax.
  • the GCI syntax includes a syntax element related to a sequence that is a set of pictures, and the GCI syntax sets a value of an SPS syntax element indicating whether to use a palette mode included in the SPS RBSP syntax.
  • the GCI syntax element is included and the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that the palette mode is not used.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether or not to use intra prediction with multiple reference lines included in the SPS RBSP syntax. Including, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with multiple reference lines is not used. It is characterized by being.
  • the GCI syntax includes an SPS syntax element that sets a value of a syntax element indicating whether to use intra prediction with subpartitions using subpartitions included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with subpartitions using the subpartitions is not used.
  • the GCI syntax includes a GCI syntax element for setting a value of an SPS syntax element indicating whether to use matrix-based intra prediction included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that the matrix-based intra prediction is not used.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether to use a low-frequency non-separable transform included in the SPS RBSP syntax. Including, and, when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a low-frequency non-separable transform is not used. It features.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether to use a merge mode with motion vector difference using a motion vector difference included in the SPS RBSP syntax. Including, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a merge mode with motion vector difference is not used. It features.
  • the GCI syntax element included in the GCI syntax sets a value of an SPS syntax element indicating whether to use a symmetric motion vector difference included in the SPS RBSP syntax, and the When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that a symmetric motion vector difference is not used.
  • the GCI syntax element included in the GCI syntax sets a value of the SPS syntax element indicating whether to use luma mapping with chroma scaling included in the SPS RBSP syntax. And, when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that luma mapping with chroma scaling is not used. .
  • the bitstream includes General Constraint Information , GCI) obtaining a syntax; Encoding a bitstream including the GCI syntax;
  • GCI syntax is encoded through an encoding method including, a decoding parameter set (DPS) RBSP (Raw Byte Sequence Payload) syntax, a sequence parameter set (SPS) RBSP syntax and a video parameter set.
  • DPS decoding parameter set
  • SPS sequence parameter set
  • VPS Video Parameter Set
  • the DPS RBSP syntax and the VPS RBSP syntax are higher level syntax of the GCI syntax, including a syntax element for video decoding
  • the RBSP syntax is a higher level syntax of the GCI syntax and includes a syntax element related to a sequence that is a set of pictures, and the GCI syntax indicates whether to use a palette mode included in the SPS RBSP syntax. It includes a GCI syntax element that sets a value of the SPS syntax element, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that the palette mode is not used. It is characterized.
  • the GCI syntax is a GCI syntax element that sets a value of an SPS syntax element indicating whether or not to use intra prediction with multiple reference lines included in the SPS RBSP syntax. Including, and when the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with multiple reference lines is not used. It is characterized by being.
  • the GCI syntax includes an SPS syntax element that sets a value of a syntax element indicating whether to use intra prediction with subpartitions using subpartitions included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that intra prediction with subpartitions using the subpartitions is not used.
  • the GCI syntax includes a GCI syntax element for setting a value of an SPS syntax element indicating whether to use matrix-based intra prediction included in the SPS RBSP syntax, When the value of the GCI syntax element is 1, the value of the SPS syntax element is set to 0, which is a value indicating that the matrix-based intra prediction is not used.
  • An embodiment of the present invention provides a video signal processing method using general constraint information and an apparatus therefor.
  • FIG. 1 is a schematic block diagram of a video signal encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a schematic block diagram of a video signal decoding apparatus according to an embodiment of the present invention.
  • FIG. 3 shows an embodiment in which a coding tree unit is divided into coding units within a picture.
  • FIG. 4 shows an embodiment of a method for signaling division of a quad tree and a multi-type tree.
  • FIG 5 and 6 more specifically illustrate an intra prediction method according to an embodiment of the present invention.
  • FIG. 7 is a diagram illustrating a network abstraction layer unit, which is a basic unit constituting a bit stream according to an embodiment of the present invention.
  • FIG. 8 is a diagram specifically illustrating a method of obtaining a residual signal by inverse transforming a transform coefficient by an encoder and a decoder.
  • FIG. 8 is a diagram showing syntax according to an embodiment of the present invention.
  • 9 to 11 are diagrams showing syntax according to an embodiment of the present invention.
  • FIG. 12 is a diagram illustrating a sequence parameter set RBSP syntax according to an embodiment of the present invention.
  • 13 to 16 are diagrams illustrating general constraint information syntax according to an embodiment of the present invention.
  • 17 is a diagram showing syntax according to an embodiment of the present invention.
  • 18 to 21 are diagrams illustrating general constraint information syntax according to an embodiment of the present invention.
  • 22 is a diagram illustrating a coding tree unit syntax according to an embodiment of the present invention.
  • FIG. 23 is a diagram illustrating a positional relationship for deriving Most Probable Modes (MPM) required for an intra prediction mode according to an embodiment of the present invention.
  • MPM Most Probable Modes
  • 24 is a diagram illustrating a relationship between a corresponding luma block required for inducing a chroma DM mode according to an embodiment of the present invention.
  • Coding can be interpreted as encoding or decoding in some cases.
  • an apparatus for generating a video signal bitstream by performing encoding (encoding) of a video signal is referred to as an encoding apparatus or an encoder
  • an apparatus for restoring a video signal by performing decoding (decoding) of a video signal bitstream is decoding It is referred to as a device or decoder.
  • a video signal processing apparatus is used as a term for a concept including both an encoder and a decoder.
  • The'unit' is used to refer to a basic unit of image processing or a specific position of a picture, and refers to an image area including at least one of a luma component and a chroma component.
  • a'block' refers to an image region including a specific component among luminance components and color difference components (ie, Cb and Cr).
  • terms such as'unit','block','partition', and'area' may be used interchangeably.
  • the unit may be used as a concept including all of a coding unit, a prediction unit, and a transform unit.
  • a picture refers to a field or a frame, and the terms may be used interchangeably according to embodiments.
  • the encoding apparatus 100 of the present invention includes a transform unit 110, a quantization unit 115, an inverse quantization unit 120, an inverse transform unit 125, a filtering unit 130, and a prediction unit 150. ) And an entropy coding unit 160.
  • the transform unit 110 converts a residual signal that is a difference between an input video signal and a prediction signal generated by the prediction unit 150 to obtain a transform coefficient value.
  • Discrete Cosine Transform DCT
  • DST Discrete Sine Transform
  • Wavelet Transform may be used.
  • Discrete cosine transform and discrete sine transform are transformed by dividing the input picture signal into a block form. In transformation, coding efficiency may vary depending on the distribution and characteristics of values in the transformation region.
  • the quantization unit 115 quantizes a transform coefficient value output from the transform unit 110.
  • the picture signal is not coded as it is, but a reconstructed picture by predicting a picture using a region already coded through the prediction unit 150 and adding a residual value between the original picture and the predicted picture to the predicted picture.
  • the method of obtaining is used.
  • information available in the decoder must be used when performing prediction in the encoder.
  • the encoder performs a process of reconstructing the encoded current block.
  • the inverse quantization unit 120 inverse quantizes the transform coefficient value, and the inverse transform unit 125 restores the residual value by using the inverse quantization transform coefficient value.
  • the filtering unit 130 performs a filtering operation to improve the quality and encoding efficiency of the reconstructed picture.
  • a deblocking filter For example, a deblocking filter, a sample adaptive offset (SAO), and an adaptive loop filter may be included.
  • the filtered picture is output or stored in a decoded picture buffer (DPB) 156 to be used as a reference picture.
  • DPB decoded picture buffer
  • the picture signal is not coded as it is, but a reconstructed picture by predicting a picture using a region already coded through the prediction unit 150 and adding a residual value between the original picture and the predicted picture to the predicted picture.
  • the method of obtaining is used.
  • the intra prediction unit 152 performs intra prediction within the current picture, and the inter prediction unit 154 predicts the current picture by using a reference picture stored in the decoded picture buffer 156.
  • the intra prediction unit 152 performs intra prediction from reconstructed regions in the current picture, and transmits the intra encoding information to the entropy coding unit 160.
  • the inter prediction unit 154 may again include a motion estimation unit 154a and a motion compensation unit 154b.
  • the motion estimation unit 154a obtains a motion vector value of the current region by referring to the restored specific region.
  • the motion estimation unit 154a transfers position information (reference frame, motion vector, etc.) of the reference region to the entropy coding unit 160 to be included in the bitstream.
  • the motion compensation unit 154b performs inter-motion compensation using the motion vector value transmitted from the motion estimation unit 154a.
  • the prediction unit 150 includes an intra prediction unit 152 and an inter prediction unit 154.
  • the intra prediction unit 152 performs intra prediction within the current picture, and the inter prediction unit 154 predicts the current picture using a reference picture stored in the decoded picture buffer 156. Perform.
  • the intra prediction unit 152 performs intra prediction from reconstructed samples in the current picture, and transmits intra encoding information to the entropy coding unit 160.
  • the intra encoding information may include at least one of an intra prediction mode, a Most Probable Mode (MPM) flag, and an MPM index.
  • Intra encoding information may include information on a reference sample.
  • the inter prediction unit 154 may include a motion estimation unit 154a and a motion compensation unit 154b.
  • the motion estimation unit 154a obtains a motion vector value of the current region by referring to a specific region of the reconstructed reference picture.
  • the motion estimation unit 154a transmits a motion information set (reference picture index, motion vector information, etc.) for the reference region to the entropy coding unit 160.
  • the motion compensation unit 154b performs motion compensation using the motion vector value transmitted from the motion estimation unit 154a.
  • the inter prediction unit 154 transmits inter encoding information including motion information on the reference region to the entropy coding unit 160.
  • the prediction unit 150 may include an intra block copy (BC) prediction unit (not shown).
  • the intra BC prediction unit performs intra BC prediction from reconstructed samples in the current picture, and transfers intra BC encoding information to the entropy coding unit 160.
  • the intra BC predictor refers to a specific region in the current picture and obtains a block vector value indicating a reference region used for prediction of the current region.
  • the intra BC prediction unit may perform intra BC prediction using the obtained block vector value.
  • the intra BC prediction unit transfers intra BC encoding information to the entropy coding unit 160.
  • Intra BC encoding information may include block vector information.
  • the transform unit 110 obtains a transform coefficient value by transforming a residual value between the original picture and the predicted picture.
  • the transformation may be performed in units of a specific block within the picture, and the size of the specific block may vary within a preset range.
  • the quantization unit 115 quantizes the transform coefficient values generated by the transform unit 110 and transmits the quantization to the entropy coding unit 160.
  • the entropy coding unit 160 generates a video signal bitstream by entropy coding information representing a quantized transform coefficient, intra coding information, and inter coding information.
  • a variable length coding (VLC) method and an arithmetic coding method may be used.
  • the variable length coding (VLC) method converts input symbols into consecutive codewords, and the length of the codeword may be variable. For example, frequently occurring symbols are expressed as short codewords, and infrequently occurring symbols are expressed as long codewords.
  • a context-based adaptive variable length coding (CAVLC) scheme may be used as a variable length coding scheme.
  • Arithmetic coding converts consecutive data symbols into one prime number, and arithmetic coding can obtain an optimal prime bit necessary to represent each symbol.
  • Context-based Adaptive Binary Arithmetic Code may be used as arithmetic coding.
  • CABAC Context-based Adaptive Binary Arithmetic Code
  • the entropy coding unit 160 may binarize information representing a quantized transform coefficient.
  • the entropy coding unit 160 may generate a bitstream by arithmetic coding the binary information.
  • the generated bitstream is encapsulated in a basic unit of a Network Abstraction Layer (NAL) unit.
  • the NAL unit includes a coded integer number of coding tree units.
  • the bitstream In order to decode a bitstream in a video decoder, the bitstream must first be separated into NAL unit units, and then each separated NAL unit must be decoded.
  • information necessary for decoding a video signal bitstream includes a picture parameter set (PPS), a sequence parameter set (SPS), a video parameter set (VPS), and decoding capability information. It may be transmitted through a higher level set of Raw Byte Sequence Payload (RBSP) such as (Decoding Capability Information, DCI).
  • RBSP Raw Byte Sequence Payload
  • FIG. 1 shows the encoding apparatus 100 according to an embodiment of the present invention, and separately displayed blocks are shown by logically distinguishing elements of the encoding apparatus 100. Accordingly, the elements of the encoding apparatus 100 described above may be mounted as one chip or as a plurality of chips according to the design of the device. According to an embodiment, the operation of each element of the encoding apparatus 100 described above may be performed by a processor (not shown).
  • the decoding apparatus 200 of the present invention includes an entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 225, a filtering unit 230, and a prediction unit 250.
  • the entropy decoding unit 210 entropy-decodes the video signal bitstream, and extracts transform coefficient information, intra encoding information, inter encoding information, and the like for each region. For example, the entropy decoding unit 210 may obtain a binarization code for transform coefficient information of a specific region from a video signal bitstream. In addition, the entropy decoding unit 210 obtains quantized transform coefficients by inverse binarizing the binarized code. The inverse quantization unit 220 inverse quantizes the quantized transform coefficient, and the inverse transform unit 225 restores a residual value using the inverse quantization transform coefficient. The video signal processing apparatus 200 restores the original pixel value by summing the residual value obtained by the inverse transform unit 225 with the predicted value obtained by the prediction unit 250.
  • the filtering unit 230 improves image quality by filtering a picture.
  • This may include a deblocking filter for reducing block distortion and/or an adaptive loop filter for removing distortion of an entire picture.
  • the filtered picture is output or stored in the decoded picture buffer (DPB) 256 to be used as a reference picture for the next picture.
  • DPB decoded picture buffer
  • the prediction unit 250 includes an intra prediction unit 252 and an inter prediction unit 254.
  • the prediction unit 250 generates a prediction picture by using an encoding type decoded by the entropy decoding unit 210 described above, a transform coefficient for each region, and intra/inter encoding information.
  • a current picture including the current block or a decoded area of other pictures may be used.
  • an intra picture or an I picture (or tile/slice), intra prediction, inter prediction, and intra BC prediction Using only the current picture for restoration, i.e., a picture (or tile/slice) performing intra prediction or intra BC prediction, an intra picture or an I picture (or tile/slice), intra prediction, inter prediction, and intra BC prediction
  • a picture (or tile/slice) that can be performed is referred to as an inter picture (or tile/slice).
  • a picture (or tile/slice) using at most one motion vector and a reference picture index is a predictive picture or a P picture (or , Tile/slice), and a picture (or tile/slice) using up to two motion vectors and a reference picture index is referred to as a bi-predictive picture or a B picture (or tile/slice).
  • a P picture (or tile/slice) uses at most one set of motion information to predict each block
  • a B picture (or tile/slice) uses at most two motion information to predict each block.
  • the motion information set includes one or more motion vectors and one reference picture index.
  • the intra prediction unit 252 generates a prediction block using intra-encoding information and reconstructed samples in the current picture.
  • the intra encoding information may include at least one of an intra prediction mode, a Most Probable Mode (MPM) flag, and an MPM index.
  • MPM Most Probable Mode
  • the intra prediction unit 252 predicts sample values of the current block by using reconstructed samples located on the left and/or above of the current block as reference samples.
  • reconstructed samples, reference samples, and samples of the current block may represent pixels. Also, sample values may represent pixel values.
  • the reference samples may be samples included in a neighboring block of the current block.
  • the reference samples may be samples adjacent to the left boundary of the current block and/or samples adjacent to the upper boundary.
  • the reference samples are samples located on a line within a preset distance from the left boundary of the current block among samples of the neighboring blocks of the current block and/or on a line within a preset distance from the upper boundary of the current block. It may be a sample.
  • the neighboring block of the current block is a left (L) block, an upper (A) block, a lower left (BL) block, an upper right (AR) block, or an upper left (Above Left) block.
  • AL may include at least one of the blocks.
  • the inter prediction unit 254 generates a prediction block using a reference picture and inter encoding information stored in the decoded picture buffer 256.
  • the inter-encoding information may include a set of motion information (reference picture index, motion vector information, etc.) of the current block for the reference block.
  • Inter prediction may include L0 prediction, L1 prediction, and Bi-prediction.
  • L0 prediction means prediction using one reference picture included in the L0 picture list
  • L1 prediction means prediction using one reference picture included in the L1 picture list.
  • a set of motion information (eg, a motion vector and a reference picture index) may be required.
  • up to two reference regions may be used, and the two reference regions may exist in the same reference picture or may exist in different pictures.
  • the two motion vectors may correspond to the same reference picture index or to different reference picture indexes. May correspond.
  • the reference pictures may be displayed (or output) temporally before or after the current picture.
  • the two reference regions used in the bi-prediction scheme may be regions selected from each of the L0 picture list and the L1 picture list.
  • the inter prediction unit 254 may obtain a reference block of the current block using a motion vector and a reference picture index.
  • the reference block exists in a reference picture corresponding to a reference picture index.
  • a sample value of a block specified by a motion vector or an interpolated value thereof may be used as a predictor of the current block.
  • an 8-tap interpolation filter may be used for a luminance signal and a 4-tap interpolation filter may be used for a color difference signal.
  • the interpolation filter for motion prediction in units of subpels is not limited thereto.
  • the inter prediction unit 254 performs motion compensation for predicting the texture of the current unit from a previously restored picture.
  • the inter prediction unit may use a motion information set.
  • the prediction unit 250 may include an intra BC prediction unit (not shown).
  • the intra BC predictor may reconstruct the current area by referring to a specific area including reconstructed samples in the current picture.
  • the intra BC prediction unit obtains intra BC encoding information for the current region from the entropy decoding unit 210.
  • the intra BC predictor acquires a block vector value of the current region indicating a specific region in the current picture.
  • the intra BC prediction unit may perform intra BC prediction using the obtained block vector value.
  • Intra BC encoding information may include block vector information.
  • a reconstructed video picture is generated by adding a prediction value output from the intra prediction unit 252 or the inter prediction unit 254 and a residual value output from the inverse transform unit 225. That is, the video signal decoding apparatus 200 reconstructs the current block by using the prediction block generated by the prediction unit 250 and the residual obtained from the inverse transform unit 225.
  • FIG. 2 shows the decoding apparatus 200 according to an embodiment of the present invention, and separately displayed blocks are shown by logically distinguishing elements of the decoding apparatus 200. Therefore, the elements of the decoding apparatus 200 described above may be mounted as one chip or as a plurality of chips according to the design of the device. According to an embodiment, the operation of each element of the decoding apparatus 200 described above may be performed by a processor (not shown).
  • a coding tree unit (CTU) is divided into coding units (CUs) in a picture.
  • a picture may be divided into a sequence of coding tree units (CTUs).
  • the coding tree unit is composed of an NXN block of luma samples and two blocks of chroma samples corresponding thereto.
  • the coding tree unit may be divided into a plurality of coding units.
  • the coding tree unit is not divided and may be a leaf node. In this case, the coding tree unit itself may be a coding unit.
  • the coding unit refers to a basic unit for processing a picture in the above-described video signal processing, that is, intra/inter prediction, transformation, quantization, and/or entropy coding.
  • the size and shape of a coding unit in one picture may not be constant.
  • the coding unit may have a square or rectangular shape.
  • the rectangular coding unit (or rectangular block) includes a vertical coding unit (or vertical block) and a horizontal coding unit (or horizontal block).
  • a vertical block is a block having a height greater than a width
  • a horizontal block is a block having a width greater than the height.
  • a non-square block may refer to a rectangular block, but the present invention is not limited thereto.
  • a coding tree unit is first divided into a quad tree (QT) structure. That is, in a quad tree structure, one node having a size of 2NX2N may be divided into four nodes having a size of NXN.
  • the quad tree may also be referred to as a quaternary tree.
  • Quad-tree partitioning can be performed recursively, and not all nodes need to be partitioned to the same depth.
  • the leaf node of the quad tree described above may be further divided into a multi-type tree (MTT) structure.
  • MTT multi-type tree
  • one node in a multi-type tree structure, one node may be divided into a horizontal or vertically divided binary (binary) or ternary (ternary) tree structure. That is, in the multi-type tree structure, there are four division structures: vertical binary division, horizontal binary division, vertical ternary division, and horizontal ternary division.
  • both widths and heights of nodes in each tree structure may have a power of 2.
  • a node having a size of 2NX2N may be divided into two NX2N nodes by vertical binary division, and divided into two 2NXN nodes by horizontal binary division.
  • a node of 2NX2N size is divided into nodes of (N/2)X2N, NX2N and (N/2)X2N by vertical ternary division, and horizontal ternary It can be divided into 2NX(N/2), 2NXN, and 2NX(N/2) nodes by division.
  • This multi-type tree division can be performed recursively.
  • Leaf nodes of a multi-type tree can be coding units. If the coding unit is not larger than the maximum transform length, the coding unit may be used as a unit of prediction and/or transformation without further division. As an embodiment, when the width or height of the current coding unit is greater than the maximum transform length, the current coding unit may be divided into a plurality of transform units without explicit signaling regarding segmentation. Meanwhile, in the above-described quad tree and multi-type tree, at least one of the following parameters may be defined in advance or transmitted through RBSP of a higher level set such as PPS, SPS, and VPS.
  • CTU size the size of the root node of the quad tree
  • MinQtSize the minimum QT leaf node size allowed
  • maximum BT size the maximum BT root node size allowed
  • Maximum TT size Maximum allowed TT root node size
  • Maximum MTT depth Maximum allowable depth of MTT split from leaf node of QT
  • Minimum BT size MinBtSize: Allowed Minimum BT leaf node size
  • Minimum TT size Minimum allowed TT leaf node size.
  • Pre-set flags may be used to signal the division of the quad tree and multi-type tree described above. 4, a flag'split_cu_flag' indicating whether to divide a node, a flag'split_qt_flag' indicating whether to divide a quad tree node, a flag'mtt_split_cu_vertical_flag' indicating a splitting direction of a multi-type tree node, or multi- At least one of the flags'mtt_split_cu_binary_flag' indicating the split shape of the type tree node may be used.
  • 'split_cu_flag' which is a flag indicating whether the current node is divided, may be signaled first.
  • the value of'split_cu_flag' is 0, it indicates that the current node is not divided, and the current node becomes a coding unit.
  • the coding tree unit includes one non-divided coding unit.
  • the current node is a quad tree node'QT node'
  • the current node is a leaf node'QT leaf node' of the quad tree and becomes a coding unit.
  • the current node is a multi-type tree node'MTT node'
  • the current node is a leaf node'MTT leaf node' of the multi-type tree and becomes a coding unit.
  • the current node may be divided into nodes of a quad tree or a multi-type tree according to the value of'split_qt_flag'.
  • the coding tree unit is a root node of a quad tree, and may be first divided into a quad tree structure. In the quad tree structure,'split_qt_flag' is signaled for each node'QT node'.
  • quad-tree division may be limited according to the type of the current node. If the current node is a coding tree unit (the root node of the quart tree) or a quart tree node, quad-tree partitioning may be allowed, and if the current node is a multi-type tree node, the quart tree partitioning may not be allowed.
  • Each quad tree leaf node'QT leaf node' may be further divided into a multi-type tree structure. As described above, when'split_qt_flag' is 0, the current node may be divided into multi-type nodes. In order to indicate the splitting direction and split shape,'mtt_split_cu_vertical_flag' and'mtt_split_cu_binary_flag' may be signaled. When the value of'mtt_split_cu_vertical_flag' is 1, the vertical split of the node'MTT node' is indicated, and the value of'mtt_split_cu_vertical_flag' is If 0, horizontal division of the node'MTT node' is indicated.
  • the node'MTT node' is divided into two rectangular nodes, and when the value of'mtt_split_cu_binary_flag' is 0, the node'MTT node' is divided into three rectangular nodes.
  • Picture prediction (motion compensation) for coding is performed for coding units that are no longer divided (ie, leaf nodes of the coding unit tree).
  • the basic unit that performs such prediction is hereinafter referred to as a prediction unit or a prediction block.
  • the term unit used herein may be used as a term to replace the prediction unit, which is a basic unit for performing prediction.
  • the present invention is not limited thereto, and may be more broadly understood as a concept including the coding unit.
  • the intra prediction unit predicts sample values of the current block by using reconstructed samples located on the left and/or above of the current block as reference samples.
  • FIG. 5 shows an embodiment of reference samples used for prediction of a current block in an intra prediction mode.
  • the reference samples may be samples adjacent to the left boundary of the current block and/or samples adjacent to the upper boundary.
  • a maximum of 2W+2H+1 located on the left and/or above of the current block Reference samples can be set using the surrounding samples.
  • the intra prediction unit may obtain a reference sample by performing a reference sample padding process. Also, the intra prediction unit may perform a reference sample filtering process to reduce an error in intra prediction. That is, filtered reference samples may be obtained by performing filtering on neighboring samples and/or reference samples obtained by the reference sample padding process. The intra prediction unit predicts samples of the current block using the reference samples thus obtained. The intra prediction unit predicts samples of the current block using unfiltered reference samples or filtered reference samples.
  • peripheral samples may include samples on at least one reference line.
  • the surrounding samples may include adjacent samples on a line adjacent to the boundary of the current block.
  • FIG. 6 shows an embodiment of prediction modes used for intra prediction.
  • intra prediction mode information indicating an intra prediction direction may be signaled.
  • the intra prediction mode information indicates any one of a plurality of intra prediction modes constituting the intra prediction mode set.
  • the decoder receives intra prediction mode information of the current block from the bitstream.
  • the intra prediction unit of the decoder performs intra prediction on the current block based on the extracted intra prediction mode information.
  • the intra prediction mode set may include all intra prediction modes (eg, a total of 67 intra prediction modes) used for intra prediction. More specifically, the intra prediction mode set may include a planar mode, a DC mode, and a plurality (eg, 65) angular modes (ie, directional modes). Each intra prediction mode may be indicated through a preset index (ie, an intra prediction mode index). For example, as shown in FIG. 6, an intra prediction mode index 0 indicates a planar mode, and an intra prediction mode index 1 indicates a DC mode.
  • intra prediction mode indexes 2 to 66 may indicate different angular modes, respectively. The angle modes indicate different angles within a preset angle range, respectively.
  • the angle mode may indicate an angle within an angle range between 45 degrees and -135 degrees in a clockwise direction (ie, a first angle range).
  • the angular mode may be defined based on the 12 o'clock direction.
  • intra prediction mode index 2 indicates a horizontal diagonal (HDIA) mode
  • intra prediction mode index 18 indicates a horizontal (HOR) mode
  • intra prediction mode index 34 indicates a diagonal (Diagonal, DIA) mode.
  • a mode is indicated
  • an intra prediction mode index 50 indicates a vertical (VER) mode
  • an intra prediction mode index 66 indicates a vertical diagonal (VDIA) mode.
  • the preset angle range may be set differently according to the shape of the current block. For example, when the current block is a rectangular block, a wide-angle mode indicating an angle exceeding 45 degrees or less than -135 degrees clockwise may be additionally used. When the current block is a horizontal block, the angle mode may indicate an angle within an angle range (that is, a second angle range) between (45+offset1) degrees and (-135+offset1) degrees in a clockwise direction. In this case, angle modes 67 to 76 outside the first angle range may be additionally used.
  • the angle mode may indicate an angle within an angle range (ie, a third angle range) between (45-offset2) degrees and (-135-offset2) degrees in a clockwise direction.
  • angle modes -10 to -1 outside the first angle range may be additionally used.
  • values of offset1 and offset2 may be determined differently according to a ratio between the width and height of the rectangular block. Also, offset1 and offset2 may be positive numbers.
  • a plurality of angular modes constituting the intra prediction mode set may include a basic angular mode and an extended angular mode.
  • the extended angle mode may be determined based on the basic angle mode.
  • the basic angle mode is a mode corresponding to an angle used in intra prediction of an existing HEVC (High Efficiency Video Coding) standard
  • the extended angle mode corresponds to an angle newly added in intra prediction of the next generation video codec standard. It can be a mode to do.
  • the basic angular mode is an intra prediction mode ⁇ 2, 4, 6, ... , 66 ⁇
  • the extended angle mode is an intra prediction mode ⁇ 3, 5, 7, ... , 65 ⁇ may be an angle mode corresponding to any one of. That is, the extended angle mode may be an angle mode between basic angle modes within the first angle range. Accordingly, the angle indicated by the extended angle mode may be determined based on the angle indicated by the basic angle mode.
  • the basic angle mode is a mode corresponding to an angle within a preset first angle range
  • the extended angle mode may be a wide angle mode outside the first angle range. That is, the basic angular mode is the intra prediction mode ⁇ 2, 3, 4,... , 66 ⁇ , and the extended angle mode is an intra prediction mode ⁇ -10, -9, ... , -1 ⁇ and ⁇ 67, 68,... , 76 ⁇ may be an angular mode corresponding to any one of.
  • the angle indicated by the extended angle mode may be determined as an angle opposite to the angle indicated by the corresponding basic angle mode. Accordingly, the angle indicated by the extended angle mode may be determined based on the angle indicated by the basic angle mode.
  • the number of expansion angle modes is not limited thereto, and additional expansion angles may be defined according to the size and/or shape of the current block.
  • the extended angle mode is the intra prediction mode ⁇ -14, -13,... , -1 ⁇ and ⁇ 67, 68,... , 80 ⁇ may be defined as an angle mode corresponding to any one of.
  • the total number of intra prediction modes included in the intra prediction mode set may vary according to the configuration of the above-described basic angle mode and extended angle mode.
  • the spacing between the extended angle modes may be set based on the spacing between the corresponding basic angle modes. For example, extended angle modes ⁇ 3, 5, 7,... , 65 ⁇ the spacing between the corresponding basic angular modes ⁇ 2, 4, 6,... , 66 ⁇ can be determined based on the interval. Also, the extended angle modes ⁇ -10, -9,... , -1 ⁇ the spacing between the corresponding opposite basic angular modes ⁇ 56, 57,... , 65 ⁇ , determined based on the spacing between the extended angle modes ⁇ 67, 68, ... , 76 ⁇ the spacing between the corresponding opposite basic angular modes ⁇ 3, 4,... , 12 ⁇ may be determined based on the interval. The angular spacing between the extended angle modes may be set to be the same as the angular spacing between the corresponding basic angle modes. In addition, the number of extended angle modes in the intra prediction mode set may be set to be less than or equal to the number of basic angle modes.
  • the extended angle mode may be signaled based on the basic angle mode.
  • the wide-angle mode ie, the extended angle mode
  • the wide-angle mode may replace at least one angle mode (ie, the basic angle mode) within the first angle range.
  • the replaced default angle mode may be an angle mode corresponding to the opposite side of the wide angle mode. That is, the replaced basic angle mode is an angle mode that corresponds to an angle in a direction opposite to the angle indicated by the wide-angle mode or to an angle that differs by a preset offset index from the angle in the opposite direction.
  • the preset offset index is 1.
  • the intra prediction mode index corresponding to the replaced basic angular mode may be remapped to the wide-angle mode to signal the corresponding wide-angle mode.
  • wide-angle mode ⁇ -10, -9,... , -1 ⁇ is the intra prediction mode index ⁇ 57, 58, ... , 66 ⁇ , each can be signaled by the wide-angle mode ⁇ 67, 68, ... , 76 ⁇ is an intra prediction mode index ⁇ 2, 3, ... , 11 ⁇ , respectively.
  • the intra prediction mode index for the basic angular mode signals the extended angular mode, so that even if the configuration of the angular modes used for intra prediction of each block are different, the intra prediction mode indexes of the same set may be applied to the signaling of the intra prediction mode. Can be used. Accordingly, signaling overhead due to a change in the intra prediction mode configuration can be minimized.
  • whether to use the extended angle mode may be determined based on at least one of the shape and size of the current block.
  • the extended angle mode when the size of the current block is larger than a preset size, the extended angle mode is used for intra prediction of the current block, otherwise, only the basic angle mode may be used for intra prediction of the current block.
  • the current block when the current block is a non-square block, the extended angle mode is used for intra prediction of the current block, and when the current block is a square block, only the basic angle mode may be used for intra prediction of the current block.
  • NAL network abstract layer
  • the NAL unit can be defined in various forms according to its purpose and can be classified by a unique ID.
  • the NAL unit may be largely divided into a part including actual image data information and a part including information necessary for decoding such a video image.
  • 7 is a diagram illustrating some of several types of NAL units.
  • the NAL unit is configured based on a predefined order, and information included in the corresponding NAL unit may also be configured based on a preset order.
  • Each NAL unit may have a cross-reference relationship.
  • the NAL unit DPS represents a decoding parameter set (DPS) RBSP syntax.
  • the NAL unit VPS represents a video parameter set (VPS) RBSP syntax.
  • the NAL unit SPS represents a sequence parameter set (SPS) RBSP syntax.
  • the NAL unit PPS represents a picture parameter set (PPS) RBSP syntax.
  • the DPS RBSP syntax is a syntax including information (syntax element) necessary for the decoder to perform video decoding.
  • the DPS RBSP syntax may be described as a decoding capability information (DCI) RBSP syntax.
  • the VPS RBSP syntax is a syntax including information (syntax element) commonly used in order to be commonly used to decode the base layer and enhancement layer encoded data.
  • the SPS RBSP syntax is a syntax including syntax elements transmitted at the level of a sequence unit.
  • the SPS RBSP syntax may include information (syntax element) commonly used to decode a picture with reference to the VPS.
  • the sequence means a set of one or more pictures.
  • the PPS RBSP syntax is a syntax including information (syntax element) commonly used to decode one or more pictures.
  • the above-described RBSP is a raw byte sequence payload (RBSP), and may mean a syntax that is byte aligned and encapsulated in a NAL unit.
  • RBSP raw byte sequence payload
  • FIG. 8 is a diagram showing syntax according to an embodiment of the present invention.
  • FIG. 8(a) is a diagram illustrating a decoding parameter set (DPS) RBSP syntax
  • FIG. 8(b) is a diagram illustrating a sequence parameter set (SPS) RBSP syntax
  • FIG. 8(c) is a diagram illustrating a profile tier level syntax'profile_tier_level()'.
  • a profile tier level syntax may be included (called) in the DPS RBSP syntax and the SPS RBSP syntax.
  • the profile tier level syntax may include information related to a profile, a tier, and a level.
  • the profile tier level syntax may include a syntax'general_constraint_info()' for general constraint inforamtion (GCI).
  • GCI syntax is a GCI syntax and/or other syntax (for example, DPS RBSP syntax, VPS RBSP syntax, SPS RBSP syntax, PPS RBSP syntax, Sliceheader syntax, etc.) for interoperability. ), it is possible to control to disable tools and/or functions.
  • the tools and/or functions declared in the lower syntax may be deactivated.
  • the profile tier level syntax'profile_tier_level()' may be included in the DPS RBSP syntax and/or the SPS RBSP syntax, and when the profile tier level syntax is included in the DPS RBSP syntax, the GCI included in the profile tier level syntax The syntax can be applied to the entire bitstream.
  • the GCI syntax included in the profile tier level syntax may be applied in a coded layer video sequence (CLVS).
  • 9 to 11 are diagrams showing syntax according to an embodiment of the present invention.
  • FIG. 9(a) is a diagram illustrating a video parameter set (VPS) RBSP syntax according to an embodiment of the present invention
  • FIG. 9(b) is a general constraint according to an embodiment of the present invention.
  • It is a diagram showing general constraint information (GCI) syntax.
  • GCI general constraint information
  • the GCI syntax'general_constraint_info()' may be included in the VPS syntax.
  • the above-described profile tier level syntax may be included in the VPS syntax
  • the GCI syntax may be included in the profile tier level syntax included in the VPS syntax.
  • the GCI syntax may include one or more syntax elements.
  • FIGS. 10 and 11 are diagrams illustrating a sequence parameter set (SPS) RBSP syntax according to an embodiment of the present invention.
  • SPS sequence parameter set
  • a constraint flag which is a syntax element included in the GCI syntax, will be described with reference to FIGS. 9 to 11.
  • no_qtbtt_dual_tree_intra_constraint_flag is a flag that controls qtbtt_dual_tree_intra_flag. For example, if the value of no_qtbtt_dual_tree_intra_constraint_flag is 1, the value of qtbtt_dual_tree_intra_flag may be set to 0. On the other hand, when the value of no_qtbtt_dual_tree_intra_constraint_flag is 0, there is no restriction on the value of qtbtt_dual_tree_intra_flag. That is, the value of qtbtt_dual_tree_intra_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • qtbtt_dual_tree_intra_flag is a flag indicating whether an I slice is used in the coding_tree syntax structure. For example, if the value of qtbtt_dual_tree_intra_flag is 1, each coding tree unit (CTU) for an I slice may be divided into coding units having 64 x 64 luma samples through implicit quad tree partitioning. In this case, the coding unit represents a root node (highest coding unit) of a separate coding_tree syntax structure for two luma and chroma.
  • qtbtt_dual_tree_intra_flag If the value of qtbtt_dual_tree_intra_flag is 0, it indicates that the coding_tree syntax structure is not used for the I slice.
  • the above-described qtbtt_dual_tree_intra_flag may be referred to as sps_qtbtt_dual_tree_intra_flag.
  • log2_ctu_size_minus5 is a syntax element indicating size information of a luma coding tree block of each coding tree unit. If 5 is added to log2_ctu_size_minus5, the size of the luma coding tree block in log2 units (CtbLog2SizeY) can be found. This can be expressed as Equation 1 below. In Equation 1 below, CtbSizeY means the size of each luma coding tree block.
  • no_partition_constraints_override_constraint_flag is a flag that controls partition_constraints_override_enabled_flag. For example, if the value of no_partition_constraints_override_constraint_flag is 1, the value of partition_constraints_override_enabled_flag may be set to 0. Meanwhile, if the value of no_partition_constraints_override_constraint_flag is 0, there is no restriction on the value of partition_constraints_override_enabled_flag. That is, the value of partition_constraints_override_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • partition_constraints_override_enabled_flag is a flag indicating whether ph_partition_constraints_override_flag in the picture header (PH) exists.
  • partition_constraints_override_enabled_flag When the value of partition_constraints_override_enabled_flag is 1, it indicates that ph_partition_constraints_override_flag exists, and when the value of partition_constraints_override_enabled_flag is 0, it indicates that ph_partition_constraints_override_flag does not exist.
  • the above-described partition_constraints_override_enabled_flag may be referred to as sps_partition_constraints_override_enabled_flag.
  • no_sao_constraint_flag is a flag that controls sps_sao_enabled_flag. For example, if the value of no_sao_constraint_flag is 1, the value of sps_sao_enabled_flag may be set to 0. Meanwhile, if the value of no_sao_constraint_flag is 0, there is no restriction on the value of sps_sao_enabled_flag. That is, the value of sps_sao_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_sao_enabled_flag is a flag indicating whether a sample adaptive offset process is applied to a picture reconstructed after a deblocking filter process for a coded layer video sequence (CLVS). For example, if the value of sps_sao_enabled_flag is 1, the sample adaptive offset process is activated on the picture restored after the deblocking filter process for CLVS, and the sample adaptive offset process is applied to the picture restored after the deblocking filter process for CLVS. Show.
  • sps_sao_enabled_flag If the value of sps_sao_enabled_flag is 0, it indicates that the sample adaptive offset process is deactivated to the picture restored after the deblocking filter process for CLVS, and the sample adaptive offset process is not applied to the picture restored after the deblocking filter process for CLVS.
  • no_alf_constraint_flag is a flag that controls sps_alf_enabled_flag. For example, if the value of no_alf_constraint_flag is 1, the value of sps_alf_enabled_flag may be set to 0. Meanwhile, when the value of no_alf_constraint_flag is 0, there is no restriction on the value of sps_alf_enabled_flag. That is, the value of sps_alf_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_alf_enabled_flag is a flag indicating whether an adaptive loop filter applied to decoding pictures in CLVS is activated. For example, if the value of sps_alf_enabled_flag is 1, it indicates that the adaptive loop filter is activated, and that the adaptive loop filter can be applied to decoding pictures in CLVS. If the value of sps_alf_enabled_flag is 0, it indicates that the adaptive loop filter is deactivated, and that the adaptive loop filter is not applied to decoding pictures in CLVS.
  • no_joint_cbcr_constraint_flag is a flag that controls sps_joint_cbcr_enabled_flag. For example, if the value of no_joint_cbcr_constraint_flag is 1, the value of sps_joint_cbcr_enabled_flag may be set to 0. Meanwhile, if the value of no_joint_cbcr_constraint_flag is 0, there is no restriction on the value of sps_joint_cbcr_enabled_flag. That is, the value of sps_joint_cbcr_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_joint_cbcr_enabled_flag is a flag indicating whether joint coding of chroma residuals used for decoding pictures in CLVS is activated. For example, if the value of sps_joint_cbcr_enabled_flag is 1, it indicates that the combined coding of chroma residuals is activated, and that the combined coding of chroma residuals can be used for decoding pictures in CLVS. If the value of sps_joint_cbcr_enabled_flag is 0, it indicates that the combined coding of chroma residuals is disabled, and that the combined coding of chroma residuals is not used for decoding pictures in CLVS. Meanwhile, sps_joint_cbcr_enabled_flag may not exist, and in this case, the value of sps_joint_cbcr_enabled_flag may be inferred as 0.
  • no_ref_wraparound_constraint_flag is a flag that controls sps_ref_wraparound_enabled_flag. For example, if the value of no_ref_wraparound_constraint_flag is 1, the value of sps_ref_wraparound_enabled_flag may be set to 0. Meanwhile, when the value of no_ref_wraparound_constraint_flag is 0, there is no restriction on the value of sps_ref_wraparound_enabled_flag. That is, the value of sps_ref_wraparound_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_ref_wraparound_enabled_flag is a flag indicating whether horizontal wrap-around motion compensation applied to decoding pictures in CLVS is activated. For example, if the value of sps_ref_wraparound_enabled_flag is 1, it indicates that horizontal wrap-around motion compensation is activated, and horizontal wrap-around motion compensation can be applied to decoding pictures in CLVS. If the value of sps_ref_wraparound_enabled_flag is 0, it indicates that horizontal wrap-around motion compensation is deactivated, and horizontal wrap-around motion compensation is not applied to decoding of pictures in CLVS.
  • no_temporal_mvp_constraint_flag is a flag that controls sps_temporal_mvp_enabled_flag. For example, if the value of no_temporal_mvp_constraint_flag is 1, the value of sps_temporal_mvp_enabled_flag may be set to 0. Meanwhile, if the value of no_temporal_mvp_constraint_flag is 0, there is no restriction on the value of sps_temporal_mvp_enabled_flag. That is, the sps_temporal_mvp_enabled_flag value may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_temporal_mvp_enabled_flag is a flag indicating whether temporal motion vector predictors used for decoding pictures in CLVS are activated. For example, if the value of sps_temporal_mvp_enabled_flag is 1, it indicates that the temporal motion vector predictor is activated, and that the temporal motion vector predictor can be used for decoding pictures in CLVS. If the value of sps_temporal_mvp_enabled_flag is 0, it indicates that the temporal motion vector predictor is deactivated, and the temporal motion vector predictor is not used for decoding pictures in CLVS.
  • no_sbtmvp_constraint_flag is a flag that controls sps_sbtmvp_enabled_flag. For example, if the value of no_sbtmvp_constraint_flag is 1, the value of sps_sbtmvp_enabled_flag may be set to 0. Meanwhile, when the value of no_sbtmvp_constraint_flag is 0, there is no restriction on the value of sps_sbtmvp_enabled_flag. That is, the value of sps_sbtmvp_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_sbtmvp_enabled_flag is a flag indicating whether subblock-based temporal motion vector predictors used for decoding pictures in CLVS are activated. For example, if the value of sps_sbtmvp_enabled_flag is 1, it indicates that the subblock-based temporal motion vector predictor is activated, and that the subblock-based temporal motion vector predictor can be used for decoding pictures in CLVS.
  • the slice type of the pictures may be a type excluding I slice (eg, B slice, P slice).
  • no_amvr_constraint_flag is a flag that controls sps_amvr_enabled_flag. For example, if the value of no_amvr_constraint_flag is 1, the value of sps_amvr_enabled_flag may be set to 0. Meanwhile, if the value of no_amvr_constraint_flag is 0, there is no restriction on the value of sps_amvr_enabled_flag. That is, the sps_amvr_enabled_flag value may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_amvr_enabled_flag is a flag indicating whether motion vector difference resolution used for decoding pictures in CLVS is activated. For example, if the value of sps_amvr_enabled_flag is 1, it indicates that the motion vector difference resolution is activated, and that the motion vector difference resolution can be used for decoding pictures in CLVS. If the value of sps_amvr_enabled_flag is 0, it indicates that the motion vector difference resolution is deactivated, and the motion vector difference resolution is not used for decoding pictures in CLVS.
  • no_bdof_constraint_flag is a flag that controls sps_bdof_enabled_flag. For example, if the value of no_bdof_constraint_flag is 1, the value of sps_bdof_enabled_flag may be set to 0. Meanwhile, if the value of no_bdof_constraint_flag is 0, there is no restriction on the value of sps_bdof_enabled_flag. That is, the value of sps_bdof_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_bdof_enabled_flag is a flag indicating whether bi-directional optical flow inter prediction used for decoding pictures in CLVS is activated. For example, if the value of sps_bdof_enabled_flag is 1, it indicates that bi-directional optical flow inter prediction is activated, and that bi-directional optical flow inter prediction can be used for decoding pictures in CLVS. If the value of sps_bdof_enabled_flag is 0, this indicates that bi-directional optical flow inter prediction is deactivated, and that bi-directional optical flow inter prediction is not used for decoding pictures in CLVS.
  • no_dmvr_constraint_flag is a flag that controls sps_dmvr_enabled_flag. For example, if the value of no_dmvr_constraint_flag is 1, the value of sps_dmvr_enabled_flag may be set to 0. Meanwhile, if the value of no_dmvr_constraint_flag is 0, there is no restriction on the value of sps_dmvr_enabled_flag. That is, the value of sps_dmvr_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_dmvr_enabled_flag is a flag indicating whether bi-prediction based on decoder motion vector refinement used for decoding pictures in CLVS is activated. For example, if the value of sps_dmvr_enabled_flag is 1, it indicates that bi-directional prediction based on decoder motion vector refinement is activated, and bi-directional prediction based on decoder motion vector refinement can be used for decoding pictures in CLVS.
  • sps_dmvr_enabled_flag If the value of sps_dmvr_enabled_flag is 0, it indicates that bi-directional prediction based on decoder motion vector refinement is deactivated, and bi-directional prediction based on decoder motion vector refinement is not used for decoding pictures in CLVS.
  • no_cclm_constraint_flag is a flag that controls sps_cclm_enabled_flag. For example, if the value of no_cclm_constraint_flag is 1, the value of sps_cclm_enabled_flag may be set to 0. Meanwhile, if the value of no_cclm_constraint_flag is 0, there is no restriction on the value of sps_cclm_enabled_flag. That is, the value of sps_cclm_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_cclm_enabled_flag is a flag indicating whether cross-component linear model intra prediction from a luma component to a chroma component used for decoding pictures in CLVS is activated. For example, if the value of sps_cclm_enabled_flag is 1, the cross-component linear model intra prediction from the luma component to the chroma component is activated, and the cross-component linear model intra prediction from the luma component to the chroma component is performed in decoding of pictures in CLVS. Indicates that it can be used.
  • sps_cclm_enabled_flag When the value of sps_cclm_enabled_flag is 0, the luma component to chroma component cross-component linear model intra prediction is disabled, and the luma component to chroma component cross component linear model intra prediction is not used for decoding pictures in CLVS. Show. Meanwhile, sps_cclm_enabled_flag may not exist, and in this case, a value of sps_cclm_enabled_flag may be inferred as 0.
  • no_mts_constraint_flag is a flag that controls sps_mts_enabled_flag. For example, if the value of no_mts_constraint_flag is 1, the value of sps_mts_enabled_flag may be set to 0. On the other hand, if the value of no_mts_constraint_flag is 0, there is no restriction on the value of sps_mts_enabled_flag. That is, the value of sps_mts_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_mts_enabled_flag is a flag indicating whether sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag are present in a sequence parameter set (SPS). For example, if the value of sps_mts_enabled_flag is 1, it indicates that sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag are present in the SPS.
  • SPS sequence parameter set
  • sps_mts_enabled_flag If the value of sps_mts_enabled_flag is 0, it indicates that sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag do not exist in the SPS.
  • sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag are flags indicating whether mts_idx is present in the intra coding unit syntax of CLVS. For example, if the value of sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag is 1, mts_idx may be present in the intra/inter coding unit syntax of CLVS.
  • sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag indicates that it does not exist in the intra/inter coding unit syntax of CLVS. Meanwhile, sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag may not exist. In this case, the value of sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag may be deduced as 0.
  • mts_idx is a syntax element indicating a transform kernel applied along the horizontal and vertical directions of the associated luma transform block in the current coding unit.
  • no_sbt_constraint_flag is a flag that controls sps_sbt_enabled_flag. For example, if the value of no_sbt_constraint_flag is 1, the value of sps_sbt_enabled_flag may be set to 0. Meanwhile, if the value of no_sbt_constraint_flag is 0, there is no restriction on the value of sps_sbt_enabled_flag. That is, the value of sps_sbt_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_sbt_enabled_flag is a flag indicating whether sub-block transform is activated for inter-predicted coding units (CU)s used for decoding pictures in CLVS. For example, if the value of sps_sbt_enabled_flag is 1, it indicates that subblock transform for inter-predicted coding units is activated, and sub-block transform for inter-predicted coding units can be used for decoding pictures in CLVS. If the value of sps_sbt_enabled_flag is 0, it indicates that sub-block transform for inter-predicted coding units is deactivated, and that sub-block transform for inter-predicted coding units is not used for decoding pictures in CLVS.
  • no_affine_motion_constraint_flag is a flag that controls sps_affine_enabled_flag. For example, if the value of no_affine_motion_constraint_flag is 1, the value of sps_affine_enabled_flag may be set to 0. Meanwhile, when the value of no_affine_motion_constraint_flag is 0, there is no restriction on the value of sps_affine_enabled_flag. That is, the value of sps_affine_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_affine_enabled_flag is a flag indicating whether or not an affine model based motion compensation used for decoding pictures in CLVS is activated.
  • sps_affine_enabled_flag indicates whether inter_affine_flag and cu_affine_type_flag exist in the coding unit syntax of CLVS. For example, if the value of sps_affine_enabled_flag is 1, it indicates that affine model-based motion compensation is activated, and that affine model-based motion compensation can be used for decoding pictures in CLVS.
  • sps_affine_enabled_flag 1
  • sps_affine_enabled_flag 1
  • affine model-based motion compensation is deactivated, and that affine model-based motion compensation is not used for decoding pictures in CLVS.
  • sps_affine_enabled_flag is 0, it indicates that inter_affine_flag and cu_affine_type_flag do not exist in the coding unit syntax of CLVS.
  • inter_affine_flag is a flag indicating whether affine model-based motion compensation is used to generate a prediction sample of the current coding unit when decoding the current coding unit.
  • cu_affine_type_flag is a flag indicating whether affine model-based motion compensation using four parameters or affine model-based motion compensation using six parameters is used when decoding the current coding unit.
  • no_bcw_constraint_flag is a flag that controls sps_bcw_enabled_flag. For example, if the value of no_bcw_constraint_flag is 1, the value of sps_bcw_enabled_flag may be set to 0. Meanwhile, if the value of no_bcw_constraint_flag is 0, there is no restriction on the value of sps_bcw_enabled_flag. That is, the value of sps_bcw_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_bcw_enabled_flag is a flag indicating whether bi-directional prediction using weights of coding units used for decoding pictures in CLVS is activated.
  • sps_bcw_enabled_flag may indicate whether bcw_idx exists in the coding unit syntax of CLVS. For example, if the value of sps_bcw_enabled_flag is 1, it indicates that bi-directional prediction using coding unit weights is activated, and bi-directional prediction using coding unit weights can be used for decoding pictures in CLVS.
  • sps_bcw_enabled_flag value 1
  • bcw_idx may exist in the coding unit syntax of CLVS.
  • the value of sps_bcw_enabled_flag 0
  • the value of sps_bcw_enabled_flag it indicates that bcw_idx does not exist in the coding unit syntax of CLVS.
  • bcw_idx is a syntax element indicating an index related to bi-directional prediction using coding unit weights.
  • no_ibc_constraint_flag is a flag that controls sps_ibc_enabled_flag. For example, if the value of no_ibc_constraint_flag is 1, the value of sps_ibc_enabled_flag may be set to 0. Meanwhile, if the value of no_ibc_constraint_flag is 0, there is no restriction on the value of sps_ibc_enabled_flag. That is, the value of sps_ibc_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_ibc_enabled_flag is a flag indicating whether the intra block copy (IBC) prediction mode used for decoding pictures in CLVS is activated. For example, if the value of sps_ibc_enabled_flag is 1, it indicates that the IBC prediction mode is activated, and that the IBC prediction mode can be used for decoding pictures in CLVS. If the value of sps_ibc_enabled_flag is 0, it indicates that the IBC prediction mode is deactivated, and the IBC prediction mode is not used for decoding pictures in CLVS.
  • IBC intra block copy
  • no_ciip_constraint_flag is a flag that controls sps_ciip_enabled_flag. For example, if the value of no_ciip_constraint_flag is 1, the value of sps_ciip_enabled_flag may be set to 0. Meanwhile, if the value of no_ciip_constraint_flag is 0, there is no restriction on the value of sps_ciip_enabled_flag. That is, the value of sps_ciip_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_ciip_enabled_flag is a flag indicating whether ciip_flag is present in the coding unit syntax for inter coding units. For example, if the value of sps_ciip_enabled_flag is 0, it indicates that ciip_flag does not exist in the coding unit syntax for inter coding units. If the value of sps_ciip_enabled_flag is 1, it indicates that ciip_flag may be present in the coding unit syntax for inter coding units.
  • ciip_flag is a flag indicating whether the combined inter-picture merge and intra-picture prediction are applied to the current coding unit.
  • no_fpel_mmvd_constraint_flag is a flag that controls sps_fpel_mmvd_enabled_flag. For example, if the value of no_fpel_mmvd_constraint_flag is 1, the value of sps_fpel_mmvd_enabled_flag may be set to 0. Meanwhile, if the value of no_fpel_mmvd_constraint_flag is 0, there is no restriction on the value of sps_fpel_mmvd_enabled_flag. That is, the value of sps_fpel_mmvd_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_fpel_mmvd_enabled_flag is a flag indicating the type of sample precision used in a merge mode using a motion vector difference. For example, if the value of sps_fpel_mmvd_enabled_flag is 1, it indicates that the sample precision used in the merge mode using the motion vector difference is integer sample precision. If the value of sps_fpel_mmvd_enabled_flag is 0, it indicates that the sample precision used in the merge mode using the motion vector difference is fractional sample precision.
  • sps_fpel_mmvd_enabled_flag may not exist, and in this case, the value of sps_fpel_mmvd_enabled_flag may be inferred as 0.
  • sps_fpel_mmvd_enabled_flag may be referred to as sps_mmvd_fullpel_only_flag.
  • no_triangle_constraint_flag is a flag that controls sps_triangle_enabled_flag. For example, if the value of no_triangle_constraint_flag is 1, the value of sps_triangle_enabled_flag may be set to 0. Meanwhile, if the value of no_triangle_constraint_flag is 0, there is no restriction on the value of sps_triangle_enabled_flag. That is, the value of sps_triangle_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_triangle_enabled_flag is a flag indicating whether or not a triangle shape-based motion compensation can be applied.
  • the triangular shape-based motion compensation prediction method can be divided into two triangular models based on the oblique line of the inter-coding unit, and the motion information set of each triangular area may be different, and motion compensation is performed based on this to generate a prediction sample. can do
  • no_ladf_constraint_flag is a flag that controls sps_ladf_enabled_flag. For example, if the value of no_ladf_constraint_flag is 1, the value of sps_ladf_enabled_flag may be set to 0. Meanwhile, when the value of no_ladf_constraint_flag is 0, there is no restriction on the value of sps_ladf_enabled_flag. That is, the value of sps_ladf_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_ladf_enabled_flag is a flag indicating whether sps_num_ladf_intervals_minus2, sps_ladf_lowest_interval_qp_offset, sps_ladf_qp_offset[i], and sps_ladf_delta_threshold_minus1[i] exist in the SPS.
  • sps_ladf_enabled_flag 1
  • sps_num_ladf_intervals_minus2 sps_ladf_lowest_interval_qp_offset
  • sps_ladf_qp_offset[i] sps_ladf_delta_threshold_minus1[i] exist in the SPS.
  • sps_ladf_enabled_flag If the value of sps_ladf_enabled_flag is 0, it indicates that sps_num_ladf_intervals_minus2, sps_ladf_lowest_interval_qp_offset, sps_ladf_qp_offset[i], and sps_ladf_delta_threshold_minus1[i] do not exist in the SPS.
  • sps_num_ladf_intervals_minus2 is a syntax element indicating the number of syntax elements sps_ladf_delta_threshold_minus1[i] and sps_ladf_qp_offset[i], which are syntax elements existing in the SPS.
  • sps_num_ladf_intervals_minus2 may have a value between 0 and 3.
  • sps_ladf_lowest_interval_qp_offset is a syntax element indicating an offset used to derive a variable quantization parameter (QP).
  • QP variable quantization parameter
  • sps_ladf_lowest_interval_qp_offset may have a value between -63 and 63.
  • sps_ladf_qp_offset[i] is a syntax element indicating an offset array used to derive a variable quantization parameter. sps_ladf_qp_offset[i] may have a value between -63 and 63.
  • sps_ladf_delta_threshold_minus1[i] is a syntax element used to calculate the value of SpsLadfIntervalLowerBound[i], a syntax element that designates the lower limit of the i-th luma intensity level inderval.
  • sps_ladf_delta_threshold_minus1[i] may have a value between 0 and 2 BitDepth -3. BitDepth represents the bit depth and means the number of bits required to express the brightness of an image.
  • no_transform_skip_constraint_flag is a flag that controls sps_transform_skip_enabled_flag. For example, if the value of no_transform_skip_constraint_flag is 1, the value of sps_transform_skip_enabled_flag may be set to 0. Meanwhile, if the value of no_transform_skip_constraint_flag is 0, there is no restriction on the value of sps_transform_skip_enabled_flag. That is, the value of sps_transfrom_skip_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_transform_skip_enabled_flag is a flag indicating whether transform_skip_flag is present in the syntax of a transform unit. For example, if the value of sps_transform_skip_enabled_flag is 1, it indicates that transform_skip_flag may exist in the transform unit syntax. If the value of sps_transform_skip_enabled_flag is 0, it indicates that transform_skip_flag does not exist in the transform unit syntax.
  • transform_skip_flag is a flag indicating whether or not transform is applied to a transform block.
  • no_bdpcm_constraint_flag is a flag that controls sps_bdpcm_enabled_flag. For example, if the value of no_bdpcm_constraint_flag is 1, the value of sps_bdpcm_enabled_flag may be set to 0. Meanwhile, if the value of no_bdpcm_constraint_flag is 0, there is no restriction on the value of sps_bdpcm_enabled_flag. That is, the value of sps_bdpcm_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_bdpcm_enabled_flag is a flag indicating whether intra_bdpcm_luma_flag and intra_bdpcm_chroma_flag are present in the coding unit syntax for intra coding units. For example, if the value of sps_bdpcm_enabled_flag is 1, it indicates that intra_bdpcm_luma_flag and intra_bdpcm_chroma_flag may exist in the coding unit syntax for intra coding units.
  • sps_bdpcm_enabled_flag If the value of sps_bdpcm_enabled_flag is 0, it indicates that intra_bdpcm_luma_flag and intra_bdpcm_chroma_flag do not exist in the coding unit syntax for intra coding units. Meanwhile, sps_bdpcm_enabled_flag may not exist. In this case, the value of sps_bdpcm_enabled_flag may be inferred as 0.
  • the intra_bdpcm_luma_flag/intra_bdpcm_chroma_flag are flags indicating whether or not bdpcm (Block-based Delta Pulse Code Modulation) is applied to a luma/chroma coding block at a specific position (x0, y0).
  • no_qp_delta_constraint_flag is a flag that controls cu_qp_delta_enabled_flag. For example, if the value of no_qp_delta_constraint_flag is 1, the value of cu_qp_delta_enabled_flag may be set to 0. Meanwhile, if the value of no_qp_delta_constraint_flag is 0, there is no restriction on the value of cu_qp_delta_enabled_flag. That is, the value of cu_qp_delta_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • cu_qp_delta_enabled_flag is a flag indicating whether syntax elements ph_cu_qp_delta_subdiv_intra_slice and ph_cu_qp_delta_subdiv_inter_slice exist in PHs referring to the PPS.
  • cu_qp_delta_enabled_flag indicates whether there are syntax elements cu_qp_delta_abs and cu_qp_delta_sign_flag, which are syntax elements included in the transform unit syntax and palette coding syntax.
  • cu_qp_delta_enabled_flag if the value of cu_qp_delta_enabled_flag is 1, it indicates that ph_cu_qp_delta_subdiv_intra_slice and ph_cu_qp_delta_subdiv_inter_slice, which are syntax elements, may exist in PHs referring to the PPS.
  • cu_qp_delta_enabled_flag indicates that the syntax elements cu_qp_delta_abs and cu_qp_delta_sign_flag may exist in the conversion unit syntax and palette coding syntax.
  • cu_qp_delta_enabled_flag If the value of cu_qp_delta_enabled_flag is 0, it indicates that syntax elements ph_cu_qp_delta_subdiv_intra_slice and ph_cu_qp_delta_subdiv_inter_slice do not exist in PHs referring to the PPS. In addition, if the value of cu_qp_delta_enabled_flag is 0, it indicates that the syntax elements cu_qp_delta_abs and cu_qp_delta_sign_flag do not exist in the conversion unit syntax and palette coding syntax.
  • the ph_cu_qp_delta_subdiv_intra_slice/ph_cu_qp_delta_subdiv_inter_slice is a syntax element representing the maximum value'cbSubdiv' of the coding unit in the intra/inter slice conveying cu_qp_delta_abs and cu_qp_delta_sign_flag.
  • 'cbSubdiv' represents a subdivision value of a block.
  • cu_qp_delta_abs is a syntax element indicating an absolute value of'CuQpDeltaVal', a difference between the quantization parameter of the current coding unit and the predicted value of the quantization parameter of the current coding unit.
  • cu_qp_delta_sign_flag is a flag indicating the sign of the'CuQpDeltaVal'.
  • no_dep_quant_constraint_flag is a flag that controls sps_dep_quant_enabled_flag. For example, if the value of no_dep_quant_constraint_flag is 1, the value of sps_dep_quant_enabled_flag may be set to 0. Meanwhile, if the value of no_dep_quant_constraint_flag is 0, there is no restriction on the value of sps_dep_quant_enabled_flag. That is, the value of sps_dep_quant_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_dep_quant_enabled_flag is a flag indicating whether dependent quantization used for pictures referring to the SPS is activated. For example, if the value of sps_dep_quant_enabled_flag is 1, it indicates that dependent quantization is activated, and dependent quantization can be used for pictures referring to the SPS. If the value of sps_dep_quant_enabled_flag is 0, it indicates that dependent quantization is deactivated, and dependent quantization is not used for pictures referring to the SPS.
  • no_sign_data_hiding_constraint_flag is a flag that controls sps_sign_data_hiding_enabled_flag. For example, if the value of no_sign_data_hiding_constraint_flag is 1, the value of sps_sign_data_hiding_enabled_flag may be set to 0. Meanwhile, if the value of no_sign_data_hiding_constraint_flag is 0, there is no restriction on the value of sps_sign_data_hiding_enabled_flag. That is, the value of sps_sign_data_hiding_enabled_flag may be determined according to a parsing result of the SPS RBSP syntax.
  • sps_sign_data_hiding_enabled_flag is a flag indicating whether sign bit hiding used for pictures referring to the SPS is activated. For example, if the value of sps_sign_data_hiding_enabled_flag is 1, it indicates that the sign bit hiding used for pictures referring to the SPS is activated, and that the sign bit hiding can be used for the picture referring to the SPS. When the value of sps_sign_data_hiding_enabled_flag is 0, it indicates that the sign bit hiding used for pictures referring to the SPS is deactivated, and that the sign bit hiding is not used for the picture referring to the SPS.
  • SPS sequence parameter set
  • the SPS RBSP syntax structure includes parameter information related to high dynamic range (hdr) including sps_scaling_list_enabled_flag, and an extension space for adding sps parameters to be described later. If clause below hrd_parameters_present_flag disclosed in FIG. 12 may be parameter information related to hdr.
  • GCI 13 is a diagram illustrating general constraint information (GCI) syntax according to an embodiment of the present invention.
  • the GCI syntax may include flags related to transform skip and block-based delta pulse code modulation (bdpcm), and may signal the flags.
  • the SPS RBSP syntax has a structure that signals sps_bdpcm_enabled_flag when the value of sps_transform_skip_enabled_flag is 1. This structure means that an activation condition for transform skip must be preceded in order to indicate whether or not bdpcm is activated.
  • the signaling structure of the same method as the SPS RBSP syntax is required in the GCI syntax. For example, if the value of no_tranform_skip_coanstraint_flag is 1, sps_transform_skip_enabled_flag has a value of 0, and thus transform skip is disabled. In this case, setting no_bdpcm_constraint_flag of 1 or 0 is equivalent to using 1 bit without any meaning.
  • no_bdpcm_constraint_flag when the value of no_transform_skip_constraint_flag is 0, no_bdpcm_constraint_flag may be signaled. This can be expressed as Equation 2 below.
  • the GCI syntax may include flags related to temporal motion vector predictors (temporal mvp) and subblock-based temporal motion vector predictors (sbtmvp). And signal the flags.
  • temporal motion vector predictors temporary mvp
  • sbtmvp subblock-based temporal motion vector predictors
  • the SPS RBSP syntax has a structure that signals sps_sbtmvp_enabled_flag when the value of sps_temporal_mvp_enabled_flag is 1.
  • This structure means that the activation condition of the temporal motion vector predictor (temporal mvp) must be preceded in order to indicate the subblock-based temporal motion vector predictor (sbtmvp).
  • no_temporal_mvp_constraint_flag 1
  • the value of sps_temporal_mvp_enabled_flag is set to 0 and is deactivated, and sps_sbtmvp_enabled_flag is not signaled, so no_sbtmvp_enabled_flag controlling sps_sbtmvp_enabled_flag is not required to be signaled.
  • no_temporal_mvp_constraint_flag 0 since the value of sps_temporal_mvp_enabled_flag is not restricted, sps_sbtmvp_enabled_flag may be signaled, and thus no_sbtmvp_constraint_flag indicating whether sps_sbtmvp_enabled_flag is activated may be signaled. This can be expressed as Equation 3 below.
  • no_sbtmvp_constraint_flag may be signaled. This can be expressed as Equation 3 below.
  • GCI 15 is a diagram illustrating general constraint information (GCI) syntax.
  • the GCI syntax may include flags related to a merge with motion vector difference (mmvd) and a full pel (fpel) mmvd, and signal the flags. I can.
  • the SPS RBSP syntax has a structure that signals sps_fpel_mmvd_enabled_flag when the value of sps_mmvd_enabled_flag is 1. This structure means that the activation condition of mmvd must be preceded in order to indicate the entire pel mmvd.
  • sps_mmvd_enabled_flag may indicate whether or not a merge mode (merge with motion vector difference, mmvd) using a motion vector difference in inter prediction is activated. For example, if the value of sps_mmvd_enabled_flag is 1, it indicates that the merge mode using the motion vector difference is activated and can be used for picture decoding in CLVS. If the value of sps_mmvd_enabled_flag is 0, this indicates that the merge mode using the motion vector difference is deactivated and not used for picture decoding in CLVS.
  • sps_fpel_mmvd_enabled_flag may indicate whether to use a motion vector difference having integer sample precision when mmvd is used.
  • no_mmvd_constraint_flag is a flag that controls sps_mmvd_enabled_flag. For example, if the value of no_mmvd_constraint_flag is 1, the value of sps_mmvd_enabled_flag may be set to 0. Meanwhile, when the value of no_mmvd_constraint_flag is 0, there is no restriction on the value of sps_mmvd_enabled_flag. That is, the value of sps_mmvd_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • no_mmvd_constraint_flag 1
  • sps_mmvd_enabled_flag 1
  • sps_fpel_mmvd_enabled_flag 1
  • no_fpel_mmvd_constraint_flag controlling sps_fpel_mmvd_enabled_flag does not need to be signaled.
  • no_mmvd_constraint_flag indicating whether or not sps_fpel_mmvd_enabled_flag is activated may be signaled. This can be expressed as Equation 4 below.
  • GCI 16 is a diagram showing general constraint information (GCI) syntax.
  • the GCI syntax may include flags related to affine model based motion compensation, and may signal the flags.
  • flags related to affine model-based motion compensation there may be sps_affine_enabled_flag, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag, and the like.
  • the SPS RBSP syntax has a structure that signals sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag when the value of sps_affine_enabled_flag is 1.
  • This structure means that in order for sps_affine_type_flag, sps_affine_amvr_enabled_flag, and sps_affine_prof_enabled_flag to be signaled, the affine model-based motion compensation activation condition must be preceded.
  • sps_affine_type_flag is a flag indicating whether to use affine model-based motion compensation using 6 parameters, and when the value of sps_affine_type_flag is 0, affine model-based motion compensation using 6 parameters is not used.
  • sps_affine_type_flag When the value of sps_affine_type_flag is 1, it may indicate that affine model-based motion compensation using 6 parameters can be used.
  • sps_affine_amvr_enabled_flag is a flag indicating whether to use adaptive motion vector resolution used for motion compensation based on affine model.
  • sps_affine_prof_enabled_flag is a flag indicating whether or not to correct for applying an optical flow to affine model-based motion compensation.
  • sps_affine_type_flag if the value of no_affine_motion_constraint_flag-zero value of sps_affine_enabled_flag are not constrained, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag may be signaled, and therefore, sps_affine_type_flag, sps_affine_amvr_enabled_flag, indicating the signaling whether sps_affine_prof_enabled_flag is no_affine_type_constraint_flag, no_affine_amvr_constraint_flag, no_affine_prof_constraint_flag may be signaled . This can be expressed as Equation 5 below.
  • 17 is a diagram showing syntax according to an embodiment of the present invention.
  • FIG. 17(a) is a diagram showing slice header syntax
  • FIG. 17(b) is a diagram showing general constraint information (GCI) syntax
  • the GCI syntax may include flags related to dependent quantization and flags related to sign data hiding, and may signal the flags.
  • FIG. 17A is a diagram showing a structure for signaling a flag related to dependent quantization (dep_quant_enabled_flag) and a flag related to sign data hiding (sign_data_hiding_enabled_flag) in a slice header syntax.
  • sign_data_hiding_enabled_flag may be signaled only when dep_quant_enabled_flag is deactivated (not used).
  • no_dep_quant_constraint_flag when the value of no_dep_quant_constraint_flag is 1, the value of dep_quant_enabled_flag is set to 0 and is deactivated, and sign_data_hiding_enabled_flag may be signaled. If the value of no_dep_quant_constraint_flag is 0, the value of dep_quant_enabled_flag is not restricted, so no_sign_data_hiding_constraint_flag indicating whether sign_data_hiding_enabled_flag is activated needs to be signaled. This can be expressed as Equation 6 below.
  • sps_dep_quant_enabled_flag may be the same as dep_quant_enabled_flag, and sps_sign_data_hiding_enabled_flag may be the same as sign_data_hiding_enabled_flag.
  • the GCI syntax may include flags related to a multiple transform set (mts), and may signal the flags.
  • mts multiple transform set
  • the flag related to the multiple transformation set there may be sps_mts_enabled_flag, sps_explicit_mts_intra_enabled_flag, sps_explicit_mts_inter_enabled_flag, and the like.
  • the above-described no_mts_constraint_flag, sps_explicit_mts_intra_enabled_flag, and sps_explicit_mts_inter_enabled_flag will be described in more detail with reference to FIGS. 11 and 18.
  • the SPS RBSP syntax has a structure that signals sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag when the value of sps_mts_enabled_flag is 1.
  • sps_mts_enabled_flag if the value of sps_mts_enabled_flag is 0, only DCT2-DCT2 can use the conversion kernel. If the value of sps_mts_enabled_flag is 1, it can be indicated to use kernels other than DCT2 implicitly.
  • sps_mts_enabled_flag 1 and the values of sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag are all 1, not only the multi-transformation set can be implicitly indicated, but also the multi-transformation set can be indicated for the intra mode, and the multi-transformation set can be separately used for the inter mode Can instruct.
  • sps_explicit_mts_intra_enabled_flag and sps_explicit_mts_inter_enabled_flag may be signaled. This can be expressed as Equation 7 below.
  • GCI 19 is a diagram illustrating general constraint information (GCI) syntax according to an embodiment of the present invention. As shown in FIG. 19, a syntax element that controls some of the syntax elements related to the tool/function defined in the sequence parameter set (SPS) RBSP syntax illustrated in FIG. 11 is added to the GCI syntax to provide the function. Can be expanded.
  • SPS sequence parameter set
  • the added syntax elements are as follows.
  • no_smvd_constraint_flag is a flag that controls sps_smvd_enabled_flag. For example, if the value of no_smvd_constraint_flag is 1, the value of sps_smvd_enabled_flag may be set to 0. Meanwhile, if the value of no_smvd_constraint_flag is 0, there is no restriction on the value of sps_smvd_enabled_flag. That is, the value of sps_smvd_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_smvd_enabled_flag is a flag indicating whether a symmetric motion vector difference used for decoding pictures in CLVS is activated. For example, if the value of sps_smvd_enabled_flag is 1, it indicates that a symmetric motion vector used for decoding pictures in CLVS is activated, and a symmetric motion vector can be used for decoding pictures in CLVS. If the value of sps_smvd_enabled_flag is 0, it indicates that the symmetric motion vector used for decoding pictures in CLVS is deactivated, and the symmetric motion vector is not used for decoding pictures in CLVS.
  • no_isp_constraint_flag is a flag that controls sps_isp_enabled_flag. For example, if the value of no_isp_constraint_flag is 1, the value of sps_isp_enabled_flag may be set to 0. Meanwhile, if the value of no_isp_constraint_flag is 0, there is no restriction on the value of sps_isp_enabled_flag. That is, the value of sps_isp_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_isp_enabled_flag is a flag indicating whether intra prediction in which subpartitions used for decoding pictures in CLVS are used is activated. For example, if the value of sps_isp_enabled_flag is 1, it indicates that intra prediction in which subpartitions used for decoding pictures in CLVS are used is activated, and intra prediction in which subpartitions are used for decoding pictures in CLVS can be used. If the value of sps_isp_enabled_flag is 0, it indicates that intra prediction in which subpartitions used for decoding pictures in CLVS are used is deactivated, and that intra prediction in which subpartitions are used for decoding pictures in CLVS is not used.
  • no_mrl_constraint_flag is a flag that controls sps_mrl_enabled_flag. For example, if the value of no_mrl_constraint_flag is 1, the value of sps_mrl_enabled_flag may be set to 0. Meanwhile, if the value of no_mrl_constraint_flag is 0, there is no restriction on the value of sps_mrl_enabled_flag. That is, the value of sps_mrl_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_mrl_enabled_flag is a flag indicating whether intra prediction using multiple reference lines used for decoding pictures in CLVS is activated. For example, if the value of sps_mrl_enabled_flag is 1, it indicates that intra prediction using multiple reference lines used for decoding pictures in CLVS is activated, and intra prediction using multiple reference lines for decoding pictures in CLVS can be used. . If the value of sps_mrl_enabled_flag is 0, it indicates that intra prediction using multiple reference lines used for decoding pictures in CLVS is deactivated, and intra prediction using multiple reference lines for decoding pictures in CLVS is not used.
  • no_mip_constraint_flag is a flag that controls sps_mip_enabled_flag. For example, if the value of no_mip_constraint_flag is 1, the value of sps_mip_enabled_flag may be set to 0. Meanwhile, if the value of no_mip_constraint_flag is 0, there is no restriction on the value of sps_mip_enabled_flag, that is, the value of sps_mip_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_mip_enabled_flag is a flag indicating whether matrix-based intra prediction used for decoding pictures in CLVS is activated. For example, if the value of sps_mip_enabled_flag is 1, it indicates that metrics-based intra prediction used for decoding pictures in CLVS is activated, and metrics-based intra prediction can be used for decoding pictures in CLVS. If the value of sps_mip_enabled_flag is 0, it indicates that metrics-based intra prediction used for decoding pictures in CLVS is deactivated, and that metrics-based intra prediction used for decoding pictures in CLVS is not used.
  • no_lfnst_constraint_flag is a flag that controls sps_lfnst_enabled_flag. For example, if the value of no_lfnst_constraint_flag is 1, the value of sps_lfnst_enabled_flag may be set to 0. Meanwhile, if the value of no_lfnst_constraint_flag is 0, there is no restriction on the value of sps_lfnst_enabled_flag. That is, the value of sps_lfnst_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_lfnst_enabled_flag is a flag indicating whether lfnst_idx is present in the intra coding unit syntax. For example, if the value of sps_lfnst_enabled_flag is 1, lfnst_idx indicates that lfnst_idx may exist in the intra coding unit syntax. If the value of sps_lfnst_enabled_flag is 0, it indicates that lfnst_idx does not exist in the intra coding unit syntax.
  • lfnst_idx is a syntax element indicating whether a low frequency non-separable transform is applied to the current block.
  • no_lmcs_constraint_flag is a flag that controls sps_lmcs_enabled_flag. For example, if the value of no_lmcs_constraint_flag is 1, the value of sps_lmcs_enabled_flag may be set to 0. Meanwhile, if the value of no_lmcs_constraint_flag is 0, there is no restriction on the value of sps_lmcs_enabled_flag. That is, the value of sps_lmcs_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_lmcs_enabled_flag is a flag indicating whether chroma scaling and luma mapping used for decoding pictures in CLVS are activated. For example, if the value of sps_lmcs_enabled_flag is 1, it indicates that chroma scaling and luma mapping used for decoding pictures in CLVS are activated, and that chroma scaling and luma mapping can be used for decoding pictures in CLVS. If the value of sps_lmcs_enabled_flag is 0, it indicates that chroma scaling and luma mapping used for decoding pictures in CLVS are disabled, and that chroma scaling and luma mapping are not used for decoding pictures in CLVS.
  • no_palette_constraint_flag is a flag that controls sps_palette_enabled_flag. For example, if the value of no_palette_constraint_flag is 1, the value of sps_palette_enabled_flag may be set to 0. Meanwhile, if the value of no_palette_constraint_flag is 0, there is no restriction on the value of sps_palette_enabled_flag. That is, the value of sps_palette_enabled_flag may be determined according to the parsing result of the SPS RBSP syntax.
  • sps_palette_enabled_flag is a flag indicating whether pred_mode_plt_flag exists in the coding unit syntax of CLVS. For example, if the value of sps_palette_enabled_flag is 1, it indicates that pred_mode_plt_flag may exist in the coding unit syntax of CLVS. If the value of sps_palette_enabled_flag is 0, it indicates that pred_mode_plt_flag does not exist in the coding unit syntax of CLVS.
  • pred_mode_plt_flag is a flag indicating whether or not the palette mode is applied to the current coding unit.
  • chroma_format_idc represents chroma sampling for luma sampling. Therefore, the syntax element chroma_format_idc needs to be included in the GCI syntax'general_constraint_info()'. In this case, it is a necessary structure within the DPS syntax and VPS syntax.
  • the GCI syntax included in the profile tier level syntax is parsed, and then the chroma_format_idc syntax element may be parsed once more, so chroma_format_idc May be called redundantly.
  • the GCI syntax included in the DPS syntax or the VPS syntax includes chroma_format_idc, and chroma_format_idc is included in the GCI syntax included in the profile tier level syntax, so that chroma_format_idc may be redundantly parsed.
  • the chroma_format_idx syntax element may not be signaled.
  • the decoder may be set so that the chroma_format_idc syntax element is not included in the SPS RBSP syntax.
  • Each of the constraint flags described in FIG. 19 may control an SPS activation flag (sps_x_enabled_flag) corresponding to the constraint flag (no_x_constraint) flag.
  • FIG. 20 is a diagram showing general constraint information (GCI) syntax according to an embodiment of the present invention.
  • the GCI syntax may include syntax elements related to cclm. Referring to FIG. 20, the no_cclm_constraint_flag described in FIG. 9 will be described in more detail.
  • ChromaArrayType plays a role of designating format values of luminance and color difference components of decoded video data.
  • no_cclm_constraint_flag may play a role of controlling sps_cclm_enabled_flag.
  • no_cclm_colocated_chroma_constraint_flag is a flag that controls sps_cclm_colocated_chroma_flag.
  • sps_cclm_enabled_flag is a flag indicating whether cross-component linear model intra prediction from a luma component to a chroma component used for decoding pictures in CLVS is activated.
  • sps_cclm_colocated_chroma_flag means that the top-left downsampled luma sample in cross-component linear model intra prediction is the same as the top-left luma sample. It is a flag indicating whether it is a location or another specified location.
  • information on the variable ChromaArrayType is required.
  • the value of the variable ChromaArrayType may be obtained by combining information on chroma_format_idc and information on separate_colour_plane_flag. Therefore, the syntax elements chroma_format_idc and separate_colour_plane_flag may be defined to be included in the SPS RBSP syntax.
  • the separate_colour_plane_flag is a flag indicating whether three separate elements (Y, Cb, and Cr) are to be coded separately when coding a picture.
  • GCI 21 is a diagram illustrating general constraint information (GCI) syntax according to an embodiment of the present invention.
  • the GCI syntax may include a syntax element no_palette_constraint_flag.
  • a syntax element controlled by no_palette_constraint_flag, sps_palette_enabled_flag related to whether or not a palette mode can be applied to a current coding unit may be included in the SPS RBSP syntax.
  • Palette mode is a method of mapping color information into a table in advance and then mapping actual pixel values to index values in the table. If the value of chroma_format_idc is equal to 3, the chroma format may be 4: 4: 4.
  • syntax elements included in the GCI syntax can individually control functions related to the syntax elements corresponding thereto. As shown in FIG.
  • no_palette_constraint_flag corresponding to sps_palette_enabled_flag may be included in the GCI syntax.
  • sps_palette_enabled_flag may be set to 0.
  • the value of no_palette_constraint_flag is 1, the value of sps_palette_enabled_flag may be set to 0.
  • sps_palette_enabled_flag may have a set value, and a decoding operation may be performed accordingly.
  • 22 is a diagram illustrating a coding tree unit syntax according to an embodiment of the present invention.
  • a palette coding syntax may be included in the coding tree unit syntax. If pred_mode_plt_flag is true, the decoder can parse the palette coding syntax'palette_coding()'. In other words, if the value of pred_mode_plt_flag is 1, it indicates that the current coding block is coded in the palette mode. pred_mode_plt_flag may be signaled/parsed if the current block is not an ibc coded block and sps_plt_enabled_flag is true (if it has a value of 1).
  • the sps_plt_enabled_flag is the same as sps_palette_enabled_flag described in FIG. 19 and the like.
  • the palette mode is a method of mapping color information into a table in advance and then mapping the actual pixel values to the index values of the table, and is different from a general intra-screen prediction method.
  • MCM Most Probable Modes
  • the MPM can be derived based on the luma prediction mode at the L position and the A position around the current coding block of FIG. 23.
  • a block coded in the palette mode may exist in a block adjacent to the current coding block.
  • the intra prediction mode value may be set to a preset prediction mode.
  • the preset prediction mode may be a planar mode.
  • the present invention is not limited thereto, and may be set to one of DC (direact current), vertical, horizontal, and angular modes.
  • IntraPredModeY[xCb][yCb] is set to the planar mode.
  • IntraPredModeY[xCb][yCb] may be set as in Equation 8 below.
  • intra_luma_not_planar_flag[xCb][yCb] If the value of intra_luma_not_planar_flag[xCb][yCb] is 1, the mode of intra_luma_not_planar_flag[xCb][yCb] may be set according to steps described later.
  • Step 1 The positions (xNbA, yNbA) and (xNbB, yNbB) of the neighboring blocks may be set to (xCb-1, yCb + cbHeight-1) and (xCb + cbWidth-1, yCb-1), respectively.
  • xCb is the x coordinate of the current block
  • yCb is the y coordinate of the current block
  • cbHeight is the height of the current block
  • cbWidth is the width of the current block.
  • Step 2 When X is replaced by either A or B, candIntraPredModeX may be set according to a step to be described later.
  • Step 2-1 In the process of deriving availability for a block, the input location (xCurr, yCurr) is set to (xCb, yCb) and the neighboring block location (xNbY, yNbY) is set to (xNbX, yNbX), available Assigned as output.
  • the intra prediction mode candidate candIntraPredModeX may be set as follows.
  • candIntraPredModeX may be set to a flat mode.
  • X is the same as B, and yCb-1 is less than ((yCb >> CtbLog2SizeY) ⁇ CtbLog2SizeY).
  • candIntraPredModeX may be set equal to IntraPredModeY[xNbX][yNbX].
  • FIG. 24 is a diagram illustrating a relationship between a corresponding luma block required for inducing a chroma DM mode according to an embodiment of the present invention.
  • FIG. 24(a) is a diagram showing division of a luma block having a dual tree structure
  • FIG. 24(b) is a diagram showing division of a chroma block having a dual tree structure.
  • FIGS. 24A and 24B divisions of luma and chroma blocks having a DUAL tree structure may be performed differently.
  • samples are composed of a 1 to 1 ratio of luma and chroma. Therefore, the block size is the same.
  • the luma block corresponding to the block corresponding to A may be a block corresponding to A of FIG. 24(a).
  • Block A of FIGS. 24(a) and 24(b) has a width x length of W/2 x H.
  • a method of predicting chroma and a method of predicting luma may be different.
  • chroma mode signaling may be determined based on the luma mode at a preset position of a corresponding luma block.
  • the preset position may be [xCb + cbWidth / 2] [yCb + cbHeight / 2] or (xCb, yCb).
  • (xCb, yCb) may be the position of the upper left corner of the corresponding luma.
  • cbWidth and cbHeight mean the width and height of the corresponding luma. Therefore, if the value of pred_mode_plt_flag is 1 at a preset position corresponding to the position C in the luma block of FIG. 24A, the method of predicting the chroma block may be set to a preset mode.
  • the preset mode may be any one of Planar, DC, VERTICAL, HORIZONTAL, and angular modes.
  • the location of the block for checking the mip flag and the ibc flag may be set to a preset [xCb + cbWidth / 2] [yCb + cbHeight / 2].
  • variable CclmEnabled inputs a luma position (xCb, yCb) and invokes a cross-component chroma intra prediction test process to induce a chroma prediction mode.
  • Step 1 If the value of intra_mip_flag[xCb + cbWidth / 2][yCb + cbHeight / 2] is 1, lumaIntraPredMode is set to a flat mode.
  • Step 2 Otherwise, if the value of pred_mode_plt_flag[xCb + cbWidth / 2][yCb + cbHeight / 2] is 1, lumaIntraPredMode is set to a preset mode (PRE_DEFINED_MODE).
  • Step 3 Otherwise, if CuPredMode [xCb + cbWidth / 2][yCb + cbHeight / 2] is the IBC mode, lumaIntraPredMode is set to the DC mode.
  • Step 4 Otherwise, lumaIntraPredMode is set equal to IntraPredModeY[xCb + cbWidth / 2][yCb + cbHeight / 2].
  • the term parsing has been described focusing on a process of obtaining information from a bit stream, but from the perspective of an encoder, it can be interpreted as configuring corresponding information in a bit stream. Therefore, the term parsing is not limited to the operation of the decoder, but can be interpreted as an operation of constructing a bitstream in the encoder. That is, the encoder may obtain flags (syntax elements) included in the above-described GCI syntax and configure a bitstream including the flags (syntax elements). Further, such a bitstream may be stored and configured in a computer-readable recording medium.
  • embodiments of the present invention described above can be implemented through various means.
  • embodiments of the present invention may be implemented by hardware, firmware, software, or a combination thereof.
  • the method according to embodiments of the present invention includes one or more Application Specific Integrated Circuits (ASICs), Digital Signal Processors (DSPs), Digital Signal Processing Devices (DSPDs), and Programmable Logic Devices (PLDs). , Field Programmable Gate Arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, and the like.
  • ASICs Application Specific Integrated Circuits
  • DSPs Digital Signal Processors
  • DSPDs Digital Signal Processing Devices
  • PLDs Programmable Logic Devices
  • FPGAs Field Programmable Gate Arrays
  • processors controllers
  • microcontrollers microcontrollers
  • microprocessors and the like.
  • the method according to the embodiments of the present invention may be implemented in the form of a module, procedure, or function that performs the functions or operations described above.
  • the software code can be stored in a memory and driven by a processor.
  • the memory may be located inside or outside the processor, and data may be exchanged with the processor by various known means.
  • Computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. Further, the computer-readable medium may include both computer storage media and communication media.
  • Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
  • Communication media typically includes computer readable instructions, data structures, or other data in a modulated data signal, such as program modules, or other transmission mechanisms, and includes any information delivery media.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 신호 복호화 장치는, 프로세서를 포함하며, 상기 프로세서는 비디오 신호의 비트스트림에 포함된 일반 제약 정보(General Constraint Information, GCI) 신택스를 복호화하고, 상기 GCI 신택스의 복호화 결과에 기초하여, 상기 비트스트림을 복호화하되, 상기 GCI 신택스는, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP(Raw Byte Sequence Payload) 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함한다.

Description

비디오 신호 처리 방법 및 장치
본 발명은 비디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 비디오 신호를 인코딩하거나 디코딩하는 비디오 신호 처리 방법 및 장치에 관한 것이다.
압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하기 위한 일련의 신호 처리 기술을 의미한다. 압축 부호화의 대상에는 음성, 영상, 문자 등의 대상이 존재하며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다. 비디오 신호에 대한 압축 부호화는 공간적인 상관관계, 시간적인 상관관계, 확률적인 상관관계 등을 고려하여 잉여 정보를 제거함으로써 이루어진다. 그러나 최근의 다양한 미디어 및 데이터 전송 매체의 발전으로 인해, 더욱 고효율의 비디오 신호 처리 방법 및 장치가 요구되고 있다.
본 발명의 목적은 비디오 신호의 코딩 효율을 높이고자 함에 있다.
본 발명은 일반 제약 정보(General constraint information)를 구성하여 비디오 신호 코딩 효율을 높이기 위한 목적을 가지고 있다.
본 명세서는 2차 변환을 이용하는 비디오 신호 처리 방법을 제공한다.
구체적으로, 비디오 신호 복호화 장치에 있어서, 프로세서를 포함하며, 상기 프로세서는, 비디오 신호의 비트스트림(bitstream)에 포함된 일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 복호화하고, 상기 GCI 신택스의 복호화 결과에 기초하여, 상기 비트스트림을 복호화하되, 상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고, 상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고, 상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 저대역 비-분리 변환(low-frequency non-separable transform)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 저대역 비-분리 변환(low-frequency non-separable transform)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 대칭 모션 벡터 차이(symmetric motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 대칭 모션 벡터 차이(symmetric motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 비디오 신호 부호화 장치에 있어서, 프로세서를 포함하며, 상기 프로세서는, 일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 획득하고, 상기 GCI 신택스를 포함하는 비트스트림을 부호화하되, 상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고, 상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고, 상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 저대역 비-분리 변환(low-frequency non-separable transform)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 저대역 비-분리 변환(low-frequency non-separable transform)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 대칭 모션 벡터 차이(symmetric motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 대칭 모션 벡터 차이(symmetric motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 비디오 신호의 비트스트림(bitstream)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서, 상기 비트스트림은, 일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 획득하는 단계; 상기 GCI 신택스를 포함하는 비트스트림을 부호화하는 단계; 를 포함하는 부호화 방법을 통해 부호화 되고, 상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고, 상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고, 상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
또한 본 명세서에 있어서, 상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고, 상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 한다.
본 발명의 일 실시 예는 일반 제약 정보(General constraint information)를 이용하는 비디오 신호 처리 방법 및 이를 위한 장치를 제공한다.
도 1은 본 발명의 일 실시예에 따른 비디오 신호 인코딩 장치의 개략적인 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 신호 디코딩 장치의 개략적인 블록도이다.
도 3은 픽쳐 내에서 코딩 트리 유닛이 코딩 유닛들로 분할되는 실시예를 도시한다.
도 4는 쿼드 트리 및 멀티-타입 트리의 분할을 시그널링하는 방법의 일 실시예를 도시한다.
도 5 및 도 6은 본 발명의 실시예에 따른 인트라 예측 방법을 더욱 구체적으로 도시한다.
도 7은 본 발명의 일 실시예에 따른 비트 스트림을 구성하는 기본 단위인 네트워크 추상화 계층 유닛을 나타낸 도면이다.
도 8은 인코더 및 디코더가 변환 계수를 역변환하여 레지듀얼 신호를 획득하는 방법을 구체적으로 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 9 내지 도 11은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 12는 본 발명의 일 실시예에 따른, 시퀀스 파라미터 세트 RBSP 신택스를 나타낸 도면이다.
도 13 내지 도 16은 본 발명의 일 실시예에 따른, 일반 제약 정보 신택스를 나타낸 도면이다.
도 17은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 18 내지 도 21은 본 발명의 일 실시예에 따른, 일반 제약 정보 신택스를 나타낸 도면이다.
도 22은 본 발명의 일 실시예에 따른 코딩 트리 유닛 신택스를 나타낸 도면이다.
도 23은 본 발명의 일 실시예에 따른, 화면내 예측 모드에 필요한 MPM(Most Probable Modes) 유도를 위한 위치 관계를 나타낸 도면이다.
도 24는 본 발명의 일 실시예에 따른, 크로마 DM 모드 유도에 필요한 대응되는 루마 블록과의 관계를 나타낸 도면이다.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도, 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한 특정 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가진 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다.
본 명세서에서 일부 용어들은 다음과 같이 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있다. 본 명세서에서 비디오 신호의 인코딩(부호화)을 수행하여 비디오 신호 비트스트림을 생성하는 장치는 인코딩 장치 혹은 인코더로 지칭되며, 비디오 신호 비트스트림의 디코딩(복호화)을 수행하여 비디오 신호를 복원하는 장치는 디코딩 장치 혹은 디코더로 지칭된다. 또한, 본 명세서에서 비디오 신호 처리 장치는 인코더 및 디코더를 모두 포함하는 개념의 용어로 사용된다. 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 포함하는 용어로서, 경우에 따라 의미는 달리 해석될 수 있으므로 본 발명은 이에 한정되지 아니한다. '유닛'은 영상 처리의 기본 단위 또는 픽쳐의 특정 위치를 지칭하는 의미로 사용되며, 휘도(luma) 성분 및 색차(chroma) 성분 중 적어도 하나를 포함하는 이미지 영역을 가리킨다. 또한, '블록'은 휘도 성분 및 색차 성분들(즉, Cb 및 Cr) 중 특정 성분을 포함하는 이미지 영역을 가리킨다. 다만, 실시예에 따라서 '유닛', '블록', '파티션' 및 '영역' 등의 용어는 서로 혼용하여 사용될 수 있다. 또한, 본 명세서에서 유닛은 코딩 유닛, 예측 유닛, 변환 유닛을 모두 포함하는 개념으로 사용될 수 있다. 픽쳐는 필드 혹은 프레임을 가리키며, 실시예에 따라 상기 용어들은 서로 혼용하여 사용될 수 있다.
도 1은 본 발명의 일 실시예에 따른 비디오 신호 인코딩 장치(100)의 개략적인 블록도이다. 도 1을 참조하면, 본 발명의 인코딩 장치(100)는 변환부(110), 양자화부(115), 역양자화부(120), 역변환부(125), 필터링부(130), 예측부(150) 및 엔트로피 코딩부(160)를 포함한다.
변환부(110)는 입력 받은 비디오 신호와 예측부(150)에서 생성된 예측 신호의 차이인 레지듀얼 신호를 변환하여 변환 계수 값을 획득한다. 예를 들어, 이산 코사인 변환(Discrete Cosine Transform, DCT), 이산 사인 변환(Discrete Sine Transform, DST) 또는 웨이블릿 변환(Wavelet Transform) 등이 사용될 수 있다. 이산 코사인 변환 및 이산 사인 변환은 입력된 픽쳐 신호를 블록 형태로 나누어 변환을 수행하게 된다. 변환에 있어서 변환 영역 내의 값들의 분포와 특성에 따라서 코딩 효율이 달라질 수 있다. 양자화부(115)는 변환부(110)에서 출력된 변환 계수 값을 양자화한다.
코딩 효율을 높이기 위하여 픽쳐 신호를 그대로 코딩하는 것이 아니라, 예측부(150)를 통해 이미 코딩된 영역을 이용하여 픽쳐를 예측하고, 예측된 픽쳐에 원본 픽쳐와 예측 픽쳐 간의 레지듀얼 값을 더하여 복원 픽쳐를 획득하는 방법이 사용된다. 인코더와 디코더에서 미스매치가 발생되지 않도록 하기 위해, 인코더에서 예측을 수행할 때에는 디코더에서도 사용 가능한 정보를 사용해야 한다. 이를 위해, 인코더에서는 부호화한 현재 블록을 다시 복원하는 과정을 수행한다. 역양자화부(120)에서는 변환 계수 값을 역양자화하고, 역변환부(125)에서는 역양자화된 변환 계수값을 이용하여 레지듀얼 값을 복원한다. 한편, 필터링부(130)는 복원된 픽쳐의 품질 개선 및 부호화 효율 향상을 위한 필터링 연산을 수행한다. 예를 들어, 디블록킹 필터, 샘플 적응적 오프셋(Sample Adaptive Offset, SAO) 및 적응적 루프 필터 등이 포함될 수 있다. 필터링을 거친 픽쳐는 출력되거나 참조 픽쳐로 이용하기 위하여 복호 픽쳐 버퍼(Decoded Picture Buffer, DPB, 156)에 저장된다.
코딩 효율을 높이기 위하여 픽쳐 신호를 그대로 코딩하는 것이 아니라, 예측부(150)를 통해 이미 코딩된 영역을 이용하여 픽쳐를 예측하고, 예측된 픽쳐에 원 픽쳐와 예측 픽쳐 간의 레지듀얼 값을 더하여 복원 픽쳐를 획득하는 방법이 사용된다. 인트라 예측부(152)에서는 현재 픽쳐 내에서 인트라 예측을 수행하며, 인터 예측부(154)에서는 복호 픽쳐 버퍼(156)에 저장된 참조 픽쳐를 이용하여 현재 픽쳐를 예측한다. 인트라 예측부(152)는 현재 픽쳐 내의 복원된 영역들로부터 인트라 예측을 수행하여, 인트라 부호화 정보를 엔트로피 코딩부(160)에 전달한다. 인터 예측부(154)는 다시 모션 추정부(154a) 및 모션 보상부(154b)를 포함하여 구성될 수 있다. 모션 추정부(154a)에서는 복원된 특정 영역을 참조하여 현재 영역의 모션 벡터값을 획득한다. 모션 추정부(154a)에서는 참조 영역의 위치 정보(참조 프레임, 모션 벡터 등) 등을 엔트로피 코딩부(160)로 전달하여 비트스트림에 포함될 수 있도록 한다. 모션 추정부(154a)에서 전달된 모션 벡터값을 이용하여 모션 보상부(154b)에서는 인터 모션 보상을 수행한다.
예측부(150)는 인트라 예측부(152)와 인터 예측부(154)를 포함한다. 인트라 예측부(152)는 현재 픽쳐 내에서 인트라(intra) 예측을 수행하며, 인터 예측부(154)는 복호 픽쳐 버퍼(156)에 저장된 참조 픽쳐를 이용하여 현재 픽쳐를 예측하는 인터(inter) 예측을 수행한다. 인트라 예측부(152)는 현재 픽쳐 내의 복원된 샘플들로부터 인트라 예측을 수행하여, 인트라 부호화 정보를 엔트로피 코딩부(160)에 전달한다. 인트라 부호화 정보는 인트라 예측 모드, MPM(Most Probable Mode) 플래그, MPM 인덱스 중 적어도 하나를 포함할 수 있다. 인트라 부호화 정보는 참조 샘플에 관한 정보를 포함할 수 있다. 인터 예측부(154)는 모션 추정부(154a) 및 모션 보상부(154b)를 포함하여 구성될 수 있다. 모션 추정부(154a)는 복원된 참조 픽쳐의 특정 영역을 참조하여 현재 영역의 모션 벡터값을 획득한다. 모션 추정부(154a)는 참조 영역에 대한 모션 정보 세트(참조 픽쳐 인덱스, 모션 벡터 정보 등)를 엔트로피 코딩부(160)로 전달한다. 모션 보상부(154b)는 모션 추정부(154a)에서 전달된 모션 벡터값을 이용하여 모션 보상을 수행한다. 인터 예측부(154)는 참조 영역에 대한 모션 정보를 포함하는 인터 부호화 정보를 엔트로피 코딩부(160)에 전달한다.
추가적인 실시예에 따라, 예측부(150)는 인트라 블록 카피(block copy, BC) 예측부(미도시)를 포함할 수 있다. 인트라 BC 예측부는 현재 픽쳐 내의 복원된 샘플들로부터 인트라 BC 예측을 수행하여, 인트라 BC 부호화 정보를 엔트로피 코딩부(160)에 전달한다. 인트라 BC 예측부는 현재 픽쳐 내의 특정 영역을 참조하여 현재 영역의 예측에 이용되는 참조 영역을 나타내는 블록 벡터값을 획득한다. 인트라 BC 예측부는 획득된 블록 벡터값을 이용하여 인트라 BC 예측을 수행할 수 있다. 인트라 BC 예측부는 인트라 BC 부호화 정보를 엔트로피 코딩부(160)로 전달한다. 인트라 BC 부호화 정보는 블록 벡터 정보를 포함할 수 있다.
위와 같은 픽쳐 예측이 수행될 경우, 변환부(110)는 원본 픽쳐와 예측 픽쳐 간의 레지듀얼 값을 변환하여 변환 계수 값을 획득한다. 이때, 변환은 픽쳐 내에서 특정 블록 단위로 수행될 수 있으며, 특정 블록의 크기는 기 설정된 범위 내에서 가변할 수 있다. 양자화부(115)는 변환부(110)에서 생성된 변환 계수 값을 양자화하여 엔트로피 코딩부(160)로 전달한다.
엔트로피 코딩부(160)는 양자화된 변환 계수를 나타내는 정보, 인트라 부호화 정보, 및 인터 부호화 정보 등을 엔트로피 코딩하여 비디오 신호 비트스트림을 생성한다. 엔트로피 코딩부(160)에서는 가변 길이 코딩(Variable Length Coding, VLC) 방식과 산술 코딩(arithmetic coding) 방식 등이 사용될 수 있다. 가변 길이 코딩(VLC) 방식은 입력되는 심볼들을 연속적인 코드워드로 변환하는데, 코드워드의 길이는 가변적일 수 있다. 예를 들어, 자주 발생하는 심볼들을 짧은 코드워드로, 자주 발생하지 않은 심볼들은 긴 코드워드로 표현하는 것이다. 가변 길이 코딩 방식으로서 컨텍스트 기반 적응형 가변 길이 코딩(Context-based Adaptive Variable Length Coding, CAVLC) 방식이 사용될 수 있다. 산술 코딩은 연속적인 데이터 심볼들을 하나의 소수로 변환하는데, 산술 코딩은 각 심볼을 표현하기 위하여 필요한 최적의 소수 비트를 얻을 수 있다. 산술 코딩으로서 컨텍스트 기반 적응형 산술 부호화(Context-based Adaptive Binary Arithmetic Code, CABAC)가 이용될 수 있다. 예를 들어, 엔트로피 코딩부(160)는 양자화된 변환 계수를 나타내는 정보를 이진화할 수 있다. 또한, 엔트로피 코딩부(160)는 이진화된 정보를 산술 코딩하여 비트스트림을 생성할 수 있다.
상기 생성된 비트스트림은 NAL(Network Abstraction Layer) 유닛을 기본 단위로 캡슐화 된다. NAL 유닛은 부호화된 정수 개의 코딩 트리 유닛(coding tree unit)을 포함한다. 비디오 디코더에서 비트스트림을 복호화하기 위해서는 먼저 비트스트림을 NAL 유닛 단위로 분리한 후, 분리된 각각의 NAL 유닛을 복호화해야 한다. 한편, 비디오 신호 비트스트림의 복호화를 위해 필요한 정보들은 픽쳐 파라미터 세트(Picture Parameter Set, PPS), 시퀀스 파라미터 세트(Sequence Parameter Set, SPS), 비디오 파라미터 세트(Video Parameter Set, VPS), 디코딩 캐파빌리티 정보(Decoding Capability Information, DCI) 등과 같은 상위 레벨 세트의 RBSP(Raw Byte Sequence Payload)를 통해 전송될 수 있다.
한편, 도 1의 블록도는 본 발명의 일 실시예에 따른 인코딩 장치(100)를 나타낸 것으로서, 분리하여 표시된 블록들은 인코딩 장치(100)의 엘리먼트들을 논리적으로 구별하여 도시한 것이다. 따라서 전술한 인코딩 장치(100)의 엘리먼트들은 디바이스의 설계에 따라 하나의 칩으로 또는 복수의 칩으로 장착될 수 있다. 일 실시예에 따르면, 전술한 인코딩 장치(100)의 각 엘리먼트의 동작은 프로세서(미도시)에 의해 수행될 수 있다.
도 2는 본 발명의 일 실시예에 따른 비디오 신호 디코딩 장치(200)의 개략적인 블록도이다. 도 2를 참조하면 본 발명의 디코딩 장치(200)는 엔트로피 디코딩부(210), 역양자화부(220), 역변환부(225), 필터링부(230) 및 예측부(250)를 포함한다.
엔트로피 디코딩부(210)는 비디오 신호 비트스트림을 엔트로피 디코딩하여, 각 영역에 대한 변환 계수 정보, 인트라 부호화 정보, 인터 부호화 정보 등을 추출한다. 예를 들어, 엔트로피 디코딩부(210)는 비디오 신호 비트스트림으로부터 특정 영역의 변환 계수 정보에 대한 이진화 코드를 획득할 수 있다. 또한, 엔트로피 디코딩부(210)는 이진화 코드를 역 이진화하여 양자화된 변환 계수를 획득한다. 역양자화부(220)는 양자화된 변환 계수를 역양자화하고, 역변환부(225)는 역양자화된 변환 계수를 이용하여 레지듀얼 값을 복원한다. 비디오 신호 처리 장치(200)는 역변환부(225)에서 획득된 레지듀얼 값을 예측부(250)에서 획득된 예측값과 합산하여 원래의 화소값을 복원한다.
한편, 필터링부(230)는 픽쳐에 대한 필터링을 수행하여 화질을 향상시킨다. 여기에는 블록 왜곡 현상을 감소시키기 위한 디블록킹 필터 및/또는 픽쳐 전체의 왜곡 제거를 위한 적응적 루프 필터 등이 포함될 수 있다. 필터링을 거친 픽쳐는 출력되거나 다음 픽쳐에 대한 참조 픽쳐로 이용하기 위하여 복호 픽쳐 버퍼(DPB, 256)에 저장된다.
예측부(250)는 인트라 예측부(252) 및 인터 예측부(254)를 포함한다. 예측부(250)는 전술한 엔트로피 디코딩부(210)를 통해 복호화된 부호화 타입, 각 영역에 대한 변환 계수, 인트라/인터 부호화 정보 등을 활용하여 예측 픽쳐를 생성한다. 복호화가 수행되는 현재 블록을 복원하기 위해서, 현재 블록이 포함된 현재 픽쳐 또는 다른 픽쳐들의 복호화된 영역이 이용될 수 있다. 복원에 현재 픽쳐만을 이용하는, 즉 인트라 예측 또는 인트라 BC 예측을 수행하는 픽쳐(또는, 타일/슬라이스)를 인트라 픽쳐 또는 I 픽쳐(또는, 타일/슬라이스), 인트라 예측, 인터 예측 및 인트라 BC 예측을 모두 수행할 수 있는 픽쳐(또는, 타일/슬라이스)를 인터 픽쳐(또는, 타일/슬라이스)라고 한다. 인터 픽쳐(또는, 타일/슬라이스) 중 각 블록의 샘플값들을 예측하기 위하여 최대 하나의 모션 벡터 및 참조 픽쳐 인덱스를 이용하는 픽쳐(또는, 타일/슬라이스)를 예측 픽쳐(predictive picture) 또는 P 픽쳐(또는, 타일/슬라이스)라고 하며, 최대 두 개의 모션 벡터 및 참조 픽쳐 인덱스를 이용하는 픽쳐(또는, 타일/슬라이스)를 쌍예측 픽쳐(Bi-predictive picture) 또는 B 픽쳐(또는, 타일/슬라이스) 라고 한다. 다시 말해서, P 픽쳐(또는, 타일/슬라이스)는 각 블록을 예측하기 위해 최대 하나의 모션 정보 세트를 이용하고, B 픽쳐(또는, 타일/슬라이스)는 각 블록을 예측하기 위해 최대 두 개의 모션 정보 세트를 이용한다. 여기서, 모션 정보 세트는 하나 이상의 모션 벡터와 하나의 참조 픽쳐 인덱스를 포함한다.
인트라 예측부(252)는 인트라 부호화 정보 및 현재 픽쳐 내의 복원된 샘플들을 이용하여 예측 블록을 생성한다. 전술한 바와 같이, 인트라 부호화 정보는 인트라 예측 모드, MPM(Most Probable Mode) 플래그, MPM 인덱스 중 적어도 하나를 포함할 수 있다. 인트라 예측부(252)는 현재 블록의 좌측 및/또는 상측에 위치한 복원된 샘플들을 참조 샘플들로 이용하여 현재 블록의 샘플 값들을 예측한다. 본 개시에서, 복원된 샘플들, 참조 샘플들 및 현재 블록의 샘플들은 픽셀들을 나타낼 수 있다. 또한, 샘플 값(sample value)들은 픽셀 값들을 나타낼 수 있다.
일 실시예에 따르면, 참조 샘플들은 현재 블록의 주변 블록에 포함된 샘플들일 수 있다. 예를 들어, 참조 샘플들은 현재 블록의 좌측 경계에 인접한 샘플들 및/또는 상측 경계에 인접한 샘플들일 수 있다. 또한, 참조 샘플들은 현재 블록의 주변 블록의 샘플들 중 현재 블록의 좌측 경계로부터 기 설정된 거리 이내의 라인 상에 위치하는 샘플들 및/또는 현재 블록의 상측 경계로부터 기 설정된 거리 이내의 라인 상에 위치하는 샘플들일 수 있다. 이때, 현재 블록의 주변 블록은 현재 블록에 인접한 좌측(L) 블록, 상측(A) 블록, 하좌측(Below Left, BL) 블록, 상우측(Above Right, AR) 블록 또는 상좌측(Above Left, AL) 블록 중 적어도 하나를 포함할 수 있다.
인터 예측부(254)는 복호 픽쳐 버퍼(256)에 저장된 참조 픽쳐 및 인터 부호화 정보를 이용하여 예측 블록을 생성한다. 인터 부호화 정보는 참조 블록에 대한 현재 블록의 모션 정보 세트(참조 픽쳐 인덱스, 모션 벡터 정보 등)를 포함할 수 있다. 인터 예측에는 L0 예측, L1 예측 및 쌍예측(Bi-prediction)이 있을 수 있다. L0 예측은 L0 픽쳐 리스트에 포함된 1개의 참조 픽쳐를 이용한 예측이고, L1 예측은 L1 픽쳐 리스트에 포함된 1개의 참조 픽쳐를 이용한 예측을 의미한다. 이를 위해서는 1세트의 모션 정보(예를 들어, 모션 벡터 및 참조 픽쳐 인덱스)가 필요할 수 있다. 쌍예측 방식에서는 최대 2개의 참조 영역을 이용할 수 있는데, 이 2개의 참조 영역은 동일한 참조 픽쳐에 존재할 수도 있고, 서로 다른 픽쳐에 각각 존재할 수도 있다. 즉, 쌍예측 방식에서는 최대 2세트의 모션 정보(예를 들어, 모션 벡터 및 참조 픽쳐 인덱스)가 이용될 수 있는데, 2개의 모션 벡터가 동일한 참조 픽쳐 인덱스에 대응될 수도 있고 서로 다른 참조 픽쳐 인덱스에 대응될 수도 있다. 이때, 참조 픽쳐들은 시간적으로 현재 픽쳐 이전이나 이후 모두에 표시(또는 출력)될 수 있다. 일 실시예에 따라, 쌍예측 방식에서는 사용되는 2개의 참조 영역은 L0 픽쳐 리스트 및 L1 픽쳐 리스트 각각에서 선택된 영역일 수 있다.
인터 예측부(254)는 모션 벡터 및 참조 픽쳐 인덱스를 이용하여 현재 블록의 참조 블록을 획득할 수 있다. 상기 참조 블록은 참조 픽쳐 인덱스에 대응하는 참조 픽쳐 내에 존재한다. 또한, 모션 벡터에 의해서 특정된 블록의 샘플 값 또는 이의 보간(interpolation)된 값이 현재 블록의 예측자(predictor)로 이용될 수 있다. 서브펠(sub-pel) 단위의 픽셀 정확도를 갖는 모션 예측을 위하여 이를 테면, 휘도 신호에 대하여 8-탭 보간 필터가, 색차 신호에 대하여 4-탭 보간 필터가 사용될 수 있다. 다만, 서브펠 단위의 모션 예측을 위한 보간 필터는 이에 한정되지 않는다. 이와 같이 인터 예측부(254)는 이전에 복원된 픽쳐로부터 현재 유닛의 텍스쳐를 예측하는 모션 보상(motion compensation)을 수행한다. 이때, 인터 예측부는 모션 정보 세트를 이용할 수 있다.
추가적인 실시예에 따라, 예측부(250)는 인트라 BC 예측부(미도시)를 포함할 수 있다. 인트라 BC 예측부는 현재 픽쳐 내의 복원된 샘플들을 포함하는 특정 영역을 참조하여 현재 영역을 복원할 수 있다. 인트라 BC 예측부는 엔트로피 디코딩부(210)로부터 현재 영역에 대한 인트라 BC 부호화 정보를 획득한다. 인트라 BC 예측부는 현재 픽쳐 내의 특정 영역을 지시하는 현재 영역의 블록 벡터값을 획득한다. 인트라 BC 예측부는 획득된 블록 벡터값을 이용하여 인트라 BC 예측을 수행할 수 있다. 인트라 BC 부호화 정보는 블록 벡터 정보를 포함할 수 있다.
상기 인트라 예측부(252) 또는 인터 예측부(254)로부터 출력된 예측값, 및 역변환부(225)로부터 출력된 레지듀얼 값이 더해져서 복원된 비디오 픽쳐가 생성된다. 즉, 비디오 신호 디코딩 장치(200)는 예측부(250)에서 생성된 예측 블록과 역변환부(225)로부터 획득된 레지듀얼을 이용하여 현재 블록을 복원한다.
한편, 도 2의 블록도는 본 발명의 일 실시예에 따른 디코딩 장치(200)를 나타낸 것으로서, 분리하여 표시된 블록들은 디코딩 장치(200)의 엘리먼트들을 논리적으로 구별하여 도시한 것이다. 따라서 전술한 디코딩 장치(200)의 엘리먼트들은 디바이스의 설계에 따라 하나의 칩으로 또는 복수의 칩으로 장착될 수 있다. 일 실시예에 따르면, 전술한 디코딩 장치(200)의 각 엘리먼트의 동작은 프로세서(미도시)에 의해 수행될 수 있다.
도 3은 픽쳐 내에서 코딩 트리 유닛(Coding Tree Unit, CTU)이 코딩 유닛들(Coding Units, CUs)로 분할되는 실시예를 도시한다. 비디오 신호의 코딩 과정에서, 픽쳐는 코딩 트리 유닛(CTU)들의 시퀀스로 분할될 수 있다. 코딩 트리 유닛은 휘도(luma) 샘플들의 NXN 블록과, 이에 대응하는 색차(chroma) 샘플들의 2개의 블록들로 구성된다. 코딩 트리 유닛은 복수의 코딩 유닛들로 분할될 수 있다. 코딩 트리 유닛은 분할되지 않고 리프 노드가 될 수도 있다. 이 경우, 코딩 트리 유닛 자체가 코딩 유닛이 될 수 있다. 코딩 유닛은 상기에서 설명한 비디오 신호의 처리 과정, 즉 인트라/인터 예측, 변환, 양자화 및/또는 엔트로피 코딩 등의 과정에서 픽쳐를 처리하기 위한 기본 단위를 가리킨다. 하나의 픽쳐 내에서 코딩 유닛의 크기 및 모양은 일정하지 않을 수 있다. 코딩 유닛은 정사각형 혹은 직사각형의 모양을 가질 수 있다. 직사각형 코딩 유닛(혹은, 직사각형 블록)은 수직 코딩 유닛(혹은, 수직 블록)과 수평 코딩 유닛(혹은, 수평 블록)을 포함한다. 본 명세서에서, 수직 블록은 높이가 너비보다 큰 블록이며, 수평 블록은 너비가 높이보다 큰 블록이다. 또한, 본 명세서에서 정사각형이 아닌(non-square) 블록은 직사각형 블록을 가리킬 수 있지만, 본 발명은 이에 한정되지 않는다.
도 3을 참조하면, 코딩 트리 유닛은 먼저 쿼드 트리(Quad Tree, QT) 구조로 분할된다. 즉, 쿼드 트리 구조에서 2NX2N 크기를 가지는 하나의 노드는 NXN 크기를 가지는 네 개의 노드들로 분할될 수 있다. 본 명세서에서 쿼드 트리는 4진(quaternary) 트리로도 지칭될 수 있다. 쿼드 트리 분할은 재귀적으로 수행될 수 있으며, 모든 노드들이 동일한 깊이로 분할될 필요는 없다.
한편, 전술한 쿼드 트리의 리프 노드(leaf node)는 멀티-타입 트리(Multi-Type Tree, MTT) 구조로 더욱 분할될 수 있다. 본 발명의 실시예에 따르면, 멀티 타입 트리 구조에서는 하나의 노드가 수평 혹은 수직 분할의 2진(binary, 바이너리) 혹은 3진(ternary, 터너리) 트리 구조로 분할될 수 있다. 즉, 멀티-타입 트리 구조에는 수직 바이너리 분할, 수평 바이너리 분할, 수직 터너리 분할 및 수평 터너리 분할의 4가지 분할 구조가 존재한다. 본 발명의 실시예에 따르면, 상기 각 트리 구조에서 노드의 너비 및 높이는 모두 2의 거듭제곱 값을 가질 수 있다. 예를 들어, 바이너리 트리(Binary Tree, BT) 구조에서, 2NX2N 크기의 노드는 수직 바이너리 분할에 의해 2개의 NX2N 노드들로 분할되고, 수평 바이너리 분할에 의해 2개의 2NXN 노드들로 분할될 수 있다. 또한, 터너리 트리(Ternary Tree, TT) 구조에서, 2NX2N 크기의 노드는 수직 터너리 분할에 의해 (N/2)X2N, NX2N 및 (N/2)X2N의 노드들로 분할되고, 수평 터너리 분할에 의해 2NX(N/2), 2NXN 및 2NX(N/2)의 노드들로 분할될 수 있다. 이러한 멀티-타입 트리 분할은 재귀적으로 수행될 수 있다.
멀티-타입 트리의 리프 노드는 코딩 유닛이 될 수 있다. 코딩 유닛이 최대 변환 길이에 비해 크지 않은 경우, 해당 코딩 유닛은 더 이상의 분할 없이 예측 및/또는 변환의 단위로 사용될 수 있다. 일 실시예로서, 현재 코딩 유닛의 너비 또는 높이가 최대 변환 길이보다 큰 경우, 현재 코딩 유닛은 분할에 관한 명시적 시그널링 없이 복수의 변환 유닛으로 분할될 수 있다. 한편, 전술한 쿼드 트리 및 멀티-타입 트리에서 다음의 파라메터들 중 적어도 하나가 사전에 정의되거나 PPS, SPS, VPS 등과 같은 상위 레벨 세트의 RBSP를 통해 전송될 수 있다. 1) CTU 크기: 쿼드 트리의 루트 노드(root node) 크기, 2) 최소 QT 크기(MinQtSize): 허용된 최소 QT 리프 노드 크기, 3) 최대 BT 크기(MaxBtSize): 허용된 최대 BT 루트 노드 크기, 4) 최대 TT 크기(MaxTtSize): 허용된 최대 TT 루트 노드 크기, 5) 최대 MTT 깊이(MaxMttDepth): QT의 리프 노드로부터의 MTT 분할의 최대 허용 깊이, 6) 최소 BT 크기(MinBtSize): 허용된 최소 BT 리프 노드 크기, 7) 최소 TT 크기(MinTtSize): 허용된 최소 TT 리프 노드 크기.
도 4는 쿼드 트리 및 멀티-타입 트리의 분할을 시그널링하는 방법의 일 실시예를 도시한다. 전술한 쿼드 트리 및 멀티-타입 트리의 분할을 시그널링하기 위해 기 설정된 플래그들이 사용될 수 있다. 도 4를 참조하면, 노드의 분할 여부를 지시하는 플래그 'split_cu_flag', 쿼드 트리 노드의 분할 여부를 지시하는 플래그 'split_qt_flag', 멀티-타입 트리 노드의 분할 방향을 지시하는 플래그 'mtt_split_cu_vertical_flag' 또는 멀티-타입 트리 노드의 분할 모양을 지시하는 플래그 'mtt_split_cu_binary_flag' 중 적어도 하나가 사용될 수 있다.
본 발명의 실시예에 따르면, 현재 노드의 분할 여부를 지시하는 플래그인 'split_cu_flag'가 먼저 시그널링될 수 있다. 'split_cu_flag'의 값이 0인 경우, 현재 노드가 분할되지 않는 것을 나타내며, 현재 노드는 코딩 유닛이 된다. 현재 노드가 코팅 트리 유닛인 경우, 코딩 트리 유닛은 분할되지 않은 하나의 코딩 유닛을 포함한다. 현재 노드가 쿼드 트리 노드 'QT node'인 경우, 현재 노드는 쿼드 트리의 리프 노드 'QT leaf node'이며 코딩 유닛이 된다. 현재 노드가 멀티-타입 트리 노드 'MTT node'인 경우, 현재 노드는 멀티-타입 트리의 리프 노드 'MTT leaf node'이며 코딩 유닛이 된다.
'split_cu_flag'의 값이 1인 경우, 현재 노드는 'split_qt_flag'의 값에 따라 쿼드 트리 또는 멀티-타입 트리의 노드들로 분할될 수 있다. 코딩 트리 유닛은 쿼드 트리의 루트 노드이며, 쿼드 트리 구조로 우선 분할될 수 있다. 쿼드 트리 구조에서는 각각의 노드 'QT node' 별로 'split_qt_flag'가 시그널링된다. 'split_qt_flag'의 값이 1인 경우 해당 노드는 4개의 정사각형 노드들로 분할되며, 'qt_split_flag'의 값이 0인 경우 해당 노드는 쿼드 트리의 리프 노드 'QT leaf node'가 되며, 해당 노드는 멀티-타입 노드들로 분할된다. 본 발명의 실시예에 따르면, 현재 노드의 종류에 따라서 쿼드 트리 분할은 제한될 수 있다. 현재 노드가 코딩 트리 유닛(쿼트 트리의 루트 노드) 또는 쿼트 트리 노드인 경우에 쿼드 트리 분할이 허용될 수 있으며, 현재 노드가 멀티-타입 트리 노드인 경우 쿼트 트리 분할은 허용되지 않을 수 있다. 각각의 쿼드 트리 리프 노드 'QT leaf node'는 멀티-타입 트리 구조로 더 분할될 수 있다. 상술한 바와 같이, 'split_qt_flag'가 0인 경우 현재 노드는 멀티-타입 노드들로 분할될 수 있다. 분할 방향 및 분할 모양을 지시하기 위하여, 'mtt_split_cu_vertical_flag' 및 'mtt_split_cu_binary_flag'가 시그널링될 수 있다.'mtt_split_cu_vertical_flag'의 값이 1인 경우 노드 'MTT node'의 수직 분할이 지시되며, 'mtt_split_cu_vertical_flag'의 값이 0인 경우 노드 'MTT node'의 수평 분할이 지시된다. 또한, 'mtt_split_cu_binary_flag'의 값이 1인 경우 노드 'MTT node'는 2개의 직사각형 노드들로 분할되며, 'mtt_split_cu_binary_flag'의 값이 0인 경우 노드 'MTT node'는 3개의 직사각형 노드들로 분할된다.
코딩을 위한 픽쳐 예측(모션 보상)은 더 이상 나누어지지 않는 코딩 유닛(즉 코딩 유닛 트리의 리프 노드)을 대상으로 이루어진다. 이러한 예측을 수행하는 기본 단위를 이하에서는 예측 유닛(prediction unit) 또는 예측 블록(prediction block)이라고 한다.
이하, 본 명세서에서 사용되는 유닛이라는 용어는 예측을 수행하는 기본 단위인 상기 예측 유닛을 대체하는 용어로 사용될 수 있다. 다만, 본 발명이 이에 한정되는 것은 아니며, 더욱 광의적으로는 상기 코딩 유닛을 포함하는 개념으로 이해될 수 있다.
도 5 및 도 6은 본 발명의 실시예에 따른 인트라 예측 방법을 더욱 구체적으로 도시한다. 전술한 바와 같이, 인트라 예측부는 현재 블록의 좌측 및/또는 상측에 위치한 복원된 샘플들을 참조 샘플들로 이용하여 현재 블록의 샘플 값들을 예측한다.
먼저, 도 5는 인트라 예측 모드에서 현재 블록의 예측을 위해 사용되는 참조 샘플들의 일 실시예를 도시한다. 일 실시예에 따르면, 참조 샘플들은 현재 블록의 좌측 경계에 인접한 샘플들 및/또는 상측 경계에 인접한 샘플들일 수 있다. 도 5에 도시된 바와 같이, 현재 블록의 크기가 WXH이고 현재 블록에 인접한 단일 참조 라인(line)의 샘플들이 인트라 예측에 사용될 경우, 현재 블록의 좌측 및/또는 상측에 위치한 최대 2W+2H+1개의 주변 샘플들을 사용하여 참조 샘플들이 설정될 수 있다.
또한, 참조 샘플로 사용될 적어도 일부의 샘플이 아직 복원되지 않은 경우, 인트라 예측부는 참조 샘플 패딩 과정을 수행하여 참조 샘플을 획득할 수 있다. 또한, 인트라 예측부는 인트라 예측의 오차를 줄이기 위해 참조 샘플 필터링 과정을 수행할 수 있다. 즉, 주변 샘플들 및/또는 참조 샘플 패딩 과정에 의해 획득된 참조 샘플들에 필터링을 수행하여 필터링된 참조 샘플들을 획득할 수 있다. 인트라 예측부는 이와 같이 획득된 참조 샘플들을 이용하여 현재 블록의 샘플들을 예측한다. 인트라 예측부는 필터링되지 않은 참조 샘플들 또는 필터링된 참조 샘플들을 이용하여 현재 블록의 샘플들을 예측한다. 본 개시에서, 주변 샘플들은 적어도 하나의 참조 라인 상의 샘플들을 포함할 수 있다. 예를 들어, 주변 샘플들은 현재 블록의 경계에 인접한 라인 상의 인접 샘플들을 포함할 수 있다.
다음으로, 도 6은 인트라 예측에 사용되는 예측 모드들의 일 실시예를 도시한다. 인트라 예측을 위해, 인트라 예측 방향을 지시하는 인트라 예측 모드 정보가 시그널링될 수 있다. 인트라 예측 모드 정보는 인트라 예측 모드 세트를 구성하는 복수의 인트라 예측 모드들 중 어느 하나를 지시한다. 현재 블록이 인트라 예측 블록일 경우, 디코더는 비트스트림으로부터 현재 블록의 인트라 예측 모드 정보를 수신한다. 디코더의 인트라 예측부는 추출된 인트라 예측 모드 정보에 기초하여 현재 블록에 대한 인트라 예측을 수행한다.
본 발명의 실시예에 따르면, 인트라 예측 모드 세트는 인트라 예측에 사용되는 모든 인트라 예측 모드들(예, 총 67개의 인트라 예측 모드들)을 포함할 수 있다. 더욱 구체적으로, 인트라 예측 모드 세트는 평면 모드, DC 모드 및 복수의(예, 65개의) 각도 모드들(즉, 방향 모드들)을 포함할 수 있다. 각각의 인트라 예측 모드는 기 설정된 인덱스(즉, 인트라 예측 모드 인덱스)를 통해 지시될 수 있다. 예를 들어, 도 6에 도시된 바와 같이 인트라 예측 모드 인덱스 0은 평면(planar) 모드를 지시하고, 인트라 예측 모드 인덱스 1은 DC 모드를 지시한다. 또한, 인트라 예측 모드 인덱스 2 내지 66은 서로 다른 각도 모드들을 각각 지시할 수 있다. 각도 모드들은 기 설정된 각도 범위 이내의 서로 다른 각도들을 각각 지시한다. 예를 들어, 각도 모드는 시계 방향으로 45도에서 -135도 사이의 각도 범위(즉, 제1 각도 범위) 이내의 각도를 지시할 수 있다. 상기 각도 모드는 12시 방향을 기준으로 정의될 수 있다. 이때, 인트라 예측 모드 인덱스 2는 수평 대각(Horizontal Diagonal, HDIA) 모드를 지시하고, 인트라 예측 모드 인덱스 18은 수평(Horizontal, HOR) 모드를 지시하고, 인트라 예측 모드 인덱스 34는 대각(Diagonal, DIA) 모드를 지시하고, 인트라 예측 모드 인덱스 50은 수직(Vertical, VER) 모드를 지시하며, 인트라 예측 모드 인덱스 66은 수직 대각(Vertical Diagonal, VDIA) 모드를 지시한다.
한편, 기 설정된 각도 범위는 현재 블록의 모양에 따라 서로 다르게 설정될 수 있다. 예를 들어, 현재 블록이 직사각형 블록일 경우 시계 방향으로 45도를 초과하거나 -135도 미만 각도를 지시하는 광각 모드가 추가적으로 사용될 수 있다. 현재 블록이 수평 블록일 경우, 각도 모드는 시계 방향으로 (45+offset1)도에서 (-135+offset1)도 사이의 각도 범위(즉, 제2 각도 범위) 이내의 각도를 지시할 수 있다. 이때, 제1 각도 범위를 벗어나는 각도 모드 67 내지 76이 추가적으로 사용될 수 있다. 또한, 현재 블록이 수직 블록일 경우, 각도 모드는 시계 방향으로 (45-offset2)도에서 (-135-offset2)도 사이의 각도 범위(즉, 제3 각도 범위) 이내의 각도를 지시할 수 있다. 이때, 제1 각도 범위를 벗어나는 각도 모드 -10 내지 -1이 추가적으로 사용될 수 있다. 본 발명의 실시예에 따르면, offset1 및 offset2의 값은 직사각형 블록의 너비와 높이 간의 비율에 따라 서로 다르게 결정될 수 있다. 또한, offset1 및 offset2는 양수일 수 있다.
본 발명의 추가적인 실시예에 따르면, 인트라 예측 모드 세트를 구성하는 복수의 각도 모드들은 기본 각도 모드와 확장 각도 모드를 포함할 수 있다. 이때, 확장 각도 모드는 기본 각도 모드에 기초하여 결정될 수 있다.
일 실시예에 따르면, 기본 각도 모드는 기존 HEVC(High Efficiency Video Coding) 표준의 인트라 예측에서 사용되는 각도에 대응하는 모드이고, 확장 각도 모드는 차세대 비디오 코덱 표준의 인트라 예측에서 새롭게 추가되는 각도에 대응하는 모드일 수 있다. 더욱 구체적으로, 기본 각도 모드는 인트라 예측 모드 {2, 4, 6, …, 66} 중 어느 하나에 대응하는 각도 모드이고, 확장 각도 모드는 인트라 예측 모드 {3, 5, 7, …, 65} 중 어느 하나에 대응하는 각도 모드일 수 있다. 즉, 확장 각도 모드는 제1 각도 범위 내에서 기본 각도 모드들 사이의 각도 모드일 수 있다. 따라서, 확장 각도 모드가 지시하는 각도는 기본 각도 모드가 지시하는 각도에 기초하여 결정될 수 있다.
다른 실시예에 따르면, 기본 각도 모드는 기 설정된 제1 각도 범위 이내의 각도에 대응하는 모드이고, 확장 각도 모드는 상기 제1 각도 범위를 벗어나는 광각 모드일 수 있다. 즉, 기본 각도 모드는 인트라 예측 모드 {2, 3, 4, …, 66} 중 어느 하나에 대응하는 각도 모드이고, 확장 각도 모드는 인트라 예측 모드 {-10, -9, …, -1} 및 {67, 68, …, 76} 중 어느 하나에 대응하는 각도 모드일 수 있다. 확장 각도 모드가 지시하는 각도는 대응하는 기본 각도 모드가 지시하는 각도의 반대편 각도로 결정될 수 있다. 따라서, 확장 각도 모드가 지시하는 각도는 기본 각도 모드가 지시하는 각도에 기초하여 결정될 수 있다. 한편, 확장 각도 모드들의 개수는 이에 한정되지 않으며, 현재 블록의 크기 및/또는 모양에 따라 추가적인 확장 각도들이 정의될 수 있다. 예를 들어, 확장 각도 모드는 인트라 예측 모드 {-14, -13, …, -1} 및 {67, 68, …, 80} 중 어느 하나에 대응하는 각도 모드로 정의될 수도 있다. 한편, 인트라 예측 모드 세트에 포함되는 인트라 예측 모드들의 총 개수는 전술한 기본 각도 모드와 확장 각도 모드의 구성에 따라 가변할 수 있다.
상기 실시예들에서, 확장 각도 모드들 간의 간격은 대응하는 기본 각도 모드들 간의 간격에 기초하여 설정될 수 있다. 예를 들어, 확장 각도 모드들 {3, 5, 7, …, 65} 간의 간격은 대응하는 기본 각도 모드들 {2, 4, 6, …, 66} 간의 간격에 기초하여 결정될 수 있다. 또한, 확장 각도 모드들 {-10, -9, …, -1} 간의 간격은 대응하는 반대편의 기본 각도 모드들 {56, 57, …, 65} 간의 간격에 기초하여 결정되고, 확장 각도 모드들 {67, 68, …, 76} 간의 간격은 대응하는 반대편의 기본 각도 모드들 {3, 4, …, 12} 간의 간격에 기초하여 결정될 수 있다. 확장 각도 모드들 간의 각도 간격은 대응하는 기본 각도 모드들 간의 각도 간격과 동일하도록 설정될 수 있다. 또한, 인트라 예측 모드 세트에서 확장 각도 모드들의 개수는 기본 각도 모드들의 개수 이하로 설정될 수 있다.
본 발명의 실시예에 따르면, 확장 각도 모드는 기본 각도 모드를 기초로 시그널링될 수 있다. 예를 들어, 광각 모드(즉, 확장 각도 모드)는 제1 각도 범위 이내의 적어도 하나의 각도 모드(즉, 기본 각도 모드)를 대체할 수 있다. 대체되는 기본 각도 모드는 광각 모드의 반대편에 대응하는 각도 모드일 수 있다. 즉, 대체되는 기본 각도 모드는 광각 모드가 지시하는 각도의 반대 방향의 각도에 대응하거나 또는 상기 반대 방향의 각도로부터 기 설정된 오프셋 인덱스만큼 차이 나는 각도에 대응하는 각도 모드이다. 본 발명의 실시예에 따르면, 기 설정된 오프셋 인덱스는 1이다. 대체되는 기본 각도 모드에 대응하는 인트라 예측 모드 인덱스는 광각 모드에 다시 매핑되어 해당 광각 모드를 시그널링할 수 있다. 예를 들어, 광각 모드 {-10, -9, …, -1}은 인트라 예측 모드 인덱스 {57, 58, …, 66}에 의해 각각 시그널링될 수 있고, 광각 모드 {67, 68, …, 76}은 인트라 예측 모드 인덱스 {2, 3, …, 11}에 의해 각각 시그널링될 수 있다. 이와 같이 기본 각도 모드를 위한 인트라 예측 모드 인덱스가 확장 각도 모드를 시그널링하도록 함으로, 각 블록의 인트라 예측에 사용되는 각도 모드들의 구성이 서로 다르더라도 동일한 세트의 인트라 예측 모드 인덱스들이 인트라 예측 모드의 시그널링에 사용될 수 있다. 따라서, 인트라 예측 모드 구성의 변화에 따른 시그널링 오버헤드가 최소화될 수 있다.
한편, 확장 각도 모드의 사용 여부는 현재 블록의 모양 및 크기 중 적어도 하나에 기초하여 결정될 수 있다. 일 실시예에 따르면, 현재 블록의 크기가 기 설정된 크기보다 클 경우 확장 각도 모드가 현재 블록의 인트라 예측을 위해 사용되고, 그렇지 않을 경우 기본 각도 모드만 현재 블록의 인트라 예측을 위해 사용될 수 있다. 다른 실시예에 따르면, 현재 블록이 정사각형이 아닌 블록인 경우 확장 각도 모드가 현재 블록의 인트라 예측을 위해 사용되고, 현재 블록이 정사각형 블록인 경우 기본 각도 모드만 현재 블록의 인트라 예측을 위해 사용될 수 있다.
도 7은 본 발명의 일 실시예에 따른 비트 스트림을 구성하는 기본 단위인 네트워크 추상화 계층(Network Abstract Layer, NAL) 유닛(unit)을 나타낸 도면이다. 비디오 영상이 인코더를 거쳐 비트스트림(bitstream)으로 부호화되어 저장될 때 상기 비트스트림은 네트워크 추상화 계층 단위로 구성될 수 있다. NAL 유닛은 그 목적에 따라 다양한 형태로 정의될 수 있고 고유의 아이디로 구분될 수 있다. NAL 유닛은 크게 실제 영상 데이터 정보를 포함하는 부분과 이러한 비디오 영상을 복호화 하는데 필요한 정보를 포함하는 부분으로 구분될 수 있다. 도 7은 여러 종류의 NAL 유닛들 중 일부를 나타낸 도면이다. NAL 유닛은 미리 정의된 순서를 기반으로 구성되며 해당 NAL 유닛에 포함되는 정보들도 기 설정된 순서에 기반하여 구성될 수 있다. 각각의 NAL 유닛은 상호 참조 관계에 있을 수 있다. 도 7에 나타난 바와 같이 NAL 유닛 DPS(NAL unit DPS)는 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP 신택스(syntax)를 나타낸다. NAL 유닛 VPS(NAL unit VPS)는, 비디오 파라미터 세트(Video parameter set, VPS) RBSP 신택스를 나타낸다. NAL 유닛 SPS(NAL unit SPS)는, 시퀀스 파라미터 세트(Sequence parameter set, SPS) RBSP 신택스를 나타낸다. NAL 유닛 PPS(unit PPS)는 픽쳐 파라미터 세트(Picture parameter set, PPS) RBSP 신택스를 나타낸다. DPS RBSP 신택스는, 디코더가 비디오 복호화를 수행하기 위해 필요한 정보(신택스 요소)를 포함하는 신택스이다. DPS RBSP 신택스는 디코딩 능력 정보(Decoding capability information, DCI) RBSP 신택스로 기술될 수 있다. VPS RBSP 신택스는, 기본 레이어 및 향상 레이어 부호화 데이터를 복호화 하기 위해 공통적으로 사용되는 위해 공통적으로 사용되는 정보(신택스 요소)를 포함하는 신택스이다. SPS RBSP 신택스는, 시퀀스 단위의 수준에서 전송되어지는 신택스 요소들을 포함하는 신택스이다. SPS RBSP 신택스는, VPS를 참조하여 픽쳐를 복호화하기 위해 공통적으로 사용되는 정보(신택스 요소)를 포함할 수 있다. 이때, 시퀀스는 하나 이상의 픽쳐들의 집합을 의미한다. PPS RBSP 신택스는, 하나 이상의 픽쳐를 복호화 하기 위해 공통적으로 사용되는 정보(신택스 요소)를 포함하는 신택스이다. 상술한 RBSP는 로우 바이트 시퀀스 페이로드(Raw Byte Sequence Payload, RBSP)로, 바이트 정렬(byte aligned)되어 NAL 유닛으로 캡슐화되는 신택스를 의미하는 것일 수 있다. 이하에서는, 상술한 신택스에 대해 살펴본다.
도 8은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 8(a)는 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP 신택스를 예시하는 도면이고, 도 8(b)는 시퀀스 파라미터 세트(Sequence parameter set, SPS) RBSP 신택스를 예시하는 나타낸 도면이며, 도 8(c)는 프로파일 티어 레벨 신택스(profile tier level syntax) 'profile_tier_level()'를 예시하는 도면이다.
도 8(a), (b)에 나타난 바와 같이 프로파일 티어 레벨 신택스(profile tier level syntax)는 DPS RBSP 신택스와 SPS RBSP 신택스에 포함(호출)될 수 있다. 프로파일 티어 레벨 신택스는, 프로파일, 티어, 및 레벨과 관련된 정보를 포함할 수 있다. 이때, 프로파일 티어 레벨 신택스(profile tier level syntax)는 일반 제약 정보(General constraint inforamtion, GCI)에 대한 신택스 'general_constraint_info()'를 포함할 수 있다. GCI에 대한 신택스(이하, GCI 신택스)는, 상호 운용성(interoperability)을 위해 GCI 신택스 및/또는 다른 신택스(예를 들어, DPS RBSP 신택스, VPS RBSP 신택스, SPS RBSP 신택스, PPS RBSP 신택스, Sliceheader 신택스 등)에 포함된 툴 및/또는 기능 등을 비활성화(disable)하도록 제어할 수 있다. GCI 신택스가 툴 및/또는 기능 등을 비활성화하도록 지시하는 경우, 하위 신택스에 선언된 툴 및/또는 기능들은 비활성화 될 수 있다. 이때, 디코더가 파싱하는 NAL 유닛의 위치에 따라 상기 GCI 신택스에 의해 비활성화(disable)되는 툴 및/또는 기능 등이 전체 비트스트림에 적용될지 부분 비트 스트림에 적용될지가 결정될 수 있다. 예를 들어, 프로파일 티어 레벨 신택스 'profile_tier_level()'는, DPS RBSP 신택스 및/또는 SPS RBSP 신택스에 포함될 수 있고, 프로파일 티어 레벨 신택스가 DPS RBSP 신택스에 포함되는 경우 상기 프로파일 티어 레벨 신택스에 포함된 GCI 신택스는 전체 비트스트림에 적용될 수 있다. 또 다른 예로, 프로파일 티어 레벨 신택스가 SPS RBSP 신택스에 포함되는 경우 상기 프로파일 티어 레벨 신택스에 포함된 GCI 신택스는 코딩된 레이어 비디오 시퀀스(coded layer video sequence, CLVS)에서 적용될 수 있다.
도 9 내지 도 11은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 9(a)는 본 발명의 일 실시예에 따른, 비디오 파라미터 세트(Video parameter set, VPS) RBSP 신택스를 예시한 도면이고, 도 9(b)는 본 발명의 일 실시예에 따른, 일반 제약 정보(General constraint information, GCI) 신택스를 나타낸 도면이다. 도 9(a)에 나타나 바와 같이 GCI 신택스 'general_constraint_info()'는 VPS 신택스에 포함될 수 있다. 또한, 도9(a)에 도시하진 않았으나 상술한 프로파일 티어 레벨 신택스는 VPS 신택스에 포함될 수 있고, GCI 신택스는 VPS 신택스에 포함된 프로파일 티어 레벨 신택스에 포함될 수 있다. GCI 신택스는 하나 이상의 신택스 요소들을 포함할 수 있다. 도 10, 도 11은 본 발명의 일 실시예에 따른, 시퀀스 파라미터 세트(Sequence parameter set, SPS) RBSP 신택스를 나타낸 도면이다. 이하 도 9 내지 도 11을 참고하여, GCI 신택스에 포함되는 신택스 요소인 제약 플래그에 대해 살펴본다.
- no_qtbtt_dual_tree_intra_constraint_flag
no_qtbtt_dual_tree_intra_constraint_flag는 qtbtt_dual_tree_intra_flag를 제어하는 플래그이다. 예를 들어, no_qtbtt_dual_tree_intra_constraint_flag의 값이 1이면 qtbtt_dual_tree_intra_flag의 값은 0으로 설정될 수 있다. 한편, no_qtbtt_dual_tree_intra_constraint_flag의 값이 0이면 qtbtt_dual_tree_intra_flag의 값에 대한 제약이 없다. 즉, qtbtt_dual_tree_intra_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, qtbtt_dual_tree_intra_flag는 coding_tree 신택스 구조에 I 슬라이스가 사용되었는지 여부를 나타내는 플래그이다. 예를 들어, qtbtt_dual_tree_intra_flag의 값이 1이면, I 슬라이스에 대해 각 코딩 트리 유닛(coding tree unit, CTU)이 암시적(implicit) 쿼드 트리 분할을 통해 64 x 64 루마 샘플을 가지는 코딩 유닛으로 분할될 수 있고, 이때 코딩 유닛은 루마 및 크로마 2개에 대한 별도의 coding_tree 신택스 구조의 루트 노드(최상위 코딩 유닛)임을 나타낸다. qtbtt_dual_tree_intra_flag의 값이 0이면, I 슬라이스에 대해 coding_tree 신택스 구조가 사용되지 않았음을 나타낸다. 상술한 qtbtt_dual_tree_intra_flag는 sps_qtbtt_dual_tree_intra_flag로 지칭될 수 있다.
도 10을 살펴보면, log2_ctu_size_minus5는 각 코딩 트리 유닛의 루마 코딩 트리 블록의 크기 정보를 나타내는 신택스 요소이다. log2_ctu_size_minus5에 5를 더하면 log2단위의 루마 코딩 트리 블록의 크기(CtbLog2SizeY)를 알 수 있다. 이를 수학식으로 나타내면 아래 수학식 1과 같다. 아래 수학식 1에서 CtbSizeY는 각 루마 코딩 트리 블록의 크기를 의미한다.
Figure PCTKR2020009562-appb-img-000001
- no_partition_constraints_override_constraint_flag
no_partition_constraints_override_constraint_flag는, partition_constraints_override_enabled_flag를 제어하는 플래그이다. 예를 들어, no_partition_constraints_override_constraint_flag의 값이 1이면 partition_constraints_override_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_partition_constraints_override_constraint_flag의 값이 0이면 partition_constraints_override_enabled_flag의 값에 대한 제약이 없다. 즉, partition_constraints_override_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, partition_constraints_override_enabled_flag는 픽쳐 헤더(picture header, PH) 내의 ph_partition_constraints_override_flag가 존재하는지 여부를 나타내는 플래그이다. partition_constraints_override_enabled_flag의 값이 1이면 ph_partition_constraints_override_flag가 존재함을 나타내고, partition_constraints_override_enabled_flag의 값이 0이면 ph_partition_constraints_override_flag가 존재하지 않음을 나타낸다. 상술한 partition_constraints_override_enabled_flag는 sps_partition_constraints_override_enabled_flag로 지칭될 수 있다.
- no_sao_constraint_flag
no_sao_constraint_flag는 sps_sao_enabled_flag를 제어하는 플래그이다. 예를 들어, no_sao_constraint_flag의 값이 1이면 sps_sao_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_sao_constraint_flag의 값이 0이면 sps_sao_enabled_flag의 값에 대한 제약이 없다. 즉, sps_sao_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_sao_enabled_flag는 샘플 적응 오프셋 프로세스(sample adaptive offset process)가 CLVS(coded layer video sequence)에 대한 디블로킹 필터 프로세스(deblocking filter process) 후 복원된 픽쳐에 적용되는지 여부를 나타내는 플래그이다. 예를 들어, sps_sao_enabled_flag의 값이 1이면, CLVS에 대한 디블로킹 필터 프로세스 후 복원된 픽쳐에 샘플 적응 오프셋 프로세스는 활성화되고, CLVS에 대한 디블로킹 필터 프로세스 후 복원된 픽쳐에 샘플 적응 오프셋 프로세스가 적용됨을 나타낸다. sps_sao_enabled_flag의 값이 0이면, CLVS에 대한 디블로킹 필터 프로세스 후 복원된 픽쳐에 샘플 적응 오프셋 프로세스는 비활성화되고 CLVS에 대한 디블로킹 필터 프로세스 후 복원된 픽쳐에 샘플 적응 오프셋 프로세스가 적용되지 않음을 나타낸다.
- no_alf_constraint_flag
no_alf_constraint_flag는 sps_alf_enabled_flag를 제어하는 플래그이다. 예를 들어, no_alf_constraint_flag의 값이 1이면 sps_alf_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_alf_constraint_flag의 값이 0이면 sps_alf_enabled_flag의 값에 대한 제약이 없다. 즉, sps_alf_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_alf_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 적용되는 적응 루프 필터(adaptive loop filter)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_alf_enabled_flag의 값이 1이면, 적응 루프 필터는 활성화되고, CLVS에서 픽쳐들의 디코딩에 적응 루프 필터가 적용될수 있음을 나타낸다. sps_alf_enabled_flag의 값이 0이면, 적응 루프 필터는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 적응 루프 필터가 적용되지 않음을 나타낸다.
- no_joint_cbcr_constraint_flag
no_joint_cbcr_constraint_flag는 sps_joint_cbcr_enabled_flag를 제어하는 플래그이다. 예를 들어, no_joint_cbcr_constraint_flag의 값이 1이면 sps_joint_cbcr_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_joint_cbcr_constraint_flag의 값이 0이면 sps_joint_cbcr_enabled_flag 값에 대한 제약이 없다. 즉, sps_joint_cbcr_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_joint_cbcr_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 크로마 잔차들의 결합 코딩(joint coding of chroma residuals)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_joint_cbcr_enabled_flag의 값이 1이면, 크로마 잔차들의 결합 코딩은 활성화되고, CLVS에서 픽쳐들의 디코딩에 크로마 잔차들의 결합 코딩이 사용될 수 있음을 나타낸다. sps_joint_cbcr_enabled_flag의 값이 0이면, 크로마 잔차들의 결합 코딩은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 크로마 잔차들의 결합 코딩은 사용되지 않음을 나타낸다. 한편, sps_joint_cbcr_enabled_flag가 존재하지 않을 수 있는데, 이때에는 sps_joint_cbcr_enabled_flag의 값은 0으로 추론될 수 있다.
- no_ref_wraparound_constraint_flag
no_ref_wraparound_constraint_flag는 sps_ref_wraparound_enabled_flag를 제어하는 플래그이다. 예를 들어, no_ref_wraparound_constraint_flag의 값이 1이면 sps_ref_wraparound_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_ref_wraparound_constraint_flag의 값이 0이면 sps_ref_wraparound_enabled_flag의 값에 대한 제약이 없다. 즉, sps_ref_wraparound_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_ref_wraparound_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 적용되는 수평 랩-어라운드 모션 보상(horizontal wrap-around motion compensation)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_ref_wraparound_enabled_flag의 값이 1이면, 수평 랩-어라운드 모션 보상은 활성화되고, CLVS에서 픽쳐들의 디코딩에 수평 랩-어라운드 모션 보상이 적용될 수 있음을 나타낸다. sps_ref_wraparound_enabled_flag의 값이 0이면, 수평 랩-어라운드 모션 보상은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 수평 랩-어라운드 모션 보상은 적용되지 않음을 나타낸다.
- no_temporal_mvp_constraint_flag
no_temporal_mvp_constraint_flag는 sps_temporal_mvp_enabled_flag를 제어하는 플래그이다. 예를 들어, no_temporal_mvp_constraint_flag의 값이 1이면 sps_temporal_mvp_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_temporal_mvp_constraint_flag의 값이 0이면 sps_temporal_mvp_enabled_flag의 값에 대한 제약이 없다. 즉, sps_temporal_mvp_enabled_flag 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_temporal_mvp_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 시간적 모션 벡터 예측자(temporal motion vector predictors)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_temporal_mvp_enabled_flag의 값이 1이면, 시간적 모션 벡터 예측자는 활성화되고, CLVS에서 픽쳐들의 디코딩에 시간적 모션 벡터 예측자가 사용될 수 있음을 나타낸다. sps_temporal_mvp_enabled_flag의 값이 0이면, 시간적 모션 벡터 예측자는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 시간적 모션 벡터 예측자는 사용되지 않음을 나타낸다.
- no_sbtmvp_constraint_flag
no_sbtmvp_constraint_flag는 sps_sbtmvp_enabled_flag를 제어하는 플래그이다. 예를 들어, no_sbtmvp_constraint_flag의 값이 1이면 sps_sbtmvp_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_sbtmvp_constraint_flag의 값이 0이면 sps_sbtmvp_enabled_flag의 값에 대한 제약이 없다. 즉, sps_sbtmvp_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_sbtmvp_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 서브블록 기반 시간적 모션 벡터 예측자(subblock-based temporal motion vector predictors)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_sbtmvp_enabled_flag의 값이 1이면, 서브블록 기반 시간적 모션 벡터 예측자는 활성화되고, CLVS에서 픽쳐들의 디코딩에 서브블록 기반 시간적 모션 벡터 예측자가 사용될 수 있음을 나타낸다. 이때, 픽쳐들의 슬라이스 타입(type)은 I 슬라이스를 제외한 타입(예: B 슬라이스, P 슬라이스)일 수 있다. sps_sbtmvp_enabled_flag의 값이 0이면, 서브블록 기반 시간적 모션 벡터 예측자는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 서브블록 기반 시간적 모션 벡터 예측자는 사용되지 않음을 나타낸다.
- no_amvr_constraint_flag
no_amvr_constraint_flag는 sps_amvr_enabled_flag를 제어하는 플래그이다. 예를 들어, no_amvr_constraint_flag의 값이 1이면 sps_amvr_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_amvr_constraint_flag의 값이 0이면 sps_amvr_enabled_flag의 값에 대한 제약이 없다. 즉, sps_amvr_enabled_flag 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_amvr_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 모션 백터 차이 해상도(motion vector difference resolution)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_amvr_enabled_flag의 값이 1이면, 모션 백터 차이 해상도는 활성화되고, CLVS에서 픽쳐들의 디코딩에 모션 백터 차이 해상도가 사용될 수 있음을 나타낸다. sps_amvr_enabled_flag의 값이 0이면, 모션 백터 차이 해상도는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 모션 백터 차이 해상도는 사용되지 않음을 나타낸다.
- no_bdof_constraint_flag
no_bdof_constraint_flag는 sps_bdof_enabled_flag를 제어하는 플래그이다. 예를 들어, no_bdof_constraint_flag의 값이 1이면 sps_bdof_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_bdof_constraint_flag의 값이 0이면 sps_bdof_enabled_flag의 값에 대한 제약이 없다. 즉, sps_bdof_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_bdof_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 양-방향 옵티컬 플로우 인터 예측(bi-directional optical flow inter prediction)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_bdof_enabled_flag의 값이 1이면, 양-방향 옵티컬 플로우 인터 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 양-방향 옵티컬 플로우 인터 예측은 사용될 수 있음을 나타낸다. sps_bdof_enabled_flag의 값이 0이면, 양-방향 옵티컬 플로우 인터 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 양-방향 옵티컬 플로우 인터 예측은 사용되지 않음을 나타낸다.
- no_dmvr_constraint_flag
no_dmvr_constraint_flag는 sps_dmvr_enabled_flag를 제어하는 플래그이다. 예를 들어, no_dmvr_constraint_flag의 값이 1이면 sps_dmvr_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_dmvr_constraint_flag의 값이 0이면 sps_dmvr_enabled_flag의 값에 대한 제약이 없다. 즉, sps_dmvr_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_dmvr_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 디코더 모션 벡터 리파인먼트(decoder motion vector refinement)에 기초한 양-방향 예측(bi-prediction)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_dmvr_enabled_flag의 값이 1이면, 디코더 모션 벡터 리파인먼트에 기초한 양-방향 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 디코더 모션 벡터 리파인먼트에 기초한 양-방향 예측이 사용될 수 있음을 나타낸다. sps_dmvr_enabled_flag의 값이 0이면, 디코더 모션 벡터 리파인먼트에 기초한 양-방향 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 디코더 모션 벡터 리파인먼트에 기초한 양-방향 예측은 사용되지 않음을 나타낸다.
- no_cclm_constraint_flag
no_cclm_constraint_flag는 sps_cclm_enabled_flag를 제어하는 플래그이다. 예를 들어, no_cclm_constraint_flag의 값이 1이면 sps_cclm_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_cclm_constraint_flag의 값이 0이면 sps_cclm_enabled_flag의 값에 대한 제약이 없다. 즉, sps_cclm_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_cclm_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측(cross-component linear model intra prediction)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_cclm_enabled_flag의 값이 1이면, 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측이 사용될 수 있음을 나타낸다. sps_cclm_enabled_flag의 값이 0이면, 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측은 사용되지 않음을 나타낸다. 한편, sps_cclm_enabled_flag가 존재하지 않을 수 있는데, 이때에는 sps_cclm_enabled_flag의 값은 0으로 추론될 수 있다.
- no_mts_constraint_flag
no_mts_constraint_flag는 sps_mts_enabled_flag를 제어하는 플래그이다. 예를 들어, no_mts_constraint_flag의 값이 1이면 sps_mts_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_mts_constraint_flag의 값이 0이면 sps_mts_enabled_flag 값에 대한 제약이 없다. 즉, sps_mts_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_mts_enabled_flag는 시퀀스 파라미터 세트(sequence parameter set, SPS)에 sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag가 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_mts_enabled_flag의 값이 1이면, SPS에 sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag가 존재함을 나타낸다. sps_mts_enabled_flag의 값이 0이면, SPS에 sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag가 존재하지 않음을 나타낸다.
이때, sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag는, mts_idx가 CLVS의 인트라 코딩 유닛 신택스에 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag의 값이 1이면 mts_idx는 CLVS의 인트라/인터 코딩 유닛 신택스에 존재할 수 있음을 나타낸다. sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag의 값이 0이면 mts_idx는 CLVS의 인트라/인터 코딩 유닛 신택스에 존재하지 않음을 나타낸다. 한편, sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag가 존재하지 않을 수 있는데 이때에는 sps_explicit_mts_intra_enabled_flag/sps_explicit_mts_inter_enabled_flag의 값은 0으로 추론될 수 있다.
상술한 mts_idx는 현재 코딩 유닛에서 연관된 루마 변환 블록의 수평 및 수직 방향을 따라 적용되는 변환 커널을 지시하는 신택스 요소이다.
- no_sbt_constraint_flag
no_sbt_constraint_flag는 sps_sbt_enabled_flag를 제어하는 플래그이다. 예를 들어, no_sbt_constraint_flag의 값이 1이면 sps_sbt_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_sbt_constraint_flag의 값이 0이면 sps_sbt_enabled_flag 값에 대한 제약이 없다. 즉, sps_sbt_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_sbt_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 인터 예측된 코딩 유닛들(inter-predicted coding unit(CU)s)에 대한 서브 블록 변환의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_sbt_enabled_flag의 값이 1이면, 인터 예측된 코딩 유닛들에 대한 서브 블록 변환은 활성화되고, CLVS에서 픽쳐들의 디코딩에 인터 예측된 코딩 유닛들에 대한 서브 블록 변환이 사용될 수 있음을 나타낸다. sps_sbt_enabled_flag의 값이 0이면, 인터 예측된 코딩 유닛들에 대한 서브 블록 변환은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 인터 예측된 코딩 유닛들에 대한 서브 블록 변환은 사용되지 않음을 나타낸다.
- no_affine_motion_constraint_flag
no_affine_motion_constraint_flag는 sps_affine_enabled_flag를 제어하는 플래그이다. 예를 들어, no_affine_motion_constraint_flag의 값이 1이면 sps_affine_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_affine_motion_constraint_flag의 값이 0이면 sps_affine_enabled_flag의 값에 대한 제약이 없다. 즉, sps_affine_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_affine_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 어파인 모델 기반 모션 보상(affine model based motion compensation)의 활성화 여부를 나타내는 플래그이다. 또한, sps_affine_enabled_flag는 CLVS의 코딩 유닛 신택스에 inter_affine_flag 및 cu_affine_type_flag가 존재하는지 여부를 나타낸다. 예를 들어, sps_affine_enabled_flag의 값이 1이면, 어파인 모델 기반 모션 보상은 활성화되고, CLVS에서 픽쳐들의 디코딩에 어파인 모델 기반 모션 보상이 사용될 수 있음을 나타낸다. 또한, sps_affine_enabled_flag의 값이 1이면, CLVS의 코딩 유닛 신택스에 inter_affine_flag 및 cu_affine_type_flag가 존재할 수 있음을 나타낸다. sps_affine_enabled_flag의 값이 0이면, 어파인 모델 기반 모션 보상은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 어파인 모델 기반 모션 보상이 사용되지 않음을 나타낸다. sps_affine_enabled_flag의 값이 0이면, CLVS의 코딩 유닛 신택스에 inter_affine_flag 및 cu_affine_type_flag가 존재하지 않음을 나타낸다.
이때, inter_affine_flag는 현재 코딩 유닛을 디코딩할 때 현재 코딩 유닛의 예측 샘플을 생성하기 위해 어파인 모델 기반 모션 보상이 사용되는지 여부를 나타내는 플래그이다. cu_affine_type_flag는 현재 코딩 유닛을 디코딩할 때 4개의 파라미터를 사용하는 어파인 모델 기반 모션 보상이 사용되는지 6개의 파라미터를 사용하는 어파인 모델 기반 모션 보상이 사용되는지를 나타내는 플래그이다.
- no_bcw_constraint_flag
no_bcw_constraint_flag는 sps_bcw_enabled_flag를 제어하는 플래그이다. 예를 들어, no_bcw_constraint_flag의 값이 1이면 sps_bcw_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_bcw_constraint_flag의 값이 0이면 sps_bcw_enabled_flag의 값에 대한 제약이 없다. 즉, sps_bcw_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_bcw_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 코딩 유닛 가중치들(weights)을 사용한 양-방향 예측의 활성화 여부를 나타내는 플래그이다. 또한, sps_bcw_enabled_flag는 CLVS의 코딩 유닛 신택스에 bcw_idx가 존재하는지 여부를 나타낼 수도 있다. 예를 들어, sps_bcw_enabled_flag의 값이 1이면, 코딩 유닛 가중치들을 사용한 양-방향 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 코딩 유닛 가중치들을 사용한 양-방향 예측이 사용될 수 있음을 나타낸다. 또한, sps_bcw_enabled_flag 값이 1이면, CLVS의 코딩 유닛 신택스에 bcw_idx가 존재할 수 있음을 나타낸다. sps_bcw_enabled_flag의 값이 0이면, 코딩 유닛 가중치들을 사용한 양-방향 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 코딩 유닛 가중치들을 사용한 양-방향 예측은 사용되지 않음을 나타낸다. 또한, sps_bcw_enabled_flag의 값이 0이면, CLVS의 코딩 유닛 신택스에 bcw_idx가 존재하지 않음을 나타낸다.
이때, bcw_idx는, 코딩 유닛 가중치들을 사용한 양-방향 예측과 관련된 인덱스를 지시하는 신택스 요소이다.
- no_ibc_constraint_flag
no_ibc_constraint_flag는 sps_ibc_enabled_flag를 제어하는 플래그이다. 예를 들어, no_ibc_constraint_flag의 값이 1이면 sps_ibc_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_ibc_constraint_flag의 값이 0이면 sps_ibc_enabled_flag 값에 대한 제약이 없다. 즉, sps_ibc_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_ibc_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 IBC(intra block copy) 예측 모드의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_ibc_enabled_flag의 값이 1이면, IBC 예측 모드는 활성화되고, CLVS에서 픽쳐들의 디코딩에 IBC 예측 모드가 사용될 수 있음을 나타낸다. sps_ibc_enabled_flag의 값이 0이면, IBC 예측 모드는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 IBC 예측 모드는 사용되지 않음을 나타낸다.
- no_ciip_constraint_flag
no_ciip_constraint_flag는 sps_ciip_enabled_flag를 제어하는 플래그이다. 예를 들어, no_ciip_constraint_flag의 값이 1이면 sps_ciip_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_ciip_constraint_flag의 값이 0이면 sps_ciip_enabled_flag의 값에 대한 제약이 없다. 즉, sps_ciip_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_ciip_enabled_flag는 ciip_flag가 인터 코딩 유닛들에 대한 코딩 유닛 신택스에 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_ciip_enabled_flag의 값이 0이면, ciip_flag가 인터 코딩 유닛들에 대한 코딩 유닛 신택스에 존재하지 않음을 나타낸다. sps_ciip_enabled_flag의 값이 1이면, ciip_flag가 인터 코딩 유닛들에 대한 코딩 유닛 신택스에 존재할수도 있음을 나타낸다.
ciip_flag는 결합된 인터-픽쳐 머지(inter-picture merge) 및 인트라-픽쳐 예측(intra-picture prediction)이 현재 코딩 유닛에 대해 적용되는지 여부를 나타내는 플래그이다.
- no_fpel_mmvd_constraint_flag
no_fpel_mmvd_constraint_flag는 sps_fpel_mmvd_enabled_flag를 제어하는 플래그이다. 예를 들어, no_fpel_mmvd_constraint_flag의 값이 1이면 sps_fpel_mmvd_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_fpel_mmvd_constraint_flag 값이 0이면 sps_fpel_mmvd_enabled_flag의 값에 대한 제약이 없다. 즉, sps_fpel_mmvd_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_fpel_mmvd_enabled_flag는 모션 벡터 차이(motion vector difference)를 사용하는 머지 모드(merge mode)에서 사용되는 샘플 정밀도의 타입을 나타내는 플래그이다. 예를 들어, sps_fpel_mmvd_enabled_flag의 값이 1이면, 모션 벡터 차이를 사용하는 머지 모드에서 사용되는 샘플 정밀도가 정수 샘플 정밀도(integer sample precision)임을 나타낸다. sps_fpel_mmvd_enabled_flag의 값이 0이면, 모션 벡터 차이를 사용하는 머지 모드에서 사용되는 샘플 정밀도가 분수 샘플 정밀도(fractional sample precision)임을 나타낸다. 한편, sps_fpel_mmvd_enabled_flag 가 존재하지 않을 수 있는데, 이때에는 sps_fpel_mmvd_enabled_flag의 값은 0으로 추론될 수 있다. sps_fpel_mmvd_enabled_flag는, sps_mmvd_fullpel_only_flag로 지칭될 수도 있다.
- no_triangle_constraint_flag
no_triangle_constraint_flag는 sps_triangle_enabled_flag를 제어하는 플래그이다. 예를 들어, no_triangle_constraint_flag의 값이 1이면 sps_triangle_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_triangle_constraint_flag의 값이 0이면 sps_triangle_enabled_flag의 값에 대한 제약이 없다. 즉, sps_triangle_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_triangle_enabled_flag는 삼각형 모양 기반 모션 보상이 적용될 수 있는 지 여부를 나타내는 플래그이다. 삼각형 모양 기반 모션 보상 예측 방법은 인터 코딩 유닛의 사선을 기준으로 두개의 삼각형 모형으로 구분될 수 있으며 각 삼각형 영역의 모션 정보 세트가 상이할 수 있고, 이를 기반으로 모션 보상을 수행하여 예측 샘플을 생성할 수 있다
- no_ladf_constraint_flag
no_ladf_constraint_flag는 sps_ladf_enabled_flag를 제어하는 플래그이다. 예를 들어, no_ladf_constraint_flag의 값이 1이면 sps_ladf_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_ladf_constraint_flag의 값이 0이면 sps_ladf_enabled_flag의 값에 대한 제약이 없다. 즉, sps_ladf_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_ladf_enabled_flag는 SPS 내에 sps_num_ladf_intervals_minus2, sps_ladf_lowest_interval_qp_offset, sps_ladf_qp_offset[i], 및 sps_ladf_delta_threshold_minus1[i]가 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_ladf_enabled_flag의 값이 1이면, SPS 내에 sps_num_ladf_intervals_minus2, sps_ladf_lowest_interval_qp_offset, sps_ladf_qp_offset[i], 및 sps_ladf_delta_threshold_minus1[i]가 존재함을 나타낸다. sps_ladf_enabled_flag의 값이 0이면, SPS 내에 sps_num_ladf_intervals_minus2, sps_ladf_lowest_interval_qp_offset, sps_ladf_qp_offset[i], 및 sps_ladf_delta_threshold_minus1[i]가 존재하지 않음을 나타낸다.
sps_num_ladf_intervals_minus2는 SPS에 존재하는 신택스 요소인 sps_ladf_delta_threshold_minus1[i], 및 sps_ladf_qp_offset[i]의 개수를 나타내는 신택스 요소이다. sps_num_ladf_intervals_minus2는 0 내지 3 사이의 값을 가질 수 있다.
sps_ladf_lowest_interval_qp_offset은 변수인 양자화 파라미터(quantization parameter, QP)를 도출하기 위해 사용되는 오프셋을 나타내는 신택스 요소이다. sps_ladf_lowest_interval_qp_offset는 -63 내지 63 사이의 값을 가질 수 있다.
sps_ladf_qp_offset[i]는 변수인 양자화 파라미터를 도출하기 위해 사용되는 오프셋 배열을 나타내는 신택스 요소이다. sps_ladf_qp_offset[i]는 -63 내지 63 사이의 값을 가질 수 있다.
sps_ladf_delta_threshold_minus1[i]는 i번째 루마 강도 레벨 인터벌(luma intensity level inderval)의 하한을 지정하는 신택스 요소인 SpsLadfIntervalLowerBound[i]의 값을 계산하기 위해 사용되는 신택스 요소이다. sps_ladf_delta_threshold_minus1[i]는 0 내지 2 BitDepth - 3 사이의 값을 가질 수 있다. BitDepth는 비트 심도를 나타내는 것으로 영상의 밝기를 표현하는데 필요한 비트 수를 의미한다.
- no_transform_skip_constraint_flag
no_transform_skip_constraint_flag는 sps_transform_skip_enabled_flag를 제어하는 플래그이다. 예를 들어, no_transform_skip_constraint_flag의 값이 1이면 sps_transform_skip_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_transform_skip_constraint_flag의 값이 0이면 sps_transform_skip_enabled_flag의 값에 대한 제약이 없다. 즉, sps_transfrom_skip_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_transform_skip_enabled_flag는 변환 유닛(transform unit) 신택스 내에 transform_skip_flag가 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_transform_skip_enabled_flag의 값이 1이면, 변환 유닛 신택스 내에 transform_skip_flag가 존재할 수 있음을 나타낸다. sps_transform_skip_enabled_flag의 값이 0이면, 변환 유닛 신택스 내에 transform_skip_flag가 존재하지 않음을 나타낸다.
transform_skip_flag는 변환 블록에 변환이 적용되었는지 여부를 나타내는 플래그이다.
- no_bdpcm_constraint_flag
no_bdpcm_constraint_flag는 sps_bdpcm_enabled_flag를 제어하는 플래그이다. 예를 들어, no_bdpcm_constraint_flag의 값이 1이면 sps_bdpcm_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_bdpcm_constraint_flag의 값이 0이면 sps_bdpcm_enabled_flag의 값에 대한 제약이 없다. 즉, sps_bdpcm_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_bdpcm_enabled_flag는 intra_bdpcm_luma_flag 및 intra_bdpcm_chroma_flag가 인트라 코딩 유닛들에 대한 코딩 유닛 신택스에 존재하는지 여부를 나타내는 플래그이다. 예를 들어, sps_bdpcm_enabled_flag의 값이 1이면, intra_bdpcm_luma_flag 및 intra_bdpcm_chroma_flag가 인트라 코딩 유닛들에 대한 코딩 유닛 신택스에 존재할 수 있음을 나타낸다. sps_bdpcm_enabled_flag의 값이 0이면, intra_bdpcm_luma_flag 및 intra_bdpcm_chroma_flag가 인트라 코딩 유닛들에 대한 코딩 유닛 신택스에 존재하지 않음을 나타낸다. 한편, sps_bdpcm_enabled_flag가 존재하지 않을 수 있는데 이때에는 sps_bdpcm_enabled_flag의 값은 0으로 추론될 수 있다.
intra_bdpcm_luma_flag/intra_bdpcm_chroma_flag는 bdpcm(Block-based Delta Pulse Code Modulation)이 특정 위치(x0, y0)의 루마/크로마 코딩 블록에 적용되는지 여부를 나타내는 플래그들이다.
- no_qp_delta_constraint_flag
no_qp_delta_constraint_flag는 cu_qp_delta_enabled_flag를 제어하는 플래그이다. 예를 들어, no_qp_delta_constraint_flag 값이 1이면 cu_qp_delta_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_qp_delta_constraint_flag의 값이 0이면 cu_qp_delta_enabled_flag의 값에 대한 제약이 없다. 즉, cu_qp_delta_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, cu_qp_delta_enabled_flag는 PPS를 참조하는 PH들 내에 신택스 요소인 ph_cu_qp_delta_subdiv_intra_slice 및 ph_cu_qp_delta_subdiv_inter_slice가 존재하는지 여부를 나타내는 플래그이다. 또한, cu_qp_delta_enabled_flag는 변환 유닛 신택스 및 팔레트 코딩 신택스 내에 포함되는 신택스 요소인 cu_qp_delta_abs 및 cu_qp_delta_sign_flag가 존재하는지 여부를 나타낸다. 예를 들어, cu_qp_delta_enabled_flag의 값이 1이면, PPS를 참조하는 PH들 내에 신택스 요소인 ph_cu_qp_delta_subdiv_intra_slice 및 ph_cu_qp_delta_subdiv_inter_slice가 존재할 수 있음을 나타낸다. 또한 cu_qp_delta_enabled_flag의 값이 1이면, 변환 유닛 신택스 및 팔레트 코딩 신택스 내에 신택스 요소인 cu_qp_delta_abs 및 cu_qp_delta_sign_flag가 존재할 수 있음을 나타낸다. cu_qp_delta_enabled_flag의 값이 0이면, PPS를 참조하는 PH들 내에 신택스 요소인 ph_cu_qp_delta_subdiv_intra_slice 및 ph_cu_qp_delta_subdiv_inter_slice가 존재하지 않음을 나타낸다. 또한 cu_qp_delta_enabled_flag의 값이 0이면, 변환 유닛 신택스 및 팔레트 코딩 신택스 내에 신택스 요소인 cu_qp_delta_abs 및 cu_qp_delta_sign_flag가 존재하지 않음을 나타낸다.
ph_cu_qp_delta_subdiv_intra_slice/ph_cu_qp_delta_subdiv_inter_slice는 cu_qp_delta_abs 및 cu_qp_delta_sign_flag를 전달(convey)하는 인트라/인터 슬라이스 내의 코딩 유닛의 최대 값 'cbSubdiv'을 나타내는 신택스 요소이다. 이때, 'cbSubdiv'는 블록의 하위분할 값을 나타낸다.
cu_qp_delta_abs는 현재 코딩 유닛의 양자화 파라미터와 현재 코딩 유닛의 양자화 파라미터 예측 값의 차이 'CuQpDeltaVal'의 절대 값을 나타내는 신택스 요소이다.
cu_qp_delta_sign_flag는 상기 'CuQpDeltaVal'의 부호(sign)를 나타내는 플래그이다.
- no_dep_quant_constraint_flag
no_dep_quant_constraint_flag는 sps_dep_quant_enabled_flag를 제어하는 플래그이다. 예를 들어, no_dep_quant_constraint_flag의 값이 1이면 sps_dep_quant_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_dep_quant_constraint_flag의 값이 0이면 sps_dep_quant_enabled_flag의 값에 대한 제약이 없다. 즉, sps_dep_quant_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_dep_quant_enabled_flag는 SPS를 참조하는 픽쳐들에 사용되는 종속 양자화(dependent quantization)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_dep_quant_enabled_flag의 값이 1이면, 종속 양자화는 활성화되고, SPS를 참조하는 픽쳐들에 종속 양자화가 사용될 수 있음을 나타낸다. sps_dep_quant_enabled_flag의 값이 0이면, 종속 양자화는 비활성화되고, SPS를 참조하는 픽쳐들에 종속 양자화는 사용되지 않음을 나타낸다.
- no_sign_data_hiding_constraint_flag
no_sign_data_hiding_constraint_flag는 sps_sign_data_hiding_enabled_flag를 제어하는 플래그이다. 예를 들어, no_sign_data_hiding_constraint_flag의 값이 1이면 sps_sign_data_hiding_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_sign_data_hiding_constraint_flag의 값이 0이면 sps_sign_data_hiding_enabled_flag의 값에 대한 제약이 없다. 즉, sps_sign_data_hiding_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_sign_data_hiding_enabled_flag는 SPS를 참조하는 픽쳐들에 사용되는 부호 비트 숨김(sign bit hiding)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_sign_data_hiding_enabled_flag의 값이 1이면, SPS를 참조하는 픽쳐들에 사용되는 부호 비트 숨김은 활성화되고, SPS를 참조하는 픽쳐에 부호 비트 숨김이 사용될 수 있음을 나타낸다. sps_sign_data_hiding_enabled_flag의 값이 0이면, SPS를 참조하는 픽쳐들에 사용되는 부호 비트 숨김은 비활성화되고, SPS를 참조하는 픽쳐에 부호 비트 숨김이 사용되지 않음을 나타낸다.
도 12는 본 발명의 일 실시예에 따른, 시퀀스 파라미터 세트(Sequence parameter set, SPS) RBSP 신택스(syntax)를 나타낸 도면이다.
도 12를 살펴보면 SPS RBSP 신택스 구조에는 sps_scaling_list_enabled_flag를 포함하여 높은 동적 범위(high dynamic range, hdr)에 관련된 파라미터 정보 및 후술하는 sps 파라미터를 추가하기 위한 확장 공간도 포함되어 있다. 도 12에 개시된 hrd_parameters_present_flag 이하 if 절이 hdr에 관련된 파라미터 정보일 수 있다.
도 13은 본 발명의 일 실시예에 따른, 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 13에 나타난 바와 같이 GCI 신택스는 변환 스킵(transform skip) 및 bdpcm(Block-based Delta Pulse Code Modulation)과 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다.
전술한, no_transform_skip_constraint_flag, no_bdpcm_constraint_flag에 대해 도 11, 도 13을 통해 보다 자세히 살펴본다. 도 11에 나타난 바와 같이 SPS RBSP 신택스는 sps_transform_skip_enabled_flag의 값이 1인 경우 sps_bdpcm_enabled_flag를 시그널링 하는 구조를 가지고 있다. 이러한 구조는, bdpcm의 활성화 여부를 지시하기 위해서 변환 스킵(transform skip)에 대한 활성화 조건이 선행되어야 하는 것을 의미한다.
따라서, GCI 신택스에서도 SPS RBSP 신택스와 동일한 방법의 시그널링 구조가 필요하다. 예를 들어, no_tranform_skip_coanstraint_flag의 값이 1이면 sps_transform_skip_enabled_flag는 0의 값을 가지고, 따라서 변환 스킵(transform skip)은 비활성화 된다. 이때, no_bdpcm_constraint_flag를 1 또는 0의 설정되는 것은 아무런 의미 없이 1 비트를 사용하는 것과 같다. 다시말하면, 변환 스킵(transform skip)이 활성화되는 경우(sps_transform_skip_enabled_flag == 1), bdpcm의 활성화 여부를 지시하기 위한 신택스 요소(sps_bdpcm_enabled_flag)가 시그널링되기 때문에, 변환 스킵(transform skip)이 비활성화되는 경우에는, bdpcm을 제약하는 플래그(no_bdpcm_constraint_flag)를 시그널링하게되면 불필요한 비트를 낭비하게 된다.
따라서, 도 13에 나타난 바와 같이 no_transform_skip_constraint_flag의 값이 0일 때에 no_bdpcm_constraint_flag가 시그널링 될 수 있다. 이는 아래 수학식 2와 같이 표현될 수 있다.
Figure PCTKR2020009562-appb-img-000002
도 14는 본 발명의 일 실시예에 따른, 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 14에 나타난 바와 같이 GCI 신택스는 시간적 모션 벡터 예측자(temporal motion vector predictors, temporal mvp) 및 서브블록 기반 시간적 모션 벡터 예측자(subblock-based temporal motion vector predictors, sbtmvp)와 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다.
전술한, no_temporal_mvp_constraint_flag, no_sbtmvp_constraint_flag에 대해 도 11, 도 14를 통해 보다 자세히 살펴본다. 도 11에 나타난 바와 같이 SPS RBSP 신택스는 sps_temporal_mvp_enabled_flag의 값이 1인 경우 sps_sbtmvp_enabled_flag를 시그널링 하는 구조를 가지고 있다. 이러한 구조는, 서브블록 기반 시간적 모션 벡터 예측자(sbtmvp)를 지시하기 위해서 시간적 모션 벡터 예측자(temporal mvp)의 활성화 조건이 선행되어야 하는 것을 의미한다.
따라서, 도 9에서 설명한 바와 같이, no_temporal_mvp_constraint_flag의 값이 1이면 sps_temporal_mvp_enabled_flag의 값은 0으로 설정되어 비활성화 되고, sps_sbtmvp_enabled_flag는 시그널링되지 않으므로 sps_sbtmvp_enabled_flag를 제어하는 no_sbtmvp_constraint_flag는 시그널링 될 필요가 없다. 한편, no_temporal_mvp_constraint_flag의 값이 0이면 sps_temporal_mvp_enabled_flag의 값은 제약되지 않으므로, sps_sbtmvp_enabled_flag는 시그널링 될 수 있고, 따라서 sps_sbtmvp_enabled_flag의 활성화 여부를 알려주는 no_sbtmvp_constraint_flag는 시그널링될 수 있다. 이는 아래 수학식 3과 같이 표현할 수 있다.
따라서, 도 14에 나타난 바와 같이, no_temporal_mvp_constraint_flag의 값이 0일 때에 no_sbtmvp_constraint_flag가 시그널링 될 수 있다. 이는 아래 수학식 3과 같이 표현할 수 있다.
Figure PCTKR2020009562-appb-img-000003
도 15는 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 15에 나타난 바와 같이 GCI 신택스는 모션 벡터 차이를 사용하는 머지 모드(merge with motion vector difference, mmvd) 및 전체 펠(full pel, fpel) mmvd와 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다.
전술한, no_mmvd_constraint_flag, no_fpel_mmvd_constraint_flag에 대해 도 11, 도 15를 통해 보다 자세히 살펴본다. 구체적으로, 도 11에 나타난 바와 같이 SPS RBSP 신택스는 sps_mmvd_enabled_flag의 값이 1인 경우 sps_fpel_mmvd_enabled_flag를 시그널링 하는 구조를 가지고 있다. 이러한 구조는, 전체 펠 mmvd를 지시하기 위해서 mmvd의 활성화 조건이 선행되어야 하는 것을 의미한다.
sps_mmvd_enabled_flag는 인터 예측(inter prediction)에서 모션 벡터 차이를 사용하는 머지 모드(merge with motion vector difference, mmvd)의 대한 활성화 여부를 나타낼 수 있다. 예를 들어, sps_mmvd_enabled_flag의 값이 1이면 모션 벡터 차이를 사용하는 머지 모드는 활성화되고 CLVS에서 픽쳐의 디코딩에 사용될 수 있음을 나타낸다. sps_mmvd_enabled_flag의 값이 0이면 모션 벡터 차이를 사용하는 머지 모드는 비활성화되고 CLVS에서 픽쳐의 디코딩에 사용되지 않음을 나타낸다.
또한, 상술한 바와 같이 sps_fpel_mmvd_enabled_flag는 mmvd를 사용할 때 정수 샘플 정밀도(integer sample precision)를 가지는 모션 벡터 차이(motion vector difference)의 사용 여부를 지시할 수 있다.
이때, no_mmvd_constraint_flag는 sps_mmvd_enabled_flag를 제어하는 플래그이다. 예를 들어, no_mmvd_constraint_flag의 값이 1이면 sps_mmvd_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_mmvd_constraint_flag의 값이 0이면 sps_mmvd_enabled_flag의 값에 대한 제약이 없다. 즉, sps_mmvd_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
따라서, no_mmvd_constraint_flag의 값이 1이면 sps_mmvd_enabled_flag의 값은 0으로 설정되어 비활성화 되어, sps_fpel_mmvd_enabled_flag는 시그널링되지 않으므로, sps_fpel_mmvd_enabled_flag를 제어하는 no_fpel_mmvd_constraint_flag는 시그널링 될 필요가 없다. 한편, no_mmvd_constraint_flag의 값이 0이면 sps_mmvd_enabled_flag의 값은 제약되지 않으므로, sps_fpel_mmvd_enabled_flag는 시그널링될 수 있고, 따라서, sps_fpel_mmvd_enabled_flag의 활성화 여부를 알려주는 no_fpel_mmvd_constraint_flag는 시그널링될 수 있다. 이는 아래 수학식 4와 같이 표현할 수 있다.
Figure PCTKR2020009562-appb-img-000004
도 16은 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 16에 나타난 바와 같이 GCI 신택스는 어파인 모델 기반 모션 보상(affine model based motion compensation)과 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다. 어파인 모델 기반 모션 보상과 관련된 플래그의 일예로, sps_affine_enabled_flag, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag 등이 있을 수 있다.
구체적으로, 도 11에 나타난 바와 같이 SPS RBSP 신택스는 sps_affine_enabled_flag의 값이 1인 경우 sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag를 시그널링 하는 구조를 가지고 있다. 이러한 구조는, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag가 시그널링되기 위해서는 어파인 모델 기반 모션 보상의 활성화 조건이 선행되어야 하는 것을 의미한다.
sps_affine_type_flag는, 6개의 파라미터를 사용하는 어파인 모델 기반 모션 보상의 사용 여부를 나타내는 플래그로, sps_affine_type_flag의 값이 0이면 6개의 파라미터를 사용하는 어파인 모델 기반 모션 보상은 사용되지 않는다. sps_affine_type_flag의 값이 1이면 6개의 파라미터를 사용하는 어파인 모델 기반 모션 보상이 사용될 수 있음을 나타낼 수 있다.
sps_affine_amvr_enabled_flag는, 어파인 모델 기반 모션 보상에 사용되는 적응적 모션 벡터 해상도(motion vector resolution)의 사용 여부를 나타내는 플래그이다.
sps_affine_prof_enabled_flag는, 어파인 모델 기반 모션 보상에 대해 옵티컬 플로우(optical flow)를 적용하는 보정 여부를 지시하는 플래그이다.
따라서, 도 9에서 설명한 바와 같이, no_affine_motion_constraint_flag의 값이 1이면 sps_affine_enabled_flag의 값은 0으로 설정되어 비활성화 되고, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag는 시그널링되지 않으므로, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag를 각각 제어하는 no_affine_type_constraint_flag, no_affine_amvr_constraint_flag, no_affine_prof_constraint_flag는 시그널링 될 필요가 없다. 한편, no_affine_motion_constraint_flag의 값이 0이면 sps_affine_enabled_flag의 값은 제약되지 않으므로, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag는 시그널링 될 수 있고, 따라서, sps_affine_type_flag, sps_affine_amvr_enabled_flag, sps_affine_prof_enabled_flag의 시그널링 여부를 알려주는 no_affine_type_constraint_flag, no_affine_amvr_constraint_flag, no_affine_prof_constraint_flag는 시그널링될 수 있다. 이는 아래 수학식 5와 같이 표현할 수 있다.
Figure PCTKR2020009562-appb-img-000005
도 17은 본 발명의 일 실시예에 따른 신택스를 나타낸 도면이다.
도 17(a)는 슬라이스 헤더 신택스를 나타낸 도면이고, 도 17(b)는 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 17(b)를 살펴보면 GCI 신택스는 종속 양자화(dependent quantization)와 관련된 플래그 및 부호 데이터 숨김(sign data hiding)과 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다. 도 17(a)는 슬라이스 헤더 신택스(slice header syntax)에서 종속 양자화와 관련된 플래그(dep_quant_enabled_flag)와 부호 데이터 숨김과 관련된 플래그(sign_data_hiding_enabled_flag)를 시그널링하기 위한 구조를 나타낸 도면이다. 도 17(a)에 나타난 바와 같이 dep_quant_enabled_flag가 비활성화된(사용되지 않는) 경우에만 sign_data_hiding_enabled_flag는 시그널링될 수 있다.
따라서, 도 9에서 설명한 바와 같이, no_dep_quant_constraint_flag의 값이 1이면 dep_quant_enabled_flag의 값은 0으로 설정되어 비활성화 되고, sign_data_hiding_enabled_flag는 시그널링될 수 있다. no_dep_quant_constraint_flag의 값이 0이면 dep_quant_enabled_flag의 값은 제약되지 않으므로, sign_data_hiding_enabled_flag의 활성화 여부를 알려주는 no_sign_data_hiding_constraint_flag는 시그널링될 필요가 있다. 이는 아래 수학식 6과 같이 표현할 수 있다. 상술한 sps_dep_quant_enabled_flag는 dep_quant_enabled_flag과 동일하고, sps_sign_data_hiding_enabled_flag는 sign_data_hiding_enabled_flag와 동일할 수 있다.
Figure PCTKR2020009562-appb-img-000006
도 18은 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 18에 나타난 바와 같이 GCI 신택스는 다중 변환 세트(multiple transform set, mts)와 관련된 플래그들을 포함할 수 있고, 상기 플래그들을 시그널링할 수 있다. 다중 변환 세트와 관련된 플래그의 일예로, sps_mts_enabled_flag, sps_explicit_mts_intra_enabled_flag, sps_explicit_mts_inter_enabled_flag 등이 있을 수 있다.
전술한, no_mts_constraint_flag, sps_explicit_mts_intra_enabled_flag, sps_explicit_mts_inter_enabled_flag에 대해 도 11, 도18을 통해 보다 자세히 살펴본다. SPS RBSP 신택스는 sps_mts_enabled_flag의 값이 1인 경우 sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag를 시그널링하는 구조를 가지고 있다. 예를 들어, sps_mts_enabled_flag의 값이 0이면 변환 커널을 DCT2-DCT2만 사용할 수 있다. sps_mts_enabled_flag의 값이 1이면 DCT2가 아닌 다른 커널들을 암시적으로(implicit) 사용하도록 나타낼 수 있다. 또한, sps_mts_enabled_flag의 값이 1이고 sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag의 값이 모두 1이면 암시적으로 다중 변환 세트를 지시할 뿐 아니라 인트라 모드에 대해서 다중 변환 세트를 지시할 수 있고, 인터 모드에 대해서도 다중 변환 세트를 별도로 지시할 수 있다.
따라서, 도 9에서 설명한 바와 같이, no_mts_constraint_flag의 값이 1이면 sps_mts_enabled_flag의 값은 0으로 설정되어 비활성화 되고, sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag는 시그널링되지 않는다. 한편, no_mts_constraint_flag의 값이 0이면 sps_mts_enabled_flag의 값은 제약되지 않으므로, sps_explicit_mts_intra_enabled_flag 및 sps_explicit_mts_inter_enabled_flag는 시그널링 될 수 있다. 이는 아래 수학식 7과 같이 표현할 수 있다.
Figure PCTKR2020009562-appb-img-000007
도 19는 본 발명의 일 실시예에 따른 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 19에 나타난 바와 같이 도 11에서 예시한 시퀀스 파라미터 세트(sequence parameter set, SPS) RBSP 신택스에 정의된 툴/기능과 관련된 신택스 요소들 중 일부를 제어하는 신택스 요소를 GCI 신택스에 추가하여 그 기능을 확장할 수 있다. 추가되는 신택스 요소는 아래와 같다.
- no_smvd_constraint_flag
no_smvd_constraint_flag는 sps_smvd_enabled_flag를 제어하는 플래그이다. 예를 들어, no_smvd_constraint_flag의 값이 1이면 sps_smvd_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_smvd_constraint_flag의 값이 0이면 sps_smvd_enabled_flag의 값에 대한 제약이 없다. 즉 sps_smvd_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_smvd_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 대칭 모션 벡터(symmetric motion vector difference)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_smvd_enabled_flag의 값이 1이면 CLVS에서 픽쳐들의 디코딩에 사용되는 대칭 모션 벡터는 활성화되고, CLVS에서 픽쳐들의 디코딩에 대칭 모션 벡터가 사용될 수 있음을 나타낸다. sps_smvd_enabled_flag의 값이 0이면 CLVS에서 픽쳐들의 디코딩에 사용되는 대칭 모션 벡터는 비활성화되고, CLVS에서 픽쳐들의 디코딩에 대칭 모션 벡터는 사용되지 않음을 나타낸다.
- no_isp_constraint_flag
no_isp_constraint_flag는 sps_isp_enabled_flag를 제어하는 플래그이다. 예를 들어, no_isp_constraint_flag의 값이 1이면 sps_isp_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_isp_constraint_flag의 값이 0이면 sps_isp_enabled_flag의 값에 대한 제약이 없다. 즉 sps_isp_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_isp_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 서브파티션들(subpartitions)이 사용되는 인트라 예측의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_isp_enabled_flag의 값이 1이면 CLVS에서 픽쳐들의 디코딩에 사용되는 서브파티션들이 사용되는 인트라 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 서브파티션들이 사용되는 인트라 예측은 사용될 수 있음을 나타낸다. sps_isp_enabled_flag의 값이 0이면 CLVS에서 픽쳐들의 디코딩에 사용되는 서브파티션들이 사용되는 인트라 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 서브파티션들이 사용되는 인트라 예측은 사용되지 않음을 나타낸다.
- no_mrl_constraint_flag
no_mrl_constraint_flag는 sps_mrl_enabled_flag를 제어하는 플래그이다. 예를 들어, no_mrl_constraint_flag의 값이 1이면 sps_mrl_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_mrl_constraint_flag의 값이 0이면 sps_mrl_enabled_flag의 값에 대한 제약이 없다. 즉 sps_mrl_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_mrl_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 다중 참조 라인들(multiple reference lines)을 사용하는 인트라 예측의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_mrl_enabled_flag의 값이 1이면 CLVS에서 픽쳐들의 디코딩에 사용되는 다중 참조 라인들을 사용하는 인트라 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 다중 참조 라인들을 사용하는 인트라 예측은 사용될 수 있음을 나타낸다. sps_mrl_enabled_flag의 값이 0이면 CLVS에서 픽쳐들의 디코딩에 사용되는 다중 참조 라인들을 사용하는 인트라 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 다중 참조 라인들을 사용하는 인트라 예측은 사용되지 않음을 나타낸다.
- no_mip_constraint_flag
no_mip_constraint_flag는 sps_mip_enabled_flag를 제어하는 플래그이다. 예를 들어, no_mip_constraint_flag의 값이 1이면 sps_mip_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_mip_constraint_flag의 값이 0이면 sps_mip_enabled_flag의 값에 대한 제약이 없다 즉 sps_mip_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_mip_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 메트릭스-기반 인트라 예측(matrix-based intra prediction)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_mip_enabled_flag의 값이 1이면 CLVS에서 픽쳐들의 디코딩에 사용되는 메트릭스-기반 인트라 예측은 활성화되고, CLVS에서 픽쳐들의 디코딩에 메트릭스-기반 인트라 예측은 사용될 수 있음을 나타낸다. sps_mip_enabled_flag의 값이 0이면 CLVS에서 픽쳐들의 디코딩에 사용되는 메트릭스-기반 인트라 예측은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 메트릭스-기반 인트라 예측은 사용되지 않음을 나타낸다.
- no_lfnst_constraint_flag
no_lfnst_constraint_flag는 sps_lfnst_enabled_flag를 제어하는 플래그이다. 예를 들어, no_lfnst_constraint_flag의 값이 1이면 sps_lfnst_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_lfnst_constraint_flag의 값이 0이면 sps_lfnst_enabled_flag의 값에 대한 제약이 없다. 즉 sps_lfnst_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_lfnst_enabled_flag는 lfnst_idx가 인트라 코딩 유닛 신택스에 존재하는지 여부를 나타내느 플래그이다. 예를 들어, sps_lfnst_enabled_flag의 값이 1이면 lfnst_idx가 lfnst_idx가 인트라 코딩 유닛 신택스에 존재할 수 있음을 나타낸다. sps_lfnst_enabled_flag의 값이 0이면 lfnst_idx가 인트라 코딩 유닛 신택스에 존재하지 않음을 나타낸다.
이때, lfnst_idx는 현재 블록에 저-대역 비분리 변환(low frequency non-separable transform)이 적용되는지 여부를 나타내는 신택스 요소이다.
- no_lmcs_constraint_flag
no_lmcs_constraint_flag는 sps_lmcs_enabled_flag를 제어하는 플래그이다. 예를 들어, no_lmcs_constraint_flag의 값이 1이면 sps_lmcs_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_lmcs_constraint_flag의 값이 0이면 sps_lmcs_enabled_flag의 값에 대한 제약이 없다. 즉 sps_lmcs_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_lmcs_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 크로마 스케일링과 루마 매핑(luma mapping with chroma scaling)의 활성화 여부를 나타내는 플래그이다. 예를 들어, sps_lmcs_enabled_flag의 값이 1이면 CLVS에서 픽쳐들의 디코딩에 사용되는 크로마 스케일링과 루마 매핑은 활성화되고, CLVS에서 픽쳐들의 디코딩에 크로마 스케일링과 루마 매핑은 사용될 수 있음을 나타낸다. sps_lmcs_enabled_flag의 값이 0이면 CLVS에서 픽쳐들의 디코딩에 사용되는 크로마 스케일링과 루마 매핑은 비활성화되고, CLVS에서 픽쳐들의 디코딩에 크로마 스케일링과 루마 매핑은 사용되지 않음을 나타낸다.
- no_palette_constraint_flag
no_palette_constraint_flag는 sps_palette_enabled_flag를 제어하는 플래그이다. 예를 들어, no_palette_constraint_flag의 값이 1이면 sps_palette_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_palette_constraint_flag의 값이 0이면 sps_palette_enabled_flag의 값에 대한 제약이 없다. 즉 sps_palette_enabled_flag의 값은 SPS RBSP 신택스의 파싱 결과에 따라 결정될 수 있다.
이때, sps_palette_enabled_flag는 CLVS의 코딩 유닛 신택스 내 pred_mode_plt_flag가 존재하는지를 나타내는 플래그이다. 예를 들어, sps_palette_enabled_flag의 값이 1이면 CLVS의 코딩 유닛 신택스 내 pred_mode_plt_flag가 존재할 수 있음을 나타낸다. sps_palette_enabled_flag의 값이 0이면 CLVS의 코딩 유닛 신택스 내 pred_mode_plt_flag가 존재하지 않음을 나타낸다.
이때, pred_mode_plt_flag 현재 코딩 유닛에 팔레트 모드(palette mode)가 적용되는지 여부를 나타내는 플래그이다.
보다 구체적으로, no_palette_constraint_flag에 대해 살펴보면, no_palette_constraint_flag가 시그널링되기 위해서는 chroma_format_idc의 변수 값이 사전에 획득되어야 한다. chroma_format_idc는, 루마 샘플링에 대한 크로마 샘플링을 나타낸다. 따라서, GCI 신택스인 'general_constraint_info()' 내에 신택스 요소 chroma_format_idc가 포함될 필요가 있다. 이 경우는 DPS 신택스와 VPS 신택스 내에서는 필요한 구조이다. 다른 경우로 SPS 신택스에 포함되는 프로파일 티어 레벨 신택스(profile_tier_level syntax)에 GCI 신택스가 포함되는 경우, 상기 프로파일 티어 레벨 신택스에 포함된 GCI 신택스가 파싱되고, 이후 chroma_format_idc 신택스 요소가 한번 더 파싱될 수 있어 chroma_format_idc가 중복되어 호출될 수 있다. 다시 말하면, DPS 신택스 또는 VPS 신택스에 포함되는 GCI 신택스는 chroma_format_idc를 포함하고, 프로파일 티어 레벨 신택스에 포함되는 GCI 신택스에 chroma_format_idc가 포함되어 chroma_format_idc는 중복되어 파싱될 수 있다. 이를 위해, 프로파일 티어 레벨 신택스에 GCI 신택스가 포함되는 경우, chroma_format_idx 신택스 요소는 시그널링 되지 않을 수 있다. 또는, 디코더가 항상 GCI 신택스를 파싱하는 시스템에서는 SPS RBSP 신택스에 chroma_format_idc 신택스 요소는 포함되지 않도록 설정될 수 있다.
도 19에서 설명한 각각의 제약 플래그는 상기 제약 플래그(no_x_constraint)flag)에 대응되는 SPS 활성화 플래그(sps_x_enabled_flag)를 제어할 수 있다.
도 20은 본 발명의 일 실시예에 따른, 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 20에 나타난 바와 같이 GCI 신택스는 cclm과 관련된 신택스 요소를 포함할 수 있다. 도 20을 참고하여, 도 9에서 설명한 no_cclm_constraint_flag에 대해 보다 구체적으로 살펴본다.
no_cclm_constraint_flag는 변수 ChromaArrayType의 값이 0과 같지 않은 경우(ChromaArrayType != 0)에 시그널링 될 수 있다. ChromaArrayType은 디코딩된 비디오 데이터의 휘도 및 색차 성분들의 포맷 값을 지정하는 역할을 한다. 상술한 바와 같이 no_cclm_constraint_flag은 sps_cclm_enabled_flag를 제어하는 역할을 할 수 있다.
no_cclm_constraint_flag의 값이 0과 같거나 chroma_format_idc의 값이 1과 같을 때 no_cclm_colocated_chroma_constraint_flag는 시그널링 될 수 있다. 이때, no_cclm_colocated_chroma_constraint_flag는 sps_cclm_colocated_chroma_flag를 제어하는 역할을 하는 플래그이다.
도 9에서 상술한 바와 같이, sps_cclm_enabled_flag는 CLVS에서 픽쳐들의 디코딩에 사용되는 루마 성분에서 크로마 성분으로의 교차-성분 선형 모델 인트라 예측(cross-component linear model intra prediction)의 활성화 여부를 나타내는 플래그이다.
sps_cclm_colocated_chroma_flag은 교차-성분 선형 모델 인트라 예측에서의 좌-상단 다운 샘플된 루마 샘플(top-left downsampled luma sample in cross-component linear model intra prediction) 이 좌-상단 루마 샘플(top-left luma sample)과 동일한 위치인지, 특정된 다른 위치인지 나타내는 플래그이다. sps_cclm_colocated_chroma_flag가 시그널링 되기 위해서는 변수 ChromaArrayType에 대한 정보가 필요하다. 변수 ChromaArrayType의 값은, chroma_format_idc에 대한 정보 및 separate_colour_plane_flag에 대한 정보의 조합으로 획득될 수 있다. 따라서, 신택스 요소 chroma_format_idc 및 separate_colour_plane_flag는 SPS RBSP syntax에 포함되도록 정의될 수 있다.
separate_colour_plane_flag는, 픽쳐를 코딩할 때, 세 가지 개별 구성 요소(Y, Cb, Cr)가 별도로 코딩될 것인지 여부를 나타내는 플래그이다.
도 21은 본 발명의 일 실시예에 따른 일반 제약 정보(General constraint information, GCI) 신택스(syntax)를 나타낸 도면이다. 도 21에 나타난 바와 같이 GCI 신택스는 신택스 요소 no_palette_constraint_flag를 포함할 수 있다.
이하 도 21을 참고하여 도 19에서 설명한 신택스 요소 no_palette_constraint_flag에 대해 구체적으로 살펴본다. 도 11에 나타난 바와 같이 chroma_format_idc의 값이 3이면(chroma_format_idc==3) sps_palette_enabled_flag는 전송될 수 있다.
no_palette_constraint_flag가 제어하는 신택스 요소인, 현재 코딩 유닛에 팔레트 모드(palette mode)가 적용될 수 있는지 여부와 관련된 sps_palette_enabled_flag는 SPS RBSP 신택스 내에 포함될 수 있다. 팔레트 모드는 색 정보를 미리 테이블로 구성한 뒤 실제 픽셀 값을 테이블의 인덱스 값으로 매핑하는 방법이다. chroma_format_idc의 값이 3과 같으면 크로마 포맷은 4: 4: 4일 수 있다. GCI 신택스가 파싱되면, GCI 신택스 내에 포함된 신택스 요소들은 이에 대응되는 신택스 요소들과 관련된 기능을 개별적으로 제어할 수 있다. 도 19에서처럼 sps_palette_enabled_flag에 대응되는, 즉 sps_palette_enabled_flag를 제어하는 no_palette_constraint_flag가 GCI 신택스 내에 포함될 수 있다. 상술한 바와 같이 GCI 신택스가 파싱되고, GCI 신택스 내에 포함된 no_palette_constraint_flag의 값이 1이면 sps_palette_enabled_flag는 0으로 설정될 수 있다. 다시 말하면 sps_palette_enabled_flag의 1로 설정되어 활성화되어 있더라도, no_palette_constraint_flag의 값이 1이면 sps_palette_enabled_flag의 값은 0으로 설정될 수 있다. 한편, no_palette_constraint_flag의 값이 0 이면 sps_palette_enabled_flag는 설정된 값을 가질 수 있고, 이에 따라 디코딩 동작은 수행될 수 있다. 또한, sps_palette_enabled_flag가 시그널링 또는 파싱되기 위한 조건은 chroma_format_idc의 값이 3인 경우(chroma_format_idc==3)일 수 있다.
도 22은 본 발명의 일 실시예에 따른 코딩 트리 유닛 신택스를 나타낸 도면이다.
도 22에 나타난 바와 같이, 코딩 트리 유닛 신택스에 팔레트 코딩 신택스(palette coding syntax)가 포함될 수 있다. pred_mode_plt_flag가 참이면 디코더는 팔레트 코딩 신택스 'palette_coding()'를 파싱할 수 있다. 다시 말하면, pred_mode_plt_flag의 값이 1이면 현재 코딩 블록이 팔레트 모드로 코딩된다는 것을 나타낸다. pred_mode_plt_flag는 현재 블록이 ibc 코딩된 블록이 아니고 sps_plt_enabled_flag가 참이면(1의 값을 가지는 경우) 시그널링/파싱 될 수 있다. 이때, 상기 sps_plt_enabled_flag는 도 19 등에서 설명한 sps_palette_enabled_flag와 동일하다. 팔레트 모드는 색 정보를 미리 테이블로 구성한 뒤 실제 픽셀 값을 테이블의 인덱스 값으로 매핑하는 방법으로, 일반적인 화면내 예측 방법과 상이하다. sps_plt_enabled_flag는 도 19에서 나타난 바와 같이 chroma_format_idc의 값이 3인 경우(chroma_format_idc==3가 같은 경우) 즉, chroma format 4 :4 :4인 경우에 시그널링/파싱 될 수 있다.
도 23은 본 발명의 실시예에 따른, 화면내 예측 모드에 필요한 MPM(Most Probable Modes) 유도를 위한 위치 관계를 나타낸 도면이다.
도 23의 현재 코딩 블록의 주변인 L 위치와 A위치의 루마 예측 모드에 기초하여 MPM은 유도될 수 있다. 팔레트 모드가 활성화된 경우 현재 코딩 블록의 이웃 블록에는 팔레트 모드로 코딩된 블록이 존재할 수 있다. 도 23에 나타난 바와 같이 A위치의 이웃 블록에 대한 pred_mode_plt_flag의 값이 1과 같으면 A위치의 이웃 블록은 팔레트 모드로 코딩된 블록을 의미한다. 한편, A위치의 이웃 블록은 일반적인 예측 모드로 코딩된 블록이 아니기 때문에 저장된 화면내 예측 모드 값이 없을 수 있다. 이때, 화면내 예측 모드 값은 기 설정된 예측 모드로 설정될 수 있다. 예를 들면, 기 설정된 예측 모드는 평면 모드(planar mode) 일 수 있다. 하지만 이에 한정되지 않고, DC(direact current), 수직(Vertical), 수평(Horizontal), 각도 모드들 중 어느 하나로 설정될 수 있다.
이하, MPM(IntraPredModeY[ xCb ][ yCb ]) 유도의 일 실시예를 설명한다.
- intra_luma_not_planar_flag[ xCb ][ yCb ]의 값이 0이면, IntraPredModeY[ xCb ][ yCb ]는 평면 모드로 설정된다.
- BdpcmFlag[ xCb ][ yCb ]의 값이 1이면, IntraPredModeY[ xCb ][ yCb ]는 다음 수학식 8과 같이 설정될 수 있다.
Figure PCTKR2020009562-appb-img-000008
- intra_luma_not_planar_flag[ xCb ][ yCb ]의 값이 1이면 후술하는 단계에 따라 intra_luma_not_planar_flag[ xCb ][ yCb ]의 모드가 설정될 수 있다.
(단계 1) 이웃 블록의 위치 (xNbA, yNbA) 및 (xNbB, yNbB)는 각각 (xCb - 1, yCb + cbHeight - 1) 및 (xCb + cbWidth - 1, yCb - 1)으로 설정될 수 있다. 이때, xCb는 현재 블록의 x 좌표, yCb는 현재 블록의 y좌표, cbHeight는 현재 블록의 높이 cbWidth는 현재 블록의 너비를 의미한다.
(단계 2) X가 A 또는 B 중 어느 하나로 대체되는 경우, candIntraPredModeX는 후술하는 단계에 따라 설정될 수 있다.
(단계 2-1) 블록에 대한 가용성 도출 과정은, 입력인 위치 (xCurr, yCurr)는 (xCb, yCb)로 설정되고 주변 블록 위치 (xNbY, yNbY) 는 (xNbX, yNbX)로 설정되고, available 출력으로 할당된다.
(단계 2-2) 인트라 예측 모드의 후보 candIntraPredModeX는 아래와 같이 설정될 수 있다.
(단계 2-2-1) 후술하는 조건들 중 하나 이상이 참이라면, candIntraPredModeX는 평면 모드로 설정될 수 있다.
(조건 1) 변수 availableX는 FALSE로 설정된다.
(조건 2) CuPredMode[ xNbX ][ yNbX ]는 인트라 모드로 설정되지 않는다.
(조건 3) intra_mip_flag[ xNbX ][ yNbX ]의 값은 1과 같다.
(조건 4) pred_mode_plt_flag[ xNbX ][ yNbX ]의 값은 1과 같다.
(조건 5) X는 B와 같고, yCb - 1 은 ((yCb >> CtbLog2SizeY) << CtbLog2SizeY)보다 작다.
(단계 2-2-2) 그렇지 않으면, candIntraPredModeX는 IntraPredModeY[ xNbX ][ yNbX ]와 동일하게 설정될 수 있다.
도 24는 본 발명의 일 실시예에 따른, 크로마 DM 모드 유도에 필요한 대응되는 루마 블록과의 관계를 나타낸 도면이다. 도 24(a)는 듀얼 트리(DUAL tree)구조를 가지는 루마 블록의 분할을 나타낸 도면이고, 도 24(b)는 듀얼 트리 구조를 가지는 크로마 블록의 분할을 나타낸 도면이다. 도 24(a), (b)를 살펴보면, 듀얼 트리(DUAL tree) 구조를 가지는 루마와 크로마 블록의 분할은 각각 상이하게 이루어질 수 있다. 크로마 포맷 4:4:4인 경우 루마와 크로마는 1대1 비율로 샘플들이 구성된다. 따라서 블록 크기가 같다. 예를 들어 도 24(b)의 크로마 블록 구조에서 A에 해당하는 블록에 대응되는 루마 블록은 도 24(a)의 A에 해당되는 블록일 수 있다. 도 24(a)와 도 24(b)의 A블록은 가로x세로가 W/2 x H이다. 듀얼 트리 구조에서는 크로마의 예측 방법과 루마의 예측 방법이 상이할 수 있다. 크로마의 예측 방법이 루마의 화면내 예측 모드를 그대로 사용하는 DM 모드인 경우, 대응되는 루마 블록의 기 설정된 위치에서의 루마 모드에 기초하여 크로마 모드 시그널링이 결정될 수 있다. 이때, 기 설정된 위치는 [xCb + cbWidth / 2][yCb + cbHeight / 2] 또는 (xCb, yCb)일 수 있다. (xCb, yCb)는 대응되는 루마의 좌상단 모서리의 위치 일 수 있다. cbWidth 와 cbHeight는 대응되는 루마의 너비(width)와 높이(height)를 의미한다. 따라서, 도 24(a)의 루마 블록에서 C의 위치에 해당하는 기 설정된 위치에서 pred_mode_plt_flag 값이 1이면 크로마 블록의 예측 방법은 기 설정된 모드로 설정될 수 있다. 이때, 기 설정된 모드는 평면(PLANAR), DC, 수직(VERTICAL), 수평(HORIZONTAL), 및 각도 모드들 중 어느 하나일 수 있다.
이하에서는 크로마 블록의 DM 모드 유도 과정에 대해 설명한다. 또한 mip flag와 ibc flag를 확인하는 블록의 위치는 기 설정된 [xCb + cbWidth / 2][yCb + cbHeight / 2]로 설정될 수 있다.
크로마 예측 모드 IntraPredModeC[ xCb ][ yCb ] 유도 과정:
변수 CclmEnabled는 루마 위치 (xCb, yCb)를 입력으로하여 교차-성분 크로마 인트라 예측 모드 (cross-component chroma intra prediction) 검사 과정을 인보크(invoke)하여 크로마 예측 모드는 유도될 수 있다.
크로마 블록에 대응되는 루마 블록의 루마 인트라 예측 모드 lumaIntraPredMode의 유도 과정:
(단계 1) intra_mip_flag[ xCb + cbWidth / 2 ][ yCb + cbHeight / 2 ]의 값이 1이면, lumaIntraPredMode 는 평면 모드로 설정된다.
(단계 2) 그렇지 않으면, pred_mode_plt_flag[xCb + cbWidth / 2][yCb + cbHeight / 2]의 값이 1이면, lumaIntraPredMode는 기 설정된 모드(PRE_DEFINED_MODE)로 설정된다.
(단계 3) 그렇지 않으면, CuPredMode [xCb + cbWidth / 2][yCb + cbHeight / 2]가 IBC 모드라면, lumaIntraPredMode는 DC 모드로 설정된다.
(단계 4) 그렇지 않으면, lumaIntraPredMode는 IntraPredModeY[xCb + cbWidth / 2][yCb + cbHeight / 2]와 동일하게 설정된다.
본 명세서는 주로 디코더 관점에서 기술되었으나 인코더에서도 동일하게 동작될 수 있다. 본 명세서의 파싱이라는 용어는 비트 스트림으로부터 정보를 획득하는 과정을 중점으로하여 설명되었으나 인코더 측면에서는 비트스트림에 해당 정보를 구성하는 것으로 해석될 수 있다. 따라서 파싱이라는 용어는 디코더 동작으로만 한정되지 않고 인코더에서는 비트스트림을 구성하는 행위로까지 해석될 수 있다. 즉 인코더는, 상술한 GCI 신택스에 포함되는 플래그(신택스 요소)들을 획득하여, 이를 포함하는 비트스트림을 구성할 수 있다. 또한, 이러한 비트르스트림은 컴퓨터 판독 가능한 기록 매체에 저장되어 구성될 수 있다.
상술한 본 발명의 실시예들은 다양한 수단을 통해 구현될 수 있다. 예를 들어, 본 발명의 실시예들은 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다.
하드웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서, 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차 또는 함수 등의 형태로 구현될 수 있다. 소프트웨어 코드는 메모리에 저장되어 프로세서에 의해 구동될 수 있다. 상기 메모리는 프로세서의 내부 또는 외부에 위치할 수 있으며, 이미 공지된 다양한 수단에 의해 프로세서와 데이터를 주고받을 수 있다.
일부 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독 가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조 또는 프로그램 모듈과 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아는 것으로 해석해야 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (20)

  1. 비디오 신호 복호화 장치에 있어서,
    프로세서를 포함하며,
    상기 프로세서는,
    비디오 신호의 비트스트림(bitstream)에 포함된 일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 복호화하고,
    상기 GCI 신택스의 복호화 결과에 기초하여, 상기 비트스트림을 복호화하되,
    상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고,
    상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고,
    상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  2. 제 1항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  3. 제 1항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  4. 제 1항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  5. 제 1항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 저대역 비-분리 변환(low-frequency non-separable transform)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 저대역 비-분리 변환(low-frequency non-separable transform)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  6. 제 1항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  7. 제 1항에 있어서,
    상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 대칭 모션 벡터 차이(symmetric motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 대칭 모션 벡터 차이(symmetric motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  8. 제 1항에 있어서,
    상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 복호화 장치.
  9. 비디오 신호 부호화 장치에 있어서,
    프로세서를 포함하며,
    상기 프로세서는,
    일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 획득하고,
    상기 GCI 신택스를 포함하는 비트스트림을 부호화하되,
    상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고,
    상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고,
    상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  10. 제 9항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  11. 제 9항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  12. 제 9항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  13. 제 9항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 저대역 비-분리 변환(low-frequency non-separable transform)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 저대역 비-분리 변환(low-frequency non-separable transform)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  14. 제 9항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 모션 벡터 차이를 이용한 머지 모드(merge mode with motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 장치.
  15. 제 9항에 있어서,
    상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 대칭 모션 벡터 차이(symmetric motion vector difference)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 대칭 모션 벡터 차이(symmetric motion vector difference)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  16. 제 9항에 있어서,
    상기 GCI 신택스에 포함되는 GCI 신택스 요소는, 상기 SPS RBSP 신택스에 포함되는 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 크로마 스케일링을 이용한 루마 매핑(luma mapping with chroma scaling)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 비디오 신호 부호화 장치.
  17. 비디오 신호의 비트스트림(bitstream)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서,
    상기 비트스트림은,
    일반 제약 정보(General Constraint Information, GCI) 신택스(syntax)를 획득하는 단계;
    상기 GCI 신택스를 포함하는 비트스트림을 부호화하는 단계; 를 포함하는 부호화 방법을 통해 부호화 되고,
    상기 GCI 신택스는, 디코딩 파라미터 세트(Decoding parameter set, DPS) RBSP(Raw Byte Sequence Payload) 신택스, 시퀀스 파라미터 세트(Sequence Parameter Set, SPS) RBSP 신택스 및 비디오 파라미터 세트(Video Parameter Set, VPS) RBSP 신택스 중 적어도 어느 하나에 포함되고,
    상기 DPS RBSP 신택스는 및 상기 VPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 비디오 복호화를 위한 신택스 요소를 포함하고,
    상기 SPS RBSP 신택스는, 상기 GCI 신택스의 상위 레벨 신택스로, 픽쳐들의 집합인 시퀀스와 관련된 신택스 요소를 포함하고,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 팔레트 모드(palette mode)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 팔레트 모드가 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 컴퓨터 판독 가능 매체.
  18. 제 17항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 다중 참조 라인들을 이용한 인트라 예측(intra prediction with multiple reference lines)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 컴퓨터 판독 가능 매체.
  19. 제 17항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)의 사용 가부를 지시하는 신택스 요소의 값을 설정하는 SPS 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 서브파티션들을 이용한 인트라 예측(intra prediction with subpartitions)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 컴퓨터 판독 가능 매체.
  20. 제 17항에 있어서,
    상기 GCI 신택스는, 상기 SPS RBSP 신택스에 포함되는 메트릭스 기반 인트라 예측(matrix-based intra prediction)의 사용 가부를 지시하는 SPS 신택스 요소의 값을 설정하는 GCI 신택스 요소를 포함하고,
    상기 GCI 신택스 요소의 값이 1인 경우, 상기 SPS 신택스 요소의 값은, 상기 메트릭스 기반 인트라 예측(matrix-based intra prediction)이 사용되지 않음을 지시하는 값인 0으로 설정되는 것을 특징으로 하는 컴퓨터 판독 가능 매체.
PCT/KR2020/009562 2019-07-19 2020-07-20 비디오 신호 처리 방법 및 장치 WO2021015523A1 (ko)

Priority Applications (7)

Application Number Priority Date Filing Date Title
EP24162423.8A EP4358514A3 (en) 2019-07-19 2020-07-20 Video signal processing method and device
EP20843700.4A EP4002848A4 (en) 2019-07-19 2020-07-20 VIDEO SIGNAL PROCESSING METHOD AND DEVICE
CN202080052114.4A CN114128266A (zh) 2019-07-19 2020-07-20 视频信号处理方法和设备
KR1020227002238A KR20220032565A (ko) 2019-07-19 2020-07-20 비디오 신호 처리 방법 및 장치
JP2022503869A JP7379655B2 (ja) 2019-07-19 2020-07-20 ビデオ信号処理方法及び装置
US17/578,381 US20220141495A1 (en) 2019-07-19 2022-01-18 Video signal processing method and device
JP2023188022A JP2023181461A (ja) 2019-07-19 2023-11-01 ビデオ信号処理方法及び装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2019-0087610 2019-07-19
KR20190087610 2019-07-19
KR20190088614 2019-07-22
KR10-2019-0088614 2019-07-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/578,381 Continuation US20220141495A1 (en) 2019-07-19 2022-01-18 Video signal processing method and device

Publications (1)

Publication Number Publication Date
WO2021015523A1 true WO2021015523A1 (ko) 2021-01-28

Family

ID=74192645

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/009562 WO2021015523A1 (ko) 2019-07-19 2020-07-20 비디오 신호 처리 방법 및 장치

Country Status (6)

Country Link
US (1) US20220141495A1 (ko)
EP (2) EP4002848A4 (ko)
JP (2) JP7379655B2 (ko)
KR (1) KR20220032565A (ko)
CN (1) CN114128266A (ko)
WO (1) WO2021015523A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022537604A (ja) * 2019-09-17 2022-08-26 ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッド Prof(prediction refinement with optical flow)の方法および装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114208183A (zh) * 2019-08-03 2022-03-18 北京字节跳动网络技术有限公司 视频的缩减二次变换中基于位置的模式导出
EP3994886A4 (en) 2019-08-06 2022-12-28 Beijing Bytedance Network Technology Co., Ltd. VIDEO ZONE PARTITION ACCORDING TO COLOR FORMAT
WO2021032045A1 (en) 2019-08-17 2021-02-25 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
MX2022002247A (es) 2019-09-02 2022-03-22 Beijing Bytedance Network Tech Co Ltd Particion de region de video basada en formato de color.
WO2021052494A1 (en) 2019-09-21 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Size restriction based for chroma intra mode
WO2021121418A1 (en) 2019-12-19 2021-06-24 Beijing Bytedance Network Technology Co., Ltd. Joint use of adaptive colour transform and differential coding of video
WO2021134047A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Profile tier level parameter set in video coding
CN115191118A (zh) * 2020-01-05 2022-10-14 抖音视界有限公司 在视频编解码中使用自适应颜色变换
CN115176470A (zh) 2020-01-18 2022-10-11 抖音视界有限公司 图像/视频编解码中的自适应颜色变换
CN115398913A (zh) 2020-02-29 2022-11-25 抖音视界有限公司 高级语法元素的约束
MX2022011208A (es) * 2020-03-17 2022-09-19 Bytedance Inc Uso de conjunto de parametros de video en codificacion de video.
KR20220164764A (ko) * 2020-04-02 2022-12-13 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021222813A1 (en) * 2020-05-01 2021-11-04 Beijing Dajia Internet Information Technology Co., Ltd. High-level syntax for video coding
WO2021233447A1 (en) 2020-05-22 2021-11-25 Beijing Bytedance Network Technology Co., Ltd. Signalling of general constrains flag
US20230093129A1 (en) * 2021-09-17 2023-03-23 Tencent America LLC Method and apparatus for intra block copy mode coding with search range switching
WO2024031691A1 (zh) * 2022-08-12 2024-02-15 Oppo广东移动通信有限公司 一种视频编解码方法、装置和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140122191A (ko) * 2013-04-05 2014-10-17 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
KR20150081236A (ko) * 2014-01-03 2015-07-13 삼성전자주식회사 효율적인 파라미터 전달을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113727109B (zh) * 2016-05-28 2023-12-29 寰发股份有限公司 用于彩***数据的调色板模式编解码的方法及装置
WO2018064948A1 (en) * 2016-10-04 2018-04-12 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding
CN115398913A (zh) * 2020-02-29 2022-11-25 抖音视界有限公司 高级语法元素的约束
US11563980B2 (en) * 2020-04-02 2023-01-24 Qualcomm Incorporated General constraint information syntax in video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140122191A (ko) * 2013-04-05 2014-10-17 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
KR20150081236A (ko) * 2014-01-03 2015-07-13 삼성전자주식회사 효율적인 파라미터 전달을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BORDES, Philippe et al. AHG17: On general constraint information. Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11. JVET-O0417-v1. 15th Meeting: Gothenburg, SE. PP. 1-3, 25 June 2019. [Retrieved on: 07 October 2020]. Retrieved from: <http://phenix.int-evry.fr/jvet/>. See pages 1-3. *
BROSS, Benjamin et al. Versatile Video Coding (Draft 6). Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11. JVET-O2001-v9. 15th Meeting: Gothenburg, SE. PP. 1-415, 16 July 2019. [Retrieved on: 07 October 2020]. Retrieved from: <http://phenix.int-evry.fr/jvet/>. See pages 33-37, 43-44, 83 and 90-91. *
DESHPANDE, Sachin. On Tile Group Signalling. Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11. JVET-N0124. 14th Meeting: Geneva, CH. PP. 1-8, 12 March 2019. [Retrieved on: 07 October 2020]. Retrieved from: <http://phenix.int-evry.fr/jvet/>. See pages 1-8. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022537604A (ja) * 2019-09-17 2022-08-26 ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッド Prof(prediction refinement with optical flow)の方法および装置
JP7305883B2 (ja) 2019-09-17 2023-07-10 ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッド Prof(prediction refinement with optical flow)の方法および装置

Also Published As

Publication number Publication date
JP2023181461A (ja) 2023-12-21
US20220141495A1 (en) 2022-05-05
JP2022542851A (ja) 2022-10-07
JP7379655B2 (ja) 2023-11-14
EP4002848A4 (en) 2022-08-31
KR20220032565A (ko) 2022-03-15
EP4002848A1 (en) 2022-05-25
CN114128266A (zh) 2022-03-01
EP4358514A3 (en) 2024-06-12
EP4358514A2 (en) 2024-04-24

Similar Documents

Publication Publication Date Title
WO2021015523A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018128323A1 (ko) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치
WO2018056703A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018062788A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018070742A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2018070713A1 (ko) 크로마 성분에 대한 인트라 예측 모드를 유도하는 방법 및 장치
WO2020096425A1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2018062950A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2018062880A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2019050115A1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2017069505A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2018105759A1 (ko) 영상 부호화/복호화 방법 및 이를 위한 장치
WO2020130600A1 (ko) 예측 모드를 시그널링하는 비디오 신호 처리 방법 및 장치
WO2020171681A1 (ko) 인트라 예측 기반 비디오 신호 처리 방법 및 장치
WO2020076142A1 (ko) 교차성분 선형 모델을 이용한 비디오 신호 처리 방법 및 장치
WO2021125912A1 (ko) 비디오 신호 처리 방법 및 이를 위한 장치
WO2017065422A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2017030270A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2016204524A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2016200235A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018070723A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2016204479A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2019135658A1 (ko) 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법
WO2021054797A1 (ko) 스케일링 프로세스를 사용하는 비디오 신호 처리 방법 및 장치
WO2017043730A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20843700

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022503869

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20227002238

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020843700

Country of ref document: EP

Effective date: 20220221