WO2021206137A1 - 符号化装置、復号装置、及びプログラム - Google Patents

符号化装置、復号装置、及びプログラム Download PDF

Info

Publication number
WO2021206137A1
WO2021206137A1 PCT/JP2021/014872 JP2021014872W WO2021206137A1 WO 2021206137 A1 WO2021206137 A1 WO 2021206137A1 JP 2021014872 W JP2021014872 W JP 2021014872W WO 2021206137 A1 WO2021206137 A1 WO 2021206137A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
scaling list
color space
component
conversion
Prior art date
Application number
PCT/JP2021/014872
Other languages
English (en)
French (fr)
Inventor
俊輔 岩村
慎平 根本
市ヶ谷 敦郎
Original Assignee
日本放送協会
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本放送協会 filed Critical 日本放送協会
Priority to CN202180005546.4A priority Critical patent/CN114450950B/zh
Priority to EP21785431.4A priority patent/EP4087241A4/en
Priority to CN202310331513.XA priority patent/CN116347079A/zh
Priority to JP2022514119A priority patent/JPWO2021206137A1/ja
Publication of WO2021206137A1 publication Critical patent/WO2021206137A1/ja
Priority to US17/655,931 priority patent/US11496739B2/en
Priority to JP2022084866A priority patent/JP7142180B2/ja
Priority to US17/938,633 priority patent/US11889031B2/en
Priority to US18/531,136 priority patent/US20240129470A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to a coding device, a decoding device, and a program.
  • the coding device can control whether or not to apply ACT for each coded block, and outputs an ACT application flag for each coded block as a stream. Therefore, the coded target block that applies the conversion process / quantization process to the predicted residual in the RGB space by ACT, and the conversion process / quantization process after converting the predicted residual from the RGB space to the YCgCo space.
  • the coded block to which is applied will be mixed in the entire image (picture).
  • a scaling list (also called a quantization matrix) that controls the quantization step for each frequency component is introduced. ..
  • the scaling list can be set individually for each of the three color components (for example, the luminance component, the first color difference component, and the second color difference component) that make up the input video signal, and the encoding device can be used as an encoding device.
  • Information indicating whether or not to apply the scaling list and, if so, what kind of scaling list is applied is signaled to the decoding side.
  • the coding apparatus encodes an image composed of three or more components including the first component, the second component, and the third component for each coded block generated by dividing the image.
  • a coding apparatus that generates a prediction unit that generates a prediction block corresponding to the coding target block for each component, and a prediction residual that represents the difference between the coding target block and the prediction block for each component.
  • a quantization control unit that determines a scaling list used for the quantization process for the conversion coefficient, and a quantization unit that performs the quantization process for the conversion coefficient using the determined scaling list.
  • the gist of the quantization control unit is to determine the scaling list based on the color space conversion process.
  • the decoding device is a decoding device that decodes each block to be decoded generated by dividing an image composed of three or more components including the first component, the second component, and the third component. Therefore, an entropy decoding unit that decodes the quantization conversion coefficient of the decoding target block from the bit stream for each component, a prediction unit that generates a prediction block corresponding to the decoding target block for each component, and an inverse transformation with respect to the conversion coefficient.
  • the inverse quantization control unit that determines the scaling list used for the processing, the inverse quantization unit that generates the conversion coefficient by performing the inverse transformation processing on the quantization transformation coefficient, and the determined scaling list are used.
  • An inverse transformation unit that generates a predicted residual by performing the inverse transformation processing on the conversion coefficient, a color space inverse transformation unit that performs a color space inverse transformation processing on the predicted residual, and the predicted residual.
  • a synthesis unit that generates a decoding block by synthesizing the prediction block is provided, and the inverse quantization control unit determines the scaling list based on the color space inverse transformation process.
  • the program according to the third aspect causes the computer to function as the coding device according to the first aspect.
  • the program according to the fourth aspect causes the computer to function as the decoding device according to the second aspect.
  • One may be a coded block to which ACT is applied and the other may be a coded block to which ACT is not applied.
  • the first scaling list is applied to the predicted residual of the Y component, and the Cg component is applied.
  • the second scaling list is applied to the predicted residuals of, and the third scaling list is applied to the predicted residuals of the Co component.
  • the first scaling list is applied to the predicted residual of the R component and the second scaling list is applied to the predicted residual of the G component while the predicted residual remains in the RGB space. Then, the third scaling list is applied to the predicted residuals of the B component.
  • the scaling list used for the image in the RGB space is based on the premise that the luminance signal is mainly included in the G component. Designed. Since the luminance signal is known to contain a large amount of high frequency components as compared with the luminance signal, the scaling list designed to be applied to the luminance signal is different from the scaling list designed to be applied to the luminance signal. It is likely that the properties will be very different.
  • the first scaling list designed for the R component that does not contain many luminance signals is applied to the Y component after conversion by ACT, so that the components have different properties. Scaling lists designed to apply to it will be applied, which can result in visual degradation.
  • the purpose of the present disclosure is to suppress deterioration of image quality even when ACT is applied.
  • the coding device and the decoding device according to the embodiment will be described with reference to the drawings.
  • the coding device and the decoding device according to the embodiment encode and decode moving images represented by MPEG (Moving Picture Experts Group), respectively.
  • MPEG Motion Picture Experts Group
  • FIG. 1 is a diagram showing a configuration of a coding device 1 according to the present embodiment.
  • the coding apparatus 1 includes a block division unit 100, a residual generation unit 110, a switching unit 111, a color space conversion unit 112, a conversion / quantization unit 120, and a quantization control unit. It has 123, an entropy coding unit 130, an inverse quantization / inverse conversion unit 140, a synthesis unit 150, a loop filter 160, a memory 170, and a prediction unit 180.
  • the block division unit 100 divides the original image, which is an input image for each frame (or picture) constituting the moving image, into a plurality of image blocks, and outputs the image block obtained by the division to the residual generation unit 110.
  • the size of the image block is, for example, 32 ⁇ 32 pixels, 16 ⁇ 16 pixels, 8 ⁇ 8 pixels, 4 ⁇ 4 pixels, or the like.
  • the shape of the image block is not limited to a square and may be a rectangle (non-square).
  • the image block is a unit in which the coding device 1 performs a coding process (that is, a block to be coded) and a unit in which the decoding device performs a decoding process (that is, a block to be decoded).
  • Such an image block is sometimes called a CU (Coding Unit).
  • the case where the input image is an RGB signal and the chroma format is 4: 4: 4 will be mainly described.
  • the "R” component corresponds to the first component
  • the "G” component corresponds to the second component
  • the "B” component corresponds to the third component.
  • the block division unit 100 outputs a block by performing block division for each of the R component, the G component, and the B component constituting the image.
  • each component is not distinguished, it is simply referred to as a coded block.
  • the residual generation unit 110 calculates a prediction residual representing a difference (error) between the coded target block output by the block dividing unit 100 and the predicted block obtained by predicting the coded target block by the prediction unit 180. .. Specifically, the residual generation unit 110 calculates the predicted residual by subtracting each pixel value of the predicted block from each pixel value of the coded block, and outputs the calculated predicted residual to the switching unit 111. do. In the present embodiment, the residual generation unit 110 generates a predicted residual of each component by the difference between the coded block of each component and the predicted block of each component.
  • the switching unit 111 outputs the predicted residual of each component output by the residual generation unit 110 to either the conversion / quantization unit 120 or the color space conversion unit 112.
  • the switching unit 111 outputs the predicted residual to the conversion / quantization unit 120 when the color space conversion process (ACT) is not performed, and outputs the predicted residual to the color space conversion unit 112 when the color space conversion process is performed. do.
  • the color space conversion unit 112 performs color space conversion processing on the predicted residuals of each component, and outputs the predicted residuals after the color space conversion processing to the conversion / quantization unit 120.
  • the color space conversion unit 112 generates a new predicted residual by performing the following conversion calculation on the R component, the G component, and the B component of the predicted residual of the coded block.
  • the color space conversion unit 112 can control whether or not to perform color conversion processing for each coded block.
  • the entropy coding unit 130 signals in the bit stream a flag indicating whether or not the color conversion process has been performed on the coded block.
  • the color space conversion process in the color space conversion unit 112 may generate a predicted residual composed of new components by addition, subtraction, multiplication, division, shift processing, etc. for each component, and color space conversion is not necessarily performed. No need. Also, the color space conversion process does not have to be a conversion that affects all components. For example, the color space conversion unit 112 maintains the first component unchanged, sets the average value of the second component and the third component as a new second component, and sets the difference between the second component and the third component. A color space conversion process of using a new third component may be applied.
  • the conversion / quantization unit 120 performs conversion processing and quantization processing in block units.
  • the conversion / quantization unit 120 includes a conversion unit 121 and a quantization unit 122.
  • the conversion unit 121 performs conversion processing on the predicted residual (referred to as predicted residual regardless of whether or not the color space conversion processing is applied) output by the switching unit 111 or the color space conversion unit 112, and calculates the conversion coefficient. Then, the calculated conversion coefficient is output to the quantization unit 122. Specifically, the conversion unit 121 generates a conversion coefficient for each component by performing conversion processing on the predicted residual in block units.
  • the conversion process may be frequency conversion such as, for example, discrete cosine transform (DCT), discrete sine transform (DST), and / or discrete wavelet transform. Further, the conversion unit 121 outputs information regarding the conversion process to the entropy coding unit 130.
  • the conversion process includes conversion skip without conversion process, which is adopted in HEVC (High Efficiency Video Codec) and VVC (Versatile Video Coding) standard draft.
  • the conversion coefficient is set by scaling the predicted residual without performing the horizontal and vertical conversion processing, but the conversion skip according to the present embodiment is a conversion to which the conversion processing is applied only to the horizontal. Also includes conversions that apply conversion processing only to vertical and vertical.
  • the conversion unit 121 may perform a secondary conversion process that further applies the conversion process to the conversion coefficient obtained by the conversion process. Further, the secondary conversion process may be applied only to a part of the area of the conversion coefficient.
  • the quantization control unit 123 determines a scaling list (quantization matrix) used for the quantization process for the conversion coefficient generated by the conversion unit 121.
  • the scaling list a uniform (flat) scaling list in which the values of the elements of all the scaling lists are equal (for example, the values of all the elements are 16) is specified in advance.
  • the quantization control unit 123 makes it possible to set a plurality of non-uniform scaling lists in which different values are set for each element. When the scaling list used for a block with a large size is defined with a small size and expanded when actually used, different values are not always set for all the elements.
  • the entropy coding unit 130 outputs information indicating which scaling list is used for the quantization process as a stream.
  • the non-uniform scaling list is also a scaling list in which at least partially different values can be set as the values of the elements of the scaling list, that is, a variable scaling list.
  • the quantization control unit 123 determines the scaling list based on whether or not the color space conversion unit 112 performs the color space conversion process. Specifically, when the quantization control unit 123 sets to use a non-uniform scaling list in which the values of the elements of the scaling list are at least partially different, the color space conversion unit 112 performs the color space conversion process. Whether to use a non-uniform scaling list or a uniform scaling list is determined based on whether (that is, whether the switching unit 111 outputs the predicted residual to the color space conversion unit 112).
  • the quantization control unit determines a non-uniform scaling list as the scaling list used by the quantization unit 122 for the quantization process.
  • the quantization control unit 123 determines a uniform scaling list as the scaling list used by the quantization unit 122 for the quantization process.
  • the non-uniform scaling list is set for each color component, the properties differ depending on the target component. Therefore, when a coded block to which ACT is applied and a coded block to which ACT is not applied coexist in one image (picture), applying a non-uniform scaling list causes deterioration of image quality.
  • the color space conversion unit 112 performs the color space conversion process (that is, when ACT is applied)
  • deterioration of the image quality can be suppressed by using a uniform scaling list.
  • the quantization unit 122 quantizes the conversion coefficient output from the conversion unit 121 using the quantization parameter and the scaling list, and outputs the quantized conversion coefficient to the entropy coding unit 130 and the inverse quantization / inverse conversion unit 140. do.
  • the scaling list used for the quantization process in the quantization unit 122 is determined by the quantization control unit 123. Further, the quantization unit 122 outputs information related to the quantization process (specifically, information on the quantization parameter and the scaling list used in the quantization process) to the entropy coding unit 130 and the inverse quantization unit 141. ..
  • the quantization parameter is a parameter in which one value is set for one block.
  • the quantization parameter is a parameter that is commonly applied to each conversion coefficient in the block, and is a parameter that determines the roughness (step size) of quantization.
  • the scaling list constitutes a matrix (quantization matrix) consisting of values set for each component in one block. Specifically, the scaling list consists of values (weighting coefficients) set for each component of the i ⁇ j element according to the block size, and the quantization roughness is calculated for each component of the conversion coefficient from low frequency to high frequency. Used to adjust.
  • the entropy coding unit 130 signals the non-uniform scaling list to the decoding side.
  • the entropy coding unit 130 performs entropy coding on the quantization conversion coefficient output by the quantization unit 122, performs data compression to generate a bit stream (encoded data), and outputs the bit stream to the decoding side. do.
  • Huffman coding and / or CABAC Context-based Adaptive Binary Arithetic Coding
  • CABAC Context-based Adaptive Binary Arithetic Coding
  • the entropy coding unit 130 includes information on the conversion process input from the conversion unit 121 in the bit stream and signals it to the decoding side, or includes information on the prediction process input from the prediction unit 180 in the bit stream. Signaling to the decoding side.
  • the entropy coding unit 130 includes a color space conversion flag indicating whether or not ACT is applied in the bit stream for each coded block and signals it to the decoding side.
  • the inverse quantization / inverse transformation unit 140 performs the inverse quantization processing and the inverse transformation processing in block units.
  • the inverse quantization / inverse conversion unit 140 includes an inverse quantization unit 141 and an inverse conversion unit 142.
  • the inverse quantization unit 141 performs the inverse quantization process corresponding to the quantization process performed by the quantization unit 122. Specifically, the inverse quantization unit 141 restores and restores the conversion coefficient by inversely quantizing the quantization conversion coefficient output by the quantization unit 122 using the quantization parameter (Qp) and the scaling list. The converted conversion coefficient is output to the inverse conversion unit 142.
  • the scaling list used for the inverse quantization process in the inverse quantization unit 141 is determined by the quantization control unit 123.
  • the reverse conversion unit 142 performs reverse conversion processing corresponding to the conversion processing performed by the conversion unit 121 based on the conversion type information output by the conversion unit 121. For example, when the conversion unit 121 performs the discrete cosine transform, the inverse transform unit 142 performs the inverse discrete cosine transform. The inverse transformation unit 142 performs an inverse transformation process on the conversion coefficient output by the inverse quantization unit 141 to restore the predicted residual, and outputs the restored predicted residual, which is the restored predicted residual, to the synthesis unit 150. ..
  • the synthesis unit 150 synthesizes the restoration prediction residual output by the inverse conversion unit 142 with the prediction block output by the prediction unit 180 in pixel units.
  • the synthesis unit 150 adds each pixel value of the restoration prediction residual and each pixel value of the prediction block to decode (reconstruct) the coded block, and outputs the decoded block to the loop filter 160.
  • the decrypted block is sometimes called a reconstructed block.
  • the loop filter 160 performs a filter process on the decoded block output by the compositing unit 150, and outputs the decoded block after the filter process to the memory 170.
  • the memory 170 stores the decoded block after the filter processing output by the loop filter 160, and stores the decoded block as a decoded image in frame units.
  • the memory 170 outputs the stored decoded block or decoded image to the prediction unit 180.
  • the prediction unit 180 performs prediction processing in block units.
  • the prediction unit 180 generates a prediction block for each component by performing prediction processing such as intra prediction and inter prediction for the coded block.
  • the prediction unit 180 according to the present embodiment includes an inter prediction unit 181, an intra prediction unit 182, and a switching unit 183.
  • the inter-prediction unit 181 performs inter-prediction using the correlation between frames. Specifically, the inter-prediction unit 181 uses the decoded image stored in the memory 170 as a reference image, calculates a motion vector by a method such as block matching, predicts the coded block, and predicts the inter-prediction block. Is generated, and the generated inter-prediction block is output to the switching unit 183.
  • the inter-prediction unit 181 selects the optimum inter-prediction method from inter-prediction using a plurality of reference images (typically bi-prediction) and inter-prediction using one reference image (one-way prediction). Select and perform inter-prediction using the selected inter-prediction method.
  • the inter-prediction unit 181 outputs information (motion vector, etc.) related to the inter-prediction to the entropy coding unit 130.
  • the intra prediction unit 182 makes an intra prediction using the spatial correlation in the frame. Specifically, the intra prediction unit 182 generates an intra prediction block by referring to the decoded pixels around the coded block among the decoded images stored in the memory 170, and the generated intra prediction block. Is output to the switching unit 183. The intra prediction unit 182 selects an intra prediction mode to be applied to the coded target block from a plurality of intra prediction modes, and predicts the coded target block using the selected intra prediction mode.
  • the switching unit 183 switches between the inter prediction block output by the inter prediction unit 181 and the intra prediction block output by the intra prediction unit 182, and outputs one of the prediction blocks to the residual generation unit 110 and the synthesis unit 150.
  • the coding apparatus 1 divides and generates an image composed of three or more components including the first component, the second component, and the third component for each coded block. Encode to.
  • the coding apparatus 1 has a prediction unit 180 that generates a prediction block corresponding to the coding target block for each component, and a residual generation that generates a prediction residual representing the difference between the coding target block and the prediction block for each component.
  • Unit 110 a color space conversion unit that performs color space conversion processing on the predicted residual, a conversion unit 121 that generates a conversion coefficient by performing conversion processing on the predicted residual, and a quantization process for the conversion coefficient.
  • It has a quantization control unit 123 that determines a scaling list used for the above, and a quantization unit 122 that performs a quantization process on a conversion coefficient using the determined scaling list.
  • FIG. 2 is a diagram showing the operation of the quantization control unit 123 according to the present embodiment.
  • the quantization control unit 123 performs the operation shown in FIG. 2 for each coded block.
  • the operation of FIG. 2 is based on the premise that a non-uniform scaling list is used based on a factor other than ACT (color space conversion processing).
  • step S11 the quantization control unit 123 determines whether or not to apply ACT (color space conversion processing) to the coded target block.
  • step S12 the quantization control unit 123 performs non-uniform scaling as a scaling list used for the conversion process corresponding to the coded block. Determine the list.
  • the non-uniform scaling list may be designed according to the characteristics of each component in RGB space.
  • the non-uniform scaling list may be designed on the assumption that the luminance signal is mainly included in the G component.
  • the quantization control unit 123 applies a non-uniform first scaling list to the predicted residual of the R component, and applies a non-uniform second scaling list to the predicted residual of the G component.
  • a non-uniform third scaling list is applied to the predicted residuals of component B.
  • step S12 the quantization control unit 123 is uniform as a scaling list used for the conversion process corresponding to the coded target block. Determine the scaling list.
  • the uniform scaling list is a preset scaling list, that is, a scaling list shared in advance by the coding side and the decoding side.
  • the quantization control unit 123 applies a uniform scaling list to each of the predicted residual of the Y component, the predicted residual of the Cg component, and the predicted residual of the Co component.
  • the coding device 1 uses a uniform scaling list when ACT is applied. As a result, deterioration of image quality can be suppressed even when a coded target block to which ACT is applied and a coded target block to which ACT is not applied coexist in one image (picture).
  • FIG. 3 is a diagram showing a configuration of a decoding device 2 according to the present embodiment.
  • the decoding device 2 is composed of an entropy decoding unit 200, an inverse quantization / inverse conversion unit 210, an inverse quantization control unit 214, a switching unit 215, and a color space inverse conversion unit 216. It has a unit 220, a loop filter 230, a memory 240, and a prediction unit 250.
  • the entropy decoding unit 200 decodes the coded data (bit stream) and outputs the quantization conversion coefficient corresponding to the decoding target block to the inverse quantization / inverse conversion unit 210. Further, the entropy decoding unit 200 acquires information on the conversion process and the quantization process, and outputs the information on the conversion process and the quantization process to the inverse quantization / inverse conversion unit 210. Further, the entropy decoding unit 200 acquires information on the prediction process and outputs the information on the prediction process to the prediction unit 250. The entropy decoding unit 200 acquires the color space conversion flag for each coded block, and outputs the acquired color space conversion flag to the inverse quantization control unit 214 and the switching unit 215.
  • the inverse quantization control unit 214 performs the same operation as the quantization control unit 123 of the coding device 1 based on the color space conversion flag (see FIG. 2).
  • the inverse quantization / inverse transformation unit 210 performs the inverse quantization process and the inverse transformation process in block units.
  • the inverse quantization / inverse conversion unit 210 includes an inverse quantization unit 211 and an inverse conversion unit 212.
  • the inverse quantization unit 211 performs the inverse quantization process corresponding to the quantization process performed by the quantization unit 122 of the coding device 1.
  • the inverse quantization unit 211 restores and restores the conversion coefficient of the decoding target block by inversely quantizing the quantization conversion coefficient output by the entropy decoding unit 200 using the quantization parameter (Qp) and the scaling list.
  • the converted conversion coefficient is output to the inverse conversion unit 212.
  • the scaling list used for the dequantization process by the dequantization unit 211 is determined by the dequantization control unit 214.
  • the inverse conversion unit 212 performs an inverse conversion process corresponding to the conversion process performed by the conversion unit 121 of the coding device 1.
  • the inverse conversion unit 212 performs inverse transformation processing on the conversion coefficient output by the inverse quantization unit 211 to restore the predicted residual, and outputs the restored predicted residual (restored predicted residual) to the switching unit 215. ..
  • the switching unit 215 outputs the predicted residual of each component output by the inverse conversion unit 212 to either the synthesis unit 220 or the color space inverse conversion unit 216 based on the color space conversion flag.
  • the switching unit 111 outputs the predicted residual to the conversion / quantization unit 120 when the color space inverse conversion process (ACT) is not performed, and outputs the predicted residual to the color space inverse conversion unit 120 when the color space inverse conversion process is performed. Output to 216.
  • the color space inverse conversion unit 216 performs color space inverse conversion processing, which is the inverse processing of the color space conversion processing performed by the color space conversion unit 112 of the coding device 1, and synthesizes the predicted residual after the color space inverse conversion processing. Output to 220. Specifically, the following inverse transformation calculation is performed using the Y component, Cg component, and Co component of the predicted residual after restoration.
  • the synthesizing unit 220 decodes (reconstructs) the original block by synthesizing the prediction residual output by the switching unit 215 or the color space inverse conversion unit 216 and the prediction block output by the prediction unit 250 on a pixel-by-pixel basis. Then, the decoded block is output to the loop filter 230.
  • the loop filter 230 performs a filter process on the decoded block output by the synthesis unit 220, and outputs the decoded block after the filter process to the memory 240.
  • the memory 240 stores the decoded blocks output by the compositing unit 220, and stores the decoded blocks as a decoded image in frame units.
  • the memory 240 outputs the decoded block or the decoded image to the prediction unit 250. Further, the memory 240 outputs the decoded image in frame units to the outside of the decoding device 2.
  • the prediction unit 250 makes a prediction for each component in block units.
  • the prediction unit 250 includes an inter-prediction unit 251, an intra-prediction unit 252, and a switching unit 253.
  • the inter-prediction unit 251 performs inter-prediction using the correlation between frames. Specifically, the inter-prediction unit 251 encodes the decoded image stored in the memory 240 as a reference image based on the information related to the inter-prediction (for example, motion vector information) output by the entropy decoding unit 200. The target block is predicted, an inter-prediction block is generated, and the generated inter-prediction block is output to the switching unit 253.
  • the inter-prediction unit 251 encodes the decoded image stored in the memory 240 as a reference image based on the information related to the inter-prediction (for example, motion vector information) output by the entropy decoding unit 200.
  • the target block is predicted, an inter-prediction block is generated, and the generated inter-prediction block is output to the switching unit 253.
  • the intra prediction unit 252 performs intra prediction using the spatial correlation in the frame. Specifically, the intra prediction unit 252 uses the intra prediction mode corresponding to the information related to the intra prediction (for example, the intra prediction mode information) output by the entropy decoding unit 200, and the decoded image stored in the memory 240. An intra prediction block is generated with reference to the decoded pixels around the coded block, and the generated intra prediction block is output to the switching unit 253.
  • the intra prediction mode information for example, the intra prediction mode information
  • the switching unit 253 switches between the inter prediction block output by the inter prediction unit 251 and the intra prediction block output by the intra prediction unit 252, and outputs one of the prediction blocks to the synthesis unit 220.
  • the decoding device 2 decodes each image to be decoded, which is generated by dividing an image composed of three or more components including the first component, the second component, and the third component. do.
  • the decoding device 2 has an entropy decoding unit 200 that decodes the quantization conversion coefficient of the block to be decoded from the bit stream for each component, a prediction unit 250 that generates a prediction block corresponding to the block to be decoded for each component, and the conversion coefficient.
  • the inverse quantization control unit 214 that determines the scaling list used for the inverse transformation processing
  • the inverse quantization unit 211 that generates the conversion coefficient by performing the inverse transformation processing on the quantization transformation coefficient, and the determined scaling list.
  • the inverse transformation unit 212 that generates the predicted residual by performing the inverse transformation processing on the conversion coefficient, the color space inverse transformation unit 216 that performs the color space inverse transformation processing on the predicted residual, and the predicted residual and prediction. It has a synthesizing unit 220 that generates a decoding block by synthesizing the blocks.
  • the inverse quantization control unit 214 determines the scaling list based on the color space inverse conversion process (color space conversion flag). In the present embodiment, the inverse quantization control unit 214 is based on whether or not the color space inverse transformation unit 216 performs the color space inverse transformation processing when the coding side sets that a non-uniform scaling list is used. , Use a non-uniform scaling list or determine a uniform scaling list.
  • the inverse quantization control unit 214 is used for the inverse quantization process when the color space inverse transformation unit 216 does not perform the color space inverse transformation process. Determine a non-uniform scaling list as the scaling list.
  • the inverse quantization control unit 214 determines a uniform scaling list as the scaling list used for the inverse quantization process.
  • the decoding device 2 uses a uniform scaling list when applying ACT. As a result, deterioration of image quality can be suppressed even when a coded target block to which ACT is applied and a coded target block to which ACT is not applied coexist in one image (picture).
  • the quantization control unit 123 of the coding device 1 changes the correspondence between the three or more components constituting the image and the scaling list for each component based on whether or not ACT is applied.
  • FIG. 4 is a diagram showing the operation of the quantization control unit 123 according to this modified example.
  • step S22 when the quantization control unit 123 of the coding apparatus 1 does not perform the color space conversion process (step S21: NO), in step S22, the first component R component is first.
  • the scaling list is determined for the G component, which is the second component, and the third scaling list is determined for the B component, which is the third component (see Table 2).
  • step S21: YES when the color space conversion unit performs the color space conversion process (step S21: YES), the correspondence relationship is changed so as to determine the second scaling list for the Y component which is the first component in step S22 (step S21: YES). See Table 3).
  • the second scaling list for the G component is applied to the Y component.
  • an appropriate scaling list can be applied to the Y component, so that deterioration of image quality can be suppressed.
  • the correspondence is changed so that the third scaling list is determined for the Cg component which is the second component and the first scaling list is determined for the Co component which is the third component. doing.
  • the inverse quantization control unit 214 of the decoding device 2 applies the ACT when the coding device 1 sets that a non-uniform scaling list is used (that is, the color space inverse conversion unit 216 is in the color space.
  • the correspondence between the three or more components constituting the image and the scaling list for each component is changed based on whether or not the inverse transformation process is performed).
  • the inverse quantization control unit 214 sets the first scaling list for the R component which is the first component and the G component which is the second component.
  • the second scaling list is determined
  • the third scaling list is determined for the B component, which is the third component (see Table 2).
  • the inverse quantization control unit 214 determines the second scaling list for the Y component which is the first component (see Table 3).
  • the correspondence after the change (that is, the correspondence between the Y component, the Cg component, and the Co component and the first to third scaling lists). It is assumed that the relationship) is fixed (see Table 3).
  • the correspondence may be variably set by signaling the correspondence from the coding device 1 (entropy coding unit 130) to the decoding device 2.
  • the coding device 1 (entropy coding unit 130) provides information indicating the changed correspondence (that is, the correspondence between the Y component, the Cg component, and the Co component and the first to third scaling lists), which will be described later. It may be included in the adaptation parameter set (APS) to be signaled.
  • the entropy coding unit 130 of the coding device 1 includes a sequence parameter set (SPS) or an adaptation parameter set (APS) including information (control flag) indicating whether or not to perform a scaling list determination operation based on the color space conversion process. May be output.
  • the entropy decoding unit 200 of the decoding device 2 may acquire an SPS or APS including information indicating whether or not to perform a scaling list determination operation based on the color space inverse transformation process.
  • the entropy coding unit 130 of the coding apparatus 1 includes SPS including information (control flag) indicating whether to use the scaling list determination operation of the above-described embodiment or the scaling list determination operation of modification 1.
  • SPS including information (control flag) indicating whether to use the scaling list determination operation of the above-described embodiment or the scaling list determination operation of modification 1.
  • APS may be output.
  • the entropy decoding unit 200 of the decoding device 2 may acquire SPS or APS including information indicating whether to use the scaling list determination operation of the above-described embodiment or the scaling list determination operation of the first modification. ..
  • the entropy coding unit 130 of the coding device 1 may signal the control flag depending on whether the chroma format is 4: 4: 4, or ACT can be applied to the sequence in SPS or the like. It may be configured to control the signaling of the control flag depending on the presence or absence.
  • the SPS may be configured to signal the control flag only when a flag indicating that the ACT can be applied to the sequence to be encoded is signaled.
  • the APS may be configured to control the signaling of the control flag according to the flag indicating whether or not the scaling list for the color difference signal is included in the APS.
  • the APS may be configured to signal the control flag only when a scaling list for the color difference signal is included.
  • FIG. 5 is a diagram showing a bit stream output by the entropy coding unit 130.
  • the bit stream consists of a plurality of NAL units and a start code provided at the beginning of each NAL unit.
  • each NAL unit comprises a NAL unit header and a payload.
  • FIG. 6 is a diagram showing the type of NAL unit.
  • the type of NAL unit is identified by nal_unit_type in the NAL unit header.
  • the types of NAL units are classified into VCL (Video Coding Layer) class and non-VCL class.
  • the VCL class is a class corresponding to a coded bit stream of a slice including a CTU (Codeing Tree Unit) to be coded.
  • the VCL class is a class corresponding to control information required for decoding, for example, VPS (Video Parameter Set), SPS (Sequence Parameter Set), PPS (Picture Parameter Set), and APS (Adaptation Parameter Set).
  • VPS, SPS, PPS, and APS are signaled by different NAL units.
  • FIG. 7 is a diagram showing the relationship between VPS, SPS, PPS, and APS.
  • the VPS has its own ID (vps_video_parameter_set_id) and is referred to by the SPS.
  • the VPS stores information about the entire decoding of the bitstream.
  • VPS includes information such as the maximum number of layers and DPB (Decoded Picture Buffer).
  • SPS has its own ID (sps_seq_parameter_set_id) and is referred to by PPS.
  • the SPS has a VPS ID (sps_video_parameter_set_id) that it refers to.
  • the SPS stores information necessary for decoding the sequence.
  • SPS is a sequence unit of chroma format, maximum width / height, bit depth, sub-picture information (number, start coordinates of each sub-picture, width, height, etc.), and each coding tool (each function).
  • On / off control and / or information such as VUI (Video usability information) is included.
  • the on / off control information for each sequence includes a flag (sps_scaling_list_enebled_flag) indicating whether or not to apply the scaling list.
  • PPS has its own ID (pps_pic_parameter_set_id) and is referred to by PH (Picture Header). Further, the PPS has an ID (pps_seq_parameter_set_id) of the SPS referred to by itself.
  • the PPS stores information necessary for decoding a picture (Picture). For example, PPS includes picture width / height, tile division information (definition of the number of vertical and horizontal tiles, width / height of each row / column, etc.), and / or slice division information (slice division shape (rect / non-rect)). ), In the case of rect, information such as the number of tiles in the width / height direction of each rect) is included.
  • PH is header information for each picture. It is the slice in the picture that refers to the PH. Since the slice can implicitly determine the picture in which it is included, it is not necessary to define the PH ID.
  • PH holds the ID (ph_pic_parameter_set_id) of the referenced PPS.
  • PH stores control information for the picture. For example, PH includes information such as on / off control of each coding tool (each function) for the picture. PH contains information indicating application on / off of each tool of ALF, LMCS, and scaling list. The on / off control information for each picture includes a flag (ph_scaling_list_present_flag) indicating whether or not to apply the scaling list.
  • PH includes the ID of APS that stores the parameter information of the tools.
  • APS is a syntax structure for parameter transmission for coding tools that need to transmit a relatively large number of parameters such as ALF, LMCS, and scaling lists. APS holds its own ID, and this ID is referred to by PH.
  • the quantization process can be controlled by one control flag even when a plurality of scaling lists are specified. , The amount of flag information can be reduced.
  • the control information (control flag) related to the above-described embodiment and its modification in the APS the scaling list applied to each of the plurality of set scaling lists is controlled according to the application of the color space conversion. Since it can be determined whether or not it is possible, more flexible quantization processing becomes possible.
  • a program may be provided that causes a computer to execute each process performed by the encoding device 1 described above. Further, a program for causing the computer to execute each process performed by the decoding device 2 may be provided.
  • the program may be recorded on a computer-readable medium. Computer-readable media allow you to install programs on your computer.
  • the computer-readable medium on which the program is recorded may be a non-transient recording medium.
  • the non-transient recording medium is not particularly limited, but may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.
  • a circuit that executes each process performed by the coding device 1 may be integrated, and the coding device 1 may be configured by a semiconductor integrated circuit (chipset, SoC).
  • a circuit that executes each process performed by the decoding device 2 may be integrated, and the decoding device 2 may be configured by a semiconductor integrated circuit (chipset, SoC).

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

符号化装置は、符号化対象ブロックごとに符号化する符号化装置であって、前記符号化対象ブロックに対応する予測ブロックを成分ごとに生成する予測部と、前記符号化対象ブロックと前記予測ブロックとの差を表す予測残差を成分ごとに生成する残差生成部と、前記成分ごとの予測残差に対して色空間変換処理を行う色空間変換部と、前記予測残差に対して変換処理を行うことで変換係数を生成する変換部と、前記変換係数に対する量子化処理に用いるスケーリングリストを決定する量子化制御部と、前記決定されたスケーリングリストを用いて、前記変換係数に対して前記量子化処理を行う量子化部と、を備え、前記量子化制御部は、前記色空間変換処理に基づいて前記スケーリングリストを決定する。

Description

符号化装置、復号装置、及びプログラム
 本発明は、符号化装置、復号装置、及びプログラムに関する。
 VVC規格案においては、入力映像のクロマフォーマットが4:4:4である場合、原画像を分割した符号化対象ブロックとその予測ブロックとの差分である予測残差を得た後に、予測残差の色空間(RGB空間)をYCgCo空間に変換し、色空間変換後の予測残差に対して変換処理・エントロピー符号化処理等の符号化処理を行う適応色変換(ACT:Adaptive Colour Transform)と呼ばれる技術が採用されている(非特許文献1参照)。
 符号化装置は、符号化対象ブロックごとにACTを適用するか否かを制御可能であり、符号化対象ブロックごとにACT適用フラグをストリーム出力する。このため、ACTにより、RGB空間において予測残差に対して変換処理・量子化処理を適用する符号化対象ブロックと、予測残差をRGB空間からYCgCo空間に変換した上で変換処理・量子化処理を適用する符号化対象ブロックとが画像(ピクチャ)全体で混在することとなる。
 ところで、VVCでは、予測残差に対して変換処理を施して得られた変換係数の量子化において、周波数成分ごとに量子化ステップを制御するスケーリングリスト(量子化行列とも呼ばれる)が導入されている。スケーリングリストは、入力映像信号を構成する3つの色成分(例えば、輝度成分、第1色差成分、及び第2色差成分)のそれぞれに対して個別に設定可能となっており、符号化装置は、スケーリングリストを適用するか否か、及び、適用する場合にはどのようなスケーリングリストを適用するかを示す情報を復号側にシグナリングする。
 第1の態様に係る符号化装置は、第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した符号化対象ブロックごとに符号化する符号化装置であって、前記符号化対象ブロックに対応する予測ブロックを成分ごとに生成する予測部と、前記符号化対象ブロックと前記予測ブロックとの差を表す予測残差を成分ごとに生成する残差生成部と、前記成分ごとの予測残差に対して色空間変換処理を行う色空間変換部と、前記予測残差に対して変換処理を行うことで変換係数を生成する変換部と、前記変換係数に対する量子化処理に用いるスケーリングリストを決定する量子化制御部と、前記決定されたスケーリングリストを用いて、前記変換係数に対して前記量子化処理を行う量子化部と、を備え、前記量子化制御部は、前記色空間変換処理に基づいて前記スケーリングリストを決定することを要旨とする。
 第2の態様に係る復号装置は、第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した復号対象ブロックごとに復号する復号装置であって、ビットストリームから前記復号対象ブロックの量子化変換係数を成分ごとに復号するエントロピー復号部と、前記復号対象ブロックに対応する予測ブロックを成分ごとに生成する予測部と、変換係数に対する逆変換処理に用いるスケーリングリストを決定する逆量子化制御部と、前記量子化変換係数に対する逆変換処理を行うことで前記変換係数を生成する逆量子化部と、前記決定されたスケーリングリストを用いて前記変換係数に対して前記逆変換処理を行うことで予測残差を生成する逆変換部と、前記予測残差に対して色空間逆変換処理を行う色空間逆変換部と、前記予測残差と前記予測ブロックとを合成することで復号ブロックを生成する合成部と、を備え、前記逆量子化制御部は、前記色空間逆変換処理に基づいて前記スケーリングリストを決定することを要旨とする。
 第3の態様に係るプログラムは、コンピュータを第1の態様に係る符号化装置として機能させる。
 第4の態様に係るプログラムは、コンピュータを第2の態様に係る復号装置として機能させる。
実施形態に係る符号化装置の構成を示す図である。 実施形態に係る量子化制御部及び逆量子化制御部の動作を示す図である。 実施形態に係る復号装置の構成を示す図である。 変更例に係る量子化制御部及び逆量子化制御部の動作を示す図である。 エントロピー符号化部が出力するビットストリームを示す図である。 NALユニットのタイプを示す図である。 VPS、SPS、PPS、及びAPSの関係を示す図である。
 ACTにより、符号化対象ブロックごとに予測残差の色空間変換の有無が制御可能であることから、RGB映像である入力映像を符号化する際に、隣接する2つの符号化対象ブロックのうち、一方がACTを適用する符号化対象ブロックであり、他方がACTを適用しない符号化対象ブロックであり得る。
 表1に示すように、ACTを適用する符号化対象ブロックについては、予測残差がRGB空間からYCgCo空間に変換された後に、Y成分の予測残差に第1スケーリングリストが適用され、Cg成分の予測残差に第2スケーリングリストが適用され、Co成分の予測残差に第3スケーリングリストが適用される。一方、ACTを適用しない符号化対象ブロックについては、予測残差がRGB空間のまま、R成分の予測残差に第1スケーリングリストが適用され、G成分の予測残差に第2スケーリングリストが適用され、B成分の予測残差に第3スケーリングリストが適用される。
Figure JPOXMLDOC01-appb-T000001
 一般的に、RGB空間における輝度成分の多くはG成分に集中することが知られており、RGB空間の映像に用いるスケーリングリストは、輝度信号がG成分に主に含まれていることを前提に設計される。輝度信号は、色差信号と比較して高い周波数成分を多く含むことが知られていることから、輝度信号に適用するよう設計されたスケーリングリストは、色差信号に適用するよう設計されたスケーリングリストと性質が大きく異なる可能性が高い。
 しかしながら、ACTを予測残差に適用することにより、輝度信号を多く含まないR成分に対して設計した第1スケーリングリストがACTによる変換後のY成分に適用されるため、本来性質の異なる成分に対して適用するよう設計されたスケーリングリストが適用されてしまい、視覚的な劣化を生じる恐れがある。
 そこで、本開示は、ACTを適用する場合であっても画質の劣化を抑制することを目的とする。
 図面を参照して、実施形態に係る符号化装置及び復号装置について説明する。実施形態に係る符号化装置及び復号装置は、MPEG(Moving Picture Experts Group)に代表される動画像の符号化及び復号をそれぞれ行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
 <符号化装置>
 まず、本実施形態に係る符号化装置の構成について説明する。図1は、本実施形態に係る符号化装置1の構成を示す図である。
 図1に示すように、符号化装置1は、ブロック分割部100と、残差生成部110と、切替部111と、色空間変換部112と、変換・量子化部120と、量子化制御部123と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、ループフィルタ160と、メモリ170と、予測部180とを有する。
 ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像である原画像を複数の画像ブロックに分割し、分割により得た画像ブロックを残差生成部110に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックの形状は正方形に限らず長方形(非正方形)であってもよい。画像ブロックは、符号化装置1が符号化処理を行う単位(すなわち、符号化対象ブロック)であり、且つ復号装置が復号処理を行う単位(すなわち、復号対象ブロック)である。このような画像ブロックはCU(Coding Unit)と呼ばれることがある。
 本実施形態において、入力画像がRGB信号であり、クロマフォーマットが4:4:4である場合について主として説明する。「R」成分は第1成分に相当し、「G」成分は第2成分に相当し、「B」成分は第3成分に相当する。ブロック分割部100は、画像を構成するR成分、G成分、及びB成分のそれぞれに対してブロック分割を行うことでブロックを出力する。以下の符号化装置の説明において、各成分を区別しないときは単に符号化対象ブロックと呼ぶ。
 残差生成部110は、ブロック分割部100が出力する符号化対象ブロックと、符号化対象ブロックを予測部180が予測して得た予測ブロックとの差分(誤差)を表す予測残差を算出する。具体的には、残差生成部110は、符号化対象ブロックの各画素値から予測ブロックの各画素値を減算することにより予測残差を算出し、算出した予測残差を切替部111に出力する。本実施形態において、残差生成部110は、各成分の符号化対象ブロックと、各成分の予測ブロックとの差分により各成分の予測残差を生成する。
 切替部111は、残差生成部110が出力する各成分の予測残差を変換・量子化部120及び色空間変換部112のいずれか一方に出力する。切替部111は、色空間変換処理(ACT)を行わない場合は予測残差を変換・量子化部120に出力し、色空間変換処理を行う場合は予測残差を色空間変換部112に出力する。
 色空間変換部112は、各成分の予測残差に対して色空間変換処理を行い、色空間変換処理後の予測残差を変換・量子化部120に出力する。色空間変換部112は、符号化対象ブロックの予測残差のR成分、G成分、及びB成分について下記のような変換計算を行うことで、新たな予測残差を生成する。
  Co=R-B
  t=B+(Co>>1)
  Cg=G-t
  Y=t+(Cg>>1)
 但し、「>>」は右シフト演算を表す。また、「Y」成分は第1成分に相当し、「Gg」成分は第2成分に相当し、「Co」成分は第3成分に相当する。
 色空間変換部112は、符号化対象ブロックごとに色変換処理を行うか否かを制御可能である。エントロピー符号化部130は、当該符号化ブロックに対して色変換処理を行ったか否かを示すフラグをビットストリーム中でシグナリングする。
 なお、色空間変換部112における色空間変換処理は各成分に対する加算・減算・乗算・除算・シフト処理などにより新たな成分により構成される予測残差を生成すればよく、必ずしも色空間変換を行う必要はない。また、色空間変換処理は、すべての成分に影響を及ぼす変換である必要はない。例えば、色空間変換部112は、第1成分を変更せずに維持し、第2成分と第3成分との平均値を新たな第2成分とし、第2成分と第3成分との差分を新たな第3成分とする、という色空間変換処理を適用してもよい。
 変換・量子化部120は、ブロック単位で変換処理及び量子化処理を行う。変換・量子化部120は、変換部121と、量子化部122とを有する。
 変換部121は、切替部111又は色空間変換部112が出力する予測残差(色空間変換処理の適用の有無にかかわらず予測残差と呼ぶ)に対して変換処理を行って変換係数を算出し、算出した変換係数を量子化部122に出力する。具体的には、変換部121は、予測残差に対してブロック単位で変換処理を行うことで成分ごとの変換係数を生成する。変換処理は、例えば離散コサイン変換(DCT)、離散サイン変換(DST)、及び/又は離散ウェーブレット変換などの周波数変換であればよい。また、変換部121は、変換処理に関する情報をエントロピー符号化部130に出力する。
 変換処理には、HEVC(High Efficiency Video Codec)やVVC(Versatile Video Coding)規格案で採用されている、変換処理を行わない変換スキップを含む。HEVCの変換スキップモードでは水平及び垂直の変換処理を行わずに、予測残差に対しスケーリングを施すことによって変換係数としているが、本実施形態に係る変換スキップは、水平のみ変換処理を適用する変換や垂直のみ変換処理を適用する変換も含む。また、変換部121は、変換処理により得られた変換係数に対してさらに変換処理を適用する二次変換処理を行ってもよい。また、二次変換処理は、変換係数の一部の領域のみに適用してもよい。
 量子化制御部123は、変換部121により生成された変換係数に対する量子化処理に用いるスケーリングリスト(量子化行列)を決定する。ここで、スケーリングリストとして、すべてのスケーリングリストの要素の値が等しい(例えば、すべての要素の値が16である)均一な(フラットな)スケーリングリストをあらかじめ規定する。量子化制御部123は、要素ごとに異なる値を設定された不均一なスケーリングリストを複数設定可能とする。なお、サイズが大きいブロックに対して用いるスケーリングリストを小さいサイズで定義し、実際に用いる際に拡大する場合、必ずしもすべての要素に異なる値が設定されるとは限らない。エントロピー符号化部130は、どのスケーリングリストを用いて量子化処理を行うかを示す情報をストリーム出力する。なお、不均一なスケーリングリストは、スケーリングリストの要素の値として少なくとも部分的に異なる値を設定可能なスケーリングリスト、すなわち、可変なスケーリングリストでもある。
 本実施形態において、量子化制御部123は、色空間変換部112が色空間変換処理を行うか否かに基づいてスケーリングリストを決定する。具体的には、量子化制御部123は、スケーリングリストの要素の値が少なくとも部分的に異なる不均一なスケーリングリストを用いる旨を設定した場合において、色空間変換部112が色空間変換処理を行うか(すなわち、切替部111が予測残差を色空間変換部112に出力したか)否かに基づいて、不均一なスケーリングリストを用いるか又は均一なスケーリングリストを用いるかを決定する。
 例えば、量子化制御部は、色空間変換部112が色空間変換処理を行わない場合、量子化部122が量子化処理に用いるスケーリングリストとして不均一なスケーリングリストを決定する。一方、色空間変換部112が色空間変換処理を行う場合、量子化制御部123は、量子化部122が量子化処理に用いるスケーリングリストとして均一なスケーリングリストを決定する。
 ここで、不均一なスケーリングリストは色成分ごとに設定されるため、対象とする成分に応じて性質が異なる。このため、1つの画像(ピクチャ)内において、ACTを適用する符号化対象ブロックとACTを適用しない符号化対象ブロックとが混在する場合、不均一なスケーリングリストを適用すると、画質の劣化を引き起こす。本実施形態においては、色空間変換部112が色空間変換処理を行う場合(すなわち、ACTを適用する場合)、均一なスケーリングリストを用いることにより、画質の劣化を抑制可能である。
 量子化部122は、変換部121から出力される変換係数を量子化パラメータ及びスケーリングリストを用いて量子化し、量子化した変換係数をエントロピー符号化部130及び逆量子化・逆変換部140に出力する。ここで、量子化部122における量子化処理に用いるスケーリングリストは量子化制御部123により決定される。また、量子化部122は、量子化処理に関する情報(具体的には、量子化処理で用いた量子化パラメータ及びスケーリングリストの情報)を、エントロピー符号化部130及び逆量子化部141に出力する。
 なお、量子化パラメータは、1つのブロックに対して1つの値が設定されるパラメータである。具体的には、量子化パラメータは、ブロック内の各変換係数に対して共通して適用されるパラメータであって、量子化の粗さ(ステップサイズ)を定めるパラメータである。
 スケーリングリストは、1つのブロック内の成分ごとに設定される値からなる行列(量子化行列)を構成する。具体的には、スケーリングリストは、ブロックサイズに応じてi×j要素の成分ごとに設定される値(重み付け係数)からなり、変換係数の低周波から高周波にわたる成分ごとに量子化の粗さを調整するために用いられる。エントロピー符号化部130は、不均一なスケーリングリストについては復号側にシグナリングする。
 エントロピー符号化部130は、量子化部122が出力する量子化変換係数に対してエントロピー符号化を行い、データ圧縮を行ってビットストリーム(符号化データ)を生成し、ビットストリームを復号側に出力する。エントロピー符号化には、ハフマン符号及び/又はCABAC(Context-based Adaptive Binary Arithmetic Coding)等を用いることができる。また、エントロピー符号化部130は、変換部121から入力された変換処理に関する情報をビットストリームに含めて復号側にシグナリングしたり、予測部180から入力された予測処理に関する情報をビットストリームに含めて復号側にシグナリングしたりする。さらに、エントロピー符号化部130は、ACTの適用有無を示す色空間変換フラグを符号化対象ブロックごとにビットストリームに含めて復号側にシグナリングする。
 逆量子化・逆変換部140は、ブロック単位で逆量子化処理及び逆変換処理を行う。逆量子化・逆変換部140は、逆量子化部141と、逆変換部142とを有する。
 逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122が出力する量子化変換係数を、量子化パラメータ(Qp)及びスケーリングリストを用いて逆量子化することにより変換係数を復元し、復元した変換係数を逆変換部142に出力する。ここで、逆量子化部141における逆量子化処理に用いるスケーリングリストは量子化制御部123により決定される。
 逆変換部142は、変換部121が出力する変換種別情報に基づいて、変換部121が行う変換処理に対応する逆変換処理を行う。例えば、変換部121が離散コサイン変換を行った場合、逆変換部142は逆離散コサイン変換を行う。逆変換部142は、逆量子化部141が出力する変換係数に対して逆変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。
 合成部150は、逆変換部142が出力する復元予測残差を、予測部180が出力する予測ブロックと画素単位で合成する。合成部150は、復元予測残差の各画素値と予測ブロックの各画素値を加算して符号化対象ブロックを復号(再構成)し、復号済みブロックをループフィルタ160に出力する。なお、復号済みブロックは、再構成ブロックと呼ばれることもある。
 ループフィルタ160は、合成部150が出力する復号済みブロックに対してフィルタ処理を行い、フィルタ処理後の復号済みブロックをメモリ170に出力する。
 メモリ170は、ループフィルタ160が出力するフィルタ処理後の復号済みブロックを記憶し、復号済みブロックをフレーム単位で復号済み画像として蓄積する。メモリ170は、記憶している復号済みブロック若しくは復号済み画像を予測部180に出力する。
 予測部180は、ブロック単位で予測処理を行う。予測部180は、符号化対象ブロックに対するイントラ予測及びインター予測などの予測処理を施すことにより成分ごとの予測ブロックを生成する。本実施形態に係る予測部180は、インター予測部181と、イントラ予測部182と、切替部183とを有する。
 インター予測部181は、フレーム間の相関を利用したインター予測を行う。具体的には、インター予測部181は、メモリ170に記憶された復号済み画像を参照画像として用いて、ブロックマッチングなどの手法により動きベクトルを算出し、符号化対象ブロックを予測してインター予測ブロックを生成し、生成したインター予測ブロックを切替部183に出力する。ここで、インター予測部181は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部181は、インター予測に関する情報(動きベクトル等)をエントロピー符号化部130に出力する。
 イントラ予測部182は、フレーム内の空間的な相関を利用したイントラ予測を行う。具体的には、イントラ予測部182は、メモリ170に記憶された復号済み画像のうち、符号化対象ブロックの周辺にある復号済み画素を参照してイントラ予測ブロックを生成し、生成したイントラ予測ブロックを切替部183に出力する。イントラ予測部182は、複数のイントラ予測モードの中から、符号化対象ブロックに適用するイントラ予測モードを選択し、選択したイントラ予測モードを用いて符号化対象ブロックを予測する。
 切替部183は、インター予測部181が出力するインター予測ブロックとイントラ予測部182が出力するイントラ予測ブロックとを切り替えて、いずれかの予測ブロックを残差生成部110及び合成部150に出力する。
 このように、本実施形態に係る符号化装置1は、第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した符号化対象ブロックごとに符号化する。符号化装置1は、符号化対象ブロックに対応する予測ブロックを成分ごとに生成する予測部180と、符号化対象ブロックと予測ブロックとの差を表す予測残差を成分ごとに生成する残差生成部110と、予測残差に対して色空間変換処理を行う色空間変換部と、予測残差に対して変換処理を行うことで変換係数を生成する変換部121と、変換係数に対する量子化処理に用いるスケーリングリストを決定する量子化制御部123と、決定されたスケーリングリストを用いて、変換係数に対して量子化処理を行う量子化部122とを有する。
 次に、本実施形態に係る量子化制御部123の動作について説明する。図2は、本実施形態に係る量子化制御部123の動作を示す図である。量子化制御部123は、符号化対象ブロックごとに図2の動作を行う。なお、図2の動作は、ACT(色空間変換処理)以外の要因に基づき不均一なスケーリングリストを用いる旨が設定されたことを前提とした動作である。
 図2に示すように、ステップS11において、量子化制御部123は、符号化対象ブロックに対してACT(色空間変換処理)を適用するか否かを判定する。
 符号化対象ブロックに対してACTを適用しない場合(ステップS11:NO)、ステップS12において、量子化制御部123は、当該符号化対象ブロックに対応する変換処理に用いるスケーリングリストとして、不均一なスケーリングリストを決定する。不均一なスケーリングリストは、RGB空間の各成分の特性に合わせて設計されたものであってもよい。例えば、不均一なスケーリングリストは、輝度信号がG成分に主に含まれていることを前提に設計されたものであってもよい。例えば、量子化制御部123は、R成分の予測残差に対して、不均一な第1スケーリングリストを適用し、G成分の予測残差に対して、不均一な第2スケーリングリストを適用し、B成分の予測残差に対して、不均一な第3スケーリングリストを適用する。
 一方、符号化対象ブロックに対してACTを適用する場合(ステップS11:YES)、ステップS12において、量子化制御部123は、当該符号化対象ブロックに対応する変換処理に用いるスケーリングリストとして、均一なスケーリングリストを決定する。均一なスケーリングリストは、事前設定されたスケーリングリスト、すなわち、符号化側及び復号側で予め共有しているスケーリングリストである。例えば、量子化制御部123は、Y成分の予測残差、Cg成分の予測残差、及びCo成分の予測残差のそれぞれに対して、均一なスケーリングリストを適用する。
 このように、本実施形態に係る符号化装置1は、ACTを適用する場合、均一なスケーリングリストを用いる。これにより、1つの画像(ピクチャ)内においてACTを適用する符号化対象ブロックとACTを適用しない符号化対象ブロックとが混在する場合であっても、画質の劣化を抑制可能である。
 <復号装置>
 次に、本実施形態に係る復号装置について、符号化装置1との相違点を主として説明する。図3は、本実施形態に係る復号装置2の構成を示す図である。
 図3に示すように、復号装置2は、エントロピー復号部200と、逆量子化・逆変換部210と、逆量子化制御部214と、切替部215と、色空間逆変換部216と、合成部220と、ループフィルタ230と、メモリ240と、予測部250とを有する。
 エントロピー復号部200は、符号化データ(ビットストリーム)を復号して、復号対象ブロックに対応する量子化変換係数を逆量子化・逆変換部210に出力する。また、エントロピー復号部200は、変換処理及び量子化処理に関する情報を取得し、変換処理及び量子化処理に関する情報を逆量子化・逆変換部210に出力する。さらに、エントロピー復号部200は、予測処理に関する情報を取得し、予測処理に関する情報を予測部250に出力する。エントロピー復号部200は、符号化対象ブロックごとの色空間変換フラグを取得し、取得した色空間変換フラグを逆量子化制御部214及び切替部215に出力する。
 逆量子化制御部214は、色空間変換フラグに基づいて、符号化装置1の量子化制御部123と同様な動作を行う(図2参照)。
 逆量子化・逆変換部210は、ブロック単位で逆量子化処理及び逆変換処理を行う。逆量子化・逆変換部210は、逆量子化部211と、逆変換部212とを有する。
 逆量子化部211は、符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー復号部200が出力する量子化変換係数を、量子化パラメータ(Qp)及びスケーリングリストを用いて逆量子化することにより、復号対象ブロックの変換係数を復元し、復元した変換係数を逆変換部212に出力する。ここで、逆量子化部211による逆量子化処理に用いるスケーリングリストは、逆量子化制御部214により決定される。
 逆変換部212は、符号化装置1の変換部121が行う変換処理に対応する逆変換処理を行う。逆変換部212は、逆量子化部211が出力する変換係数に対して逆変換処理を行って予測残差を復元し、復元した予測残差(復元予測残差)を切替部215に出力する。
 切替部215は、色空間変換フラグに基づいて、逆変換部212が出力する各成分の予測残差を合成部220及び色空間逆変換部216のいずれか一方に出力する。切替部111は、色空間逆変換処理(ACT)を行わない場合は予測残差を変換・量子化部120に出力し、色空間逆変換処理を行う場合は予測残差を色空間逆変換部216に出力する。
 色空間逆変換部216は、符号化装置1の色空間変換部112が行う色空間変換処理の逆処理である色空間逆変換処理を行い、色空間逆変換処理後の予測残差を合成部220に出力する。具体的には、復元後の予測残差のY成分、Cg成分、Co成分を用いて下記のような逆変換計算を行う。
  t=Y-(Cg>>1)
  G=Cg+t
  B=t-(Co>>1)
  R=Co+B
 合成部220は、切替部215又は色空間逆変換部216が出力する予測残差と、予測部250が出力する予測ブロックとを画素単位で合成することにより、元のブロックを復号(再構成)し、復号済みブロックをループフィルタ230に出力する。
 ループフィルタ230は、合成部220が出力する復号済みブロックに対してフィルタ処理を行い、フィルタ処理後の復号済みブロックをメモリ240に出力する。
 メモリ240は、合成部220が出力する復号済みブロックを記憶し、復号済みブロックをフレーム単位で復号済み画像として蓄積する。メモリ240は、復号済みブロック若しくは復号済み画像を予測部250に出力する。また、メモリ240は、フレーム単位の復号済み画像を復号装置2の外部に出力する。
 予測部250は、ブロック単位で成分ごとに予測を行う。予測部250は、インター予測部251と、イントラ予測部252と、切替部253とを有する。
 インター予測部251は、フレーム間の相関を利用したインター予測を行う。具体的には、インター予測部251は、エントロピー復号部200が出力するインター予測に関する情報(例えば、動きベクトル情報)に基づいて、メモリ240に記憶された復号済み画像を参照画像として用いて符号化対象ブロックを予測してインター予測ブロックを生成し、生成したインター予測ブロックを切替部253に出力する。
 イントラ予測部252は、フレーム内の空間的な相関を利用したイントラ予測を行う。具体的には、イントラ予測部252は、エントロピー復号部200が出力するイントラ予測に関する情報(例えば、イントラ予測モード情報)に応じたイントラ予測モードを用いて、メモリ240に記憶された復号済み画像のうち符号化対象ブロックの周辺にある復号済み画素を参照してイントラ予測ブロックを生成し、生成したイントラ予測ブロックを切替部253に出力する。
 切替部253は、インター予測部251が出力するインター予測ブロックとイントラ予測部252が出力するイントラ予測ブロックとを切り替えて、いずれかの予測ブロックを合成部220に出力する。
 このように、本実施形態に係る復号装置2は、第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した復号対象ブロックごとに復号する。復号装置2は、ビットストリームから復号対象ブロックの量子化変換係数を成分ごとに復号するエントロピー復号部200と、復号対象ブロックに対応する予測ブロックを成分ごとに生成する予測部250と、変換係数に対する逆変換処理に用いるスケーリングリストを決定する逆量子化制御部214と、量子化変換係数に対する逆変換処理を行うことで変換係数を生成する逆量子化部211と、決定されたスケーリングリストを用いて変換係数に対して逆変換処理を行うことで予測残差を生成する逆変換部212と、予測残差に対して色空間逆変換処理を行う色空間逆変換部216と、予測残差と予測ブロックとを合成することで復号ブロックを生成する合成部220とを有する。
 逆量子化制御部214は、色空間逆変換処理(色空間変換フラグ)に基づいてスケーリングリストを決定する。本実施形態において、逆量子化制御部214は、不均一なスケーリングリストを用いる旨を符号化側が設定した場合において、色空間逆変換部216が色空間逆変換処理を行うか否かに基づいて、不均一なスケーリングリストを用いるか又は均一なスケーリングリストを決定する。
 例えば、不均一なスケーリングリストを用いる旨を符号化側が設定した場合において、逆量子化制御部214は、色空間逆変換部216が色空間逆変換処理を行わない場合、逆量子化処理に用いるスケーリングリストとして不均一なスケーリングリストを決定する。色空間逆変換部216が色空間逆変換処理を行う場合、逆量子化制御部214は、逆量子化処理に用いるスケーリングリストとして均一なスケーリングリストを決定する。
 このように、本実施形態に係る復号装置2は、ACTを適用する場合、均一なスケーリングリストを用いる。これにより、1つの画像(ピクチャ)内においてACTを適用する符号化対象ブロックとACTを適用しない符号化対象ブロックとが混在する場合であっても、画質の劣化を抑制可能である。
 <変更例>
 次に、上述した実施形態の変更例について、上述した実施形態との相違点を主として説明する。
 本変更例では、不均一なスケーリングリストを用いる旨を符号化装置1が設定した場合において、ACT(色空間変換処理)を適用する場合であっても、不均一なスケーリングリストを用いる。但し、符号化装置1の量子化制御部123は、ACTを適用するか否かに基づいて、画像を構成する3つ以上の成分と各成分用のスケーリングリストとの対応関係を変更する。
 図4は、本変更例に係る量子化制御部123の動作を示す図である。
 図4に示すように、符号化装置1の量子化制御部123は、色空間変換処理を行わない場合(ステップS21:NO)、ステップS22において、第1成分であるR成分に対して第1スケーリングリストを、第2成分であるG成分に対して第2スケーリングリストを、第3成分であるB成分に対して第3スケーリングリストをそれぞれ決定する(表2参照)。
Figure JPOXMLDOC01-appb-T000002
 一方、色空間変換部が色空間変換処理を行う場合(ステップS21:YES)、ステップS22において、第1成分であるY成分に対して第2スケーリングリストを決定するように対応関係を変更する(表3参照)。
Figure JPOXMLDOC01-appb-T000003
 RGB空間における輝度成分の多くはG成分に集中することから、G成分用の第2スケーリングリストをY成分に適用することとしている。これにより、適切なスケーリングリストをY成分に適用できるため、画質の劣化を抑制可能である。なお、表3の例において、第2成分であるCg成分に対して第3スケーリングリストを決定し、第3成分であるCo成分に対して第1スケーリングリストを決定するように、対応関係を変更している。
 同様に、復号装置2の逆量子化制御部214は、不均一なスケーリングリストを用いる旨を符号化装置1が設定した場合において、ACTを適用する(すなわち、色空間逆変換部216が色空間逆変換処理を行う)か否かに基づいて、画像を構成する3つ以上の成分と各成分用のスケーリングリストとの対応関係を変更する。
 逆量子化制御部214は、色空間逆変換部216が色空間逆変換処理を行わない場合、第1成分であるR成分に対して第1スケーリングリストを、第2成分であるG成分に対して第2スケーリングリストを、第3成分であるB成分に対して第3スケーリングリストをそれぞれ決定する(表2参照)。一方、色空間逆変換部216が色空間逆変換処理を行う場合、逆量子化制御部214は、第1成分であるY成分に対して第2スケーリングリストを決定する(表3参照)。
 なお、本変更例では、各成分と各スケーリングリストとの対応関係を変更する場合において、変更後の対応関係(すなわち、Y成分・Cg成分・Co成分と第1乃至第3スケーリングリストとの対応関係)が固定であることを想定している(表3参照)。しかしながら、当該対応関係を符号化装置1(エントロピー符号化部130)から復号装置2にシグナリングすることにより、当該対応関係を可変設定してもよい。例えば、符号化装置1(エントロピー符号化部130)は、変更後の対応関係(すなわち、Y成分・Cg成分・Co成分と第1乃至第3スケーリングリストとの対応関係)を示す情報を、後述するアダプテーションパラメータセット(APS)に含めてシグナリングしてもよい。
 <その他の実施形態>
 符号化装置1のエントロピー符号化部130は、色空間変換処理に基づくスケーリングリストの決定動作を行うか否かを示す情報(制御フラグ)を含むシーケンスパラメータセット(SPS)又はアダプテーションパラメータセット(APS)を出力してもよい。復号装置2のエントロピー復号部200は、色空間逆変換処理に基づくスケーリングリストの決定動作を行うか否かを示す情報を含むSPS又はAPSを取得してもよい。
 また、符号化装置1のエントロピー符号化部130は、上述した実施形態のスケーリングリストの決定動作、及び変更例1のスケーリングリストの決定動作のいずれを用いるかを示す情報(制御フラグ)を含むSPS又はAPSを出力してもよい。復号装置2のエントロピー復号部200は、上述した実施形態のスケーリングリストの決定動作、及び変更例1のスケーリングリストの決定動作のいずれを用いるかを示す情報を含むSPS又はAPSを取得してもよい。符号化装置1のエントロピー符号化部130は、クロマフォーマットが4:4:4か否かに応じて、当該制御フラグをシグナリングしてもよいし、SPSなどにおいてACTがシーケンスに対して適用可能であるか否かに応じて当該制御フラグのシグナリングを制御するよう構成してもよい。具体的には、SPSにおいて、ACTを符号化対象シーケンスに対して適用可能とする旨を示すフラグがシグナリングされた場合にのみ当該制御フラグをシグナリングするよう構成してもよい。また、APSにおいて色差信号に対するスケーリングリストが当該APSに含まれるか否かを示すフラグに応じて当該制御フラグのシグナリングを制御するよう構成してもよい。具体的には、APSにおいて、前記色差信号に対するスケーリングリストが含まれる場合にのみ当該制御フラグをシグナリングするよう構成してもよい。
 図5は、エントロピー符号化部130が出力するビットストリームを示す図である。
 図5(a)に示すように、ビットストリームは、複数のNALユニットと、各NALユニットの先頭に設けられるスタートコードとからなる。スタートコードは4byteであり、NALユニット内ではこの0001(=0x00000001)が発生しないよう制御されている。図5(b)に示すように、各NALユニットは、NALユニットヘッダとペイロードとからなる。
 図6は、NALユニットのタイプを示す図である。NALユニットのタイプは、NALユニットヘッダ内のnal_unit_typeにより識別される。NALユニットのタイプは、VCL(Video Coding Layer)クラスとnon-VCLクラスとに分類される。VCLクラスは、符号化対象CTU(Coding Tree Unit)を含むスライスの符号化ビットストリームに対応するクラスである。VCLクラスは、復号に必要な制御情報、例えば、VPS(Video Parameter Set)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)、及びAPS(Adaptation Parameter Set)に対応するクラスである。VPS、SPS、PPS、及びAPSは、それぞれ異なるNALユニットによりシグナリングされる。
 図7は、VPS、SPS、PPS、及びAPSの関係を示す図である。
 図7に示すように、VPSは、自身のID(vps_video_parameter_set_id)を持ち、SPSから参照される。VPSは、ビットストリームの復号全体に関する情報を格納する。例えば、VPSは、最大レイヤ枚数及びDPB(Decoded Picture Buffer)などの情報を含む。
 SPSは、自身のID(sps_seq_parameter_set_id)を持ち、PPSから参照される。また、SPSは、自身が参照するVPSのID(sps_video_parameter_set_id)を持つ。SPSは、シーケンスの復号に必要な情報を格納する。例えば、SPSは、クロマフォーマット、最大の幅・高さ、ビット深度、サブピクチャ情報(個数、各サブピクチャの開始座標、幅、高さなど)、各符号化ツール(各機能)のシーケンス単位でのオン・オフ制御、及び/又はVUI(Video usability information)などの情報を含む。シーケンス単位でのオン・オフ制御の情報は、スケーリングリストを適用するか否かを示すフラグ(sps_scaling_list_enebled_flag)を含む。
 PPSは、自身のID(pps_pic_parameter_set_id)を持ち、PH(Picture Header)から参照される。また、PPSは、自身が参照するSPSのID(pps_seq_parameter_set_id)を持つ。PPSは、ピクチャ(Picture)の復号に必要な情報を格納する。例えば、PPSは、ピクチャの幅・高さ、タイル分割情報(縦横のタイル数、各行・列の幅・高さなどの定義)、及び/又はスライス分割情報(スライス分割形状(rect/non-rect)、rectの場合は各rectの幅・高さ方向のタイル数)などの情報を含む。
 PHは、ピクチャごとのヘッダ情報である。PHを参照するのはピクチャ内のスライスである。スライスは、自身が含まれるピクチャを暗黙的に判別できるのでPHのIDは定義する必要ない。一方、PHは、参照先のPPSのID(ph_pic_parameter_set_id)を保持する。PHは、当該ピクチャに対する制御情報を格納する。例えば、PHは、当該ピクチャに対する各符号化ツール(各機能)のオン・オフ制御などの情報を含む。PHは、ALF、LMCS、及びスケーリングリストのそれぞれのツールの適用オン・オフを示す情報を含む。ピクチャ単位でのオン・オフ制御の情報は、スケーリングリストを適用するか否かを示すフラグ(ph_scaling_list_present_flag)を含む。PHは、1つ以上のツールを適用する場合、当該ツールのパラメータ情報を格納するAPSのIDを含む。
 APSは、ALF、LMCS、スケーリングリストなどの比較的多くのパラメータを伝送する必要がある符号化ツールのためのパラメータ伝送用のシンタックス構造である。APSは、自身のIDを保持しており、このIDはPHから参照される。
 上述した実施形態及びその変更例に係る制御情報(制御フラグ)をSPS中でシグナリングすることで、複数のスケーリングリストを規定する場合であっても、1つの制御フラグにより量子化処理を制御できるため、フラグ情報量を削減できる。一方、上述した実施形態及びその変更例に係る制御情報(制御フラグ)をAPS中でシグナリングすることで、設定する複数のスケーリングリストごとに適用するスケーリングリストを色空間変換の適用に応じて制御するか否かを決定できるため、より柔軟な量子化処理が可能となる。
 上述した符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。また、復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
 符号化装置1が行う各処理を実行する回路を集積化し、符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。復号装置2が行う各処理を実行する回路を集積化し、復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。
 以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
 本願は、日本国特許出願第2020-070106号(2020年4月8日出願)の優先権を主張し、その内容の全てが本願明細書に組み込まれている。

Claims (16)

  1.  第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した符号化対象ブロックごとに符号化する符号化装置であって、
     前記符号化対象ブロックに対応する予測ブロックを成分ごとに生成する予測部と、
     前記符号化対象ブロックと前記予測ブロックとの差を表す予測残差を成分ごとに生成する残差生成部と、
     前記成分ごとの予測残差に対して色空間変換処理を行う色空間変換部と、
     前記予測残差に対して変換処理を行うことで変換係数を生成する変換部と、
     前記変換係数に対する量子化処理に用いるスケーリングリストを決定する量子化制御部と、
     前記決定されたスケーリングリストを用いて、前記変換係数に対して前記量子化処理を行う量子化部と、を備え、
     前記量子化制御部は、前記色空間変換処理に基づいて前記スケーリングリストを決定することを特徴とする符号化装置。
  2.  前記量子化制御部は、前記色空間変換部が前記色空間変換処理を行うか否かに基づいて前記スケーリングリストを決定することを特徴とする請求項1に記載の符号化装置。
  3.  前記スケーリングリストの要素の値として少なくとも部分的に異なる値を設定可能である可変なスケーリングリストを用いる旨を前記符号化装置が設定した場合において、前記量子化制御部は、前記色空間変換部が前記色空間変換処理を行うか否かに基づいて、前記可変なスケーリングリストを用いるか又は前記要素の値が等しい均一なスケーリングリスト用いるかを決定することを特徴とする請求項2に記載の符号化装置。
  4.  前記可変なスケーリングリストを用いる旨を前記符号化装置が設定した場合において、前記量子化制御部は、
      前記色空間変換部が前記色空間変換処理を行わない場合、前記スケーリングリストとして前記可変なスケーリングリストを決定し、
      前記色空間変換部が前記色空間変換処理を行う場合、前記スケーリングリストとして前記均一なスケーリングリストを決定することを特徴とする請求項3に記載の符号化装置。
  5.  前記スケーリングリストの要素の値として少なくとも部分的に異なる値を設定可能である可変なスケーリングリストを用いる旨を前記符号化装置が設定した場合において、前記量子化制御部は、前記色空間変換部が前記色空間変換処理を行うか否かに基づいて、前記3つ以上の成分と各成分用のスケーリングリストとの対応関係を変更することを特徴とする請求項2に記載の符号化装置。
  6.  前記可変なスケーリングリストを用いる旨を前記符号化装置が設定した場合において、前記量子化制御部は、
      前記色空間変換部が前記色空間変換処理を行わない場合、前記第1成分であるR成分に対して第1スケーリングリストを、前記第2成分であるG成分に対して第2スケーリングリストを、前記第3成分であるB成分に対して第3スケーリングリストをそれぞれ決定し、
      前記色空間変換部が前記色空間変換処理を行う場合、前記第1成分であるY成分に対して前記第2スケーリングリストを決定することを特徴とする請求項5に記載の符号化装置。
  7.  エントロピー符号化部をさらに備え、
     前記エントロピー符号化部は、前記色空間変換処理に基づく前記スケーリングリストの決定動作を行うか否かを示す情報を含むシーケンスパラメータセット又はアダプテーションパラメータセットを出力することを特徴とする請求項1乃至6のいずれか1項に記載の符号化装置。
  8.  第1成分、第2成分、及び第3成分を含む3つ以上の成分により構成される画像を分割して生成した復号対象ブロックごとに復号する復号装置であって、
     ビットストリームから前記復号対象ブロックの量子化変換係数を成分ごとに復号するエントロピー復号部と、
     前記復号対象ブロックに対応する予測ブロックを成分ごとに生成する予測部と、
     変換係数に対する逆変換処理に用いるスケーリングリストを決定する逆量子化制御部と、
     前記量子化変換係数に対する逆変換処理を行うことで前記変換係数を生成する逆量子化部と、
     前記決定されたスケーリングリストを用いて前記変換係数に対して前記逆変換処理を行うことで予測残差を生成する逆変換部と、
     前記予測残差に対して色空間逆変換処理を行う色空間逆変換部と、
     前記予測残差と前記予測ブロックとを合成することで復号ブロックを生成する合成部と、を備え、
     前記逆量子化制御部は、前記色空間逆変換処理に基づいて前記スケーリングリストを決定することを特徴とする復号装置。
  9.  前記逆量子化制御部は、前記色空間逆変換部が前記色空間逆変換処理を行うか否かに基づいて前記スケーリングリストを決定することを特徴とする請求項8に記載の復号装置。
  10.  前記スケーリングリストの要素の値として少なくとも部分的に異なる値を設定可能である可変なスケーリングリストを用いる旨を符号化側が設定した場合において、前記逆量子化制御部は、前記色空間逆変換部が前記色空間逆変換処理を行うか否かに基づいて、前記可変なスケーリングリストを用いるか又は前記要素の値が等しい均一なスケーリングリストを用いるかを決定することを特徴とする請求項9に記載の復号装置。
  11.  前記可変なスケーリングリストを用いる旨を前記符号化側が設定した場合において、前記逆量子化制御部は、
      前記色空間逆変換部が前記色空間逆変換処理を行わない場合、前記スケーリングリストとして前記可変なスケーリングリストを決定し、
      前記色空間逆変換部が前記色空間逆変換処理を行う場合、前記スケーリングリストとして前記均一なスケーリングリストを決定することを特徴とする請求項10に記載の復号装置。
  12.  前記スケーリングリストの要素の値として少なくとも部分的に異なる値を設定可能である可変なスケーリングリストを用いる旨を符号化側が設定した場合において、前記逆量子化制御部は、前記色空間逆変換部が前記色空間逆変換処理を行うか否かに基づいて、前記3つ以上の成分と各成分用のスケーリングリストとの対応関係を変更することを特徴とする請求項9に記載の復号装置。
  13.  前記可変なスケーリングリストを用いる旨を符号化側が設定した場合において、前記逆量子化制御部は、
      前記色空間逆変換部が前記色空間逆変換処理を行わない場合、前記第1成分であるR成分に対して第1スケーリングリストを、前記第2成分であるG成分に対して第2スケーリングリストを、前記第3成分であるB成分に対して第3スケーリングリストをそれぞれ決定し、
      前記色空間逆変換部が前記色空間逆変換処理を行う場合、前記第1成分であるY成分に対して前記第2スケーリングリストを決定することを特徴とする請求項12に記載の復号装置。
  14.  前記エントロピー復号部は、前記色空間逆変換処理に基づく前記スケーリングリストの決定動作を行うか否かを示す情報を含むシーケンスパラメータセット又はアダプテーションパラメータセットを取得することを特徴とする請求項8乃至13のいずれか1項に記載の復号装置。
  15.  コンピュータを請求項1乃至7のいずれか1項に記載の符号化装置として機能させることを特徴とするプログラム。
  16.  コンピュータを請求項8乃至14のいずれか1項に記載の復号装置として機能させることを特徴とするプログラム。
PCT/JP2021/014872 2020-04-08 2021-04-08 符号化装置、復号装置、及びプログラム WO2021206137A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN202180005546.4A CN114450950B (zh) 2020-04-08 2021-04-08 编码装置、解码装置及存储介质
EP21785431.4A EP4087241A4 (en) 2020-04-08 2021-04-08 CODING DEVICE, DECODING DEVICE AND PROGRAM
CN202310331513.XA CN116347079A (zh) 2020-04-08 2021-04-08 编码装置、解码装置及程序
JP2022514119A JPWO2021206137A1 (ja) 2020-04-08 2021-04-08
US17/655,931 US11496739B2 (en) 2020-04-08 2022-03-22 Encoding device, decoding device and program
JP2022084866A JP7142180B2 (ja) 2020-04-08 2022-05-24 符号化装置、復号装置、及びプログラム
US17/938,633 US11889031B2 (en) 2020-04-08 2022-10-06 Encoding device, decoding device and program that encode or decode each target block by dividing an image that includes three or more components
US18/531,136 US20240129470A1 (en) 2020-04-08 2023-12-06 Encoding device, decoding device and program that encode or decode each target block by dividing an image that includes three or more components

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020070106 2020-04-08
JP2020-070106 2020-04-08

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/655,931 Continuation US11496739B2 (en) 2020-04-08 2022-03-22 Encoding device, decoding device and program

Publications (1)

Publication Number Publication Date
WO2021206137A1 true WO2021206137A1 (ja) 2021-10-14

Family

ID=78022849

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/014872 WO2021206137A1 (ja) 2020-04-08 2021-04-08 符号化装置、復号装置、及びプログラム

Country Status (5)

Country Link
US (3) US11496739B2 (ja)
EP (1) EP4087241A4 (ja)
JP (3) JPWO2021206137A1 (ja)
CN (2) CN114450950B (ja)
WO (1) WO2021206137A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4038876A1 (en) * 2019-10-02 2022-08-10 InterDigital VC Holdings France, SAS Derivation of quantization matrices for joint cb-cr coding
CN114450950B (zh) * 2020-04-08 2023-04-18 日本放送协会 编码装置、解码装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020070106A (ja) 2018-11-02 2020-05-07 東洋製罐株式会社 充填システム、容器成形ユニット、充填ユニット、容器転送ユニット、および充填方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2016012636A (es) * 2014-03-27 2016-12-14 Microsoft Technology Licensing Llc Ajuste de cuantificacion/escalamiento y cuantificacion/escalamient o inverso cuando se cambian espacios de color.
US9883184B2 (en) * 2014-10-07 2018-01-30 Qualcomm Incorporated QP derivation and offset for adaptive color transform in video coding
US11153594B2 (en) * 2016-08-29 2021-10-19 Apple Inc. Multidimensional quantization techniques for video coding/decoding systems
KR101997681B1 (ko) * 2018-06-11 2019-07-08 광운대학교 산학협력단 양자화 파라미터 기반의 잔차 블록 부호화/복호화 방법 및 장치
CN117579830A (zh) * 2019-06-21 2024-02-20 北京字节跳动网络技术有限公司 自适应环内颜色空间转换和其他编解码工具的选择性使用
CA3225288A1 (en) * 2019-11-22 2021-05-27 Lg Electronics Inc. Image encoding/decoding method and device using lossless color transform, and method for transmitting bitstream
CN114450950B (zh) * 2020-04-08 2023-04-18 日本放送协会 编码装置、解码装置及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020070106A (ja) 2018-11-02 2020-05-07 東洋製罐株式会社 充填システム、容器成形ユニット、充填ユニット、容器転送ユニット、および充填方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A. K. RAMASUBRAMONIAN (QUALCOMM), G. VAN DER AUWERA (QUALCOMM), V. SEREGIN (QUALCOMM), H. E. EGILMEZ (QUALCOMM), M. KARCZEWICZ (QU: "AHG15: Scaling matrices for LFNST-coded blocks", 16. JVET MEETING; 20191001 - 20191011; GENEVA; (THE JOINT VIDEO EXPLORATION TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16 ), 11 October 2019 (2019-10-11), XP030217082 *
S. IWAMURA, S. NEMOTO, A. ICHIGAYA (NHK), P. DE LAGRANGE (INTERDIGITAL), F. LE LEANNEC, E. FRANCOIS (INTERDIGITAL): "[AHG15] On scaling list for JCCR", 16. JVET MEETING; 20191001 - 20191011; GENEVA; (THE JOINT VIDEO EXPLORATION TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16 ), 25 September 2019 (2019-09-25), XP030217836 *
T. TSUKUBA (SONY), K. KONDO, M. IKEDA, Y. YAGASAKI, T. SUZUKI (SONY): "On QP Adjustment for Adaptive Color Transform", 17. JVET MEETING; 20200107 - 20200117; BRUSSELS; (THE JOINT VIDEO EXPLORATION TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16 ), 13 January 2020 (2020-01-13), XP030222573 *

Also Published As

Publication number Publication date
US20230040274A1 (en) 2023-02-09
CN114450950B (zh) 2023-04-18
JPWO2021206137A1 (ja) 2021-10-14
EP4087241A1 (en) 2022-11-09
EP4087241A4 (en) 2023-05-17
CN114450950A (zh) 2022-05-06
CN116347079A (zh) 2023-06-27
JP2022105654A (ja) 2022-07-14
JP2022168226A (ja) 2022-11-04
JP7357736B2 (ja) 2023-10-06
US11889031B2 (en) 2024-01-30
US20240129470A1 (en) 2024-04-18
US20220217348A1 (en) 2022-07-07
US11496739B2 (en) 2022-11-08
JP7142180B2 (ja) 2022-09-26

Similar Documents

Publication Publication Date Title
JP2018056685A (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
US11695955B2 (en) Image encoding device, image decoding device and program
JP7357736B2 (ja) 符号化装置、復号装置、及びプログラム
US20240195992A1 (en) Decoding device, program, and decoding method
JP2024053019A (ja) 符号化装置、復号装置、及びプログラム
JP2023071949A (ja) イントラ予測装置、画像復号装置、及びプログラム
WO2021215454A1 (ja) 符号化装置、復号装置、及びプログラム
WO2021201222A1 (ja) 符号化装置、復号装置、及びプログラム
JP2021093575A (ja) 符号化装置、復号装置、及びプログラム
WO2021132404A1 (ja) 符号化装置、復号装置、及びプログラム
WO2021100450A1 (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
WO2021054380A1 (ja) 符号化装置、復号装置、及びプログラム
WO2021251398A1 (ja) デブロッキングフィルタ装置、復号装置、及びプログラム
JP7388900B2 (ja) 符号化装置、復号装置、及びプログラム
WO2021251400A1 (ja) 復号装置及びプログラム
JP2021093634A (ja) 符号化装置、復号装置、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21785431

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022514119

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2021785431

Country of ref document: EP

Effective date: 20220803

NENP Non-entry into the national phase

Ref country code: DE