RU2562414C1 - Method for fast selection of spatial prediction mode in hevc coding system - Google Patents

Method for fast selection of spatial prediction mode in hevc coding system Download PDF

Info

Publication number
RU2562414C1
RU2562414C1 RU2014138769/08A RU2014138769A RU2562414C1 RU 2562414 C1 RU2562414 C1 RU 2562414C1 RU 2014138769/08 A RU2014138769/08 A RU 2014138769/08A RU 2014138769 A RU2014138769 A RU 2014138769A RU 2562414 C1 RU2562414 C1 RU 2562414C1
Authority
RU
Russia
Prior art keywords
values
list
array
candidate modes
prediction
Prior art date
Application number
RU2014138769/08A
Other languages
Russian (ru)
Inventor
Максим Павлович Шарабайко
Олег Геннадьевич Пономарев
Original Assignee
Закрытое акционерное общество "Элекард наноДевайсез"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Закрытое акционерное общество "Элекард наноДевайсез" filed Critical Закрытое акционерное общество "Элекард наноДевайсез"
Priority to RU2014138769/08A priority Critical patent/RU2562414C1/en
Priority to PCT/RU2014/000848 priority patent/WO2016048186A1/en
Priority to EA201700050A priority patent/EA201700050A1/en
Application granted granted Critical
Publication of RU2562414C1 publication Critical patent/RU2562414C1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

FIELD: physics.
SUBSTANCE: disclosed is a method for fast selection of spatial prediction mode in a HEVC coding system. Analysis of the modulus of high-frequency horizontal and vertical components of the stationary wavelet of Haar transformation of an image of the encoded region is performed to construct a list of candidate modes. The process of constructing candidate modes consists of four steps. The first and second steps include making decisions to include a Planar mode and a DC mode in the list. The third step includes selecting angular candidate modes based on values in an array of vertical details and the fourth step includes selecting candidate modes based on analysis of the values of an array of horizontal details.
EFFECT: speeding up the encoding process by reducing the volume of computations when searching for an optimum block coding mode.

Description

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

Изобретение относится к кодированию и декодированию цифровых видеоданных.The invention relates to the encoding and decoding of digital video data.

УРОВЕНЬ ТЕХНИКИBACKGROUND

В основе алгоритмов компрессии видеоданных HEVC лежит несколько простых идей. Если взять некоторую часть изображения, то с большой вероятностью вблизи этого участка в данном кадре или в соседних кадрах окажется участок, содержащий похожее, мало отличающееся по значениям интенсивности пикселей, изображение. Таким образом, для передачи информации об изображении в текущем участке достаточно передать только его отличие от ранее закодированного похожего участка. Процесс поиска похожих участков среди ранее закодированных изображений называют предсказанием (от англ. prediction). Набор разностных значений, определяющих отличие текущего участка от найденного предсказания, называют остатком (от англ. residual). Можно выделить два основных типа предсказания. В первом из них значения Prediction представляют собой набор линейных комбинаций пикселей, примыкающих к текущему участку изображения слева и сверху. Такое предсказание называют пространственным (от англ. Intra Prediction). Во втором - в качестве предсказания используются линейные комбинации пикселей похожих участков изображений ранее закодированных кадров (эти кадры называют ссылочными - от англ. Reference). Такое предсказание называют временным (от англ. Inter Prediction). Для восстановления изображения текущего участка, закодированного с временным предсказанием, при декодировании необходима информация не только об остатке (Residual), но и о номере кадра, на котором находится похожий участок, и координатах этого участка.HEVC video compression algorithms are based on a few simple ideas. If we take a certain part of the image, then with a high probability near this section in this frame or in neighboring frames there will be a section containing a similar image that differs little in terms of pixel intensity. Thus, to transmit information about the image in the current section, it is sufficient to transmit only its difference from a previously encoded similar section. The process of finding similar areas among previously encoded images is called prediction (from the English prediction). A set of difference values that determine the difference between the current section and the found prediction is called the remainder (from the English residual). Two main types of prediction can be distinguished. In the first of them, Prediction values are a set of linear combinations of pixels adjacent to the current image area on the left and top. Such a prediction is called spatial (from the English Intra Prediction). In the second, linear combinations of pixels of similar sections of images of previously encoded frames are used as a prediction (these frames are called reference frames from the English Reference). Such a prediction is called temporary (from the English Inter Prediction). To restore the image of the current section encoded with time prediction, decoding requires information not only about the Residual, but also about the frame number on which the similar section is located and the coordinates of this section.

На следующем этапе кодирования полученные при предсказании значения Residual подвергаются двумерному косинус-преобразованию Фурье с последующим квантованием. Затем полученный набор квантованных спектральных коэффициентов, сопровождаемый информацией, необходимой для выполнения предсказаний при декодировании, подвергается энтропийному кодированию.At the next stage of coding, the Residual values obtained during the prediction are subjected to a two-dimensional Fourier cosine transform with subsequent quantization. Then, the obtained set of quantized spectral coefficients, accompanied by the information necessary to make predictions during decoding, is subjected to entropy encoding.

Основной структурной единицей в HEVC является блок кодирования (CU - сокр. от англ. coding unit). Внутри каждого такого блока выбираются области - блоки предсказания (PU - сокр. от англ. prediction unit). Разбиение видеокадра на CU производится адаптивно, так что есть возможность подстраивать границы CU под границы объектов на изображении, а вложенные CU образуют квадродерево.The basic structural unit in HEVC is the coding unit (CU - abbr. From English coding unit). Inside each such block, areas are selected - prediction blocks (PU - abbr. From English prediction unit). The video frame is divided into CU adaptively, so it is possible to adjust the borders of the CU to the boundaries of the objects in the image, and the embedded CUs form a quad tree.

В пределах каждой CU выбираются области для вычисления предсказания - Prediction Unit (PU). При пространственном предсказании область CU может совпадать с PU (режим 2N×2N) или может быть разбита на 4 квадратных PU вдвое меньшего размера (режим N×N). Стандартом определены минимально и максимально возможные размеры PU - 4×4 и 32×32 соответственно.Within each CU, areas for prediction calculation — the Prediction Unit (PU) —are selected. In spatial prediction, the CU region may coincide with the PU (2N × 2N mode) or may be divided into 4 square PUs half the size (N × N mode). The standard defines the minimum and maximum possible sizes of PUs - 4 × 4 and 32 × 32, respectively.

Пространственное предсказание выполняется в HEVC одним из 35 способов. При этом используются значения пикселей-«соседей», примыкающих к границе кодируемой PU слева и сверху. Способы пространственного предсказания в HEVC можно условно разделить на две неравные группы. К первой группе относятся два способа - Planar и DC. В режиме Planar значения, используемые в качестве предсказания, лежат на плоскости, наклон которой в вертикальном и горизонтальном направлениях определяется по пикселям-«соседям». Этот режим предназначен для предсказания областей PU с линейным изменением значений пикселей в каком-либо направлении. В режиме DC в качестве предсказания всех пикселей из PU используется одно значение, равное среднему арифметическому пикселям-«соседям». Назначение этого режима не требует пояснений.Spatial prediction is performed in HEVC in one of 35 ways. In this case, the values of pixels - "neighbors" are used, adjacent to the border of the encoded PU on the left and top. Spatial prediction methods in HEVC can be divided into two unequal groups. The first group includes two methods - Planar and DC. In Planar mode, the values used as a prediction lie on a plane whose slope in the vertical and horizontal directions is determined by the "neighboring" pixels. This mode is designed to predict areas of the PU with a linear change in pixel values in any direction. In DC mode, a single value equal to the arithmetic average of the neighboring pixels is used as a prediction of all pixels from the PU. The purpose of this mode is self-explanatory.

Режимы второй группы называют угловыми. При вычислении значения, используемого в качестве предсказания, во всех 33-х угловых режимах пиксели-«соседи» сдвигаются в заданном (одном из 33-х) направлении. Если положение предсказываемого пикселя попадает между сдвинутыми копиями пикселей-«соседей», для расчета предсказания используется линейная интерполяция. Точность оценки положения предсказываемого пикселя между сдвинутыми пикселями-«соседями» задана равной 1/32 межпиксельного интервала.The modes of the second group are called angular. When calculating the value used as a prediction, in all 33 angular modes, the neighboring pixels are shifted in a given (one of 33) directions. If the position of the predicted pixel falls between shifted copies of the "neighbor" pixels, linear interpolation is used to calculate the prediction. The accuracy of estimating the position of the predicted pixel between the shifted "neighbor" pixels is set to 1/32 of the pixel interval.

Адаптивность разбиения максимально возможной CU совместно с большим количеством возможных режимов предсказания порождает огромное число возможных вариантов предсказания каждой такой CU так, что процесс кодирования видеокадров становится крайне вычислительно емким. Снижение вычислительных затрат на кодирование возможно, прежде всего, за счет предварительного отбора режимов предсказания, построения списка режимов-кандидатов. После построения такого списка выбор режима предсказания для каждой CU осуществляется только из режимов-кандидатов. Понятно, что чем короче список, тем эффективнее в вычислительном отношении система кодирования. С другой стороны, такой список должен с высокой вероятностью содержать наилучший для каждой CU, то есть обеспечивающий минимальное отличие предсказания от кодируемых пикселей и минимальное количество битов, представляющих CU в закодированном видеопотоке, режим предсказания.The adaptability of splitting the maximum possible CU together with a large number of possible prediction modes gives rise to a huge number of possible prediction options for each such CU so that the process of encoding video frames becomes extremely computationally intensive. Reducing the computational cost of coding is possible, first of all, due to the preliminary selection of prediction modes, building a list of candidate modes. After constructing such a list, the prediction mode for each CU is selected only from candidate modes. It is clear that the shorter the list, the more computationally efficient the coding system. On the other hand, such a list should with high probability contain the best prediction mode for each CU, that is, ensuring the minimum difference between the prediction and the encoded pixels and the minimum number of bits representing the CU in the encoded video stream.

Из предшествующего уровня техники известен способ выбора одного из 35 режимов предсказания при кодировании, реализованных в кодере [HEVC Test Model НМ v. 11.0 [Электронный ресурс]. - Режим доступа: https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-11.0/], в котором осуществляется перебор всех возможных для каждого кодируемого блока вариантов предсказания. В этом случае выполняется полный цикл кодирования-декодирования каждого блока, что позволяет провести т.н. Rate-Distortion Optimization (RDO). В процессе RDO из всех возможных режимов выбирается тот, который обеспечивает наибольшую степень сжатия видеоданных кодируемого блока (наименьший rate) при наименьшем уровне искажений, вносимых в эти данные в процессе кодирования (наименьший уровень Distortion).From the prior art, a method is known for selecting one of the 35 prediction modes during encoding implemented in the encoder [HEVC Test Model NM v. 11.0 [Electronic resource]. - Access mode: https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-11.0/], which enumerates all the possible prediction options for each encoded block. In this case, a complete encoding-decoding cycle of each block is performed, which allows the so-called Rate-Distortion Optimization (RDO). In the RDO process, from all possible modes, one is selected that provides the greatest degree of compression of the video data of the encoded block (the lowest rate) at the lowest level of distortion introduced into this data during the encoding (lowest level of Distortion).

Недостатком этого решения является то, что такой подход оказывается крайне затратным в вычислительном отношении, но обеспечивает гарантированный выбор наилучшего режима предсказания.The disadvantage of this solution is that this approach is extremely computationally expensive, but provides a guaranteed choice of the best prediction mode.

Известен также способ, называемый быстрым, [Zhao, L.; Zhang, L.; Ma, S.; Zhao, D. Fast mode decision algorithm for intra prediction in HEVC. Visual Communications and Image Processing (VCIP). IEEE, 2011, pp. 1-4], который реализуется в два этапа. На первом этапе выполняется предсказание кодируемого блока всеми возможными способами и формируется укороченный список режимов-кандидатов. Выбор из сформированного списка наилучшего режима осуществляется в процессе RDO на втором этапе. Отбор режимов-кандидатов на этапе формирования списка может осуществляться по различным критериям, определяемым настройками кодирующей системы. В качестве такого критерия может выступать минимальное значение суммы абсолютных разностей пикселей предсказания и оригинала (SAD или Sum of Absolute Differences), минимальное значение суммы квадратов разностей пикселей предсказания и оригинала (SSE или Sum of Sqared Errors) или минимальное значение суммы модулей коэффициентов преобразования Адамара разностей пикселей предсказания и оригинала (SATD или Sum of Absolute Transformed Differences).There is also a method called fast, [Zhao, L .; Zhang, L .; Ma, S .; Zhao, D. Fast mode decision algorithm for intra prediction in HEVC. Visual Communications and Image Processing (VCIP). IEEE, 2011, pp. 1-4], which is implemented in two stages. At the first stage, the encoded block is predicted by all possible methods and a shortened list of candidate modes is formed. The selection of the best mode from the generated list is carried out in the second stage of the RDO process. The selection of candidate modes at the stage of list formation can be carried out according to various criteria determined by the settings of the coding system. Such a criterion may be the minimum value of the sum of the absolute differences of the prediction pixels and the original (SAD or Sum of Absolute Differences), the minimum value of the sum of the squares of the differences of the prediction pixels and the original (SSE or Sum of Sqared Errors), or the minimum value of the sum of the modules of the Hadamard transform coefficients pixels of the prediction and the original (SATD or Sum of Absolute Transformed Differences).

Недостатком этого способа является то, что для построения списка режимов-кандидатов необходимо выполнить предсказание кодируемой области всеми 35 способами. Быстрый способ опять основан на полном переборе всех 35 режимов предсказания для каждой кодируемой области. Некоторое ускорение здесь достигается не за счет уменьшения количества перебираемых режимов предсказания, а за счет упрощения процедуры оценки качества предсказания в каждом из режимов. На основе таких упрощенных процедур оценивания качества строится сокращенный список режимов-кандидатов, для которых уже проводится полная RDO-оценка качества предсказания, полностью аналогичная той, что используется в первом способе.The disadvantage of this method is that to build a list of candidate modes, it is necessary to predict the encoded area in all 35 ways. The fast method is again based on a complete enumeration of all 35 prediction modes for each coded area. Some acceleration here is achieved not by reducing the number of predicted prediction modes, but by simplifying the procedure for assessing the quality of prediction in each of the modes. Based on such simplified quality assessment procedures, a shortened list of candidate modes is constructed for which a full RDO-assessment of the quality of the prediction is already carried out, completely similar to that used in the first method.

СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

Технический результат, который решается с помощью предложенного решения, состоит в снижении объемов вычислений при поиске оптимального режима кодирования блока, что позволяет ускорить процесс кодирования в целом за счет предварительного отбора режимов предсказания, построения списка режимов-кандидатов.The technical result, which is solved with the help of the proposed solution, is to reduce the amount of computation when searching for the optimal coding mode of the block, which allows to speed up the coding process as a whole due to the preliminary selection of prediction modes, building a list of candidate modes.

Технический результат достигается тем, что в способе быстрого выбора режима пространственного предсказания в системе кодирования HEVC, заключающемся в построении укороченного списка режимов-кандидатов пространственного предсказания длиной не более шести позиций, основанном на анализе высокочастотных горизонтальной и вертикальной составляющих стационарного вейвлет преобразования Хаара кодируемой области изображения, согласно предложенному решению: - массив значений высокочастотной горизонтальной составляющей преобразования Хаара получается путем вычитания из значения каждого пикселя кодируемой области значения соседнего слева пикселя;The technical result is achieved in that in a method for quickly selecting a spatial prediction mode in the HEVC coding system, which consists in constructing a shortened list of spatial prediction candidate modes with a length of not more than six positions, based on the analysis of the high-frequency horizontal and vertical components of the stationary wavelet transform of the Haar encoded image region, according to the proposed solution: - an array of values of the high-frequency horizontal component of the Haar transformation It is obtained by subtracting the value of each pixel value of the encoded region adjacent left pixel;

- массив значений высокочастотной вертикальной составляющей преобразования Хаара получается путем вычитания из значения каждого пикселя кодируемой области значения соседнего сверху пикселя;- the array of values of the high-frequency vertical component of the Haar transform is obtained by subtracting from the value of each pixel of the encoded region the values of the neighboring neighboring top pixel;

- режим Planar включают в список режимов-кандидатов, если все абсолютные значения горизонтальных и вертикальных высокочастотных составляющих меньше шага квантования при кодировании;- Planar mode is included in the list of candidate modes if all absolute values of horizontal and vertical high-frequency components are less than the quantization step during encoding;

- режим DC включают в список режимов-кандидатов, если среднеквадратическое отклонение значений горизонтальных и вертикальных высокочастотных составляющих меньше шага квантования,- DC mode is included in the list of candidate modes if the standard deviation of the horizontal and vertical high-frequency components is less than the quantization step,

- два угловых режима предсказания, соответствующие взаимному смещению точек пересечения линии минимальных значений модуля градиента, проходящей через точку максимума массива вертикальных высокочастотных составляющих, с вертикальными границами массива высокочастотных составляющих включают в список режимов-кандидатов, - two angular prediction modes corresponding to the mutual displacement of the points of intersection of the line of minimum values of the gradient modulus passing through the maximum point of the array of vertical high-frequency components, with the vertical boundaries of the array of high-frequency components are included in the list of candidate modes,

-два угловых режима предсказания, соответствующие взаимному смещению точек пересечения линии минимальных значений модуля градиента, проходящей через точку максимума массива горизонтальных высокочастотных составляющих, с горизонтальными границами массива высокочастотных составляющих включают в список режимов-кандидатов,- two angular prediction modes corresponding to the mutual displacement of the points of intersection of the line of the minimum values of the gradient module passing through the maximum point of the array of horizontal high-frequency components, with horizontal boundaries of the array of high-frequency components, are included in the list of candidate modes,

- окончательный выбор режима предсказания для кодируемой области изображения из построенного списка режимов-кандидатов осуществляют на основе стандартной RDO (rate-distortion optimization) оценки.- the final choice of the prediction mode for the encoded image area from the constructed list of candidate modes is carried out on the basis of standard RDO (rate-distortion optimization) estimates.

СПОСОБ ОСУЩЕСТВЛЯЕТСЯ СЛЕДУЮЩИМ ОБРАЗОМThe method is carried out as follows.

Для построения списка режимов-кандидатов проводят анализ модуля высокочастотных горизонтальной и вертикальной составляющих (подробностей) стационарного вейвлет преобразования Хаара (СВПХ) изображения кодируемой области.To build a list of candidate modes, an analysis of the module of high-frequency horizontal and vertical components (details) of the stationary Haar wavelet transform (CVH) of the image of the encoded area is carried out.

Для получения горизонтальных и вертикальных подробностей СВПХ формируются массивы hC(x,y), х=-1,0,…,nТ-1, y=1,0,…,nТ-1 и νC(x,y), х=-1,0,…nТ-1, y=-1,0,…,nT-1. Значения элементов этих массивов при x=0,…, nТ-1, y=0,…,nТ-1 равны значениям интенсивности пикселов кодируемой PU. Значения hc(-1,y),y=-1,…nT равны значениям интенсивности пикселей-«соседей», примыкающих к области PU слева, a hc(x,-1),x=0,…,nΤ-1 равны значениям интенсивности пикселей-«соседей», примыкающих к PU сверху. Аналогично, значения νC(x,-1),х=-1,…,nΤ-1 равны значениям интенсивности пикселей-соседей», примыкающих к области PU сверху, а νC(-1,y),y=0,…,nТ-1 - значениям интенсивности пикселей-«соседей», примыкающих к PU слева. За nT обозначен размер кодируемой PU. Горизонтальные и вертикальные подробности H и V формируются как:To obtain horizontal and vertical details of the SVPK, arrays hC (x, y), x = -1.0, ..., nT-1, y = 1.0, ..., nT-1 and νC (x, y), x = -1.0, ... nT-1, y = -1.0, ..., nT-1. The values of the elements of these arrays at x = 0, ..., nТ-1, y = 0, ..., nТ-1 are equal to the pixel intensities of the encoded PU. The values of hc (-1, y), y = -1, ... nT are equal to the intensities of the pixel “neighbors” adjacent to the PU region to the left, and hc (x, -1), x = 0, ..., nΤ-1 are the values of the intensity of the pixels "neighbors" adjacent to the PU from above. Similarly, the values of νC (x, -1), x = -1, ..., nΤ-1 are equal to the intensities of the neighboring pixels ”adjacent to the PU region from above, and νC (-1, y), y = 0, ..., nТ-1 - the intensity values of the pixels - "neighbors" adjacent to the PU on the left. For nT, the size of the encoded PU is indicated. Horizontal and vertical details of H and V are formed as:

H(x,y)=|hC(x,y)-hC(x-1,y)|, x=0,…,nT-1, y=0,…,nT.H (x, y) = | hC (x, y) -hC (x-1, y) |, x = 0, ..., nT-1, y = 0, ..., nT.

V(x,y)=|νC(x,y)-νC(x,y-1)|, x=0,…,nΤ, y=0,…,nT-1.V (x, y) = | νC (x, y) -νC (x, y-1) |, x = 0, ..., nΤ, y = 0, ..., nT-1.

Процесс построения списка режимов-кандидатов состоит из четырех этапов. На первом этапе принимается решение о включении в список режима Planar. Этот режим включается в список, если:The process of building a list of candidate modes consists of four stages. At the first stage, a decision is made to include Planar mode in the list. This mode is included in the list if:

Figure 00000001
,
Figure 00000001
,

где: qStep - шаг квантования.where: qStep is the quantization step.

На втором этапе проверяется режим DC. Этот режим включается в список, если выполняется условие:In the second step, the DC mode is checked. This mode is included in the list if the condition is met:

Figure 00000002
Figure 00000002

На третьем этапе выбираются угловые режимы-кандидаты по значениям в массиве вертикальных подробностей V(x,y). Для этого определяется позиция ymax, xmax максимального элемента массива V(x,y). Текущая позиция ycr устанавливается равной ymax, xcr - равной xmax. Итеративно для каждого следующего столбца с номером xcrcr+1 новое значение ycr устанавливается равным номеру максимального элемента в данном столбце из диапазона [ycr-2, ycr+2,].At the third stage, the candidate angular modes are selected by the values in the array of vertical details V (x, y). For this, the position y max , x max of the maximum element of the array V (x, y) is determined. The current position y cr is set equal to y max , x cr equal to x max . Iteratively for each next column with the number x cr = x cr +1, the new value of y cr is set equal to the number of the maximum element in this column from the range [y cr -2, y cr +2,].

Обновление позиции продолжается, пока xcr≤nT и 0<ycr<nT-1. Точки xcr, ycr в процессе итераций проходят по линии минимального градиента значений V(x,y) справа от максимального элемента этого массива. Аналогичный итеративный процесс позволяет проследить линию наименьшего градиента значений V(x,y) слева от позиции xmax, ymax. Начинается этот процесс с установки текущей позиции ycl равной ymax, хсl - равной xmax. Итеративно для каждого следующего столбца с номером хс=xcl-1 новое значение yсl устанавливается равным номеру максимального элемента в данном столбце из диапазона [ycl-2, ycl+2]. Обновление позиции хсl, yсl продолжается, пока хсl≥0 и 0<уcr<nТ-1.The position update continues until x cr ≤nT and 0 <y cr <nT-1. The points x cr , y cr during iterations pass along the line of the minimum gradient of V (x, y) values to the right of the maximum element of this array. A similar iterative process allows us to trace the line of the smallest gradient of the values of V (x, y) to the left of the position x max , y max . This process begins by setting the current position y cl equal to y max , x cl - equal to x max . Iteratively for each next column with the number x c = x cl -1, the new value of y cl is set equal to the number of the maximum element in this column from the range [y cl -2, y cl +2]. The update of the position x cl , y cl continues until x cl ≥ 0 and 0 <y cr <nT-1.

Если обе позиции ycr и ycl попали на одну и ту же границу блока, результаты такого поиска некорректны. В таком случае поиск выполняется вверх и вниз в соответствии с алгоритмом четвертого этапа, применяемого к подробностям V(x,y).If both positions y cr and y cl hit the same block boundary, the results of such a search are incorrect. In this case, the search is performed up and down in accordance with the algorithm of the fourth stage, applied to the details of V (x, y).

Взаимное расположение найденных двух точек xcl, ycl и xcr, ycr задают направление, по которому определяется параметр режимов углового предсказания IntraPredAngle и номер режима предсказания. Определяются значения переменных следующими выражениями:The relative position of the two points x cl , y cl and x cr , y cr found determines the direction in which the parameter of the angular prediction modes IntraPredAngle and the number of the prediction mode are determined. The values of the variables are determined by the following expressions:

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

Figure 00000005
.
Figure 00000005
.

Если dir=1, то IntraPredAngle1=-αi, IntraPredAngle2=-αi+1,If dir = 1, then IntraPredAngle1 = -α i , IntraPredAngle2 = -α i + 1 ,

где α∈{-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} и αi≤tgphi<αi+1, а номера соответствующих режимов предсказания лежат в диапазоне 2-17.where α∈ {-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} and α i ≤ tgphi <α i + 1 , and the numbers of the corresponding prediction modes are in the range 2-17.

Если dir=1, то IntraPredAngle1=-αi, IntraPredAngle2=-αi+1,If dir = 1, then IntraPredAngle1 = -α i , IntraPredAngle2 = -α i + 1 ,

где α∈{-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} и αi≤tgphi<αi+1, номера соответствующих режимов предсказания лежат в диапазоне 18-34.where α∈ {-32, -26, -21, -17, -13 , -9, -5, -2, 0 , 2, 5, 9, 13, 17, 21, 26, 32} and α i ≤ tgphi <α i + 1 , the numbers of the corresponding prediction modes lie in the range 18-34.

Четвертый этап аналогичен третьему, но режимы-кандидаты выбираются на основе анализа значений массива горизонтальных подробностей H(x,y). Для этого определяется позиция ymax, xmax максимального элемента массива Н(x,y) Текущая позиция ycr устанавливается равной ymax, xcr - равной xmax. Итеративно для каждой следующей строки с номером ycr=ycr+1, новое значение xcr устанавливается равным номеру максимального элемента в данной строке из диапазона [xcr-2, xcr+2]. Обновление позиции продолжается, пока ycr≤nT и 0<xcr<nT-1. Точки xcr, ycr в процессе итераций проходят по линии минимального градиента значений H(x,y) ниже положения максимального элемента этого массива. Аналогичный итеративный процесс позволяет проследить линию наименьшего градиента значений H(x,y) над позицей xmax, ymax. Начинается этот процесс с установки текущей позиции ycl равной ymax, xcl - равной xmax. Итеративно для каждой следующей строки с номером ycl=ycl-1, новое значение хcl устанавливается равным номеру максимального элемента в данной строке из диапазона [xcl-2, xcl+2]. Обновление позиции хсl, ycl продолжаетсяе пока ycl≥0 и 0<xcl<nT-1.The fourth stage is similar to the third, but the candidate modes are selected based on the analysis of the values of the array of horizontal details H (x, y). To do this, determine the position y max , x max of the maximum element of the array H (x, y). The current position y cr is set to y max , x cr equal to x max . Iteratively for each next line with the number y cr = y cr +1, the new value x cr is set equal to the number of the maximum element in this line from the range [x cr -2, x cr +2]. The position update continues until y cr ≤nT and 0 <x cr <nT-1. The points x cr , y cr during iterations pass along the line of the minimum gradient of the values of H (x, y) below the position of the maximum element of this array. A similar iterative process allows us to trace the line of the smallest gradient of the values of H (x, y) over the position x max , y max . This process begins by setting the current position y cl equal to y max , x cl equal to x max . Iteratively for each next line with the number y cl = y cl -1, the new value of x cl is set to the number of the maximum element in this line from the range [x cl -2, x cl +2]. The update of the position x cl , y cl continues until y cl ≥0 and 0 <x cl <nT-1.

Если обе позиции хcr и хсl попали на одну и ту же границу блока, результаты такого поиска некорректны. В таком случае поиск выполняется влево и вправо в соответствии с алгоритмом третьего этапа, применяемого к массиву значений горизонтальных подробностей H(x,y).If both positions x cr and x cl fell on the same block boundary, the results of such a search are incorrect. In this case, the search is performed left and right in accordance with the algorithm of the third stage, applied to the array of values of horizontal details H (x, y).

Взаимное расположение найденных двух точек xcl, ycl и xcr, ycr задают направление, по которому определяется параметр режимов углового предсказания IntraPredAngle и номер режима предсказания. Определим значения переменных следующими выражениями:The relative position of the two points x cl , y cl and x cr , y cr found determines the direction in which the parameter of the angular prediction modes IntraPredAngle and the number of the prediction mode are determined. We define the values of the variables by the following expressions:

Figure 00000006
Figure 00000006

Figure 00000007
Figure 00000007

Figure 00000008
Figure 00000008

Figure 00000009
.
Figure 00000009
.

Если dir=0, то IntraPredAngle1=αi, IntraPredAngle2=αi+1,If dir = 0, then IntraPredAngle1 = α i , IntraPredAngle2 = α i + 1 ,

где α∈{-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} и αi≤tgphi<αi+1, а номера соответствующих режимов предсказания лежат в диапазоне 2-17.where α∈ {-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} and α i ≤ tgphi <α i + 1 , and the numbers of the corresponding prediction modes are in the range 2-17.

Если dir=1, то IntraPredAngle1=-αi, IntraPredAngle2=-αi+1,If dir = 1, then IntraPredAngle1 = -α i , IntraPredAngle2 = -α i + 1 ,

где α∈{-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} и αi≤tgphi<αi+1, а номера соответствующих режимов предсказания лежат в диапазоне 18-34.where α∈ {-32, -26, -21, -17, -13, -9, -5, -2, 0, 2, 5, 9, 13, 17, 21, 26, 32} and α i ≤ tgphi <α i + 1 , and the numbers of the corresponding prediction modes lie in the range 18-34.

Таким образом, предложенный способ позволяет формировать список режимов-кандидатов, качество предсказаний которых оценивается на заключительном этапе по стандартной процедуре RDO. Длина списка ограничена сверху шестью позициями. Формирование списка не требует проведения самой процедуры предсказания, что приводит к существенному сокращению объема вычислений при выполнении пространственного предсказания значений пикселей кодируемого блока.Thus, the proposed method allows you to create a list of candidate modes, the quality of the predictions of which are evaluated at the final stage according to the standard RDO procedure. The list length is limited to six at the top. The formation of the list does not require the prediction procedure itself, which leads to a significant reduction in the amount of computation when performing spatial prediction of the pixel values of the encoded block.

Claims (1)

Способ быстрого выбора режима пространственного предсказания в системе кодирования HEVC, заключающийся в построении укороченного списка режимов-кандидатов пространственного предсказания длиной не более шести позиций, основанный на анализе высокочастотных горизонтальной и вертикальной составляющих стационарного вейвлет преобразования Хаара кодируемой области изображения, при этом массив значений высокочастотной горизонтальной составляющей преобразования Хаара получается путем вычитания из значения каждого пикселя кодируемой области значения соседнего слева пикселя, при этом массив значений высокочастотной вертикальной составляющей преобразования Хаара получается путем вычитания из значения каждого пикселя кодируемой области значения соседнего сверху пикселя, при этом режим Planar включают в список режимов-кандидатов, если все абсолютные значения горизонтальных и вертикальных высокочастотных составляющих меньше шага квантования при кодировании, при этом режим DC включают в список режимов-кандидатов, если среднеквадратическое отклонение значений горизонтальных и вертикальных высокочастотных составляющих меньше шага квантования, при этом два угловых режима предсказания, соответствующие взаимному смещению точек пересечения линии минимальных значений модуля градиента, проходящей через точку максимума массива вертикальных высокочастотных составляющих, с вертикальными границами массива высокочастотных составляющих включают в список режимов-кандидатов, при этом два угловых режима предсказания, соответствующие взаимному смещению точек пересечения линии минимальных значений модуля градиента, проходящей через точку максимума массива горизонтальных высокочастотных составляющих, с горизонтальными границами массива высокочастотных составляющих включают в список режимов-кандидатов, при этом окончательный выбор режима предсказания для кодируемой области изображения из построенного списка режимов-кандидатов осуществляют на основе стандартной RDO (rate-distortion optimization) оценки. A method for quickly selecting the spatial prediction mode in the HEVC coding system, which consists in constructing a shortened list of spatial prediction candidate modes with a length of not more than six positions, based on the analysis of the high-frequency horizontal and vertical components of the stationary Haar wavelet transform of the encoded image region, while the array of values of the high-frequency horizontal component Haar transform is obtained by subtracting from the value of each pixel encoded about the values of the pixel adjacent to the left, while the array of values of the high-frequency vertical component of the Haar transform is obtained by subtracting from the value of each pixel of the encoded region the values of the neighboring neighboring pixels, while the Planar mode is included in the list of candidate modes if all the absolute values of the horizontal and vertical high-frequency components are less quantization steps during encoding, while the DC mode is included in the list of candidate modes if the standard deviation of the horizontal values of vertical and high-frequency components is less than the quantization step, and two angular prediction modes corresponding to the mutual displacement of the points of intersection of the line of minimum values of the gradient modulus passing through the maximum point of the array of vertical high-frequency components with vertical boundaries of the array of high-frequency components are included in the candidate modes for two angular prediction modes corresponding to the mutual displacement of the points of intersection of the line of minimum values of the grad module An element passing through a maximum point of an array of horizontal high-frequency components with horizontal boundaries of an array of high-frequency components is included in the list of candidate modes, and the final choice of the prediction mode for the encoded image area from the constructed list of candidate modes is based on standard RDO (rate-distortion optimization ) estimates.
RU2014138769/08A 2014-09-24 2014-09-24 Method for fast selection of spatial prediction mode in hevc coding system RU2562414C1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2014138769/08A RU2562414C1 (en) 2014-09-24 2014-09-24 Method for fast selection of spatial prediction mode in hevc coding system
PCT/RU2014/000848 WO2016048186A1 (en) 2014-09-24 2014-11-10 Rapid selection of spatial prediction mode in hevc coding system
EA201700050A EA201700050A1 (en) 2014-09-24 2014-11-10 A METHOD FOR QUICK SELECTION OF A SPATIAL PREDICTION MODE IN THE HEVC ENCODING SYSTEM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014138769/08A RU2562414C1 (en) 2014-09-24 2014-09-24 Method for fast selection of spatial prediction mode in hevc coding system

Publications (1)

Publication Number Publication Date
RU2562414C1 true RU2562414C1 (en) 2015-09-10

Family

ID=54073648

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014138769/08A RU2562414C1 (en) 2014-09-24 2014-09-24 Method for fast selection of spatial prediction mode in hevc coding system

Country Status (3)

Country Link
EA (1) EA201700050A1 (en)
RU (1) RU2562414C1 (en)
WO (1) WO2016048186A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109996074A (en) * 2017-12-29 2019-07-09 富士通株式会社 Picture coding device, picture decoding apparatus and electronic equipment
CN110662029A (en) * 2018-06-30 2020-01-07 上海天荷电子信息有限公司 Data compression method and device for dynamically and adaptively limiting value range
CN113382254B (en) * 2019-06-21 2022-05-17 杭州海康威视数字技术股份有限公司 Encoding and decoding method, device, equipment and storage medium
CN114445386B (en) * 2022-01-29 2023-02-24 泗阳三江橡塑有限公司 PVC pipe quality detection and evaluation method and system based on artificial intelligence

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102665078A (en) * 2012-05-08 2012-09-12 北方工业大学 Intra prediction mode decision based on direction vector for HEVC (High Efficiency Video Coding)
RU2496252C2 (en) * 2007-06-29 2013-10-20 Шарп Кабусики Кайся Image coding apparatus, image coding method, image decoding apparatus, image decoding method, program and recording medium
GB2508339A (en) * 2012-11-22 2014-06-04 Sony Corp Manipulation of transform coefficient blocks in high-efficiency video coding (HEVC)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754266B2 (en) * 1998-10-09 2004-06-22 Microsoft Corporation Method and apparatus for use in transmitting video information over a communication network
US9210438B2 (en) * 2012-01-20 2015-12-08 Sony Corporation Logical intra mode naming in HEVC video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496252C2 (en) * 2007-06-29 2013-10-20 Шарп Кабусики Кайся Image coding apparatus, image coding method, image decoding apparatus, image decoding method, program and recording medium
CN102665078A (en) * 2012-05-08 2012-09-12 北方工业大学 Intra prediction mode decision based on direction vector for HEVC (High Efficiency Video Coding)
GB2508339A (en) * 2012-11-22 2014-06-04 Sony Corp Manipulation of transform coefficient blocks in high-efficiency video coding (HEVC)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
статья Frank Bossen et al., "HEVC Complexity and implementation analysis", опубликованная 31.12.2012. статья Mengmeng Zhang et al., "Fast intra prediction mode decision algorithm for HEVC", опубликованная 31.10.2013 *

Also Published As

Publication number Publication date
EA201700050A1 (en) 2017-07-31
WO2016048186A1 (en) 2016-03-31

Similar Documents

Publication Publication Date Title
US10523951B2 (en) Systems and methods for processing a digital image
RU2665237C1 (en) Moving image encoding device, moving image decoding device, moving image encoding method and moving image decoding method
WO2018010492A1 (en) Rapid decision making method for intra-frame prediction mode in video coding
CN108184115B (en) HEVC intra-frame CU partition and PU prediction mode selection method and system
US9053544B2 (en) Methods and apparatuses for encoding/decoding high resolution images
JP2020527001A (en) Point group encoder
TWI634777B (en) Method of searching reference patches
US10602186B2 (en) Systems and methods for mask based processing of a block of a digital image
WO2018099579A1 (en) Apparatus and method for encoding an image
CN103248895B (en) A kind of quick mode method of estimation for HEVC intraframe coding
US11153564B2 (en) Systems and methods for processing a block of a digital image
CN101366279A (en) Adaptive motion search range
RU2562414C1 (en) Method for fast selection of spatial prediction mode in hevc coding system
CN109587491A (en) A kind of intra-frame prediction method, device and storage medium
JP6339977B2 (en) Video encoding apparatus and video encoding program
CN113992911A (en) Intra-frame prediction mode determination method and device for panoramic video H264 coding
CN104796725B (en) With method intra prediction pretreated video encoder and be used therewith
KR20120086131A (en) Methods for predicting motion vector and methods for decording motion vector
WO2012153440A1 (en) Prediction vector generation method, prediction vector generation device, prediction vector generation program, image encoding method, image encoding device, image encoding program, image decoding method, image decoding device, and image decoding program
JP2016181799A (en) Moving picture encoding system, moving picture encoding method and program for encoding moving picture
Krishnegowda et al. Optimal coding unit decision for early termination in high efficiency video coding using enhanced whale optimization algorithm

Legal Events

Date Code Title Description
PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181015