RU2555238C1 - Digital image segmentation method (versions) - Google Patents
Digital image segmentation method (versions) Download PDFInfo
- Publication number
- RU2555238C1 RU2555238C1 RU2013156222/08A RU2013156222A RU2555238C1 RU 2555238 C1 RU2555238 C1 RU 2555238C1 RU 2013156222/08 A RU2013156222/08 A RU 2013156222/08A RU 2013156222 A RU2013156222 A RU 2013156222A RU 2555238 C1 RU2555238 C1 RU 2555238C1
- Authority
- RU
- Russia
- Prior art keywords
- digital image
- pixels
- equivalence class
- image
- binary
- Prior art date
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
Изобретения относятся к области цифровой обработки изображений и используются для выделения целевого объекта из фонового изображения путем сегментации исходного изображения. Сегментация является одной из наиболее важных задач в системах машинного зрения, которые применяются во многих научно-технических и производственных отраслях: медицине, металлографии, аэрофотосъемке, робототехнике, дефектоскопии, системах безопасности и охраны правопорядка и других. Подобные системы широко используются в задачах разделения изображения на сегменты для их дальнейшего распознавания. Представляемые способы позволяют повысить быстродействие процесса поиска объектов и поэтому могут быть использованы в системах с ограниченными ресурсами.The invention relates to the field of digital image processing and is used to select the target object from the background image by segmenting the original image. Segmentation is one of the most important tasks in machine vision systems, which are used in many scientific, technical and industrial sectors: medicine, metallography, aerial photography, robotics, flaw detection, security systems and law enforcement and others. Such systems are widely used in problems of dividing an image into segments for their further recognition. The presented methods can improve the speed of the process of searching for objects and therefore can be used in systems with limited resources.
Известен способ выделения данных об изображении объекта переднего плана на основе данных о цвете и глубине (патент РФ RU 2426172 C1, опубликованный 10.08.2011). Способ заключается в выделении данных об изображении объекта из последовательности видеокадров на основании выделения фона, не содержащего данных об изображении объекта, и последовательности данных о глубине изображения. Недостатком данного способа является то, что для его реализации необходима специальная система, включающая в себя две цифровые видеокамеры, удаленные одна от другой и выполненные с возможностью съемки сцены в стереоформате.There is a method of extracting data about an image of a foreground object based on data on color and depth (RF patent RU 2426172 C1, published on 08/10/2011). The method consists in extracting data about an image of an object from a sequence of video frames based on the selection of a background that does not contain data about an image of an object and a sequence of data on the image depth. The disadvantage of this method is that its implementation requires a special system that includes two digital video cameras, remote from one another and made with the possibility of shooting the scene in stereo format.
Известен способ, изложенный в патенте РФ RU 2395787 С2, опубликованном 27.07.2010. Способ обнаружения объектов содержит этапы получения кадров, инициализации фонового кадра, инициализации порогового кадра. Далее для каждого из полученных кадров осуществляют сегментацию путем вычисления разности между текущим кадром и фоновым кадром, бинаризации с пороговым кадром и пространственной фильтрации. Недостатком данного способа является необходимость в предварительном получении фонового кадра на основе кадров видеопоследовательности, что не позволяет использовать данный способ для динамически изменяющегося фона и для статических изображений.The known method described in the patent of the Russian Federation RU 2395787 C2, published on July 27, 2010. A method for detecting objects comprises the steps of acquiring frames, initializing a background frame, initializing a threshold frame. Then, for each of the received frames, segmentation is performed by calculating the difference between the current frame and the background frame, binarization with a threshold frame, and spatial filtering. The disadvantage of this method is the need for preliminary obtaining a background frame based on frames of a video sequence, which does not allow using this method for a dynamically changing background and for static images.
Известен способ сегментации изображений путем поиска минимума ценовых функций, заявленный в патенте РФ RU 2489752 С2, опубликованный 10.08.2013, заключающийся в том, что осуществляется оптимальная сегментация изображения, при которой достигается глобальный минимум суммы ценовых функций швов и данных изображения, близкая к абсолютно-оптимальной при отсутствии необходимости в дополнительных ресурсах памяти мобильного устройства, устойчивости к шумам в изображении и быстродействии. Результат достигается тем, что сегментацию осуществляют в один этап от более грубой к более детализированной, а поиск производят на n-количестве уровней детализации исходного изображения, на каждом уровне детализации изображение разделяют на области, для каждой области путем n-количества последовательных итераций назначают единое значение сегментации, подсчитывают значение ценовой функции швов на границах областей при разных вариантах сегментации изображения и для каждой области выбирают значение сегментации, приводящее к минимизации суммы ценовых функций швов и данных. Однако, такой способ не всегда обеспечивает точное выделение объекта на изображении, поскольку он предназначен для осуществления оптимальной сегментации для решения задач улучшения качества результирующего изображения панорамной съемки, полученного из нескольких исходных снимков.A known method of image segmentation by searching for a minimum of price functions, as claimed in RF patent RU 2489752 C2, published on 08/10/2013, namely, that optimal image segmentation is achieved, at which a global minimum of the sum of price functions of seams and image data is achieved, which is close to absolutely optimal in the absence of the need for additional memory resources of the mobile device, noise immunity in the image and speed. The result is that segmentation is carried out in one step from coarser to more detailed, and the search is performed on an n-number of levels of detail of the original image, at each level of detail the image is divided into regions, for each region a single value is assigned by n-number of consecutive iterations segmentation, calculate the value of the price function of the seams at the boundaries of the regions for different variants of image segmentation, and for each region choose a segmentation value that leads to minimization and the sum of cost functions of joints and data. However, this method does not always ensure accurate selection of an object in the image, since it is designed to perform optimal segmentation to solve problems of improving the quality of the resulting panoramic image obtained from several source images.
Способом, выбранным в качестве прототипа, является способ сегментации растровых изображений на основе выращивания и слияния областей, представленный в патенте РФ RU 2440609 С1, опубликованный 20.01.2012. Техническим результатом данного способа является повышение качества сегментации. В способе производят начальную избыточную сегментацию с помощью выращивания областей до полного заполнения ими площади изображения с использованием информации о цвете, осуществляют пошаговый процесс слияний областей с возможностью использования текстурной информации, рассчитывают многомасштабное градиентное изображение с использованием метода вычисления вейвлет-статистики, при определении центров кристаллизации с помощью поиска минимумов градиентного изображения используют морфологическую заливку и квантование уровней, производят вычисление вейвлет-статистики для получения текстурной информации, которую одинаково используют как при попиксельном выращивании областей, так и при слиянии областей, при поиске оптимального шага окончания слияний областей определяется максимум скорости роста последовательности значений функции стоимости слияний, вычисленных на всем диапазоне слияний областей.The method selected as a prototype is a method for segmenting raster images based on growing and merging areas, as presented in RF patent RU 2440609 C1, published January 20, 2012. The technical result of this method is to improve the quality of segmentation. In the method, the initial excess segmentation is performed by growing areas until they completely fill the image area using color information, carry out a step-by-step process of merging areas with the possibility of using texture information, calculate a multiscale gradient image using the method of calculating wavelet statistics, when determining the crystallization centers with using the search for minima of the gradient image using morphological fill and quantization of levels, produced odyat calculating wavelet-statistic for the texture information which is equally used as cultivation at per-pixel areas, and the fusion regions, when searching for the optimum step closure M areas defined by the maximum growth rate of the sequence of M values of the cost function calculated on the whole range of M regions.
Недостатком данного способа является вычислительная сложность осуществления сегментации изображения вследствие применения трудоемких действий, направленных на улучшение результата сегментации: начальной избыточной сегментации с помощью выращивания областей, пошагового процесса слияний областей, расчета многомасштабного градиентного изображения с использованием метода вычисления вейвлет-статистики.The disadvantage of this method is the computational complexity of image segmentation due to the use of time-consuming actions aimed at improving the segmentation result: initial excessive segmentation by growing areas, a step-by-step process of merging areas, calculating a multiscale gradient image using the method of calculating wavelet statistics.
Решение технической задачи предложенным в данной заявке способом заключается в упрощении процесса сегментации изображения за счет применения вычисления особых точек вейвлет-преобразования.The solution to the technical problem proposed in this application is to simplify the process of image segmentation by applying the calculation of the specific points of the wavelet transform.
Решение технической задачи в первом варианте способа сегментации цифрового изображения, заключающемся в бинаризации цифрового изображения, при котором одним цветом на бинарном цифровом изображении выделяют фон, а другим цветом - объекты, имеющиеся на фоне, и в последующей сегментации бинарного цифрового изображения, достигается тем, что получение бинарного цифрового изображения осуществляют путем выделения особых точек вейвлет-преобразования цифрового изображения, для чего осуществляют вейвлет-разложение цифрового изображения на нескольких уровнях детализации цифрового изображения, каждый пиксель цифрового изображения рассматривают как возможную особую точку цифрового изображения, вычисляя его вес на основании вейвлет-коэффициентов вейвлет-преобразования цифрового изображения, далее формируют бинарное цифровое изображение, отмечая на нем пиксели, соответствующие по местоположению полученным особым точкам вейвлет-преобразования цифрового изображения, вес которых превышает заданное пороговое значение веса, подобранное таким образом, что особые точки вейвлет-преобразования цифрового изображения концентрируются на объекте цифрового изображения и отсутствуют на фоне цифрового изображения, далее осуществляют сегментацию бинарного цифрового изображения при помощи поиска связных компонент пикселей цифрового изображения путем объединения только таких граничащих друг с другом пикселей бинарного цифрового изображения, которые соответствуют пикселям объектов бинарного цифрового изображения, в отдельные классы эквивалентности пикселей цифрового изображения, определяя классы эквивалентности пикселей цифрового изображения и присваивая пикселям бинарного изображения метки, соответствующие классам эквивалентности пикселей цифрового изображения, анализируя каждый пиксель бинарного цифрового изображения один раз: если при маркировании пикселя бинарного цифрового изображения выясняют, что ему уже была присвоена метка класса эквивалентности пикселей цифрового изображения и значение этой метки класса эквивалентности пикселей цифрового изображения меньше значения присваиваемой метки класса эквивалентности пикселей цифрового изображения, то осуществляют перемаркирование всех пикселей бинарного цифрового изображения, принадлежащих классу эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения, при помощи метки класса эквивалентности пикселей цифрового изображения с меньшим значением, а также объединение класса эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения с классом эквивалентности с меньшим значением метки класса эквивалентности пикселей цифрового изображения в один класс эквивалентности пикселей цифрового изображения с меньшим значением метки класса эквивалентности пикселей цифрового изображения, после осуществления анализа всех пикселей цифрового изображения формируют новое цифровое изображение, на котором отмечают пиксели, имеющие метки классов эквивалентности пикселей цифрового изображения, и рассматривают полученное цифровое изображение как цифровое изображение, разделенное на сегменты и содержащее объекты исходного цифрового изображения и не содержащее фона исходного цифрового изображения.The solution of the technical problem in the first embodiment of the digital image segmentation method, which consists in binarizing a digital image, in which the background is highlighted in one binary image and the objects on the background are highlighted in another color, and in the subsequent binary digital image segmentation, it is achieved by obtaining a binary digital image is carried out by highlighting the specific points of the wavelet transform of the digital image, for which the wavelet decomposition of the digital image into n how many levels of detail of the digital image, each pixel of the digital image is considered as a possible singular point of the digital image, calculating its weight based on the wavelet coefficients of the wavelet transform of the digital image, then form a binary digital image, marking on it the pixels corresponding to the location of the obtained special points of the wavelet -transformations of a digital image, the weight of which exceeds a predetermined threshold value of the weight, selected in such a way that the singular points of the wavelet Digital image t-transformations are concentrated on the digital image object and are absent on the background of the digital image, then they segment the binary digital image by searching for connected components of the pixels of the digital image by combining only such adjacent pixels of the binary digital image that correspond to the pixels of the binary digital objects images, into separate pixel equivalence classes of a digital image, defining classes equivalently these pixels of the digital image and assigning the pixels corresponding to the equivalence classes of pixels of the digital image to the pixels of the binary image, analyzing each pixel of the binary digital image once: if, when marking the pixel of the binary digital image, it is determined that it has already been assigned the label of the equivalence class of pixels of the digital image and the value of this digital pixel equivalence class labels are less than the value of the assigned digital pixel equivalence class labels of a flat image, then all the pixels of the binary digital image belonging to the equivalence class of pixels of a digital image with a large label value of the equivalence class of pixels of a digital image are marked using a label of the equivalence class of pixels of a digital image with a lower value, as well as the combination of the equivalence class of pixels of a digital image with a large the label value of the equivalence class of pixels of a digital image with an equivalence class with a smaller the value of the label equivalence class label of the digital image pixels into one pixel equivalence class of the digital image with the lower pixel equivalence class label value of the digital image, after analyzing all the pixels of the digital image, a new digital image is formed on which the pixels having the label equivalence class labels of the digital image are marked, and consider the resulting digital image as a digital image, divided into segments and containing objects and similar digital image and not containing the background of the original digital image.
Решение технической задачи во втором варианте способа сегментации цифрового изображения, заключающемся в бинаризации цветного изображения, при котором одним цветом на бинарном цифровом изображении выделяют фон, а другим цветом - объекты, имеющиеся на фоне, и в последующей сегментации бинарного цифрового изображения, достигается тем, что получение бинарного цифрового изображения осуществляют путем выделения особых точек вейвлет-преобразования цифрового изображения, для чего осуществляют вейвлет-разложение цифрового изображения на нескольких уровнях детализации цифрового изображения, каждый пиксель цифрового изображения рассматривают как возможную особую точку цифрового изображения, вычисляя его вес на основании вейвлет-коэффициентов вейвлет-преобразования цифрового изображения, далее формируют бинарное цифровое изображение, отмечая на нем только такие пиксели цифрового бинарного изображения, которые не соответствуют по местоположению полученным особым точкам вейвлет-преобразования цифрового изображения, вес которых превышает заданное пороговое значение веса, подобранное таким образом, что особые точки вейвлет-преобразования цифрового изображения концентрируются на контурах объекта цифрового изображения и отсутствуют на фоне цифрового изображения, далее осуществляют сегментацию бинарного цифрового изображения при помощи поиска связных компонент пикселей цифрового изображения путем объединения только таких граничащих друг с другом пикселей бинарного цифрового изображения, которые не соответствуют пикселям контуров объектов бинарного цифрового изображения, в отдельные классы эквивалентности пикселей цифрового изображения, определяя классы эквивалентности пикселей цифрового изображения и присваивая пикселям бинарного цифрового изображения метки, соответствующие классам эквивалентности пикселей цифрового изображения, анализируя каждый пиксель бинарного цифрового изображения один раз: если при маркировании пикселя бинарного цифрового изображения выясняют, что ему уже была присвоена метка класса эквивалентности пикселей цифрового изображения и значение этой метки класса эквивалентности пикселей цифрового изображения меньше значения присваиваемой метки класса эквивалентности пикселей цифрового изображения, то осуществляют перемаркирование всех пикселей бинарного цифрового изображения, принадлежащих классу эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения, при помощи метки класса эквивалентности пикселей цифрового изображения с меньшим значением, а также объединение класса эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения с классом эквивалентности с меньшим значением метки класса эквивалентности пикселей цифрового изображения в один класс эквивалентности пикселей цифрового изображения с меньшим значением метки класса эквивалентности пикселей цифрового изображения, после осуществления анализа всех пикселей цифрового изображения формируют новое цифровое изображение, на котором отмечают пиксели цифрового изображения, соответствующие контурам объекта цифрового изображения, и все совокупности пикселей каждого класса эквивалентности пикселей цифрового изображения, кроме совокупности пикселей класса эквивалентности пикселей цифрового изображения, в который входит наибольшее число пикселей цифрового изображения и который считают соответствующим пикселям фона цифрового изображения.The solution to the technical problem in the second variant of the digital image segmentation method, which consists in binarizing a color image, in which the background is highlighted in one binary image and the objects on the background in another color, and in the subsequent binary digital image segmentation is achieved by obtaining a binary digital image is carried out by highlighting the specific points of the wavelet transform of the digital image, for which the wavelet decomposition of the digital image into n how many levels of detail of the digital image, each pixel of the digital image is considered as a possible singular point of the digital image, calculating its weight on the basis of the wavelet coefficients of the wavelet transform of the digital image, then form a binary digital image, marking on it only such pixels of the digital binary image that correspond to the location of the obtained special points of the wavelet transform of the digital image, the weight of which exceeds a predetermined threshold value in It is chosen in such a way that the singular points of the wavelet transform of the digital image are concentrated on the contours of the digital image object and are absent against the background of the digital image, then the binary digital image is segmented by searching for connected components of the pixels of the digital image by combining only such adjacent pixels binary digital images that do not match the pixels of the contours of objects of the binary digital image, in separate classes of equi the valency of the pixels of a digital image, determining the equivalence classes of pixels of a digital image and assigning labels to the pixels of a binary digital image labels corresponding to the classes of equivalence of pixels of a digital image, analyzing each pixel of a binary digital image once: if, when marking a pixel of a binary digital image, it is determined that a label has already been assigned to it the equivalence class of pixels of a digital image and the value of this label the equivalence class of pixels of a digital if the image is less than the value of the assigned label equivalence class of the pixels of the digital image, then all the pixels of the binary digital image belonging to the class of equivalence of the pixels of the digital image with a large label value of the class of equivalence of pixels of the digital image are re-marked using the label of the equivalence class of pixels of the digital image with a lower value, and combining the pixel equivalence class of a digital image with a large label value the equivalence of pixels of a digital image with an equivalence class with a lower label value of the equivalence class of pixels of a digital image into one equivalence class of pixels of a digital image with a lower label value of the class of equivalence of pixels of a digital image, after analyzing all the pixels of the digital image, a new digital image is formed, on which the pixels of the digital images corresponding to the contours of the digital image object, and all pixel collections each equivalence class pixels of the digital image other than the set of pixels of the equivalence class of pixels of the digital image, which includes the largest number of pixels of the digital image and which is considered relevant to the background of the digital image pixels.
Достоинством способа сегментации при помощи вейвлет-преобразования для обоих вариантов способа является возможность выделения наиболее значимых объектов на изображении, не учитывая объекты небольшого размера. В предлагаемом способе сегментации предлагается осуществлять сегментацию только за счет применения математического аппарата вейвлет-преобразования для поиска особых точек, что позволяет ускорить процесс сегментации, а также предоставляет возможность осуществить несложную аппаратную реализацию данного способа.The advantage of the method of segmentation using wavelet transform for both variants of the method is the ability to highlight the most significant objects in the image, not taking into account the objects of small size. In the proposed method of segmentation, it is proposed to carry out segmentation only through the use of the mathematical apparatus of the wavelet transform to search for specific points, which allows to accelerate the segmentation process, and also provides the ability to implement a simple hardware implementation of this method.
На фиг.1 представлено устройство, с помощью которого может быть осуществлен предлагаемый способ по первому и второму варианту. Оно содержит: 1 - центральный процессор, 2 - блок оперативной памяти, 3 - накопитель на магнитном диске, 4 - видеомонитор, 5 - компьютерную мышь, 6 - клавиатуру. Входы центрального процессора 1 соединены с выходами блока оперативной памяти 2, накопителя на магнитном диске 3, компьютерной мыши 5 и клавиатуры 6. Выходы центрального процессора 1 соединены с входами блока оперативной памяти 2, накопителя на магнитном диске 3 и видеомонитора 4.Figure 1 shows the device with which the proposed method according to the first and second embodiment can be implemented. It contains: 1 - a central processor, 2 - a RAM block, 3 - a magnetic disk drive, 4 - a video monitor, 5 - a computer mouse, 6 - a keyboard. The inputs of the
На фиг.2 представлено исходное цифровое изображение, содержащее объект на фоне.Figure 2 presents the original digital image containing the object on the background.
На фиг.3 представлено цифровое изображение, представляющее результат применения вейвлет-разложение исходного цифрового изображения как на фиг.2 до второго уровня детализации вейвлет-преобразования цифрового изображения согласно первому и второму вариантам способа, где 7 - усредненное цифровое изображение второго уровня вейвлет-преобразования цифрового изображения фиг.2, 8 - вертикальные детализирующие коэффициенты второго уровня вейвлет-преобразования цифрового изображения фиг.2, 9 - горизонтальные детализирующие коэффициенты второго уровня вейвлет-преобразования цифрового изображения фиг.2, 10 - диагональные детализирующие коэффициенты второго уровня вейвлет-преобразования цифрового изображения фиг.2, 11 - горизонтальные детализирующие коэффициенты первого уровня вейвлет-преобразования цифрового изображения фиг.2, 12 - вертикальные детализирующие коэффициенты первого уровня вейвлет-преобразования цифрового изображения фиг.2, 13 - диагональные детализирующие коэффициенты первого уровня вейвлет-преобразования цифрового изображения фиг.2.Figure 3 presents a digital image representing the result of applying the wavelet decomposition of the original digital image as in figure 2 to the second level of detail of the wavelet transform of the digital image according to the first and second variants of the method, where 7 is an averaged digital image of the second level of the wavelet transform of
На фиг.4 представлено бинарное цифровое изображение, где 14 - совокупность пикселей, соответствующих особым точкам вейвлет-преобразования цифрового изображения фиг.2, отмечена черным цветом, и 15 - совокупность пикселей, соответствующих фону цифрового изображения фиг.2, отмечена белым цветом.Figure 4 presents a binary digital image, where 14 is a set of pixels corresponding to the specific points of the wavelet transform of the digital image of figure 2, is marked in black, and 15 is a set of pixels corresponding to the background of the digital image of figure 2, is marked in white.
На фиг.5 представлено бинарное цифровое изображение, где согласно первому и второму вариантам способа меткой «0» помечены пиксели бинарного цифрового изображения, принадлежащие фону, меткой «1» помечены пиксели бинарного цифрового изображения, принадлежащие объектам на фоне согласно первому и второму вариантам способа.Figure 5 presents a binary digital image, where according to the first and second variants of the method, the “0” marks the pixels of the binary digital image belonging to the background, the “1” marks the pixels of the binary digital image belonging to objects on the background according to the first and second variants of the method.
На фиг.6 представлено бинарное цифровое изображение, где согласно первому и второму вариантам способа меткой «0» помечены пиксели бинарного цифрового изображения, принадлежащие фону, метками с числовыми значениями больше 0 помечены пиксели бинарного цифрового изображения, принадлежащие различным объектам, выделенным на фоне, порядок нахождения которых соответствует значению метки пикселей цифрового изображения.Figure 6 presents a binary digital image, where according to the first and second variants of the method, the “0” label indicates the pixels of the binary digital image belonging to the background, the labels with numerical values greater than 0 indicate the pixels of the binary digital image belonging to various objects highlighted in the background, the order finding which corresponds to the value of the pixel label of the digital image.
На фиг.7 представлено цифровое изображение, где 16 - сегмент цифрового изображения фиг.2.In Fig.7 presents a digital image, where 16 is a segment of a digital image of Fig.2.
На фиг.8 представлено результирующее цифровое изображение, на котором согласно первому варианту способа отображен объект исходного цифрового изображения фиг.2On Fig presents the resulting digital image, which according to the first variant of the method displays the object of the original digital image of figure 2
На фиг.9 представлено бинарное цифровое изображение, где 17 - совокупность пикселей, соответствующих особым точкам вейвлет-преобразования цифрового изображения фиг.2, отмечена белым цветом, и 18 - совокупность пикселей, соответствующих фону цифрового изображения фиг.2, отмечена черным цветом.Figure 9 presents a binary digital image, where 17 is the set of pixels corresponding to the specific points of the wavelet transform of the digital image of figure 2, is marked in white, and 18 is the set of pixels corresponding to the background of the digital image of figure 2, is marked in black.
На фиг.10 представлено результирующее цифровое изображение, на котором согласно второму варианту способа отображен объект исходного цифрового изображения фиг.2.Figure 10 presents the resulting digital image, which according to the second variant of the method displays the object of the original digital image of figure 2.
Алгоритм работы центрального процессора 1 для осуществления первого варианта заявленного способа сегментации цифрового изображения приведен в приложении 1 к заявке.The operation algorithm of the
Алгоритм работы центрального процессора 1 для осуществления второго варианта заявленного способа сегментации цифрового изображения приведен в приложении 2 к заявке.The algorithm of the
Рассмотрим осуществление предлагаемого способа сегментации цифрового изображения согласно первому варианту способа. Данный способ заключается в бинаризации цифрового изображения и его последующей сегментации. Под цифровым изображением в данном случае понимают цветное растровое цифровое изображение, которое представляет собой двумерную дискретную функцию f(x, у) дискретных величин x, y, которая представляет собой цифровой сигнал значений интенсивности цвета, представленного в каком-либо цветовом пространстве, в точках плоскости, где x и y - координаты пикселя. Пиксель - это наименьший логический элемент двумерного цифрового изображения в растровой графике. Под бинарным изображением понимают цифровое растровое изображение, когда каждый пиксель может представлять только один из двух цветов.Consider the implementation of the proposed method of segmentation of a digital image according to the first variant of the method. This method consists in binarizing a digital image and its subsequent segmentation. In this case, a digital image is understood to mean a color raster digital image, which is a two-dimensional discrete function f (x, y) of discrete values x, y, which is a digital signal of the values of the color intensity, presented in any color space, at points on the plane where x and y are the coordinates of the pixel. A pixel is the smallest logical element of a two-dimensional digital image in raster graphics. A binary image is understood to mean a digital raster image when each pixel can represent only one of two colors.
В качестве входных данных для сегментации цифрового изображения используют цифровые растровые изображения, которые предварительно получены с любого цифрового устройства получения цифровых растровых изображений и сохранены на накопителе на магнитном диске 3. Программу сегментации цифрового изображения предварительно сохраняют также на накопителе на магнитном диске 3.As input data for digital image segmentation, digital raster images are used, which are preliminarily obtained from any digital device for receiving digital raster images and stored on a
Сначала производят включение устройства, блок-схема которого приведена на фиг.1, в сеть питания. Затем осуществляют загрузку программы, являющейся инструкцией для центрального процессора 1 по выполнению действий для осуществления сегментации цифрового изображения согласно алгоритма, приведенного в приложении 1 к заявке, в блок оперативной памяти 2 при помощи сигналов от компьютерной мыши 5 и клавиатуры 6. Далее при помощи выполнения инструкций загруженной программы сегментации цифрового изображения на центральном процессоре 1 осуществляют загрузку цифрового изображения, например, как на фиг.2, с накопителя на магнитном диске 3 в блок оперативной памяти 2 при помощи управляющих сигналов от компьютерной мыши 5 и клавиатуры 6. Далее посредством центрального процессора 1 в блоке оперативной памяти 2 осуществляют получение бинарного цифрового изображения при помощи вейвлет-преобразования цифрового изображения на нескольких уровнях детализации изображения.First, the device, the block diagram of which is shown in figure 1, is turned on in the power supply. Then, the program is loaded, which is an instruction for the
Вейвлет-преобразование сигнала - это его представление в виде обобщенного ряда или интеграла Фурье по системе базисных функций.The wavelet transform of a signal is its representation in the form of a generalized series or Fourier integral over a system of basis functions.
Индекс i служит для идентификации направления вейвлетов по горизонтали, вертикали и диагонали. Дискретное вейвлет-преобразование изображения f(x,y) определяется следующим образом.Index i is used to identify the direction of wavelets horizontally, vertically and diagonally. The discrete wavelet transform of the image f (x, y) is defined as follows.
В данном случае j0 - произвольный начальный масштаб, Wφ, усредненное изображение, например, как на фиг.3 усредненное цифровое изображение 7 для второго уровня вейвлет-преобразования цифрового изображения фиг.2, коэффициенты определяют горизонтальные, вертикальные и диагональные детализирующие коэффициенты масштабов j вейвлет-преобразования цифрового изображения. Например, на фиг.3 представлены горизонтальные детализирующие коэффициенты 8, вертикальные детализирующие коэффициенты 9 и диагональные детализирующие коэффициенты 10 второго уровня вейвлет-преобразования цифрового изображения фиг.2, горизонтальные детализирующие коэффициенты 11, вертикальные детализирующие коэффициенты 12 и диагональные детализирующие коэффициенты 13 первого уровня вейвлет-преобразования цифрового изображения фиг.2. Исходное цифровое изображение f(x,y) может быть восстановлено по данным коэффициентам Wφ, и при помощи обратного дискретного вейвлет-преобразования цифрового изображения. Полученное усредненное цифровое изображение Wφ, подвергают повторному вейвлет-преобразованию заданное количество раз и, таким образом, получают разложение цифрового изображения на вейвлет-коэффициенты вейвлет-преобразования цифрового изображения на нескольких уровнях детализации вейвлет-преобразования цифрового изображения. Например, для осуществляют вейвлет-преобразование цифрового изображения фиг.2 до второго уровня детализации вейвлет-преобразования цифрового изображения и получают цифровое изображение как на фиг.3.In this case, j 0 is an arbitrary initial scale, W φ , an averaged image, for example, as in FIG. 3, an averaged
После этого при помощи центрального процессора 1 осуществляют поиск особых точек вейвлет-преобразования цифрового изображения в блоке оперативной памяти 2.After that, using the
Особыми точками называют те точки цифрового изображения, которые содержат основную информацию о цифровом изображении. Особые точки обычно располагаются в местах сильного перепада яркости пикселей цифрового изображения, на границах и краях объектов. Особой точкой х′ изображения называется точка, чья окрестность отличается от окрестностей близлежащих точек по выбранной мере, т.е. , где Ωx - окрестность точки х. В данном случае особой точкой вейвлет-преобразования цифрового изображения считают точку, вес которой превышает заданное пороговое значение веса.Special points are those points of the digital image that contain basic information about the digital image. Special points are usually located in places of a sharp difference in the brightness of the pixels of a digital image, at the borders and edges of objects. A singular point x ′ of an image is a point whose neighborhood differs from the neighborhoods of nearby points by the chosen measure, i.e. , where Ω x is a neighborhood of x. In this case, a point whose weight exceeds a predetermined threshold weight value is considered a special point of the wavelet transform of a digital image.
Для каждого пикселя исходного цифрового изображения вводят понятие веса:For each pixel of the original digital image, the concept of weight is introduced:
где Wi(f(x,y)) - вес точки на i-ом уровне детализации, dhi(x,y) - горизонтальный коэффициент i-ого уровня, dνi(x,y) - вертикальный коэффициент i-ого уровня, ddi(x,y) - диагональный коэффициент i-ого уровня.where W i (f (x, y)) is the weight of the point at the i-th level of detail, dh i (x, y) is the horizontal coefficient of the i-th level, dν i (x, y) is the vertical coefficient of the i-th level , dd i (x, y) is the diagonal coefficient of the i-th level.
На первом шаге все веса равны 0. Затем осуществляют вейвлет-преобразование цифрового изображения до n-о уровня детализации цифрового изображения, подсчитывают начальный вес особой точки по формуле (6), и производят рекурсивный переход на (n-1)-й уровень детализации цифрового изображения. На этом уровне получают 4 дочерних точки цифрового изображения. Вес каждой из этих точек цифрового изображения добавляют к весу родительской точки предыдущего уровня детализации цифрового изображения. Производят корректировку веса особой точки в соответствии с формулой (7) и рекурсивный переход на предыдущий уровень вейвлет-преобразования цифрового изображения.At the first step, all weights are 0. Then, the wavelet transform of the digital image to the n-th level of detail of the digital image is carried out, the initial weight of the singular point is calculated by formula (6), and a recursive transition to the (n-1) th level of detail of the digital Images. At this level, 4 child points of the digital image are obtained. The weight of each of these points of the digital image is added to the weight of the parent point of the previous level of detail of the digital image. The weight of the singular point is adjusted in accordance with formula (7) and a recursive transition to the previous level of the wavelet transform of the digital image is performed.
Вышеуказанные действия повторяют для всех уровней вейвлет-преобразования цифрового изображения. Окончательный вес точки цифрового изображения определяют суммой вейвлет-коэффициентов предыдущих уровней (7).The above steps are repeated for all levels of the wavelet transform of the digital image. The final weight of the digital image point is determined by the sum of the wavelet coefficients of the previous levels (7).
После сортировки особых точек цифрового изображения по убыванию весов при помощи центрального процессора 1 выбирают особые точки цифрового изображения с весами, большими заданного порогового значения, подобранного таким образом, что особые точки концентрируются на объекте и отсутствуют на фоне. Затем в блоке оперативной памяти 2 при помощи центрального процессора 1 формируют бинарное цифровое изображение, отмечая на нем в качестве пикселей объекта цифрового изображения пиксели, соответствующие по местоположению полученным особым точкам цифрового изображения, например, как на фиг.4. Цифровое изображение, полученное в результате бинаризации цифрового изображения, выводится в виде цифрового видеосигнала на видеомонитор 4. Например, при уровне детализации вейвлет-преобразования цифрового изображения фиг.2, равном четырем, и пороговом значении веса особых точек вейвлет-преобразования цифрового изображения, равном 200, получают цифровое изображение как на фиг.4, состоящее из совокупности 14 пикселей, соответствующих особым точкам вейвлет-преобразования цифрового изображения фиг.2, и совокупности 15 пикселей, соответствующих фону цифрового изображения фиг.2. Бинарное цифровое изображение фиг.4 выводится в виде цифрового видеосигнала на видеомонитор 4.After sorting the specific points of the digital image in descending order by means of the
После этого при помощи центрального процессора 1 осуществляют сегментацию бинарного изображения в блоке оперативной памяти 2, например, как на фиг.4, при помощи поиска связных компонент пикселей цифрового изображения. Сегментация - это процесс разделения цифрового изображения на несколько сегментов (множества пикселей). Более точно, сегментация изображений - это процесс присвоения таких меток каждому пикселю изображения, что пиксели с одинаковыми метками имеют общие визуальные характеристики. Связная компонента - топологическое пространство пикселей цифрового изображения, которое невозможно разбить на два непустых непересекающихся открытых подмножества пикселей цифрового изображения. Такие компоненты получают путем объединения граничащих друг с другом пикселей бинарного цифрового изображения в отдельные классы эквивалентности пикселей цифрового изображения. Класс эквивалентности пикселей цифрового изображения - совокупность граничащих пикселей, в соответствие которой ставится числовая метка, отражающая временной порядок нахождения первого пикселя данного класса эквивалентности пикселей цифрового изображения. Нумерация меток начинается от нуля. Нулевая метка соответствует пикселям фона на цифровом изображении, метки со значением «1» соответствуют пикселям объектов на цифровом изображении, например, как на фиг.5. Метка хранится как бинарное значение цифрового сигнала соответствующего пикселя цифрового изображения.After that, using the
Для осуществления сегментации при помощи центрального процессора 1 определяют классы эквивалентности пикселей бинарного цифрового изображения и присваивают пикселям бинарного цифрового изображения метки, соответствующие классам эквивалентности пикселей бинарного цифрового изображения, анализируя каждый пиксель бинарного цифрового изображения один раз. Если при маркировании пикселя бинарного цифрового изображения выясняют, что ему уже была присвоена метка класса эквивалентности пикселей цифрового изображения и значение этой метки класса эквивалентности пикселей цифрового изображения меньше значения присваиваемой метки класса эквивалентности пикселей цифрового изображения, то осуществляют перемаркирование всех пикселей бинарного цифрового изображения, принадлежащих классу эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения, при помощи метки класса эквивалентности пикселей цифрового изображения с меньшим значением, а также объединение класса эквивалентности пикселей цифрового изображения с большим значением метки класса эквивалентности пикселей цифрового изображения с классом эквивалентности с меньшим значением метки класса эквивалентности пикселей цифрового изображения в один класс эквивалентности пикселей цифрового изображения с меньшим значением метки класса эквивалентности пикселей цифрового изображения. Таким образом, цифровое изображение, где каждому пикселю поставлена в соответствие либо метка фона, равная 0, либо метка класса эквивалентности, соответствующего отдельному сегменту (объекту) цифрового изображения, например, как на фиг.6. Например, цифровое изображение, полученное в результате сегментации цифрового изображения фиг.4, представленное на фиг.7, содержит найденные совокупности пикселей цифрового изображения, соответствующих различным объектам цифрового изображения: первому, второму, третьему, четвертому и пятому, и помеченных соответствующими метками «1», «2», «3», «4», «5», и совокупность пикселей фона, помеченных меткой «0». Цифровое изображение, полученное в результате сегментации, выводится в виде цифрового видеосигнала на видеомонитор 4.To perform segmentation using the
После осуществления анализа всех пикселей цифрового изображения при помощи центрального процессора 1 в блоке оперативной памяти 2 формируют новое цифровое изображение как на фиг.7, на котором отмечают совокупности пикселей каждого класса эквивалентности пикселей цифрового изображения и рассматривают их как сегменты (объекты) исходного цифрового изображения, например, на фиг.7 найден сегмент 16 цифрового изображения фиг.2. Затем получают новое цифровое изображение, например, как на фиг.8, на котором отображают прямоугольную область, содержащую сегмент 16 цифрового изображения фиг.2, и при помощи центрального процессора 1 выводят на видеомонитор 4.After the analysis of all the pixels of the digital image by means of the
Согласно второму варианту выполнения способа также сначала производят включение устройства в сеть питания. Затем осуществляют загрузку программы, являющейся инструкцией для центрального процессора 1 по выполнению действий для осуществления сегментации цифрового изображения согласно алгоритма, приведенного в приложении 2 к заявке, в блок оперативной памяти 2 при помощи сигналов от компьютерной мыши 5 и клавиатуры 6. Далее при помощи выполнения инструкций загруженной программы сегментации цифрового изображения на центральном процессоре 1 осуществляют загрузку цифрового изображения, например, как на фиг.2, с накопителя на магнитном диске 3 в блок оперативной памяти 2 при помощи сигналов от компьютерной мыши 5 и клавиатуры 6. Далее посредством центрального процессора 1 в блоке оперативной памяти 2 осуществляют получения бинарного цифрового изображения при помощи вейвлет-преобразования цифрового изображения на нескольких уровнях детализации изображения таким же образом, как и в первом варианте способа.According to a second embodiment of the method, the device is also first powered up. Then, the program is loaded, which is the instruction for the
После этого при помощи центрального процессора 1 осуществляют поиск особых точек вейвлет-преобразования цифрового изображения в блоке оперативной памяти 2, как и в первом варианте способа, однако, пороговое значение веса особых точек подбирают таким образом, что точки концентрируются на контурах объектов цифрового изображения и отсутствуют на фоне цифрового изображения, бинарное цифровое изображение формируют, отмечая на нем в качестве пикселей контуров объектов цифрового изображения пиксели, соответствующие по местоположению полученным особым точкам вейвлет-преобразования цифрового изображения, вес которых превышает заданное пороговое значение веса. Например, цифровое изображение как на фиг.2 подвергают вейвлет-преобразованию и разлагают на коэффициенты вейвлет-преобразования до третьего уровня, осуществляют поиск особых точек вейвлет-преобразования цифрового изображения, выделяют только те особые точки вейвлет-преобразования цифрового изображения, которые превышают заданное пороговое значение веса, равное 200, получают таким образом цифровое изображение как на фиг.9 с отмеченной белым цветом совокупностью 17 пикселей, соответствующих особым точкам вейвлет-преобразования цифрового изображения фиг.2, и отмеченной черным цветом совокупностью 18 пикселей, соответствующих фону цифрового изображения фиг.2.After that, using the
После этого при помощи центрального процессора 1 осуществляют сегментацию бинарного изображения в блоке оперативной памяти 2, при которой пиксели бинарного изображения черного цвета рассматривают в качестве пикселей, принадлежащих контурам цифрового изображения, а пиксели бинарного изображения белого цвета рассматривают в качестве пикселей объектов на изображении. Остальные действия для сегментации цифрового изображения осуществляются, как и в первом способе.After that, using the
После осуществления анализа всех пикселей цифрового изображения при помощи центрального процессора 1 в блоке оперативной памяти 2 формируют новое цифровое изображение, на котором отмечают пиксели изображения, соответствующие контурам объекта цифрового изображения, и все совокупности пикселей каждого класса эквивалентности пикселей цифрового изображения, кроме совокупности пикселей класса эквивалентности пикселей цифрового изображения, в который входит наибольшее число пикселей изображения. Пиксели этого класса эквивалентности пикселей цифрового изображения считают принадлежащими фону цифрового изображения и на новом цифровом изображении не отмечают. Остальные совокупности пикселей, принадлежащих отдельным классам эквивалентности пикселей цифрового изображения, рассматривают как сегменты (объекты) исходного цифрового изображения, например, как на фиг.10. Полученное цифровое изображение, например, как на фиг.10, при помощи центрального процессора 1 отображают на видеомониторе 4.After the analysis of all the pixels of the digital image by means of the
Уровень детализации вейвлет-преобразования цифрового изображения и пороговое значение весов особых точек вейвлет-преобразования цифрового изображения согласно первому и второму вариантам способа задают при помощи компьютерной мыши 5 и клавиатуры 6. Значение уровня детализации вейвлет-преобразования цифрового изображения и порогового значения весов особых точек вейвлет-преобразования цифрового изображения определяют в зависимости от размера объекта, имеющегося на цифровом изображении. Например, согласно первому варианту способа для цифрового изображения фиг.2 были выбраны четвертый уровень вейвлет-преобразования цифрового изображения и пороговое значение весов особых точек вейвлет-преобразования цифрового изображения, равное 400. Для осуществления второго варианта способа для цифрового изображения фиг.2 были выбраны третий уровень вейвлет-преобразования цифрового изображения и пороговое значение весов особых точек вейвлет-преобразования цифрового изображения, равное 200.The level of detail of the wavelet transform of the digital image and the threshold value of the weights of the singular points of the wavelet transform of the digital image according to the first and second variants of the method are set using the
По сравнению с прототипом решение задачи сегментации достигается только за счет применения математического аппарата вейвлет-преобразования для поиска особых точек вейвлет-преобразования цифрового изображения. Это позволяет ускорить процесс сегментации, а также предоставляет возможность осуществить несложную аппаратную реализацию данного способа.Compared with the prototype, the solution to the segmentation problem is achieved only by using the mathematical apparatus of the wavelet transform to search for specific points of the wavelet transform of the digital image. This allows you to speed up the segmentation process, and also provides the opportunity to implement a simple hardware implementation of this method.
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013156222/08A RU2555238C1 (en) | 2013-12-17 | 2013-12-17 | Digital image segmentation method (versions) |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013156222/08A RU2555238C1 (en) | 2013-12-17 | 2013-12-17 | Digital image segmentation method (versions) |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013156222A RU2013156222A (en) | 2015-06-27 |
RU2555238C1 true RU2555238C1 (en) | 2015-07-10 |
Family
ID=53497097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013156222/08A RU2555238C1 (en) | 2013-12-17 | 2013-12-17 | Digital image segmentation method (versions) |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2555238C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2638014C2 (en) * | 2015-09-28 | 2017-12-08 | Общество С Ограниченной Ответственностью "Яндекс" | Method and computer device for creating simplified borders of graphic objects |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2325044C1 (en) * | 2007-02-21 | 2008-05-20 | Московский государственный университет инженерной экологии | Gradient method of object contour extraction at halftone raster image matrix |
RU2368007C1 (en) * | 2008-03-25 | 2009-09-20 | Самсунг Электроникс Ко., Лтд. | Method for segmentation of text by colour criterion in process of copying |
US20110182517A1 (en) * | 2010-01-20 | 2011-07-28 | Duke University | Segmentation and identification of layered structures in images |
RU2440608C1 (en) * | 2010-12-02 | 2012-01-20 | Государственное образовательное учреждение высшего профессионального образования Московский военный институт радиоэлектроники Космических войск | Object recognition method based on fractal-wavelet analysis |
-
2013
- 2013-12-17 RU RU2013156222/08A patent/RU2555238C1/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2325044C1 (en) * | 2007-02-21 | 2008-05-20 | Московский государственный университет инженерной экологии | Gradient method of object contour extraction at halftone raster image matrix |
RU2368007C1 (en) * | 2008-03-25 | 2009-09-20 | Самсунг Электроникс Ко., Лтд. | Method for segmentation of text by colour criterion in process of copying |
US20110182517A1 (en) * | 2010-01-20 | 2011-07-28 | Duke University | Segmentation and identification of layered structures in images |
RU2440608C1 (en) * | 2010-12-02 | 2012-01-20 | Государственное образовательное учреждение высшего профессионального образования Московский военный институт радиоэлектроники Космических войск | Object recognition method based on fractal-wavelet analysis |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2638014C2 (en) * | 2015-09-28 | 2017-12-08 | Общество С Ограниченной Ответственностью "Яндекс" | Method and computer device for creating simplified borders of graphic objects |
Also Published As
Publication number | Publication date |
---|---|
RU2013156222A (en) | 2015-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chudasama et al. | Image segmentation using morphological operations | |
Xiao et al. | Fast image dehazing using guided joint bilateral filter | |
Russ | Computer-assisted microscopy: the measurement and analysis of images | |
Roa'a et al. | Generation of high dynamic range for enhancing the panorama environment | |
Luan et al. | Fast single image dehazing based on a regression model | |
Sharma et al. | Edge detection using Moore neighborhood | |
CN108960012B (en) | Feature point detection method and device and electronic equipment | |
Srinivas et al. | Remote sensing image segmentation using OTSU algorithm | |
CN108805838B (en) | Image processing method, mobile terminal and computer readable storage medium | |
Sert | A new modified neutrosophic set segmentation approach | |
Zhang et al. | Single image dehazing using fixed points and nearest-neighbor regularization | |
Favorskaya et al. | Fast salient object detection in non-stationary video sequences based on spatial saliency maps | |
RU2555238C1 (en) | Digital image segmentation method (versions) | |
Prasad et al. | Grayscale to color map transformation for efficient image analysis on low processing devices | |
Marques et al. | Enhancement of low-lighting underwater images using dark channel prior and fast guided filters | |
CN104778468B (en) | Image processing apparatus, image processing method, and monitoring device | |
CN108717699B (en) | Ultrasonic image segmentation method based on continuous minimum segmentation | |
CN111932469B (en) | Method, device, equipment and medium for fusing saliency weight fast exposure images | |
Murali et al. | Shadow removal from uniform-textured images using iterative thresholding of shearlet coefficients | |
Wu et al. | Omnidirectional Gradient and Its Application in Stylized Edge Extraction of Infrared Image | |
Van Vo et al. | High dynamic range video synthesis using superpixel-based illuminance-invariant motion estimation | |
RU2440609C1 (en) | Method for segmentation of bitmap images based on growing and merging regions | |
Chaczko et al. | A preliminary investigation on computer vision for telemedicine systems using OpenCV | |
Chang et al. | Pixel-based adaptive normalized cross correlation for illumination invariant stereo matching | |
Abin et al. | Blending of contrast enhancement techniques for underwater images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20161218 |