RU2304306C1 - Method for identification of a digital image containing a digital watermark - Google Patents

Method for identification of a digital image containing a digital watermark Download PDF

Info

Publication number
RU2304306C1
RU2304306C1 RU2006106881/09A RU2006106881A RU2304306C1 RU 2304306 C1 RU2304306 C1 RU 2304306C1 RU 2006106881/09 A RU2006106881/09 A RU 2006106881/09A RU 2006106881 A RU2006106881 A RU 2006106881A RU 2304306 C1 RU2304306 C1 RU 2304306C1
Authority
RU
Russia
Prior art keywords
image
digital
values
wavelet transform
wavelet
Prior art date
Application number
RU2006106881/09A
Other languages
Russian (ru)
Inventor
Владимир Алексеевич Иванов (RU)
Владимир Алексеевич Иванов
Эдуард Петрович Стельмах (RU)
Эдуард Петрович Стельмах
Олег В чеславович Гатилов (RU)
Олег Вячеславович Гатилов
Алексей Валентинович Скурнович (RU)
Алексей Валентинович Скурнович
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) filed Critical Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России)
Priority to RU2006106881/09A priority Critical patent/RU2304306C1/en
Application granted granted Critical
Publication of RU2304306C1 publication Critical patent/RU2304306C1/en

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

FIELD: steganography, namely, methods for identification of digital images, containing a digital watermark.
SUBSTANCE: in accordance to invention, native characteristic image vectors from teaching selection are built, which image vectors include statistical characteristics, calculated from distribution of wavelet coefficients and from distributions of wavelet coefficient prediction error within various sub-ranges. Teaching selection includes two image classes: digital images, containing watermarks, and digital images, not containing watermarks. After teaching of classifier, based on discriminant analysis, classification of analyzed image is performed, i.e. it is related to one of the classes. Therefore it is possible to identify the digital image with a watermark, i.e. to distinguish original image, protected by copyrights, from its copies, produced by printing and scanning.
EFFECT: possible identification of digital images, containing digital watermarks, under conditions of absence of a priori information about presence of digital watermark in the image and about the rule in accordance to which digital watermark is integrated.
3 dwg, 1 tbl

Description

Изобретение относится к области стеганографии, а именно к способам идентификации цифровых изображений (ЦИ), содержащих цифровой водяной знак (ЦВЗ), и может быть использовано для различения оригинального ЦИ, защищенного авторскими правами с помощью внедренного в него ЦВЗ, от его копий, а также для поиска ЦИ различных форматов, содержащих дополнительную цифровую информацию в условиях отсутствия априорных сведений о законе ее встраивания и присутствии в изображении.The invention relates to the field of steganography, and in particular to methods for identifying digital images (DIs) containing a digital watermark (CEH), and can be used to distinguish the original DI protected by copyright with the help of the integrated CEH from its copies, and to search for digital data of various formats containing additional digital information in the absence of a priori information about the law of its embedding and presence in the image.

Известен способ декодирования ЦВЗ, содержащегося в изображении формата JPEG (см. Patent US №0040001626, МПК G06K 009/00, 2004 г.) [1], основанный на оценке местных геометрических искажений, произошедших в изображении из-за встраивания эталонного сообщения X, и включающий следующие шаги: моделирование локальных искажений посредством индексной переменной J, позволяющей определить отличия искаженных данных от исходных, оценивание геометрических искажений с помощью эталонного сообщения X, модели локальных искажений и модели искаженных данных.A known method of decoding the CEH contained in a JPEG image (see Patent US No. 0040001626, IPC G06K 009/00, 2004) [1], based on the assessment of local geometric distortions that occurred in the image due to the embedding of the reference message X, and it includes the following steps: modeling local distortions using the index variable J, which allows one to determine the differences between the distorted data and the original ones, estimating geometric distortions using the reference message X, the local distortion model, and the distorted data model.

Также известен способ для идентификации данных изображения JPEG (см. Patent US №0040015697, МПК G06K 009/00, 2004 г.) [2], позволяющий установить, действительно ли полученное изображение отправлено известным источником и не было ли содержимое файла незначительно модифицировано во время передачи. Для кодирования проверочной информации уникальная хеш-функция получается из первой части данных изображения, содержащихся в сжатом изображении JPEG таким образом, что любые искажения указанной части данных изображения в дальнейшем были бы отражены в иной хеш-функции, полученной на основе принятого файла. Хеш-функция дает значение проверки целостности, записываемое в первую часть данных изображения. Далее это значение шифруется в строку подписи. Строка подписи встраивается в следующую часть данных изображения. Процесс повторяется до тех пор, пока все части данных изображения не будут обработаны. Строка подписи, соответствующая последней части данных, встраивается в эту часть. Так как внедрение значения проверки целостности не изменяет последовательности данных файла JPEG, любой декодер после этого может декодировать изображение. Далее файл изображения передается предназначенному получателю. Для декодирования получателем внедренной проверочной информации относительно подлинности отправителя файла JPEG хеш-функция вычисляется на основе первой части данных принятого изображения. Вторая часть данных характеризует местоположение, где была внедрена строка подписи для первой части данных. В этом случае подпись извлекается из данных. После чего строка подписи дешифруется в виде результата хеш-функции (проверки целостности), содержащейся в самих данных. Эти два числа сравниваются друг с другом. Если первое проверочное число соответствует числу, содержащемуся в найденной строке подписи, которая была ранее внедрена автором, то принимается решение, что данные первой части изображения подлинны. Процесс повторяется для каждой последующей части данных, пока не будут обработаны все части данных изображения.There is also a method for identifying JPEG image data (see Patent US No. 0040015697, IPC G06K 009/00, 2004) [2], which allows to establish whether the received image was really sent by a known source and if the contents of the file were slightly modified during transmission. To encode the verification information, a unique hash function is obtained from the first part of the image data contained in the compressed JPEG image so that any distortions of the specified part of the image data would be reflected in a different hash function obtained on the basis of the received file. The hash function gives the integrity check value written to the first part of the image data. Further, this value is encrypted in the signature line. The signature line is embedded in the next piece of image data. The process is repeated until all parts of the image data have been processed. The signature line corresponding to the last part of the data is embedded in this part. Since embedding the integrity check value does not change the data sequence of the JPEG file, any decoder can then decode the image. Next, the image file is transferred to the intended recipient. For the receiver to decode the embedded verification information regarding the authenticity of the sender of the JPEG file, the hash function is calculated based on the first part of the received image data. The second part of the data characterizes the location where the signature line was inserted for the first part of the data. In this case, the signature is retrieved from the data. After that, the signature string is decrypted as the result of the hash function (integrity check) contained in the data itself. These two numbers are compared with each other. If the first check number corresponds to the number contained in the found signature line, which was previously introduced by the author, then it is decided that the data of the first part of the image is authentic. The process is repeated for each subsequent piece of data until all parts of the image data have been processed.

Приведенные выше аналоги применяются в области защиты авторских прав для поиска изображений формата JPEG, содержащих ЦВЗ, которые могут быть искаженны в результате попыток их удаления из изображения, однако они применимы только в случае априорного знания о присутствии ЦВЗ в анализируемом изображении формата JPEG и о законе его встраивания, при этом способы применимы только для ЦИ формата JPEG.The above analogs are used in the field of copyright protection to search for JPEG images containing CEH, which may be distorted as a result of attempts to remove them from the image, but they are applicable only if there is a priori knowledge of the presence of the CEH in the analyzed JPEG image and its law embedding, while the methods are applicable only for digital format JPEG.

Наиболее близким по своей сущности к заявляемому способу (прототипом) является известный способ идентификации изображения, содержащего многократный ЦВЗ (см. Patent US №20050058320, МПК G06K 009/00, 2005 г.) [3], включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, соединенный с этапом считывания встроенных ЦВЗ из идентифицируемого документа (изображения), который в свою очередь соединен с этапом сравнения полученных энергетических характеристик считанных ЦВЗ двух типов с образцом, соединенным с этапом принятия решения о несанкционированном копировании идентифицируемого документа (изображения).The closest in essence to the claimed method (prototype) is a known method for identifying an image containing multiple CEH (see US Patent No. 200550058320, IPC G06K 009/00, 2005) [3], which includes the step of embedding in a document (image) additional information consisting of two types of CEH connected to the step of reading the embedded CEH from an identifiable document (image), which in turn is connected to the step of comparing the obtained energy characteristics of the read CEH of two types with a sample connected to the step m deciding on unauthorized copying of an identifiable document (image).

Такой способ используется в области защиты авторских прав и обеспечивает различение документов-оригиналов (изображений-оригиналов) от их копий, полученных путем распечатки и сканирования, однако недостатком способа является то, что он применяется только в условиях присутствия априорных сведений о законе встраивания ЦВЗ, в противном случае способ становится неэффективным и различить, является ли идентифицируемый документ (изображение) копией или оригиналом, не представляется возможным.This method is used in the field of copyright protection and provides a distinction between original documents (original images) from their copies obtained by printing and scanning, however, the disadvantage of this method is that it is used only in the presence of a priori information about the embedding law of the CEH in Otherwise, the method becomes ineffective and it is not possible to distinguish whether the identifiable document (image) is a copy or an original.

Целью изобретения является разработка способа идентификации цифровых изображений, содержащих цифровой водяной знак, обеспечивающего работу в условиях отсутствия априорных сведений о законе встраивания ЦВЗ, при этом способ должен быть применим для анализа изображений разных форматов (BMP, JPEG, GIF, PNG).The aim of the invention is to develop a method for identifying digital images containing a digital watermark, providing work in the absence of a priori information about the law of embedding CEH, and the method should be applicable for the analysis of images of different formats (BMP, JPEG, GIF, PNG).

Поставленная цель достигается за счет того, что в известный способ идентификации документа (изображения), содержащего многократный ЦВЗ, включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, соединенный с этапом считывания встроенных ЦВЗ из идентифицируемого документа (изображения), который в свою очередь соединен с этапом сравнения полученных энергетических характеристик считанных ЦВЗ двух типов с образцом, соединенным с этапом принятия решения о несанкционированном копировании идентифицируемого документа (изображения), после этапа встраивания вместо этапа считывания встроенных ЦВЗ из идентифицируемого документа (изображения) и последующих за ним этапов сравнения и принятия решения введены этап формирования трехмерного массива значений интенсивности точек изображения, этап формирования массива значений интенсивности точек красной цветовой составляющей изображения, этап формирования массива значений интенсивности точек зеленой цветовой составляющей изображения, этап формирования массива значений интенсивности точек синей цветовой составляющей изображения, этап многоуровневого дискретного двумерного вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на отдельных поддиапазонах вейвлет-преобразования, этап вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования, этап формирования собственного характеристического вектора изображения, этап формирования массива собственных характеристических векторов цифровых изображений из обучающей выборки, этап обучения классификатора и этап классифицирования цифрового изображения.This goal is achieved due to the fact that in the known method of identifying a document (image) containing multiple CEH, comprising the step of embedding additional information in the document (image), consisting of two types of CEH, connected to the step of reading the embedded CEH from the identifiable document (image) , which, in turn, is connected to the step of comparing the obtained energy characteristics of the read two types of CEHs with a sample connected to the step of deciding on unauthorized copying of the identifiable document (image), after the embedding step, instead of the step of reading the embedded CEH from the identifiable document (image) and the subsequent stages of comparison and decision making, the stage of forming a three-dimensional array of image point intensities values, the stage of generating an array of points intensity values of the red color component of the image are introduced, the stage of forming an array of intensity values of points of the green color component of the image, the stage of forming an array of intensities the identities of the points of the blue color component of the image, the step of a multi-level discrete two-dimensional wavelet transform, the step of calculating high-order statistical characteristics from the distribution of wavelet coefficients on individual sub-bands of the wavelet transform, the step of calculating the error of predicting coefficient values on different sub-bands of the wavelet transform, the step of calculating statistical characteristics high orders from the distribution of the error in predicting the values of wavelet coefficients on different subdia azone wavelet transform, the step of forming its own characteristic vector of the image, a step of forming an array of characteristic vectors of digital images from the training set, the classifier training step and a step of classifying a digital image.

Введение новых этапов позволяет идентифицировать цифровое изображение, содержащее ЦВЗ в условиях отсутствия априорных сведений о законе и месте встраивания ЦВЗ, при этом за счет введения этапов формирования трех массивов значений интенсивности точек трех цветовых составляющих изображения возникает возможность анализировать ЦИ различных форматов (BMP, JPEG, GIF, PNG).The introduction of new stages allows the identification of a digital image containing a CEH in the absence of a priori information about the law and place of incorporation of a CEH, and through the introduction of the stages of forming three arrays of point intensity values of the three color components of the image, it becomes possible to analyze DIs of various formats (BMP, JPEG, GIF , PNG).

Заявленный способ поясняется чертежами, на которых на фиг.1 представлена общая схема реализации способа идентификации цифрового изображения, содержащего цифровой водяной знак; на фиг.2 - выбор положения коэффициентов "соседей" относительно анализируемого коэффициента "А" (зачерненные квадраты) вейвлет-преобразования для формулы линейного предсказателя значений вейвлет-коэффициентов для: (А) - вертикальных поддиапазонов, (Б) - горизонтальных поддиапазонов, (В) - диагональных поддиапазонов; на фиг.3. представлен график вероятности правильной идентификации изображений различных форматов, содержащих ЦВЗ, в результате работы известного способа и заявляемого.The claimed method is illustrated by drawings, in which figure 1 presents a General diagram of a method for identifying a digital image containing a digital watermark; figure 2 - selection of the position of the coefficients of the "neighbors" relative to the analyzed coefficient "A" (blackened squares) wavelet transform for the formula of a linear predictor of the values of the wavelet coefficients for: (A) - vertical subranges, (B) - horizontal subranges, (C ) - diagonal subranges; figure 3. presents a graph of the probability of correct identification of images of various formats containing CEH, as a result of the known method and the claimed.

Заявленный способ, схема которого представлена на фиг.1, состоит из блока встраивания в изображение дополнительной информации 1, блока формирования трехмерного массива значений интенсивности точек изображения 2, который соединен с блоком формирования массива значений интенсивности точек красной цветовой составляющей изображения 3, с блоком формирования массива значений интенсивности точек зеленой цветовой составляющей изображения 4 и с блоком формирования массива значений интенсивности точек синей цветовой составляющей изображения 5, которые в свою очередь соединены с блоком многоуровневого дискретного двумерного вейвлет-преобразования 6, выход которого соединен с входом блока вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 7 и входом блока вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования 8, соединенного в свою очередь с блоком вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 9, выходы блоков 7 и 9 соединяются с входом блока формирования собственного характеристического вектора изображения 10, соединенного в свою очередь с блоком классифицирования изображения 13 и с блоком формирования массива собственных характеристических векторов изображений из обучающей выборки 11, который обратной связью соединен с блоком формирования трехмерного массива значений интенсивности точек изображения 2 и прямой связью с блоком обучения классификатора 12, выход которого соединен с входом блока классифицирования изображения 13.The claimed method, the scheme of which is shown in Fig. 1, consists of a block for embedding additional information 1 in an image, a block for generating a three-dimensional array of intensity values for image points 2, which is connected to a block for generating an array of intensity values for points of the red color component of image 3, with an array forming unit the intensity values of the points of the green color component of the image 4 and with the block forming an array of values of the intensity of the points of the blue color component of the image 5, which in turn are connected to a block of a multi-level discrete two-dimensional wavelet transform 6, the output of which is connected to the input of a block for calculating high-order statistical characteristics from the distribution of wavelet coefficients on different subbands of wavelet transform 7 and the input of a block for computing error prediction of coefficient values at different subbands of wavelet transform 8, which in turn is connected to the unit for calculating the statistical characteristics of high orders from the distribution of the error legends of the values of wavelet coefficients on different subbands of wavelet transform 9, the outputs of blocks 7 and 9 are connected to the input of the block for generating the own characteristic vector of the image 10, which in turn is connected to the block for classifying the image 13 and with the block for forming the array of the own characteristic vector of images from the training sample 11, which is connected by feedback to a block for generating a three-dimensional array of values of the intensity of image points 2 and for direct communication with a learning block an identifier 12, the output of which is connected to the input of the image classification block 13.

Способ осуществляют в два этапа, называемых "обучение" и "анализ". Этап "обучение" реализуется за счет того, что сначала с помощью блока 1 формируют обучающую выборку, включающую изображения, содержащие встроенные случайным образом ЦВЗ, затем с помощью блоков 2, 3, 4, 5 формируют три двумерных массива значений интенсивности точек цифрового изображения для каждой из трех цветовых составляющих в виде карты пикселей цветовой схемы RGB (красной, зеленой, синей) [4].The method is carried out in two stages, called "training" and "analysis". The “training” stage is implemented due to the fact that first, using block 1, a training sample is formed that includes images containing randomly generated DECs, then, using blocks 2, 3, 4, 5, three two-dimensional arrays of values of the intensity of the points of the digital image for each of the three color components in the form of a pixel map of the RGB color scheme (red, green, blue) [4].

Далее в блоке многоуровневого дискретного двумерного вейвлет-преобразования 6 каждый массив интенсивностей точек трех цветовых составляющих в отдельности подвергается многоуровневому двумерному дискретному вейвлет-преобразованию (необходимо не менее трех уровней вейвлет-преобразования) с использованием биортогональных низкочастотного (НЧ) и высокочастотного (ВЧ) фильтров [5]. Рекомендуется использовать фильтры с коэффициентами согласно таблице 1.Further, in the block of multi-level discrete two-dimensional wavelet transform 6, each array of intensities of points of three color components individually is subjected to a multi-level two-dimensional discrete wavelet transform (at least three levels of wavelet transform are necessary) using biorthogonal low-pass (LF) and high-frequency (HF) filters [ 5]. It is recommended to use filters with coefficients according to table 1.

Таблица 1
Значения коэффициентов блока биортогональных вейвлет-фильтров 7/9
Table 1
The values of the coefficients of the block biorthogonal wavelet filters 7/9
№ п/пNo. p / p Значение коэффициентов НЧ фильтраThe value of the coefficients of the lowpass filter № п/пNo. p / p Значение коэффициентов ВЧ фильтраRF filter coefficients 00 0.8526990.852699 00 0.7884850.788485 1one 0.3774030.377403 1one -0.418092-0.418092 22 -0.110624-0.110624 22 - 0.040690- 0.040690 33 - 0.023849- 0.023849 33 0.0645390.064539 4four 0.0378290.037829

Затем в блоке вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 7 производится вычисление статистических характеристик высоких порядков из распределений вейвлет-коэффициентов каждого поддиапазона всех уровней вейвлет-преобразования, исключая три поддиапазона последнего уровня, для каждой цветовой составляющей изображения. Данными статистическими характеристиками являются выборочное среднее, выборочная дисперсия, асимметрия и эксцесс [6] согласно формулам (1, 2, 3, 4) соответственно.Then, in the unit for calculating high-order statistical characteristics from the distribution of wavelet coefficients on different sub-bands of the wavelet transform 7, the statistical characteristics of high orders are calculated from the distributions of the wavelet coefficients of each sub-range of all levels of the wavelet transform, excluding three sub-ranges of the last level, for each color component of the image . These statistical characteristics are the sample mean, sample variance, asymmetry and excess [6] according to formulas (1, 2, 3, 4), respectively.

Figure 00000002
Figure 00000002

где

Figure 00000003
- выборочное среднее;Where
Figure 00000003
- sample mean;

n - количество коэффициентов данного поддиапазона вейвлет-преобразования;n is the number of coefficients of a given subband of the wavelet transform;

Figure 00000004
Figure 00000004

где DB - выборочная дисперсия;where D B is the sample variance;

n - количество коэффициентов данного поддиапазона вейвлет-преобразования;n is the number of coefficients of a given subband of the wavelet transform;

Figure 00000005
Figure 00000005

где AS - асимметрия теоретического распределения;where A S is the asymmetry of the theoretical distribution;

μ3 - центральный момент третьего порядка;μ 3 is the central moment of the third order;

σ3 - куб выборочного среднего квадратического отклонения;σ 3 - cube of the sample mean square deviation;

Figure 00000006
Figure 00000006

где Ek - эксцесс теоретического распределения;where E k is the excess of the theoretical distribution;

μ4 - центральный момент четвертого порядка;μ 4 is the fourth-order central moment;

σ4 - выборочное среднее квадратическое отклонение в четвертой степени.σ 4 - sample mean square deviation to the fourth degree.

Одновременно с процедурой вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования в блоке вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования 8 вычисляется ошибка предсказания значений вейвлет-коэффициентов на разных поддиапазонах n-го уровня вейвлет-преобразования, а также на поддиапазонах последующего n+1-го уровня вейвлет-преобразования согласно фиг.3 и формулам линейного предсказателя значений вейвлет-коэффициентов (5, 6, 7) для вертикального, горизонтального и диагонального поддиапазонов соответственно [7].Simultaneously with the procedure for calculating high-order statistical characteristics from the distribution of wavelet coefficients on different subbands of the wavelet transform, in the block for calculating the error of predicting the values of the coefficients on different subbands of the wavelet transform 8, the error of predicting the values of wavelet coefficients on different subbands of the n-th level of the wavelet transform is calculated , as well as on the subbands of the subsequent n + 1-th level of the wavelet transform according to figure 3 and the linear predictor formulas wavelet coefficients (5, 6, 7) for the vertical, horizontal and diagonal subbands, respectively [7].

Figure 00000007
Figure 00000007

Figure 00000008
Figure 00000008

Figure 00000009
Figure 00000009

где |·| означает, что значения коэффициентов взяты по модулю;where | · | means that the values of the coefficients are taken modulo;

Vi, Hi, Di указывают, на каком поддиапазоне и каком уровне вейвлет-преобразования вычисляется формула линейного предсказателя (соответственно вертикальный, горизонтальный, диагональный поддиапазон);V i , H i , D i indicate at which sub-band and at what level of the wavelet transform the linear predictor formula is calculated (respectively, vertical, horizontal, diagonal sub-bands);

i - уровень вейвлет-преобразования;i is the level of wavelet transform;

x - координата вейвлет-коэффициента по горизонтали;x is the horizontal coordinate of the wavelet coefficient;

у - координата вейвлет-коэффициента по вертикали;y is the vertical coordinate of the wavelet coefficient;

ωk - скалярные весовые коэффициенты линейного предсказателя.ω k are the scalar weights of the linear predictor.

Формулы (5, 6, 7) могут быть представлены в векторном виде:Formulas (5, 6, 7) can be represented in vector form:

Figure 00000010
Figure 00000010

где

Figure 00000011
- вектор-строка, содержащая весовые коэффициенты;Where
Figure 00000011
- a row vector containing weighting factors;

Figure 00000012
- вектор-строка, включающая значения анализируемых коэффициентов Аi;
Figure 00000012
- a row vector, including the values of the analyzed coefficients A i ;

Q - матрица, столбцы которой содержат значения так называемых коэффициентов "соседей" для анализируемых коэффициентов Аi (зачерненные квадраты на фиг.2).Q is a matrix whose columns contain the values of the so-called "neighbors" coefficients for the analyzed coefficients A i (blackened squares in figure 2).

Коэффициенты линейного предсказателя ωi определяются путем минимизации функции квадрата ошибки:The linear predictor coefficients ω i are determined by minimizing the squared error function:

Figure 00000013
Figure 00000013

Затем производится дифференцирование по

Figure 00000014
:Then differentiation is made according to
Figure 00000014
:

Figure 00000015
Figure 00000015

получаемый результат приравнивается к нулю, а нахождение

Figure 00000014
производится по следующей формуле:the result is equal to zero, and finding
Figure 00000014
produced by the following formula:

Figure 00000016
Figure 00000016

После определения значений коэффициентов линейного предсказателя логарифмическая погрешность между фактическими коэффициентами и предсказанными вычисляется по формуле:After determining the values of the coefficients of the linear predictor, the logarithmic error between the actual coefficients and the predicted is calculated by the formula:

Figure 00000017
Figure 00000017

Из полученных на каждом поддиапазоне распределений векторов ошибки

Figure 00000018
в блоке вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 9 вычисляются выборочное среднее, выборочная дисперсия, асимметрия и эксцесс согласно формулам (1, 2, 3, 4) соответственно.From the distributions of error vectors obtained on each subband
Figure 00000018
in the block for calculating the statistical characteristics of high orders from the distribution of the prediction error of the values of the wavelet coefficients at different subbands of the wavelet transform 9, the sample mean, sample variance, asymmetry and excess are calculated according to formulas (1, 2, 3, 4), respectively.

В блоке формирования собственного характеристического вектора (СХВ) изображения 10 все вычисленные значения статистических характеристик включаются в вектор, называемый собственным характеристическим вектором изображения (13).In the block for generating the eigen characteristic vector (CX) of the image 10, all calculated values of the statistical characteristics are included in the vector called the eigen characteristic vector of the image (13).

Figure 00000019
Figure 00000019

где N=24(n-1), n - число уровней вейвлет-преобразования.where N = 24 (n-1), n is the number of wavelet transform levels.

Таким образом, размерность такого вектора зависит от количества уровней вейвлет-преобразования n и равна 72(n-1).Thus, the dimension of such a vector depends on the number of levels of the wavelet transform n and is equal to 72 (n-1).

Далее в блоке формирования массива собственных характеристических векторов изображений из обучающей выборки 11 производится формирование массива СХВ всех изображений из обучающей выборки, для этого блок 11 соединен с блоком 2 обратной связью, указывающей на то, что все вышеописанные процедуры выполняются с каждым изображением из обучающей выборки отдельно (обучающая выборка должна содержать не менее 200 ЦИ, не содержащих ЦВЗ, и не менее 200 ЦИ, содержащих ЦВЗ, причем все ЦИ данной обучающей выборки должны быть одного формата и ЦВЗ должны встраиваться по различным законам).Further, in the block for generating an array of eigenvector characteristic vectors of images from the training sample 11, an array of SHW of all images from the training sample is generated, for this, block 11 is connected to the block 2 by feedback, indicating that all the above procedures are performed with each image from the training sample separately (the training sample should contain at least 200 DIs that do not contain CEH and at least 200 DIs containing CEH, and all DIs of this training sample should be of the same format and the CEH should be integrated ivatsya by different laws).

После формирования массива СХВ всех изображений из обучающей выборки в блоке 11 полученный массив подается на вход блока обучения классификатора 12, построенного на основе дискриминантного анализа для линейной дискриминации изображений из обучающей выборки на два класса: ЦИ, содержащие ЦВЗ, и ЦИ, не содержащие ЦВЗ. После этого этап "обучение" заканчивается и начинается второй этап - "анализ".After the formation of the CXW array of all images from the training set in block 11, the resulting array is fed to the input of the training block of the classifier 12, which is based on discriminant analysis for linear discrimination of images from the training set into two classes: DIs containing CEHs and DIs not containing CEHs. After this, the “training” stage ends and the second stage begins - the “analysis”.

На этапе "анализ" с выбранным для анализа ЦИ (оно должно быть одного формата с цифровыми изображениями из обучающей выборки) производятся все процедуры, производящиеся в блоках 2-10 и описанные выше, только теперь после блока формирования собственного характеристического вектора анализируемого изображения 10 сформированный СХВ подается на вход блока классифицирования изображения 13, на который одновременно с этим с блока обучения классификатора 12 подаются результаты дискриминации всех СХВ, полученных от ЦИ из обучающей выборки на этапе "обучение".At the “analysis” stage with the selected digital analysis for analysis (it should be of the same format with digital images from the training set), all procedures are performed that are performed in blocks 2-10 and described above, only now, after the block for generating its own characteristic vector of the analyzed image 10, the formed SHV fed to the input of the image classification block 13, to which at the same time from the training block of the classifier 12 the results of discrimination of all SHV received from the center from the training sample at the teaching. "

В блоке классифицирования изображения 13 на основании вычисленного расстояния Махаланобиса (согласно формуле 14) принимается решение о принадлежности анализируемого изображения к одному из классов, либо к классу ЦИ, содержащих ЦВЗ, либо к классу ЦИ, не содержащих ЦВЗ:In the image classification block 13, on the basis of the calculated Mahalanobis distance (according to Formula 14), a decision is made whether the analyzed image belongs to one of the classes, or to the class of digital centers containing CEH, or to the class of digital centers that do not contain CEH:

Figure 00000020
Figure 00000020

где dM(xi, xj) - расстояние Махаланобиса,where d M (x i , x j ) is the Mahalanobis distance,

К-1=С - матрица, обратная ковариационной матрице К, вычисленной по выборке х,K -1 = C is the matrix inverse to the covariance matrix K calculated from the sample x,

сpq - элементы матрицы С [8].with pq are the elements of the matrix C [8].

Обоснование положительного эффекта предлагаемого способа осуществлено следующим образом.The rationale for the positive effect of the proposed method is as follows.

Показателем эффективности способов идентификации ЦИ, содержащих ЦВЗ, является вероятность правильной идентификации Ридент..An indicator of the effectiveness of methods for identifying QIs containing CEH is the probability of correct identification of P ident. .

Задача состоит в том, чтобы достигнуть максимальной вероятности правильной идентификации при условии, что закон встраивания ЦВЗ и его присутствие в анализируемом изображении априорно неизвестны. Это позволит отличить изображение-оригинал от его копий, полученных с помощью распечатки и сканирования.The task is to achieve the maximum probability of correct identification, provided that the law of embedding the CEH and its presence in the analyzed image is a priori unknown. This will distinguish the original image from its copies obtained by printing and scanning.

Для проверки заявляемого способа классификатор, основанный на дискриминантном анализе, был обучен на выборке из 1000 изображений различных форматов, 500 из которых содержали ЦВЗ. С помощью набора из 1650 изображений, не принадлежащих обучающей выборке, 150 из которых содержали встроенный по неизвестному закону ЦВЗ (по 50 изображений форматов JPEG, BMP, GIF), прототип и заявляемый способ были протестированы. Результаты, представленные на фиг.3, показали, что в условиях отсутствия априорных сведений о законе встраивания ЦВЗ известный способ правильно идентифицировал 11 изображений-оригиналов из 150, а с помощью предлагаемого способа удалось правильно отличить 144 изображения-оригинала из 150 от их высококачественных копий. Это подтверждает существенный положительный эффект от внедрения нового способа.To verify the proposed method, a classifier based on discriminant analysis was trained on a sample of 1000 images of various formats, 500 of which contained CEH. Using a set of 1650 images that do not belong to the training set, 150 of which contained the CEH built-in under an unknown law (50 JPEG, BMP, GIF images each), the prototype and the claimed method were tested. The results presented in figure 3 showed that in the absence of a priori information about the law of embedding the CEH, the known method correctly identified 11 original images from 150, and using the proposed method it was possible to correctly distinguish 144 original images from 150 from their high-quality copies. This confirms the significant positive effect of the introduction of a new method.

Следовательно, заявленный способ может обеспечить идентификацию ЦИ, содержащих ЦВЗ в условиях отсутствия априорных сведений о законе его встраивания в анализируемое изображение, при этом способ может быть применен для идентификации изображений различного формата.Therefore, the claimed method can provide identification of digital information centers containing CEH in the absence of a priori information about the law of its incorporation into the analyzed image, and the method can be used to identify images of various formats.

Источники информацииInformation sources

1. Patent US №0040001626, кл. МПК G06K 009/00, 2004 г.1. Patent US No. 0040001626, cl. IPC G06K 009/00, 2004

2. Patent US №0040015697, кл. МПК G06K 009/00, 2004 г.2. Patent US No. 0040015697, cl. IPC G06K 009/00, 2004

3. Patent US №20050058320, кл. МПК G06K 009/00, 2005 г.3. Patent US No. 200550058320, cl. IPC G06K 009/00, 2005

4. Миано Д. Форматы и алгоритмы сжатия изображений в действии. - М.: Триумф, 2003.4. Miano D. Formats and image compression algorithms in action. - M .: Triumph, 2003.

5. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - С.-Петербург: Военный университет связи, 1999.5. Vorobev V.I., Gribunin V.G. Theory and practice of wavelet transform. - St. Petersburg: Military University of Communications, 1999.

6. Гурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 1972.6. Gourmet V.E. Theory of Probability and Mathematical Statistics. - M .: Higher school, 1972.

7. Portilla J., Simoncelli Е. A. Parametric texture model based on joint statistics of complex wavelet coefficients. - International Journal of Computer Vision, 2000.7. Portilla J., Simoncelli E. A. Parametric texture model based on joint statistics of complex wavelet coefficients. - International Journal of Computer Vision, 2000.

8. Калугина Т.Ф., Киселев В.Ю. Математическая статистика. Учебное пособие / Иван. гос. энерг. ун-т. - Иваново, 2001.8. Kalugina T.F., Kiselev V.Yu. Math statistics. Textbook / Ivan. state energy un-t - Ivanovo, 2001.

Claims (1)

Способ идентификации документа (изображения), содержащего многократный цифровой водяной знак (ЦВЗ), включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, отличающийся тем, что этап встраивания соединен с этапом формирования трехмерного массива значений интенсивности точек изображения, соединенный с этапом формирования массива значений интенсивности точек красной цветовой составляющей изображения, с этапом формирования массива значений интенсивности точек зеленой цветовой составляющей изображения и с этапом формирования массива значений интенсивности точек синей цветовой составляющей изображения, которые в свою очередь соединены с этапом многоуровневого дискретного двумерного вейвлет-преобразования, соединенного с этапом вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования и этапом вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования, соединенного в свою очередь с этапом вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования и этап вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования соединены с этапом формирования собственного характеристического вектора изображения, соединенного в свою очередь с этапом классифицирования изображения и с этапом формирования массива собственных характеристических векторов изображений из обучающей выборки, который обратной связью соединен с этапом формирования трехмерного массива значений интенсивности точек изображения и прямой связью с этапом обучения классификатора, соединенного в свою очередь с этапом классифицирования изображения.A method for identifying a document (image) containing a multiple digital watermark (CEH), comprising the step of embedding additional information in the document (image) consisting of two types of CEH, characterized in that the embedding step is connected to the step of forming a three-dimensional array of image point intensities, connected to the stage of forming an array of intensity values of points of the red color component of the image, with the step of forming an array of intensity values of points of the green color component of the image and with the step of generating an array of intensity values of the points of the blue color component of the image, which in turn are connected to the step of a multi-level discrete two-dimensional wavelet transform connected to the step of calculating high-order statistical characteristics from the distribution of wavelet coefficients on different sub-bands of the wavelet transform and the step calculating the error of predicting the values of the coefficients on different subbands of the wavelet transform, which is connected in turn with the step of calculating the statistical characteristics of high orders from the distribution of the prediction error of the values of the wavelet coefficients on different subbands of the wavelet transform, the step of calculating the statistics of high orders from the distribution of the wavelet coefficients on different subbands of the wavelet transform and the step of calculating the statistical characteristics of high orders from the distribution of the prediction error the values of the wavelet coefficients on different subbands of the wavelet transform are connected to the step the formation of the eigen characteristic vector of the image, which in turn is connected to the stage of image classification and to the stage of forming an array of eigen characteristic vectors of images from the training sample, which is connected by feedback to the stage of forming a three-dimensional array of values of the intensity of the image points and direct connection with the training stage of the classifier connected to in turn, with the image classification step.
RU2006106881/09A 2006-03-06 2006-03-06 Method for identification of a digital image containing a digital watermark RU2304306C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2006106881/09A RU2304306C1 (en) 2006-03-06 2006-03-06 Method for identification of a digital image containing a digital watermark

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2006106881/09A RU2304306C1 (en) 2006-03-06 2006-03-06 Method for identification of a digital image containing a digital watermark

Publications (1)

Publication Number Publication Date
RU2304306C1 true RU2304306C1 (en) 2007-08-10

Family

ID=38510903

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006106881/09A RU2304306C1 (en) 2006-03-06 2006-03-06 Method for identification of a digital image containing a digital watermark

Country Status (1)

Country Link
RU (1) RU2304306C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559773C2 (en) * 2013-12-11 2015-08-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Method of searching for digital image containing digital watermark

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559773C2 (en) * 2013-12-11 2015-08-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Method of searching for digital image containing digital watermark

Similar Documents

Publication Publication Date Title
Karampidis et al. A review of image steganalysis techniques for digital forensics
Swaminathan et al. Digital image forensics via intrinsic fingerprints
Sedighi et al. Content-adaptive steganography by minimizing statistical detectability
Stamm et al. Anti-forensics of digital image compression
Fridrich et al. Practical steganalysis of digital images: state of the art
Pramanik An adaptive image steganography approach depending on integer wavelet transform and genetic algorithm
Sabeti et al. An adaptive image steganography method based on integer wavelet transform using genetic algorithm
Hsu et al. Enhancing the robustness of image watermarking against cropping attacks with dual watermarks
Gupta et al. A study on source device attribution using still images
Subhedar et al. Image steganography using contourlet transform and matrix decomposition techniques
Gul et al. SVD based image manipulation detection
Lu et al. A robust fractal color image watermarking algorithm
Eze et al. Integrity verification in medical image retrieval systems using spread spectrum steganography
CN114998080A (en) Face tamper-proof watermark generation method, tamper detection method and attribute detection method
Meenakshi et al. A hybrid matrix factorization technique to free the watermarking scheme from false positive and negative problems
Jarusek et al. Robust steganographic method based on unconventional approach of neural networks
Hadmi et al. A robust and secure perceptual hashing system based on a quantization step analysis
Ouyang et al. A semi-fragile watermarking tamper localization method based on QDFT and multi-view fusion
Ouyang et al. A semi-fragile reversible watermarking method based on qdft and tamper ranking
Seyyedi et al. High payload and secure steganography method based on block partitioning and integer wavelet transform
CN116757904A (en) Information hiding and verifying method and device based on digital image watermark
RU2304306C1 (en) Method for identification of a digital image containing a digital watermark
CN114390154A (en) Robust steganography method and system for selecting embedded channel based on channel matching network
Amerini et al. Acquisition source identification through a blind image classification
Savoldi et al. Blind multi-class steganalysis system using wavelet statistics

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20080307