RU2427911C1 - Способ обнаружения лиц на изображении с применением каскада классификаторов - Google Patents

Способ обнаружения лиц на изображении с применением каскада классификаторов Download PDF

Info

Publication number
RU2427911C1
RU2427911C1 RU2010103904/08A RU2010103904A RU2427911C1 RU 2427911 C1 RU2427911 C1 RU 2427911C1 RU 2010103904/08 A RU2010103904/08 A RU 2010103904/08A RU 2010103904 A RU2010103904 A RU 2010103904A RU 2427911 C1 RU2427911 C1 RU 2427911C1
Authority
RU
Russia
Prior art keywords
cascade
face
image
classifiers
classifier
Prior art date
Application number
RU2010103904/08A
Other languages
English (en)
Inventor
Анвар Адхамович Ирматов (RU)
Анвар Адхамович Ирматов
Дмитрий Юрьевич БУРЯК (RU)
Дмитрий Юрьевич БУРЯК
Дмитрий Владимирович ЧЕРДАКОВ (RU)
Дмитрий Владимирович ЧЕРДАКОВ
Донгсунг ЛИИ (KR)
Донгсунг ЛИИ
Original Assignee
Фирма "С1 Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фирма "С1 Ко., Лтд." filed Critical Фирма "С1 Ко., Лтд."
Priority to RU2010103904/08A priority Critical patent/RU2427911C1/ru
Priority to PCT/KR2011/000220 priority patent/WO2011096651A2/ko
Priority to KR1020127026548A priority patent/KR101410489B1/ko
Priority to US13/576,484 priority patent/US8885943B2/en
Application granted granted Critical
Publication of RU2427911C1 publication Critical patent/RU2427911C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

Изобретение относится к области обработки цифровых изображений, а более конкретно к нахождению произвольно ориентированных лиц на цифровых изображениях. Техническим результатом изобретения является повышение быстродействия и точности обрабатываемых данных при обнаружении лиц на изображении. Технический результат достигается благодаря тому, что в способе обнаружения лиц на изображении, включающем в себя применение каскада однородных классификаторов, каждый классификатор используют для разделения входного вектора на два класса «лицо», «нелицо», причем каждый классификатор характеризуется более высокой точностью классификации по сравнению с предыдущим классификатором в каскаде, выполняют поиск окружностей на входном изображении с помощью преобразования Хафа для окружностей, формируют набор фрагментов в областях изображения, где были обнаружены окружности, путем разделения областей на набор фрагментов одинакового размера, применяют каскад классификаторов к каждому фрагменту и определяют, содержит он лицо или нет, причем для принятия решения о наличии лица все классификаторы должны отнести соответствующий входной вектор, построенный по фрагменту, к классу «лицо». 5 з.п. ф-лы, 7 ил.

Description

Изобретение относится к области обработки цифровых изображений, а более конкретно к нахождению произвольно ориентированных лиц на цифровых изображениях.
Цифровое представление изображений используется во многих современных мультимедийных устройствах. При этом функция определения наличия и положения лица на изображении является одной из основных. Необходимость в ней возникает, например, при формировании контекстно-зависимой выборки из хранимых устройством изображений, в случаях специализированной обработки участков изображения в цифровых устройствах фотозахвата и фотопечати, при идентификации и верификации в системах охраны и видеонаблюдения, для организации взаимодействия людей и мультимедийных компьютерных систем.
На текущий момент известно значительное число подходов к решению задачи нахождения объектов на изображениях, использующих технологии нейронных сетей, разложения на обучаемые пространства, SVM и т.д. В условиях отсутствия четкой формализации объекта поиска все эти методы, так или иначе, используют процесс обучения (настройки параметров), который требует значительного количества исходных примеров объектов поиска. Как следствие, работа каждого из методов: определение класса объектов по заданному изобретению - задача, требующая больших вычислительных затрат. Вычислительная сложность задачи возрастает на порядки в случае неопределенного положения, размера и ориентации лица на изображении.
Из уровня техники известны, например, системы обнаружения лиц (см., в частности, патенты США: №6661907 [1] и №6816611 [2]), которые ориентированы на использование цветовой информации изображений. Это свойство существенно сужает область их применения, т.к. накладывает требование использовать цветные устройства захвата изображений.
В патенте США №6940545 [3] предлагается система, реализующая два этапа обнаружения лица. Первый из них основан на использовании вероятностных цветовых моделей различных элементов головы человека, например волос и кожи лица. Результатом первого этапа является список областей-кандидатов на наличие в них лица. На втором этапе используется классификатор, реализующий баессовское правило принятия решения. Он обрабатывает полученный список областей и формирует окончательное решение о наличии и положении лица на изображении. Предложенную в [3] систему предполагается использовать в цифровых фотокамерах для получения более точных оценок параметров съемки в случае наличия лиц в снимаемой сцене. Целевая направленность патента [3] позволяет сформулировать достаточно слабые требования по скорости и точности работы системы. Это не позволит использовать предложенный алгоритм в большинстве задач, связанных с обнаружением лица человека.
Работоспособный вариант двухэтапного алгоритма обнаружения лиц предложен в патенте США №6463163 [4]. На первом стадии выполняется двухэлементный алгоритм, состоящий из линейного и нелинейного фильтров. Сначала вычисляется корреляция с ядром линейного фильтра (полученного в результате обучения), затем на корреляционной карте выделяются локальные экстремумы. Завершает первый этап алгоритма сравнение яркостных характеристик областей, соответствующих найденным экстремумам, с модельными значениями. Результатом первого этапа является набор регионов возможного положения лица. На второй стадии найденные регионы анализируются многослойной нейронной сетью прямого распространения, в результате чего формируется список обнаруженных на изображении лиц. Недостатком данного подхода является низкая устойчивость корреляционного алгоритма к изменениям, вызванным поворотом лица. Кроме этого скорость функционирования многослойных нейронных сетей не достаточна для применения данной системы в приложениях, выполняющихся в реальном времени.
Частично эти трудности были преодолены в патенте США №7099510 [5], где разработан вычислительно эффективный алгоритм локализации области лица с учетом масштаба и сдвига. Предложенный метод основан на использовании последовательности (каскада) вычислительно простых классификаторов. Индивидуально каждый элемент каскада малоэффективен для решения задачи обнаружения лица, но специальный способ их построения и объединения позволил добиться высоких показателей по точности и скорости работы. Данный патент является наиболее близким к заявленному изобретению, он был выбран в качестве прототипа.
Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы разработать усовершенствованный способ, обеспечивающий устойчивое обнаружение лиц в различных условиях освещения, небольшое число ложных обнаружений даже при наличии сложного, структурно-разнообразного окружения, вычислительное быстродействие, в том числе в случае реализации способа на специализированных устройствах, таких как сигнальные процессоры.
При этом следует отметить, что для систем обнаружения лиц на изображении характерны два типа проблем. Во-первых, для большинства приложений требуется высокая, близкая к реальному времени, скорость работы алгоритма детектирования лица. Во-вторых, большое разнообразие лиц, внешних объектов, которые могут возникнуть на лице человека (например, очки, шапка, борода и т.п.), структурная сложность внешнего окружения, неравномерность освещения способствуют появлению большого числа ошибок, связанных с выделением лица в тех регионах изображения, где его на самом деле нет. Ошибки такого рода являются критическими, например, для систем биометрической идентификации.
Технический результат достигнут за счет разработки усовершенствованного способа обнаружения лиц на изображении, при этом заявляемый способ включает в себя применение каскада однородных классификаторов и отличается от прототипа тем, что предусматривает выполнение следующих операций:
- каждый классификатор использует для разделения входного вектора на два класса «лицо», «нелицо», причем каждый классификатор характеризуется более высокой точностью классификации по сравнению с предыдущим классификатором в каскаде;
- выполняют поиск окружностей на входном изображении с помощью преобразования Хафа для окружностей;
- формируют набор фрагментов в областях изображения, где были обнаружены окружности, путем разделения областей на набор фрагментов одинакового размера;
- применяют каскад классификаторов к каждому фрагменту и определяют, содержит он лицо или нет, причем для принятия решения о наличии лица все классификаторы должны отнести соответствующий входной вектор, построенный по фрагменту, к классу «лицо».
Другими словами, заявляемое изобретение основано на применении каскадного принципа формирования алгоритма обнаружения лица на изображении. Составные этапы, формирующие каскад, опираются как на однотипную, так и разнотипную информацию об изображении, что способствует высокой эффективности алгоритма. Структура каскада характеризуется гибкостью, которая позволяет варьировать количеством входящих в его состав стадий. Разработанное представление обрабатываемых данных позволило получить быстродействующий алгоритм, работающий с высокой точностью.
Заявляемый способ в предпочтительном варианте реализован на основе системы, включающей в себя следующие элементы:
- блок получения изображения;
- блок обнаружения лица;
- блок обучения.
Далее существо заявляемого изобретения поясняется с привлечением графических материалов.
Схема функционирования устройства, реализующего данное изобретения, представлена на Фиг.1. С помощью блока получения изображения формируют исходное изображение. В качестве такого блока может выступать, например, камера захвата, устройство выбора изображения из базы или последовательности. Полученное изображение передают на блок обнаружения лица, который объединяет в себе цифровой процессор и устройство хранения данных, предназначенное для хранения исходного изображения, вспомогательных буферов и результатов работы. Выходом блока обнаружения лица является исходное изображение с отмеченными на нем найденными лицами.
Блок обучения представляет собой компьютер и используется на этапе обучения данного изобретения. Он предназначен для построения классификаторов, входящих в состав изобретения, путем проведения их обучения на выборке примеров, содержащих изображения лиц и нелиц. Этап обучения выполняют единственный раз, до начала использования классификаторов. После его окончания результаты обучения передают на блок обнаружения лица, который использует полученные классификаторы для детектирования лиц на входных изображениях.
На фиг.2 представлена схема работы блока обнаружения лица. На вход блока передают изображение, которое может быть получено от видеокамеры, из базы изображений, видеопоследовательности или другого источника цифровых изображений. Конструктор пирамиды изображений выполняет построение набора изображений, каждое из которых представляет собой уменьшенную с некоторым коэффициентом копию исходного изображения. Данные коэффициенты (коэффициенты масштабирования) различны для каждого изображения из пирамиды. Пирамиду изображений передают на многоуровневый детектор лица, который выполняет обнаружение лиц на каждом изображении из пирамиды и формирует результат, представляющий собой исходное изображение с отмеченными на нем обнаруженными лицами.
Схема работы многоуровневого детектора лица показана на Фиг.3. Исходными данными является пирамида изображений. Каждое изображение пирамиды передают на детектор лица, который выполняет обнаружение лиц. Полученные на каждом изображении координаты лиц передают на вход интегратора лиц, который объединяет эти данные и вычисляет окончательные координаты найденных лиц. Интегратор лиц выполняет кластеризацию координат найденных лиц, после чего проводит обработку полученных кластеров, анализируя количество элементов каждого кластера и его суммарный коэффициент уверенности. Используя сравнение с порогом, интегратор принимается решение, какой из кластеров соответствует лицу на входном изображении, а какой - нет. Суммарный коэффициент уверенности вычисляется как сумма коэффициентов уверенности для каждого элемента кластера, которые в свою очередь являются результатом работы детектора лица.
На Фиг.4 представлена схема работы детектора лица. Входное изображение передают на детектор окружностей. Используя преобразование Хафа для обнаружения окружностей [6] детектор выделяет на исходном изображении все окружности фиксированного радиуса. По результатам обнаружения формируют карту, на которой отмечены точки, соответствующие центрам найденных окружностей. Данная карта совместно с исходным изображением образуют маскированное изображение, которое передают в обработчик изображения. Обработчик сканирует полученное изображение с целью формирования набора фрагментов изображения, которые затем поступают на вход каскадного классификатора.
Схема работы классификатора показана на Фиг.5. Он представляет собой каскад однотипных классификаторов. Детектор лица использует их для классификации фрагментов изображения по двум типам: лицо и нелицо. Классификаторы применяют к дескрипторам, построенным для каждого фрагмента из множества, сформированного обработчиком изображения. На первом этапе каскада конструируют дескрипторы небольшой размерности, после чего передают их на вход первого классификатора. Обработав полученные множество дескрипторов, первый классификатор удаляет из данного множества большое число отрицательных примеров, т.е. фрагментов, не содержащих лицо. Он характеризуется высокой скоростью работы, т.к. обрабатывает дескрипторы малой размерности. На Фиг.5 удаление отрицательных примеров обозначено символами NF (non-face), такие примеры перемещаются во множество отклоненных фрагментов. Если классификатор относит обрабатываемый фрагмент к классу «лицо», то он передает его на следующий этап каскада. На Фиг.5 этому действию соответствует стрелка, маркированная символом F (face). После прохождения четырех этапов каскада фрагмент, если он не был помещен во множество отрицательных фрагментов, передается на этап дальнейшей обработки, которая может заключаться в применении дополнительных классификаторов или в подготовке вывода результатов работы, путем выделения соответствующих областей на исходном изображении.
Каждый последующий этап каскада удаляет больше отрицательных фрагментов, требуя при этом увеличения числа вычислений. На более поздних стадиях применяются классификаторы, обрабатывающие дескрипторы большой размерности, поэтому они выполняются значительно медленнее, чем первые этапы каскада. Однако обычно структура множества фрагментов, сформированная обработчиком изображения, характеризуется большим числом фрагментов, относящихся к классу «нелицо», и относительно малым количество фрагментов, содержащих лицо. Полностью через все стадии каскада должны пройти только небольшое число положительных фрагментов. Таким образом, удаляя на первых стадиях наибольшее число отрицательных примеров, для наиболее вычислительно емких этапов оставляют сравнительно немного фрагментов, значительную часть которых составляют лица. Такая логика организации обработки позволяет реализовать высокую скорость работы всего каскада классификаторов.
Входными данными для классификаторов, входящих в состав каскада, являются вектора, построенные по обрабатываемому фрагменту. В зависимости от позиции классификатора в каскаде фрагмент сначала масштабируют, после чего по нему формируют Local Binary Pattern (LBP) дескриптор. При этом для первых уровней каскада используют больший коэффициент масштабирования, получая тем самым дескрипторы меньшей размерности, что обеспечивает более высокую скорость работы соответствующих классификаторов.
Операция LBP состоит в проведении набора сравнений интенсивности пикселя с интенсивностями восьми соседних пикселей. Результаты сравнений кодируют с помощью восьмиэлементного вектора, каждый элемент которого принимает значение 0 или 1 в зависимости от соответствующего результата сравнения. Каждому такому вектору сопоставляют число от 0 до 255, объединив элементы в восьмиразрядное число в двойной записи. На фиг.6 представлена схема выполнения операции LBP.
Операцию LBP применяют к каждому пикселю входного изображения, после чего формируют дескриптор D, являющийся матрицей размером Н×W, каждый элемент которого является целым числом от 0 до 255. В качестве классификаторов, входящих в состав каскада, применяют нейронные сети с архитектурой SNOW [7]. Это однослойная полносвязанная сеть прямого распространения. Размер входного слоя определяется размерностью анализируемого дескриптора по формуле: N=256*W*H,
здесь W, H - ширина и высота обрабатываемого дескриптора соответственно. Выходной слой состоит из двух нейронов, один из них сопоставлен входным векторам, кодирующим нелица, другой - лицам. Входные вектора бинарные, при этом количество единиц в них равно W*H. Таким образом, несмотря на большую размерность входного вектора подавляющая часть элементов в нем равны нулю, и, следовательно, в вычислении линейной комбинации участвуют только W*H единичных входов. Это способствует достаточно высокой скорости работы нейронной сети.
Для вычисления позиций входного вектора, на который находятся единицы, применяют формулу:
Ind=256*(y*W+x)+D(x,y),
Здесь x,y - координаты элемента дескриптора D, W - ширина D.
Функция активация нейронов выходного слоя - сигмоида:
Figure 00000001
Решение о классификации принимают на основе результатов сравнения выходных значений нейронов.
В предпочтительной реализации изобретения с целью повышения скорости работы классификатора реализована следующая съема принятия решения. Сначала вычисляют значение линейной комбинации входного вектора с весами каждого из нейронов:
Figure 00000002
Далее вычисляют значение нелинейной функции:
Figure 00000003
Если полученное значение больше порога thr, то обрабатываемый вектор относят к классу «лицо», в противном случае - к классу «нелицо». При этом если в качестве порога использовать следующее выражение:
Figure 00000004
,
то вычисление экспоненты и сравнение с порогом при принятии решения для каждого входного вектора допустимо заменить на сравнение выражения u1-u2 с порогом thr1.
Исходя из формулы вычисления линейной комбинации:
Figure 00000005
,
исходную нейронную сеть можно заменить на эквивалентную ей, состоящую из одного выходного нейрона с весами, равными разности соответствующих весов нейронов первоначальной сети. Новая сеть характеризуется меньшим количеством требуемых вычислений. В предпочтительной реализации изобретения используют каскад, состоящий из четырех нейронных сетей с описанной архитектурой.
На вход классификатора подают фрагменты размером 24×24. На первом этапе работает нейронная сеть, принимающая на вход дескриптор размера 3×3. Далее выполняют классификатор для дескриптора 4×3, после этого - для дескриптора 6×6, и последним является классификатор для дескрипторов 12×12.
Методы, используемые в данном изобретении, требуют проведения этапа обучения. Для его выполнения были сформированы две выборки: обучающая и проверочная. В состав каждой из выборок входят фрагменты, содержащие лицо и нелицо. Подбор весовых коэффициентов осуществляют на примерах из обучающей выборки, оценку эффективности обученной сети - на проверочной выборке.
Стадия обучения состоит из нескольких этапов.
- Начальное обучение;
- В один и/или несколько этапов процедуры Bootstrap.
Архитектуры нейронных сетей, используемых в предпочтительной реализации изобретения, были выбраны эвристически.
Подбор весов нейронной сети выполняют при помощи одного из известных алгоритмов [8].
Процесс обучения на каждом из этапов выполняли по следующей схеме. Сначала обучение проводят для нейронной сети, выполняющейся на первом этапе. Полученную сеть запускают на примерах из обучающей выборки и удаляют из нее отброшенные примеры. Аналогичные действия выполняют по отношению к проверочной выборке. Новые измененные выборки используют для обучения нейронной сети, выполняющейся на втором этапе. Аналогично первому этапу обученную сеть применяют к обучающим и проверочным примерам и удаляют те из них, которые были классифицированы ей как нелица. Далее описанные действия выполняют для сетей, выполняющихся на оставшихся двух этапах.
В качестве критерия остановки обучения нейронной сети применяют оценку ее эффективности на проверочной выборке. В предпочтительной реализации данного изобретения фиксируют показатель количества отрицательных примеров, на которых нейронная сеть совершает ошибки, а в качестве критерия для выбора используют количество неправильно классифицируемых примеров, содержащих лицо. Результатом обучения объявляют нейронную сеть, на которой достигается минимум выбранного критерия.
Процедуру Bootstrap выполняют в соответствии с алгоритмом, описанным в [8]. Обученный каскад классификаторов запускают на наборе изображений, не содержащих лиц. Фиксируют все случаи обнаружения лица и добавляют соответствующие фрагменты в обучающую выборку. Проводят обучение всех стадий каскада на измененной обучающей выборке.
На фиг.7 представлена общая блок-схема алгоритма детектирования лиц на изображениях, реализованного в данном изобретении. На первом шаге по входному изображению вычисляют пирамиду масштабированных изображений. Далее каждый уровень пирамиды обрабатывают независимо. На масштабированном изображении выполняют поиск окружностей с использованием преобразования Хафа. На следующем шаге сканируют области, соответствующие позициям найденных окружностей, и конструируют множество фрагментов для классификации. Данное множество поступает на вход классификатора, представленного на Фиг.5.
Классификатор представляет собой каскад нейронных сетей. Принцип его построения заключается в создании быстрых НС, обрабатывающих вектора небольшой размерности, для их размещения на первых этапах каскада. Они выполняют «грубую» обработку входного изображения, отбрасывая большую часть фрагментов, не содержащих лицо, и пропуская почти все вектора, соответствующие лицу человека. На последующих этапах каскада размещаются более медленные НС, реализующие более «тонкую» классификацию входных фрагментов за счет их представления векторами с размерностью больше, чем на предыдущих этапах.
После проведения классификации на всех уровнях пирамиды изображений результаты работы передают в блок интеграции, который с использованием алгоритмов кластеризации и эвристик вычисляет координаты лиц, найденных на входном изображении. После чего алгоритм заканчивает свою работу.
Фиг.1. Схема системы детектирования, представленной в данном изобретении.
Фиг.2. Диаграмма управления потоком данных для блока обнаружения лица.
Фиг.3. Диаграмма управления потоком данных для многоуровневого детектора лица.
Фиг.4. Диаграмма управления потоком данных для детектора лица.
Фиг.5. Схема работы каскадного классификатора.
Фиг.6. Схема выполнения операции LBP.
Фиг.7. Блок-схема алгоритма обнаружения лиц на изображении, представленного в данном изобретении.
Лучшим вариантом реализации устройства является его использование в биометрических системах распознавания для выделения лица человека на входящих изображениях.
Прибор реализуется в виде набора устройств, включающего в себя: устройство захвата изображений, например видеокамеру; цифрового процессора, а также устройство хранения данных.
Дополнительные ссылки
6. Duda R.О. and P.E.Hart. "Use of the Hough Transformation to Detect Lines and Curves in Pictures", Comm. ACM, Vol.15, p.11-15 (January 1972).
7. M.-H.Yang, D.Rosh & N.Ahuja. A SNOW-based face detector, Advances in Neural Information Processing Systems 12, 2000, 855-861.
8. H.Rowley, S.Baluja & Т.Kanade. Neural network-based face detection, Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1996, 203-208.

Claims (6)

1. Способ обнаружения лиц на изображении, включающий в себя применение каскада однородных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:
- каждый классификатор используют для разделения входного вектора на два класса «лицо», «нелицо», причем каждый классификатор характеризуется более высокой точностью классификации по сравнению с предыдущим классификатором в каскаде;
- выполняют поиск окружностей на входном изображении с помощью преобразования Хафа для окружностей;
- формируют набор фрагментов в областях изображения, где были обнаружены окружности, путем разделения областей на набор фрагментов одинакового размера;
- применяют каскад классификаторов к каждому фрагменту и определяют, содержит он лицо или нет, причем для принятия решения о наличии лица все классификаторы должны отнести соответствующий входной вектор, построенный по фрагменту, к классу «лицо».
2. Способ по п.1, отличающийся тем, что создают пирамиду изображений, состоящую из изображений, полученных масштабированием входного изображения с предопределенными коэффициентами; выполняют этапы поиска окружностей, формирования набора фрагментов и применения каскада классификаторов к каждому изображению пирамиды.
3. Способ по п.1, отличающийся тем, что однородные классификаторы формируют на этапе обучения с использованием обучающей выборки, генерируя оптимальные классификаторы.
4. Способ по п.1, отличающийся тем, что на вход каждого классификатора каскада передают представление входного фрагмента изображения, построенного на основе дескриптора LBP.
5. Способ по п.4, отличающийся тем, что представление для каждого классификатора каскада конструируют на основе уменьшенного входного фрагмента, причем коэффициент масштабирования уменьшается для каждого последующего этапа каскада.
6. Способ по п.1, отличающийся тем, что в качестве классификаторов, входящих в состав каскада, применяют искусственные нейронные сети с архитектурой SNOW.
RU2010103904/08A 2010-02-05 2010-02-05 Способ обнаружения лиц на изображении с применением каскада классификаторов RU2427911C1 (ru)

Priority Applications (4)

Application Number Priority Date Filing Date Title
RU2010103904/08A RU2427911C1 (ru) 2010-02-05 2010-02-05 Способ обнаружения лиц на изображении с применением каскада классификаторов
PCT/KR2011/000220 WO2011096651A2 (ko) 2010-02-05 2011-01-12 얼굴 식별 방법 및 그 장치
KR1020127026548A KR101410489B1 (ko) 2010-02-05 2011-01-12 얼굴 식별 방법 및 그 장치
US13/576,484 US8885943B2 (en) 2010-02-05 2011-01-12 Face detection method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2010103904/08A RU2427911C1 (ru) 2010-02-05 2010-02-05 Способ обнаружения лиц на изображении с применением каскада классификаторов

Publications (1)

Publication Number Publication Date
RU2427911C1 true RU2427911C1 (ru) 2011-08-27

Family

ID=44355907

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010103904/08A RU2427911C1 (ru) 2010-02-05 2010-02-05 Способ обнаружения лиц на изображении с применением каскада классификаторов

Country Status (4)

Country Link
US (1) US8885943B2 (ru)
KR (1) KR101410489B1 (ru)
RU (1) RU2427911C1 (ru)
WO (1) WO2011096651A2 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2556461C2 (ru) * 2013-11-18 2015-07-10 Закрытое акционерное общество "ИнфоВотч" Способ автоматизированного поиска эталонных печатей
RU2665217C2 (ru) * 2015-11-26 2018-08-28 Сяоми Инк. Способ и устройство обработки изображений
RU2678668C2 (ru) * 2013-07-24 2019-01-30 Нью Лак Глобал Лимитед Устройство обработки изображений и способ кодирования дескриптора изображения на основе гистограмм градиентов
US10350438B2 (en) 2015-06-30 2019-07-16 Elekta Ltd. System and method for target tracking using a quality indicator during radiation therapy
RU2718222C1 (ru) * 2016-07-29 2020-03-31 Общество С Ограниченной Ответственностью "Нтех Лаб" Распознавание лиц с помощью искусственной нейронной сети

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5649601B2 (ja) * 2012-03-14 2015-01-07 株式会社東芝 照合装置、方法及びプログラム
CN103150552B (zh) * 2013-02-06 2016-08-17 湖北微驾技术有限公司 一种基于人头计数的驾驶培训管理方法
KR101484003B1 (ko) * 2013-11-20 2015-01-20 (주)나노인사이드 얼굴 분석 평가 시스템
KR102200950B1 (ko) 2014-03-14 2021-01-12 삼성전자주식회사 오브젝트 인식 장치 및 그 제어 방법
KR102024867B1 (ko) 2014-09-16 2019-09-24 삼성전자주식회사 예제 피라미드에 기초하여 입력 영상의 특징을 추출하는 방법 및 얼굴 인식 장치
CN105303200B (zh) * 2014-09-22 2018-10-16 电子科技大学 用于手持设备的人脸识别方法
CN105809625B (zh) * 2016-03-07 2019-04-02 哈尔滨中研普瑞电子工程技术中心有限公司 基于局部纹理模式的碎片重构方法
US10627887B2 (en) 2016-07-01 2020-04-21 Microsoft Technology Licensing, Llc Face detection circuit
US10282598B2 (en) * 2017-03-07 2019-05-07 Bank Of America Corporation Performing image analysis for dynamic personnel identification based on a combination of biometric features
CN107330878A (zh) * 2017-06-21 2017-11-07 苏州卡睿知光电科技有限公司 一种建立镜片识别模型的方法及装置
US20190205693A1 (en) * 2017-12-28 2019-07-04 MorphoTrak, LLC Scale-Invariant Feature Point Extraction in Edge Map
CN108596892B (zh) * 2018-04-23 2020-08-18 西安交通大学 一种基于改进LeNet-5模型的焊缝缺陷识别方法
CN110751670B (zh) * 2018-07-23 2022-10-25 中国科学院长春光学精密机械与物理研究所 一种基于融合的目标跟踪方法
JP7165746B2 (ja) * 2018-08-13 2022-11-04 ベイジン・センスタイム・テクノロジー・デベロップメント・カンパニー・リミテッド Id認証方法および装置、電子機器並びに記憶媒体
CN110032959B (zh) * 2019-03-29 2021-04-06 北京迈格威科技有限公司 一种人脸脸型判断方法及装置
CN110717424B (zh) * 2019-09-26 2023-06-30 南昌大学 一种基于预处理机制的实时极小人脸检测方法
CN111814763B (zh) * 2020-08-26 2021-01-08 长沙鹏阳信息技术有限公司 一种基于跟踪序列的无感考勤和制服识别方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7190829B2 (en) * 2003-06-30 2007-03-13 Microsoft Corporation Speedup of face detection in digital images
US7430315B2 (en) * 2004-02-13 2008-09-30 Honda Motor Co. Face recognition system
US7848566B2 (en) * 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
CN100472556C (zh) * 2005-10-09 2009-03-25 欧姆龙株式会社 特定被摄体检测装置及方法
JP4462176B2 (ja) * 2005-12-05 2010-05-12 ソニー株式会社 画像処理装置および方法、並びにプログラム
US7822696B2 (en) * 2007-07-13 2010-10-26 Microsoft Corporation Histogram-based classifiers having variable bin sizes
CN100463000C (zh) * 2007-09-27 2009-02-18 上海交通大学 基于级联分类和哈夫圆变换的人眼状态检测方法
JP4995024B2 (ja) * 2007-10-02 2012-08-08 キヤノン株式会社 パターン認識方法、パターン認識装置及びプログラム
US20090161912A1 (en) * 2007-12-21 2009-06-25 Raviv Yatom method for object detection
US8831379B2 (en) * 2008-04-04 2014-09-09 Microsoft Corporation Cartoon personalization

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2678668C2 (ru) * 2013-07-24 2019-01-30 Нью Лак Глобал Лимитед Устройство обработки изображений и способ кодирования дескриптора изображения на основе гистограмм градиентов
RU2698765C2 (ru) * 2013-07-24 2019-08-29 Нью Лак Глобал Лимитед Устройство обработки изображений и способ кодирования дескриптора изображения на основе гистограмм градиентов
RU2556461C2 (ru) * 2013-11-18 2015-07-10 Закрытое акционерное общество "ИнфоВотч" Способ автоматизированного поиска эталонных печатей
US10350438B2 (en) 2015-06-30 2019-07-16 Elekta Ltd. System and method for target tracking using a quality indicator during radiation therapy
RU2696428C2 (ru) * 2015-06-30 2019-08-01 Электа Лтд. Система и способ отслеживания целевого объекта с использованием показателя качества во время лучевой терапии
RU2665217C2 (ru) * 2015-11-26 2018-08-28 Сяоми Инк. Способ и устройство обработки изображений
RU2718222C1 (ru) * 2016-07-29 2020-03-31 Общество С Ограниченной Ответственностью "Нтех Лаб" Распознавание лиц с помощью искусственной нейронной сети

Also Published As

Publication number Publication date
KR20130018763A (ko) 2013-02-25
KR101410489B1 (ko) 2014-07-04
WO2011096651A3 (ko) 2011-11-17
WO2011096651A2 (ko) 2011-08-11
US8885943B2 (en) 2014-11-11
US20120294535A1 (en) 2012-11-22

Similar Documents

Publication Publication Date Title
RU2427911C1 (ru) Способ обнаружения лиц на изображении с применением каскада классификаторов
Farfade et al. Multi-view face detection using deep convolutional neural networks
Yu et al. Anchor cascade for efficient face detection
CN111178251A (zh) 一种行人属性识别方法及***、存储介质及终端
CN111539351A (zh) 一种多任务级联的人脸选帧比对方法
US20110182497A1 (en) Cascade structure for classifying objects in an image
CN111126249A (zh) 一种大数据和贝叶斯相结合的行人重识别方法及装置
Shukla et al. Face recognition using convolutional neural network in machine learning
Gürel et al. Design of a face recognition system
Ramirez et al. Multi-pose face detection with asymmetric haar features
Alafif et al. On detecting partially occluded faces with pose variations
Kumar et al. One-shot face recognition
Patel et al. Robust face detection using fusion of haar and daubechies orthogonal wavelet template
Joshi et al. Meta-Learning, Fast Adaptation, and Latent Representation for Head Pose Estimation
Majeed et al. Face Detectors Evaluation to Select the Fastest among DLIB, HAAR Cascade, and MTCNN
Chae et al. An efficient face detection based on color-filtering and its application to smart devices
Younis et al. Developing Viola Jones' algorithm for detecting and tracking a human face in video file
Patil et al. Forensic sketch based face recognition using geometrical face model
Suma Dense feature based face recognition from surveillance video using convolutional neural network
Jain et al. Review on Face Recognition by Machine Learning and Deep Learning Approaches
Lebedev et al. Face detection algorithm based on a cascade of ensembles of decision trees
Han et al. Real-time face detection using AdaBoot algorithm
Hadjkacem et al. Multi-shot human re-identification using a fast multi-scale video covariance descriptor
CN111353353A (zh) 跨姿态的人脸识别方法及装置
Dalali et al. Face Recognition: Multi-features Extraction with Parallel Computation for Big Data

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20120206