Распознавание людей по изображению с использование последовательной процедуры

Эффективность последовательной процедуры распознавания гипотез. Определение геометрических признаков лица, являющихся наиболее подходящими для распознавания. Особенности использования нейросетевого распознавания для определения человека по изображению.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.04.2017
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

НОУВПО "Международный институт компьютерных технологий"

РАСПОЗНАВАНИЕ ЛЮДЕЙ ПО ИЗОБРАЖЕНИЮ С ИСПОЛЬЗОВАНИЕМ ПОСЛЕДОВАТЕЛЬНОЙ ПРОЦЕДУРЫ

Байбеков Дмитрий Владиславович ассистент

Воронеж, Россия

Для задачи распознавания человека по фотографии произведена оценка эффективности последовательной процедуры распознавания гипотез. Определены геометрические признаки лица, которые являются наиболее подходящими для распознавания

Ключевые слова: ПОСЛЕДОВАТЕЛЬНАЯ ПРОЦЕДУРА, РАСПОЗНАВАНИЕ ЛИЦА

В последние десятилетия активно разрабатываются алгоритмы распознавания человека по фотографии [1, 2]. Задача определения человека по фотографии относится к сфере искусственного интеллекта и актуальна для систем поиска в интернете, социальных сетей, спецслужб [3]. Задача осложнена тем, что изображение человека на разных фотографиях может сильно различаться из-за мимических искажений лица, особенностей прически и растительности на лице, наличия головного убора, пространственного расположения. Кроме того, сравнение исследуемой фотографии с эталонной затруднено из-за различного характера освещения, цветопередачи, разрешения изображения.

К настоящему времени разработаны и используются несколько продуктивных методов определения человека по изображению, такие как нейросетевое распознавание [1], методы преобразований изображения [2] и др. При этом большинство существующих методов используют полный перебор базы данных, что занимает значительное время даже при использовании высокопроизводительных компьютеров. Так, например, время поиска человека по сравнительно небольшой базе данных порядка 10000 человек занимает длительное время порядка 100-1000 с.

Большое преимущество в скорости поиска по сравнению с методами, использующими полный перебор базы данных, имеют последовательные алгоритмы [4]. Основываясь на полученных ранее оценках можно ожидать, что для решения задачи распознавания человека по фотографии высокую эффективность будет иметь усеченная последовательная процедура с отсечением маловероятных гипотез [5, 6]. Поэтому цель данной работы заключалась в проверке работоспособности и оценке эффективности данного типа последовательной процедуры для задачи распознавания человека по фотографии. распознавание изображение лицо нейросетевой

В настоящей работе распознавание человека проводилось на основе геометрических характеристик лица, сфотографированного анфас. При этом использовались фотографии людей, в которых поворот головы вбок от положения анфас и наклон головы вправо или влево не превышал 10О. Поэтому искажения поворота практически не ухудшают точность определения геометрических характеристик по фотографии. По фотографии головы человека определялось положение 23 базовых точек (рис. 1). Для удобства определения декартовых координат (xi, yi) базовых точек в плоскости фотографии разработана специальная компьютерная программа на языке Object Pascal в интегрированной среде программирования Borland Delphi 7 (рис. 2). После поочередного выбора кнопками слева типов базовых точек и нажатий кнопки мыши в местах расположения соответствующих точек, программа записывала координаты базовых точек в файл для каждой фотографии.

Рис. 1 Базовые точки лица, положение которых определяли для распознаваемых людей

Рис. 2 Интерфейсная форма "Программы для создания базы данных по лицам"

В данном исследовании решалась задача определения человека по заданной фотографии из 20 человек, информация о которых хранится в базе данных. Поэтому для каждого из 20 человек предварительно отобрали по четыре фотографии: три использовались для создания базы данных, одна для распознавания (рис. 3).

Рис. 3 Комплекты фотографий для 20 человек, составляющих базу данных, с нанесенными на фотографии базовыми точками

Для определенности отобрали только мужчин от 18 до 35 лет. Для повышения репрезентативности выборки и приближения к реальным условиям старались выбирать фотографии различного качества и различного возраста для одного и того же человека.

В качестве геометрических характеристик лица выступают отношения расстояний между базовыми точками, называемые в дальнейшем признаками распознавания pij (где i - номер признака, j - номер человека в базе данных).

Были проанализированы более 60 возможных признаков, из которых были выбраны 25 признаков, в наибольшей мере отражающих индивидуальные черты лица человека. Для отбора признаков была составлена контрольная группа из трех человек (номера 1, 2, 3 на рис. 3), для которых были проанализированы по 10 фотографий. При выборе признаков необходимо было учесть, что признак должен иметь как можно меньший статистический разброс среди фотографий для одного человека (высокая "кучность"), а средние значения признака для различных людей должны существенно различаться. Для количественной оценки того, насколько хорошо данный признак p позволяет отличить людей друг от друга, введен следующий критерий "разделяемости":

(1)

где (Дp)min = min(| - |, | - |, | - |) - минимальное расстояние между математическим ожиданиями признака , , для трех человек из контрольной группы; уmax = max(у1, у2, у3) - максимальное из среднеквадратичных отклонений признака для трех человек из контрольной группы. Чем выше значение критерия r для данного признака p, тем с большей эффективностью данный признак позволяет различать людей.

Для нормирования значений признаков использована ширина головы по ушам x6-x5, так как данное расстояние в наименьшей степени зависит от мимических искажений лица. Ниже перечислены пять признаков p1,.. p5 с наибольшими значениями критерия r:

1) положение рта по отношению к подбородку: отношение расстояние по высоте от верхнего края нижней губы до линии подбородка к ширине головы по ушам (r = 1,638);

2) отношение расстояние между внешними краями глаз к ширине головы по ушам (r = 1,424);

3) отношение расстояния между внутренними краями глаз к ширине головы по ушам (r = 1,156);

4) отношение ширины головы по ушам к высоте головы (r = 0,909);

5) отношение расстояния от верхней части головы до средней высоты крыльев носа к ширине головы по ушам (r = 0,792).

Перечисленные признаки рассчитываются по следующим формулам.

(2)

Хорошая различимость людей по данным признакам иллюстрируется рис. 4, где пики плотности вероятности, соответствующие троим людям из контрольной группы, находятся на значительном расстоянии друг от друга.

В процессе распознавания производится проверка гипотез вида "на заданной фотографии изображен человек m". Задача последовательной процедуры заключается в поиске истинной гипотезы среди M = 20 гипотез. На каждом этапе k процедуры поочередно проверяются признаки pkm, по которым делается попытка либо сразу принять решение об истинности конкретной гипотезы m, либо принять решение о недостаточности информации и необходимости следующего этапа k + 1. Последовательная процедура ограничивается некоторым максимальным количеством этапов Kmax = 25 (количество отобранных признаков), после чего принимается решение об истинности некоторой гипотезы по наибольшей функции правдоподобия.

Рис. 4 Распределение признаков для троих человек из контрольной группы: три ряда штрихов означают по 10 реализаций признака pi для каждого из трех контрольных человек; графики плотности вероятности f(p) построены в предположении о нормальном распределении признака для каждого из людей

Для принятия решения на k-м этапе производится расчет функций правдоподобия щm для каждой из M гипотез - условных плотностей вероятности данных при истинности m-й гипотезы:

(3)

где сi - весовые коэффициенты;- математическое ожидание признака i, определенное по трем эталонным фотографиям человека m; уi - среднеквадратичное отклонение в предположении о нормальном распределении признака pi, определенное на этапе выбора признаков по троим людям из контрольной группы.

Рис. 5 Алгоритмическая схема последовательной процедуры

Затем производится сортировка гипотез по убыванию функции правдоподобия и сравнение двух наиболее вероятных гипотез с функциями правдоподобия щmax и щmax-1. Решение об истинности гипотезы m с функцией щmax принимается в случае где б0 - порог принятия решения [5] (рис. 5). В данном исследовании было принято б0 = 2. Отсечение маловероятных гипотез производится путем сравнения каждой гипотезы m c гипотезой, имеющей максимальную функцию правдоподобия, и отбрасыванием гипотезы m в случае, если , где в0, - порог принятия решения об отбрасывании гипотезы [6]. Очевидно, что для корректной работы алгоритма должно выполняться неравенство б0 < в0.

Для анализа эффективности предложенной процедуры, она реализована в виде программы на языке Object Pascal в интегрированной среде программирования Borland Delphi 7. Для оценки эффективности процедуры она запускалась многократно, и производилось усреднение показателей эффективности как по 20 людям, так и по номеру фотографии которая выбиралась в качестве заданной из четырех возможных для каждого человека (остальные три фотографии составляли базу данных) (рис. 6).

Рис. 6 Влияние параметра в0 на основные показатели эффективности алгоритма: вероятность правильного определения гипотезы P (а); среднее количество этапов алгоритма Kср (б)

Первые запуски процедуры показали, что уже на первом этапе процедуры (сравнение по первому признаку p1) из 20 человек исключаются 10-13 человек, и на последующих этапах уже не тратится вычислительное время на их анализ. На втором этапе процедуры исключаются еще примерно 4 человека. Таким образом, уже на первых двух этапах в рассмотрении остается лишь 15-20 % от всей базы данных, и на на последующих этапах делается вывод о наилучшем совпадении какого-либо человека с контрольной фотографией по порогу б0. Оказалось, что процедура завершает свою работу примерно на 10 этапе. Как видно из графиков на рис. 6 оптимальное значение порога в0 составляет около 8. При таком значении достаточно высока вероятность правильного распознавания человека (около 0,95) и достаточно мало количество этапов процедуры (около 12).

Таким образом, в рамках данной работы определены геометрические признаки лица, которые являются наиболее подходящими для распознавания. Усеченная последовательная процедура проверки гипотез с отсечением маловероятных гипотез имеет высокую эффективность для распознавания человека по фотографии. Для базы данных из 20 человек процедура обеспечивает точность распознавания 0,95, а время вычисления ориентировочно в 5-10 раз меньше, чем при использовании метода полного перебора базы данных.

Список литературы

1. Yoon K. S., Ham Y. K. and Park R.-H. Hybrid approaches to frontal view face recognition using the Hidden Markov Model and Neural Network // Pattern Recognition 1998. Vol. 31. P. 283-293.

2. Wiskott L., Fellous J.-M., Krueger N and Malsburg C. Face Recognition by Elastic Bunch Graph Matching // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997. Vol. 19. P. 775-779.

3. Байбеков Д.В. Исторические подходы к проблеме становления и развития искусственного интеллекта и их значение в современных условиях // Сб. мат. межвуз. науч. конф.; Изд. ГОУВПО ВГТУ. Воронеж, 2010. С. 78-87.

4. Сосулин Ю.Г., Фишман М.М. Теория последовательных решений и ее применения. М.: Радио и связь, 1985. 272 с.

5. Житенев С.А., Плотникова И.Н., Федорова Т.В. Закономерности усеченной последовательной процедуры проверки многих гипотез по максимуму функции правдоподобия // Теория и техника радиосвязи. 2008. Вып. 2. С. 124-137.

6. Байбеков Д.В., Житенёв С.А., Посметьев В.В. Оптимизация усечённой последовательной процедуры проверки многих гипотез с отсечением маловероятных гипотез. Теория и техника радиосвязи, 2011. № 3. С. 77 - 82.

Размещено на Allbest.ru


Подобные документы

  • Распознавание образов - задача идентификации объекта или определения его свойств по его изображению или аудиозаписи. История теоретических и технических изменений в данной области. Методы и принципы, применяемые в вычислительной технике для распознавания.

    реферат [413,6 K], добавлен 10.04.2010

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.

    курсовая работа [215,2 K], добавлен 19.10.2010

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.

    курсовая работа [3,0 M], добавлен 14.11.2013

  • Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.

    дипломная работа [3,3 M], добавлен 11.02.2017

  • Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.

    курсовая работа [2,1 M], добавлен 20.09.2014

  • Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.

    курсовая работа [462,2 K], добавлен 15.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.