Анализ математических подходов к идентификации лиц
Исследование, реализованных в разработанной системе распознавания человека по изображению лица, алгоритмов по различным критериям. Рассмотрение подходов к распознаванию лиц и выявленных при реализации достоинств и недостатков анализированных подходов.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 31.10.2017 |
Размер файла | 332,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Волгоградский государственный технический университет
Национальный экономический университет
Анализ математических подходов к идентификации лиц
А.Н. Земцов, Зунг Хань Чан
Аннотация
распознавание изображение лицо алгоритм
В работе проведено исследование реализованных в разработанной системе распознавания человека по изображению лица алгоритмов по различным критериям. Рассматриваются три основные подхода к распознаванию лиц, приводятся, выявленные при реализации, достоинства и недостатки подходов.
Ключевые слова: Базы данных, распознавание лиц, выделение объектов, скрытые марковские модели, метод главных компонент, нейронная сеть, нейросетевые алгоритмы.
Основная часть
Одним из основных направлений исследований в решении задачи распознавания лиц является уменьшение вычислительной сложности на этапе классификации за счет снижения размерности данных. Метод главных компонент [1, 4, 9], дискретное косинусное преобразование [5, 6], линейный дискриминантный анализ [4, 9] являются основными методами снижения размерности данных. Особое внимание при этом уделяется методам классификации, таким как: метрические [3, 4], нейросетевые [4, 7] и на основе скрытых Марковских моделей [2]. Необходимо отметить, что сокращение времени решения задачи классификации, в том числе, может достигаться за счет распараллеливания вычислений [10].
Для анализа влияния разрешения входных изображений на процент распознавания, время создания, а также время обучения моделей, был проведен ряд экспериментов, часть результатов из которых представлены в данной работе. В качестве экспериментов были взяты оптимальные внутренние параметры метода главных компонент, метода на основе скрытых марковских моделей и многослойного персептрона [4]. Эксперименты проводились с использованием базы 40 наборов по 10 изображений размером 92х112 ORL, изображений размером 512х768 базы FERET [8], а также собственной азиатской базы, которая представляет собой 100 наборов изображений по 20 изображений в каждом. Как показано на рис. 1, изображения лиц представлены в различных параметрах освещенности, ракурса, мимики и возраста людей.
Рис. 1 Вариативность параметров освещенности, ракурса и мимики
Предварительное исследование показало, что процент распознавания резко снижается при уменьшении размера входного изображения менее чем 40х40 пикселей, и слабо возрастает после увеличения размера более чем 256х256 пикселей.
Рис. 2 Изменение процента распознавания в зависимости от качества входных изображений на проверочной выборке
Время обучения увеличивается с увеличением размера входного изображения. При увеличении разрешения с 50х50 до 256х256 пикселей время для обучения базиса пространства собственных лиц увеличивается в 5 раз, для двухслойного персептрона - в 2 раза, для скрытой Марковской модели - в 3 раза.
Рис. 3 Зависимость процента распознавания от количества лиц в обучающей выборке
По результатам исследований можно сделать вывод о том, что разрешение изображения прямо пропорционально времени обучения и распознавания для любого метода. Другими словами, увеличение разрешения изображения приводит к увеличению времени, и наоборот, снижение разрешения входного изображения приводит к ускорению работы системы, но уменьшению процента распознавания.
Для анализа влияния количества лиц в обучающей выборке на процент распознавания, время создания и обучения моделей, были проведены эксперименты, результаты которых представлены на рис. 3-4. Эксперименты проводились для двух методов [2, 7], т. к. реализованный метод главных компонент не предполагает изменения количества лиц в наборе для 20 изображений лиц каждого человека, не принадлежащих обучающему набору.
По результатам анализа можно сделать вывод, что при количестве обучающих примеров, лежащем в интервале , большую эффективность показал метод на основе скрытых Марковских моделей, а более стабильная работа обоих алгоритмов наблюдается в интервале , на котором оба метода достигают высокого процента распознавания.
Рис. 4 Зависимость времени обучения от количества обучающих лиц изображений
Дальнейшее увеличение количества обучающих лиц формирует прямую зависимость процента распознавания и возрастания времени обучения.
По результатам исследований можно сделать вывод о том, что увеличение количества элементов в обучающей выборке приводит к увеличению времени обучения. Наименьшее время обучения показала двухслойная нейронная сеть, что показывает трудоемкость вычислений в методе распознавания на основе скрытых Марковских моделей.
Оптимальное количество обучающих лиц лежит в интервале в зависимости от общего количества человек в базе изображений и поставленной задачи.
Метод главных компонент показал приемлемые результаты на нормированной базе изображений - 86.8%. При изменении различных параметров съемки, происходит заметное снижение процента распознавания, что обуславливает необходимость применения подсистемы предварительной обработки изображений: геометрическая обработка особенностей лица, нормализация интенсивности, удаление шума, повышение резкости и др. Также метод главных компонент показал наименьшее значение времени распознавания и обучения - около 5 секунд, что обусловлено обучением на одном лице каждого человека, это делает метод главных компонент перспективным для решения задачи поиска в больших базах данных, содержащих собственные векторы и значения ковариационной матрицы.
Двухслойная нейронная сеть показала наиболее высокий процент распознавания в условиях вариативности освещенности - 73.6%. По сравнению с методом на основе скрытых Марковских моделей, двухслойная нейронная сеть уступает малозначительно, а также характеризуется меньшим временем обучения и распознавания. Этот факт делает актуальным применение многослойных нейронных сетей для решения задачи контроля доступа на крупные предприятия, где с одной стороны необходимы незначительные показатели ошибок FRR и FAR, а с другой стороны необходимо небольшое время выполнения вычислений для режимов обучения и классификации.
Скрытые Марковские модели показали устойчивость и надежность в условиях существенного изменения ракурса, мимики лица, распознавания затемненных малоинформативных изображений с сохранением высокого процента распознавания - 87.4%, 96% и 88.2% соответственно. Однако, также было выявлено, что данный метод имеет самые большие показатели времени обучения базы скрытых марковских моделей, и как следствие, требует высокой производительности вычислительной системы, что сказывается на поиске в больших базах данных.
Литература
1. Kirby M. Application of the KL procedure for the characterization of human faces // IEEE Trans. on Pattern Analysis, 1990. Vol. 12. pp. 103-108.
2. Othman H., Aboulnasr T. A separable low complexity 2d hmm with application to face recognition // IEEE Trans. on Pattern Analysis, 2003. Vol. 25. pp. 1229-1238.
3. Седов В.А., Седова Н.А. Методы оценки качества полученных решений // Южно-сибирский научный вестник, 2012. № 1. С. 88-91.
4. Земцов А.Н. Алгоритмы распознавания лиц и их применение в системах биометрического контроля доступа. LAP Academic Publishing, 2011. 128 c.
5. Земцов А.Н. Сравнительный анализ эффективности методов сжатия изображений на основе дискретного косинусного преобразования // Прикладная информатика, 2011. № 5. С. 77-84.
6. Земцов А.Н. Сравнительный анализ эффективности методов сжатия изображений на основе дискретного косинусного преобразования // Прикладная информатика, 2011. № 4. С. 90-104.
7. Пучков Е.В. Сравнительный анализ алгоритмов обучения искусственной нейронной сети // Инженерный вестник Дона, 2013, №4. URL: ivdon.ru/ru/magazine/archive/n4y2013/2135.
8. Phillips P.J. The FERET evaluation methodology for face recognition algorithms // IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000. Vol. 22. pp. 1090-1104.
9. Mokeev A.V., Mokeev V.V. Pattern recognition by means of linear discriminant analysis and the principal components analysis // Pattern recognition and image analysis, 2015. Vol. 25. pp. 685-691.
10. Серов С.С., Андреев А.Е., Кравченя П.Д., Гущин Р.И., Чеботарев П.П. Сокращение времени оценки схожести текстовых документов на неоднородной многопроцессорной вычислительной системе // Инженерный вестник Дона, 2015, №2(2). URL: ivdon.ru/ru/magazine/archive/n2p2y2015/3031.
Размещено на Allbest.ru
Подобные документы
Рассмотрение основных подходов к построению математических моделей процесса. Сопряженное уравнение для простейшего уравнения диффузии и структура алгоритмов для решения задач. Использование принципа двойственности для представления линейного функционала.
курсовая работа [711,0 K], добавлен 03.08.2012Динамическая модель как теоретическая конструкция, описывающая изменение состояний объекта. Характеристика основных подходов к построению: оптимизационный, описательный. Рассмотрение способов построения математических моделей дискретных объектов.
контрольная работа [769,7 K], добавлен 31.01.2013Исторический обзор формирования тригонометрии как науки от древности до наших дней. Введение понятия тригонометрических функций на уроках алгебры и начал анализа по учебникам А.Г. Мордковича, М.И. Башмакова. Решения линейных дифференциальных уравнений.
дипломная работа [2,6 M], добавлен 02.07.2011Основные понятия и результаты, связанные с теорией диофантовых уравнений, теорией эллиптических кривых и abc-гипотезой. Метод бесконечного спуска и доказательство теоремы Ферма для n=4. Анализ выводов К. Рибета Великой теоремы Ферма из гипотезы Таниямы.
дипломная работа [351,4 K], добавлен 26.05.2012Эволюция взглядов и подходов к процессу родов до 1900 года и на современном этапе. Преимущества и недостатки применения обезболивающих средств, степень их опасности для матери и ребенка. Кесарево сечение: плюсы и минусы. Ответственность женщины.
реферат [34,7 K], добавлен 28.11.2010Основные математические постулаты Эвклида. Попытки математиков доказать пятый постулат "О параллельности" как теорему. Основные подходы к подходов к построению гиперболической геометрии, ее содержание, примеры и отличие от эвклидовой аксиоматики.
контрольная работа [223,2 K], добавлен 25.06.2009Описание подходов к построению динамической модели технологического процесса, этапы и направления данного процесса, ее конкретное представление. Аппроксимация заданных уравнений и оценка полученных результатов, решение и математическое значение.
контрольная работа [92,9 K], добавлен 11.03.2015Использование системы MathCAD как средства описания алгоритмов решения основных математических задач. Рассмотрение законов Кеплера и понятия о всемирном тяготении. Аналитические и численные решения задачи трех тел (материальных точек), вывод уравнений.
курсовая работа [287,2 K], добавлен 04.06.2013Математические методы распознавания (классификации с учителем) и прогноза. Кластеризация как поиск оптимального разбиения и покрытия. Алгоритмы распознавания и интеллектуального анализа данных. Области практического применения систем распознавания.
учебное пособие [2,1 M], добавлен 14.06.2014Особенности математических моделей и моделирования технического объекта. Применение численных математических методов в моделировании. Методика их применения в системе MathCAD. Описание решения задачи в Mathcad и Scilab, реализация базовой модели.
курсовая работа [378,5 K], добавлен 13.01.2016