Обзор задач и методов анализа графической информации в системах идентификации пользователя

Функциональные задачи интеллектуальных систем анализа изображений. Области применения, классификация систем распознавания лиц (2D-; 3D-(трехмерная) идентификация). Алгоритмизация верификации лиц по 68 "волшебным точкам", описание математического аппарата.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 14.02.2022
Размер файла 719,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Обзор задач и методов анализа графической информации в системах идентификации пользователя

М.В. Кравчук, Г.К. Олейников; Пензенский государственный университет

Аннотация

Рассмотрены вопросы использования информационных систем анализа изображения (ИСАИ), их значение и функциональные задачи. Выбрано направление верификации пользователя, которое на данный момент является одним из ведущих из ИСАИ в разработке. Таковым была выведена ИСАИ вида: верификации лица. В данном направлении были рассмотрены классификационные группы, проанализированы их особенности и недостатки. Помимо этого, были рассмотрены существующие подходы реализации и необходимое техническое оборудование для каждого из них, после чего были приведены общая алгоритмизация обеих классификационных групп и описание математического аппарата одной из них.

Ключевые слова: информационные системы анализа изображения, верификация лиц, 2D- и 3D-подходы, лицо, распознавание, идентификация, ключевые точки, обнаружение лица

Более 90 % информации мы получаем с помощью глаз. И по этой причине понятно, что технический прогресс затронул средства сбора и обрабатывания визуальной информации [1]. Одними из наиболее важных областей применения технологий анализа изображений являются системы безопасности [2-4] и медицинские системы [5-7].

На данный момент реализация происходит при помощи технических и программных средств. В общем интеллектуальные системы анализа изображений (ИСАИ) имеют следующие функциональные задачи:

- оценка и улучшение (наложение фильтра Unsharp Mask) качества изображения;

- определение границ объекта (метод Виолы - Джонса [8]);

- классификация распознанных объектов;

-кластеризация и распознавание образов [9].

На сегодняшний момент главной задачей реализации множества таких систем стала задача кластеризации полученных данных с целью упрощения поиска и доступа к ним.

В данной статье будут рассмотрены виды уже существующих средств и методов верификации лиц и будет выбран один из них, который на данный момент является наиболее распространенным и точным.

Идентификация лиц в настоящее время стала одним из актуальных вопросов безопасности информационных систем [10], если исходить из того, что из 7 млрд человек относительно похожих на вас лишь несколько человек (исключая родных и близких) [11]. Распознавание лица объединяет две глобальные дисциплины:

1. Цифровую обработку изображений.

2. Искусственный интеллект.

Зачем же решили использовать распознавание лиц вместо распознавания отпечатка пальца? Использование распознавания лиц продиктовано следующими причинами. Во-первых, это удобство использования для верификации: вам требуется лишь подойти к ЭВМ и «улыбнуться», нежели как для распознавания отпечатка пальца требовалось подойти к ЭВМ, удостовериться что ваш палец чист и не поврежден, а также сам сканер приведен в порядок.

Основными видами задач, которые решаются с помощью систем распознавания лиц (СРЛ), являются:

- обеспечение безопасности;

- контроль доступа по лицу;

- построение аналитики.

Области применения СРЛ включают:

- системы безопасности (помогает обнаруживать нарушителей во избежание совершения противоправных действий. Если лицо, находящееся в «черном списке», появится в объективе камеры, ПО сразу же среагирует подачей сигнала оператору);

- банковские системы, а также попросту защита информации на ПК (мобильном устройстве) (обеспечение мгновенной и максимально облегченной верификации для прохождения на засекреченную территорию, контроля перемещений, доступа к данным, содержащим секретную информацию);

- системы торговли (бизнеса) (с целью повышения продаж, данное ПО определит характеристики пользователя (пол, эмоции, возраст), после чего пользователю будет предлагаться таргетированная реклама).

Для решения данных задач сейчас используется большое разнообразие методов верификации пользователя по геометрии его лица. Основаны они на индивидуальности черт лица и формы черепа каждого человека. Главное преимущество данной технологии в том, что она проста для понимания и восприятия пользователей (так как люди распознают друг друга по лицу (его физиологическим признакам)). Прежде чем рассматривать различные подходы распознавания лиц, требуется выделить общую структуру данного процесса (рис. 1) [12].

СРЛ могут быть классифицированы на две группы:

Рис. 1. Обобщенный алгоритм распознавания лиц

- 2D-распознавание;

- 3D- (трехмерное) распознавание.

Наверное, самым сложным, точным и дорогостоящим является трехмерное распознавание. Само трехмерное распознавание включает в себя два ключевых подхода:

1. Стереотехнология.

2. Освещение лица структурированным светом.

Принцип стереотехнологии в том, что она формирует трехмерное изображение за счет синтеза двух или более двухмерных фотографий. В противоположной технологии лицо подсвечивается структурированным светом от трех источников, после чего отраженный свет улавливается камерой и инициализируется порядка 40 000 измерительных точек. Данная технология более надежная в отличие от 2D-технологий, так как используются свои источники света.

Но минус использования технологий 3D-верификации - их стоимость, поэтому 2D-технологии будут рассмотрены подробнее. Но стоимость - это не единственная причина подробного рассмотрения, более преимущественная причина - это то, что на сегодняшний день широко используется РЛ 2D.

Единственная существенная проблема 2D-технологий в том, что ни один из алгоритмов, существующих на данный момент, не предоставляет полного решения задачи (присутствуют ошибки и недоработки) [13].

Традиционно алгоритмы распознавания лиц включают следующие этапы:

1. Обнаружение лица на фотографии.

Данная задача предполагает собой выделение региона, внутри которого располагается изображение одного лица.

2. Идентификация пользователя.

В выделенной области реализуется отбор индивидуальных особенностей изображения лица. К системе требуется привязка базы данных, которая содержит определенное количество фотографий, после чего система распознавания выделяет в базе ту из фотографий, которая обладает наибольшей схожестью с предоставленным изображением.

Главным преимуществом 2D-методов распознавания лица будет являться то, что большинство биометрических методов требует использования дорогостоящего оборудования, также для их разработки на данный момент уже существует множество готовых библиотек, проработанные и протестированные алгоритмы и методы самой верификации. При наличии данных преимуществ также присутствуют и некоторые недостатки, такие как:

- низкая статистическая достоверность;

- наличие хорошего освещения;

- требование фронтального изображения лица и т.д.

Ведущим методом обнаружения лиц по 2Б-изображению является метод Виолы-Джонса [8], после чего уже непосредственно верификация производится по модели ASM (Active Shape Models) [10] (рис. 2). Главная концепция состоит в учете статистических связей между расположением антропометрических точек лица. Проблема состоит в том, что на каждом изображении лица, выявленном по методу Виолы-Джонса, точки проинициализированы в идентичном порядке и уже непосредственно по их расположению реализуется сравнение с лицами, которые были занесены в базу данных.

После того, как лицо было обнаружено и проинициализировано 68 точек, требуется учитывать то, что верифицированный каркас лица будет отображаться по-разному из-за некоторых факторов, таких как:

- положение лица относительно камеры (оно должно быть фронтально отображено, соответствуя модели ASM);

- некорректное или слабое освещение;

- эмоциональное искажение лица;

- прищуривание глаз и т.п.

При возникновении хотя бы одного из факторов точечный каркас будет некорректным, также возможно, что они будут оторваны от лица, увы, но при видеозахвате иногда проскальзывают такие изображения, и их требуется отфильтровывать в целях обучения системы.

На нашем лице также присутствует некоторое количество точек, которые являются статическими и наиболее информативными, такие как положение глаз [14]. Множество этих точек «привязано» к лицу, вне зависимости от его положения относительно камеры (тем самым можно избежать ошибочного объективного фактора). Данные точки можно использовать как базу для моделирования определенных признаков.

Рис. 2. Модель ASM (Active Shape Models)

Главное - учитывать то, что все эти признаки (68 точек) и расстояния между ними должны быть «безразмерные» (иметь соотношение с каким-то размером или расстоянием). Учитывая мимику лица, наиболее подходящим расстоянием является расстояние между «внутренними» уголками глаз. Данное решение было принято исходя из того, что при любом выражении эмоций, реакции на освещение и моргании расстояние между точками 39 и 42 практически не изменяется.

Также требуется вывести основной признак лица, который сразу же начнет отсеивать ненужные. Таким признаком может стать расстояние от верхней точки переносицы (точка 27) до нижней точки подбородка (точка 8). При анализировании некоторого количества лиц было выведено, что данный параметр будет существенно отличаться у каждого человека.

После того, как теория рассмотрена, требуется разобраться с реализацией данного подхода (с алгоритмизацией верификации лиц по 68 «волшебным точкам»).

В ОрепБУ система координат (по стандарту) привязана к верхней левой точке окна (Оу направлена вниз). Пользовательская система координат будет использоваться с целью нормализации данных и наиболее комфортного восприятия со стороны пользователей (рис. 3).

Но, помимо того, что требуется задать пользовательскую систему координат, также надо нормализовать расстояние между точками (рис. 4).

Рис. 3. Пользовательская система координат

Не следует забывать то, что решение ЭМВ надо предоставлять относительно системы координат, которая определена непосредственно OpenSV. Итак, начнем определять координаты наших 68 «волшебных точек».

Рис. 4. Нормализация размерности в целях «безразмерной» инициализации точек

Изначально, чтобы в дальнейшем перейти к ПСК, требуется определить расположение так называемого «зрачка» (точка посередине 36-39 и 42-45). Для этого выведем следующие формулы:

После определения местоположения «зрачка» для перехода к ПСК нам требуется вычислить начало нашей ПСК. Для этого выведем следующие формулы:

После определения нулевой точки нашей ПСК, выведем еще две формулы, которые потребуются нам в целях:

- определения расстояния между «зрачками»;

- тригонометрической функции угла поворота ПСК.

Далее приступим к вычислению расстояния между «зрачками»:

Уже после того, как произошел переход на «безразмерную» пользовательскую систему координат, можно реализовывать фильтрацию лиц по особенным признакам.

верификация лицо алгоритмизация распознавание

Список литературы

1. Анализ изображений: человек или компьютер? // Проблема анализа изображений.

2. Карамазова Ж. В Китае камеры начали определять личность людей по походке. Да, даже круче, чем в «Черном зеркале» // Проблема актуальности технологии ИСАИ.

3. Хрящев В.В., Приоров А.Л., Стефаниди А.Ф., Топников А.И. Разработка и исследование алгоритмов обработки и распознавания речевых сигналов и изображений для систем мультимодальной биометрии // Цифровая обработка сигналов. 2017. №3. С. 45-49.

4. Свирин И., Ханин А. Некоторые аспекты автоматического распознавания автомобильных номеров //Алгоритмы безопасности. 2010. № 3. С. 26-29.

5. Лебедев А.А., Степанова О.А., Юрченко Е.А., Хрящев В.В. Разработка алгоритмов анализа изображений для классификации патологий слизистой оболочки желудка // DSPA: Вопросы применения цифровой обработки сигналов. 2018. Т. 8, № 3. С. 223-227.

6. Патент 2372844 Российская Федерация, C1. Способ автоматического определения размеров и положения сердца пациента по флюорографическим снимкам / Бодин О.Н., Кузьмин А.В., Семенкин М.А., Моисеев А.Е.; опубл. 20.11.2009; заявка № 2008123240/14 от 16.06.2008.

7. Бодин О.Н., Чураков П.П., Тычков А.Ю., Кузьмин А.В. Информационно-измерительная система для предварительной обработки флюорографических снимков // Измерительная техника. 2011. № 4. С. 41-44.

8. Viola P., Jones M.J. Rapid Object Detection using a Boosted Cascade of Simple Features // Proceedings IEEE Conf. on Computer Vision and Pattern Recognition (CVPR 2001). 2001. Vol. 1. P. I-511-I-518.

9. Усмонов М.С., Тохирова Ч. Интеллектуальные системы анализа изображений // Технические науки: проблемы и перспективы: материалы VI Междунар. науч. конф. (г. Санкт- Петербург, июль 2018 г.). СПб. : Свое издательство, 2018. С. 19-21.

10. Cootes T.F., Taylor C.J., Cooper D.H., Graham J. Active shape models - their training and application // Computer Vision and Image Understanding. 1995. Vol. 61. P. 38-59.

11. Правда ли, что в мире есть еще 7 человек, которые похожи на вас? Если да, то как? // Проблема физиологически похожих людей.

12. Анализ существующих подходов к распознаванию лиц // Проблема анализа изображений.

13. Miny-Hsuan Y., Kriegman D.J., Ahuja N. Detecting faces in images: a survey // IEEE Trans. Pattern Analysis and Machine Intelligence. 2002. Vol. 24. P. 34-57.

14. Хрящев В.В., Приоров А.Л., Никитин А.Е., Матвеев Д.В. Алгоритм распознавания лиц с использованием информации о расположении центра глаз // Радиолокация, навигация, связь: материалы ХХI Междунар. науч.-техн. конф. (г. Воронеж, 14-16 апреля 2015 г.). Воронеж, 2015. С. 177-187.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.