Повышение надежности распознавания лиц по цифровой 3D-модели
Основные проблемы, существующие в системах 3D-распознавания, преимущества и недостатки метода. Комбинированный метод распознавания лиц по цифровым 2D и 3D-моделям для повышения надежности операции. Результаты эксперимента на основе базы CASIA-3D FaceV1.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 21.01.2018 |
Размер файла | 153,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
УДК 58
Повышение надежности распознавания лиц по цифровой 3D-модели
М.И. Шаханов
Владимирский Государственный университет
имени А.Г. и Н.Г. Столетовых
Научный
к.т.н., профессор В.Ф. Жирков
Системы распознавания человека требуют повышения надежности принятия решения, особенно в системах реального времени. Большинство из существующих подходов основываются на применении обычных 2D-изображений человека. Ограничения, накладываемые на подобные системы, могут быть сняты за счет использования 3D-моделей распознаваемых лиц. Благодаря усовершенствованию аппаратной базы и использованию комбинированных методов распознавания по 2D и 3D-изображению возможно достичь нового уровня надежности в подобных системах.
Интерес к 3D системам распознавания лиц вызван тем, что использование 3D-представления объекта потенциально имеет большую точность, чем использование его двухмерного снимка. Для 3D-моделей объектов справедливы следующие утверждения:
- обработка в пространстве 3D позволяет преодолеть такие ограничения 2D-моделей, как различные углы обзора и неоднородность освещения;
- устойчивость распознавания к отклонению ракурса лица от фронтального;
- высокая точность расстановки антропометрических точек на лице с получением абсолютных, а не только относительных размеров;
- устойчивость модели даёт возможность выявить форму и другие отличительные признаки объекта за счёт неизменности поверхности лица;
- глубина и особенности кривизны поверхности лица имеют ряд преимуществ над использованием яркостных характеристик в 2D-изображениях, так, например, становится значительно проще описать формы таких областей, как щёки, лоб, подбородок[1].
Основные проблемы, существующие в системах 3D-распознавания:
- ограничения, существующие в технологии обработки объектов 3D-сенсорами;
- ограниченность алгоритмов распознавания;
- сложность в организации и проведении экспериментов[2].
Предлагаемый комбинированный метод распознавания позволяет использовать преимущества 3D и 2D моделей.
Комбинированный метод распознавания по 2D и 3D-модели. Различия в распознаваемом образе лица и эталоне могут быть вызваны двумя типами причин - внутренними (зависящими от самого человека) и внешними (не зависящими от него). К первой категории относятся выражения эмоций на лице, пол, изменения, связанные с возрастом. Ко второй группе относятся положение головы, освещение, точка обозрения. Основными проблемам моделей являются:
- освещение. Изменение условий освещения, например, в помещении или на улице, при которых идет съемка изображения лица, может повлиять на точность распознавания. Различия в освещении могут быть вызваны как различными типами источника так и физическими параметрами камеры или другого устройства съемки. Решение данной проблемы заключается в использовании информации, представленной в 3D-поверхности лица. Таким образом, имея такую 3D-модель, проблема сводится к простому сравнению геометрии формы лица распознаваемого человека и модели, хранящейся в базе, причем данные модели окажутся инвариантны к освещению.
- положение головы. Разнообразие в позиции может быть вызвано разными углами обзора камеры, что становится причиной отклонения положения лица на 3D и 2D изображениях. Так как лицо является трехмерным объектом, двухмерное распознавание при различных отклонениях лица от фронтального становится затруднительным. При наличии же информации о лице в трехмерной модели проблема может быть решена путем геометрических преобразований и последующим распознаванием с применением 2D либо 3D подходов.
- выражения лица. Разработка надежных систем распознавания лиц сталкивается с проблемой нечувствительности применяемых алгоритмов к изменчивости выражений лица человека.
- эффект старения. Старение является неотъемлемой проблемой распознавания, потому что лицо это идентификатор, который меняется с годами и эффект старения не может быть проконтролирован и игнорироваться. Так как причин старения и изменения лица может быть бесконечное множество, общего решения данной проблемы не существует[3].
Несмотря на все вышеперечисленные преимущества, 3D-распознавание лиц имеет и ряд недостатков:
- получение 3D-модели лица с использованием специального сканера или стереосистемы - процесс, требующий временных и материальных затрат;
- извлечение отличительных признаков (глаза, нос, рот) по 3D-модели очень трудоемкая задача;
- сравнение формы распознаваемого образа и эталонного вычислительно сложная задача, требующая больших временных затрат;
- потеря информации о текстуре лица после получения 3D-модели.
Основываясь на предыдущих выводах, комбинированная система распознавания (3D + 2D) представляет наибольший интерес и позволит повысить надежность распознавания[3]. Например, проблемы, связанные в различиях в положении и освещении, могут быть преодолены с помощью 3D-данных (форма), полученных из модели, в то время, как отличительные особенности лица могут быть выделены с помощью 2D-данных (текстура). Как правило, текстура дает информации о наиболее отличительных особенностях изображения. При использовании комбинированной схемы 2D и 3D-распознавание может быть использовано на различных уровнях, например, уровень выделения признаков, уровень принятия решения. Причем общая производительность системы будет повышаться за счет разделения ответственности каждой из используемых моделей.
Рисунок 1 Комбинированная схема распознавания лиц
В первом случае используется как 2D-модель (текстура), так и 3D-модель (форма), то есть каждой точке на двумерном изображении соответствует точка на трехмерном изображении. Данный подход основан на использовании нагруженного графа отношений (НГО).
Во втором случае какая-либо из моделей может либо использоваться изолированно в виду того, что система 3D-сканирования может запаздывать во времени по отношению к системе получения простого 2D-изображения и точка, полученная в 2D-изображении, не будет соответствовать точке в 3D-модели, либо не использоваться вовсе. В таком случае принятие решения по распознаванию будет осуществляться по результатам работы одной из систем.
Экспериментальная база. Для проведения экспериментов была выбрана свободно распространяемая база CASIA-3D FaceV1, которая состоит из изображений 123 различных людей, каждое изображение представлено как 2D-изображением (bmp-фотография) и 3D-моделью (wrl-представление). Кроме того, каждый человек в коллекции снят при разном освещении, положении относительно камеры и с разными выражениями лица. Такое достаточно полное представление различных изображений в базе позволяет проводить эксперименты, учитывающие многие условия работы, которые могут присутствовать в реальных системах распознавания.
Использование комбинированного подхода к распознаванию по 2D и 3D-моделям позволяет снять ряд ограничений, накладываемых на каждую из моделей в отдельности. Предлагаемый подход также предусматривает как синхронную, так и асинхронную работу подсистем распознавания, что в свою очередь повышает надежность всей системы в целом. Использования данного подхода позволяет применять различные алгоритмы распознавания для 2D и 3D-моделей, что способствует повышению гибкости системы распознавания за счет применения подходящего алгоритма в каждом конкретном случае.
цифровой распознавание лицо
Список литературы
1. Cyganek ,B. An Introduction to 3D Computer Vision Techniques and Algorithms / Bogusіaw Cyganek and J. Paul Siebert. - John Wiley & Sons, 2009. - 483 p.
2. Haar, F. B. A 3D Face Matching Framework / F. B. ter Haar, R. C. Veltkamp. - Technical Report UU-CS-2007-047, Utrecht University, 2007. - Mode of access: http://www.cs.uu.nl/research/techreps/repo/CS-2007/2007-047.pdf
3. Mahoor, M. H. A Multi-modal approach face modeling and recognition: a dissertation / Mohammad Hossein Mahoor; University of Miami. - Coral Gables, Florida, December 2007. -170 p.
Размещено на Allbest.ru
Подобные документы
Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.
курсовая работа [215,2 K], добавлен 19.10.2010Анализ систем распознавания поведения лабораторных мышей. Классификация движений на основе построенных дескрипторов. Существующие методы обнаружения движения, разработка соответствующего программного обеспечения и оценка его эффективности, функции.
дипломная работа [1,1 M], добавлен 16.09.2017Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Строение артикуляционного аппарата человека с точки зрения возможности распознавания речи по артикуляции. Комплекс параметров артикуляции на основе контура внутренней области губ. Реализация модуля распознавания фонем русской речи по изображениям губ.
дипломная работа [3,1 M], добавлен 19.08.2012Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.
реферат [100,5 K], добавлен 18.01.2014