Математические методы распознавания образов

Представление изображений в компьютере. Представление цвета в компьютерных системах. Оценка геометрических характеристик объектов на изображениях. Вероятностный критерий качества классификации, классификатор Байеса. Аутентификация по оболочке глаза.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 29.06.2012
Размер файла 6,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

3. Блики от окружающих предметов на роговице. Роговица работает как сферическое зеркало, отражая окружающий мир. Эти отражения (в особенности отражения источников света, пятен солнечного света и участков дневного неба) могут быть в несколько раз ярче деталей радужки и полностью подавлять их. Для решения этой проблемы применяют высокоинтенсивное в узкой области спектра освещение (значительно превосходящее солнечное по освещенности, лучше всего использовать ближний ИК, невидимый и не раздражающий человека) и регистрация изображения в этой же области спектра.

4. Различный размер зрачка при изменяющихся условиях съемки. Как уже было сказано, аффинное преобразование изображения радужки к стандартному размеру решает эту проблему лишь в первом приближении, так как растяжение радужки подчиняется нелинейному, весьма сложному закону. Для решения этой проблемы предлагается, например, запоминать размер зрачков человека при регистрации в системе, а при распознавании добиваться аккомодации зрачков до этого размера, манипулируя яркостью специального источника видимого света.

5. Патологические и возрастные изменения. На радужке весьма отчетливо отражается состояние организма, в том числе разного рода патологии (болезни, травмы, отравления). (Изучением этой взаимосвязи занимается иридология.) В связи с этим возникает вопрос об устойчивости (по времени) распознавания объекта, подверженного этим изменениям. Однако, на радужке существует значительное число врожденных и не изменяющихся в течение всей жизни признаков. Врожденные и приобретенные признаки разделить практически невозможно, однако человека можно распознавать на основании совпадения даже незначительной доли признаков.

6. Неопределенность угла поворота радужки. В системе с регистрацией двух радужек или в системе, комбинирующей радужку и лицо эта проблема не существует. Можно определять угол по конфигурации век, децентрации зрачка или по какому-либо выдающемуся характерному признаку на радужке. Однако, все эти признаки изменяются со временем, а на некоторых глазах отсутствуют. В таком случае остается перебирать углы поворота (существенно увеличивается время) или вычислять признаки, инвариантные к повороту (таких признаков существенно, в десятки раз, меньше, следовательно, сильно снижается надежность)

7. Обнаружение подделок. Достаточно важной для биометрических систем безопасности является устойчивость к подделке (фотография радужки или макет глаза) или отчуждению (вырванный глаз) биометрических признаков. Существует два способа решения этой проблемы: по спектру отражения радужки и по реакции глаза на освещение. Зрачок определенным образом и с определенным запаздыванием реагирует на внешние раздражители (вспышка света, громкий звук и т.д.), причем эта реакция управляется головным мозгом. Построив график реакции зрачка (пупиллограмму) и соотнеся ее с моментом, когда был подан импульс-раздражитель, можно с высокой надежностью отсечь попытки фальсификации.

Запись пупиллограммы дает еще одну интересную возможность. Как известно, пупиллограмма служит характеристикой физического функционального состояния человека (норма, перевозбужден, угнетен). По пупиллограмме с большой точностью можно установить насколько работоспособен человек в данный момент, а также определить состояния опьянения или воздействия стимуляторов. Такая возможность ценна для систем безопасности, устанавливаемых на объектах, где требуется не только допуск определенных лиц, но и проверка их работоспособности (операторские АЭС, авиадиспетчерские и т.п.) .

4. реализация системы распознавания образов

Рассмотренные выше теоретические методы работы с изображениями и алгоритмы распознавания образов позволяют получить лишь общее представление о том, как решаются задачи распознавания, но не дают чёткого понимания работы самих алгоритмов.

Поэтому я предлагаю конкретизировать задачу распознавания (т.е. рассмотреть её на примере распознавания человеческого глаза), тогда можно сформулировать задачу следующим образом: исследовать современные методы работы с компьютерными изображениями и их приложимость к конструированию распознающей системы на примере системы распознавания человеческого глаза. Разработать собственную библиотеку алгоритмов работы с изображениями и распознавания образов, а также программный продукт, демонстрирующий работу этих алгоритмов при распознавании человеческого глаза.

В качестве среды для разработки данной системы выбрана операционная оболочка MS Windows. Это обусловлено тем, что Windows поддерживает работу с графическими изображениями на уровне разработчика приложений. Тем самым из работы исключается вопрос о кодировании своих средств по работе с графикой.

Для разработки системы была выбрана среда программирования Borland Delphi производства фирмы Borland International® USA, California. Delphi представляет собой среду, поддерживающую визуальное проектирование приложений для Windows. При этом интерфейс пользователя создается путем комбинирования и редактирования стандартных компонентов (форм (окон), меню, полей ввода, статических текстов, списков различной формы, экранных кнопок и т.п.), имеющихся в стандартной библиотеке визуального конструктора. Среда визуального программирования выбрана потому, что она обеспечивает возможность максимально простого, быстрого и качественного создания стандартных фрагментов программы.

По сравнению с другими системами визуального программирования Delphi имеет следующие преимущества.

- Все системы являются интерпретаторами, то есть для выполнения созданных в них программ требуется загрузка модуля интерпретатора языка, либо псевдокомпиляторами, которые формируют программу в виде EXE-модуля, содержащего псевдокод программы (определенным образом закодированный текст) и модуль интерпретации, выполняющего этот псевдокод. В Delphi™ результатом генерации проекта является программа на языке Object Pascal™, который компилируется компилятором Borland Pascal 8.0™ в EXE-модуль, либо DLL-библиотеку. EXE-модуль содержит процессорный код и может быть запущен непосредственно из Windows™. DLL-библиотеку может использовать любое Windows™ приложение, в том числе написанное на другом языке. Действительная компиляция обеспечивает значительно большее быстродействие и дает выигрыш по памяти и дисковому пространству (если учитывать ресурсы, потребляемые модулем интерпретации в интерпретирующих системах).

- В отличие от ряда других систем Delphi™ обеспечивает возможность визуального конструирования не только интерфейса, но и ряда стандартных модулей программы, не отображаемых на экране. Кроме того, Delphi™ имеет стандартные средства создания собственных экранных и невидимых компонентов, что позволяет неограниченно расширять набор объектов, использование которых возможно в любом проекте и ничем не отличается от использования стандартных объектов библиотеки Delphi™.

- В Delphi™ доступны тексты программы, порожденной визуальным конструктором, причем изменения в них не влияют на возможность дальнейшей обработки их конструктором. Это дает возможность производить требуемую коррекцию работы объектов программы, если она не обеспечивается визуальным конструктором.

Таким образом, Delphi удовлетворяет требованиям удобства, быстроты и качества разработки. Кроме того, использование языка Pascal позволяет обеспечить приемлемую скорость выполнения преобразований, требующих большого объема вычислений за счет действительной компиляции и возможности непосредственной работы с памятью компьютера [9, с.6].

4.1 Выделение области распознавания

Для распознавания человеческого глаза в реальном времени входное изображение должно поступать с видеоисточника, ведущего непрерывное слежение за определенным пространством, из которого периодически производится захват изображения, которое поступает на распознавание. В нашем примере видеоисточником будет служить обычная web-камера, дающее изображение (порядка пикселей). Пример такого изображения, открытого в разработанной программе представлен в приложении А.

Для того чтобы перейти непосредственно к самому распознаванию человеческого глаза, необходимо предварительно локализовать определенную область на изображении, а именно радужку глаза.

Для этого необходимо выполнить следующие этапы работы с изображением:

1. Бинаризация изображения для поиска точек, близких к черному цвету;

2. Поиск центра глаза и локализация зрачка глаза;

3. Определение размеров радужки и её локализация.

Рассмотрим эти процедуры более подробно.

4.1.1 Поиск центра глаза и локализация зрачка глаза

Для определения зрачка предварительно проведем бинаризацию изображения. Экспериментально получено, что точки принадлежащие зрачку лежат в диапазоне от (0,0,0) до (45,75,85) , если рисунок рассматривать в цветовой модели RGB. В приложении Б показывается правильность таких выводов в результате выполнения процедуры бинаризации. Далее воспользуемся методом интегральных проекций для вычисления прямоугольника, ограничивающего область скопления точек, принадлежащих зрачку. Вертикальная интегральная проекция столбца изображения I задается следующим образом:

Аналогично задается горизонтальная проекция строки :

Столбцы и строки, для которых значения интегральных проекций велики, с высокой вероятностью содержат скопления точек, принадлежащих зрачку. Координаты, соответствующие областям резкого убывания интегральных проекций, относятся к границам области точек, принадлежащих зрачку.

Путем анализа полученной информации можно определить размеры зрачка, т.е. его радиус, а также центр зрачка, а значит и радужки.

Для проведения анализа необходимо получить всего лишь одну точку, про которую с уверенностью можно сказать что она принадлежит зрачку. На рисунке 19 продемонстрировано, что получить её не так уж и сложно. Далее в четыре перпендикулярные стороны пускаются “щупы” - шаблоны размерностью точек. Если содержимое шаблона хотя бы на 50% принадлежит области зрачка, то “щуп” двигается дальше, в противном случае останавливается. Использование такого рода шаблона исключает случаи, когда на пути “щупа” может встретится группа “светлых” точек, которая принадлежит области зрачка, что может привести к неправильной локализации области.

В результате получим четыре точки изображения, которые с уверенностью можно считать точками, лежащими на границе зрачка: , . Координаты центра зрачка получим как среднее между противоположенными точками:

, .

Для определения радиуса зрачка вычислим расстояния от центра зрачка до четырех известных нам точек , :

, .

Тогда радиус зрачка определяется как среднее :

.

4.1.2 Определение размеров радужки и её локализация

В процессе бинаризации при определении зрачка опытным путем были обнаружены темные точки на границе радужки. Этими точками очень удобно воспользоваться при определении границ радужки. Будем рассматривать кольца некоторой толщины и центром в точке , расположенные вне зрачка. Кольцо с максимальной концентрацией темных точек и будет являться границей радужки.

4.2 Приведение области распознавания к единому масштабу

Для того, чтобы сравнить две радужки между собой необходимо привести их к единому, заранее определённому размеру . Для этого применим к полученной радужке алгоритм интерполяции. Будем вставлять недостающие точки через заранее определенные равномерные промежутки по формулам:

где , , - RGB-компоненты искомой точки, , , , , , - RGB-компоненты соседних с искомой точкой точек.

Результат работы интерполяционного алгоритма можно увидеть в приложении Д.

4.3 Определение принадлежности радужки

Для того чтобы определить, какому человеку принадлежит полученная радужка, необходимо сравнить её с эталонами, находящимися в заранее заготовленной базе данных.

4.3.1 Сравнение двух радужек между собой

Рисунок радужки представляет по своей сути матрицу размером , элементами которой являются тройки чисел. Вычтем поэлементно из матрицы полученной радужки, матрицу отдельно взятой радужки из базы данных:

где - матрица разности, а и - матрица полученной радужки, и матрица отдельно взятой радужки из базы данных. При составлении радужки не учитываются белые - “незначащие” точки.

4.3.2 Очистка от шумов

Для улучшения результатов сравнения необходимо очистить матрицу сравнения от шумов - одиночных точек, заметно ухудшающих результат. Для этого пройдем матрицу сравнения квадратным шаблоном, изображенным на рисунке 18.

Рисунок 18. Шаблон, используемый для очистки от шумов

В случае, когда центральная точка шаблона оказывается окруженной незначащими точками, будем считать, что эта точка также считается незначащей. Результат обработки матрицы разности можно увидеть в приложении Е.

После составления матрицы разности подсчитывается соотношение между “совпавшими” и “не совпавшими” точками, на основании которого и делается вывод о принадлежности радужки.

4.3.3 Гистограмма цветов

Гистограмма представляет собой диаграмму, где по горизонтальной шкале откладываются все полутоновые градации от черного цвета слева до белого цвета справа, а по вертикальной - количество пикселов, соответствующее тоновой градации в данном изображении. Чем выше столбец, тем больше точек соответствующей яркости содержится в данном изображении. Если говорить проще, то гистограмма - это график распределения полутонов в конкретном изображении.

В дальнейшем рассматриваются гистограммы трех основных полутонов: гистограмма красного цвета, гистограмма синего цвета, гистограмма зеленого цвета.

Построим гистограммы цветов для разных изображений различных глаз и проанализируем. В приложении Ж можно увидеть результаты построения. Очевидно, что гистограмма цветов, построенная для одного и того же глаза в одних условиях, есть величина постоянная и уникальная, и её можно использовать при аутентификации глаза. Также очевидно, что при смене условий съемки меняется и гистограмма. Так в случае съемки в темном помещении гистограмма смещается в левую часть, что соответствует увеличению темных пикселей. Отсюда можно сделать вывод, что для качественной аутентификации необходимо использовать постоянное освещение.

ЗАКЛЮЧЕНИЕ

На сегодняшний день системы распознавания являются коммерческим продуктом, информация о работе этих алгоритмов в приложениях распознающие образы является недоступной. Поэтому в данной работе была исследован математический аппарат и разработан программный модуль решающий данную задачу, доступный для тех, кто интересуется данной проблемой с точки зрения работы, как самих алгоритмов, так и приложение математических выкладок непосредственно в программной реализации для задач распознавания.

Существует множество математических подходов к решению задачи распознавания, в данной работе были изучены некоторые из них, и на этой основе была спроектирована и реализована распознающая система на примере распознавания человеческого глаза.

В проекте использовались графические манипуляции, приводящие изображение к виду удобному для распознавания виду. Были исследованы методы обработки изображения с целью локализации области распознавания (в нашем случае радужки глаза) и с целью масштабирования полученного изображения.

Была исследована также и математическая сторона этих алгоритмов.

Результатом проекта является компьютерная программа с открытым исходным кодом, в котором реализованы все алгоритмы, рассматривающиеся в данной работе.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ:

1. Бородаенко Д.Н. Распознавание образов // Распознавание образов и искусственный интеллект. 2001. http://www.ocrai.narod.ru (26.12.2007).

2. Интеллектуальные системы безопасности [Офиц. сайт]. http://www.iss.ru (08.01.2008).

3. Математические методы распознавания образов // Доклады 11-й Всероссийской конференции. - 2003. - 18 апр. - С.18.

4. Пореев В.Н. Компьютерная графика/ В.Н. Пореев. - СПб.: БХВ-Петербург, 2002. - 432 с.

5. Садыков М.Р. Кодирование изображений/ М. Р. Садыков - Реферат: 1997. - 35 с.

6. Система видео наблюдения для автотранспортных предприятий [Офиц. сайт]. http://www.neotec.ru (28.01.2004).

7. Турчак В.В. Численные методы/ В.В. Турчак - М.: Наука, 1987. - 314 с.

8. Федотов Н.Г. Новые методы формирования признаков распознавания образов с позиции стохастической геометрии // Сайт информационных технологий. http://www.inftech.webservis.ru (15.01.2008).

9. Фленов М.Е. Библия Delphi/ М.Е. Фленов - СПб.: БХВ-Петрербург, 2002. - 415 с.

10. Форум программистов Delphi. http://forum.vingrad.ru/index.php? showforum=2 (03.03.2008).

11. Фу. К. Последовательные методы в распознавании образов и обучении машин/ К. Фу. - М.: Наука, 1971. - 355 с.

12. Фукунага К. Введение в статистическую теорию распознавания образов/ К. Фукунага - М.: Наука, 1979. - 267 с.

Размещено на Allbest.ru


Подобные документы

  • Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.

    дипломная работа [1019,9 K], добавлен 13.10.2017

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.

    курсовая работа [462,2 K], добавлен 15.01.2014

  • Определение компьютерной графики, задачи, виды, области применения. Способы распознавания образов, системы технического зрения. Инструменты для синтеза изображений и обработки визуальной информации. Представление цветов, форматы графических файлов.

    шпаргалка [49,9 K], добавлен 13.09.2011

  • Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.

    курсовая работа [645,2 K], добавлен 05.04.2015

  • Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.

    дипломная работа [332,2 K], добавлен 30.11.2012

  • Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.

    презентация [31,6 K], добавлен 06.01.2014

  • Формы и системы представления информации для ее машинной обработки. Аналоговая и дискретная информация, представление числовой, графической и символьной информации в компьютерных системах. Понятие и особенности файловых систем, их классификация и задачи.

    реферат [170,3 K], добавлен 14.11.2013

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.