Разработка приложения на основе алгоритма классификации объектов
Процедура предъявления обучающих выборок. Изучение и моделирование метода классификации объектов на изображении "случайный лес", "CART" и "SVM". Изучение и моделирование метода опорных векторов. Проведение сранительного анализа полученных результатов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 07.08.2018 |
Размер файла | 3,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Предположим, что выборка линейно разделима, то есть существуют такие значения параметров щ, , при которых функционал числа ошибок
(5.2)
принимает нулевое значение. В этом случае разделяющая гиперплоскость не единственна, поскольку существуют и другие положения разделяющей гиперплоскости, реализующие то же самое разбиение выборки. Идея метода заключается в том, чтобы разделяющая гиперплос- кость максимально далеко отстояла от ближайших к ней точек обоих классов [9].
Параметры линейного порогового классификатора определены с точностью до нормировки: алгоритм a(x) не изменится, если щ и одновременно умножить на одну и ту же положительную константу. Удобно выбрать эту константу таким образом, чтобы для всех пограничных (ближайших к разделяющей гиперплоскости) объектов из выполнялись условия:
(5.3)
При оптимальном положении разделяющей гиперплоскости все пограничные объекты находятся от неё на одинаковом расстоянии, остальные объекты находятся дальше. Таким образом, для всех ? [10]:
(5.4)
Условие ?1 < < 1 задаёт полосу, разделяющую классы. Ни одна из точек обучающей выборки не может лежать внутри этой полосы. Границами полосы служат две параллельные гиперплоскости с направляющим вектором щ. Точки, ближайшие к разделяющей гиперплос- кости, лежат в точности на границах полосы. При этом сама разделяющая гиперплоскость проходит ровно посередине полосы.
Чтобы разделяющая гиперплоскость как можно дальше отстояла от точек выборки, ширина полосы должна быть максимальной. Пусть и -- две произвольные точки классов ?1 и +1 соответственно, лежащие на границе полосы. Тогда ширина полосы:
(5.5)
Ширина полосы максимальна, когда норма вектора щ минимальна. В итоге требуется найти такие значения параметров щ и , при которых норма вектора щ минимальна при условии (5.4).
5.1 Применение метода опорных векторов к рассматриваемой задаче
Для классификации объектов городского ландшафта был использован метод опорных векторов. Так как задача мультиклассовая, применялось решающее правило, основанное на разбиении задачи на бинарные по схеме «один против остальных». Инструментом также являлся язык программирования R и библиотека метода опорных векторов «e1071» [10]. Для каждого уровня сегментации объектов была построена система опорных векторов. В таблице 5.1 приведена достигнутая точность классификации и количество опорных векторов, построенных в ходе работы алгоритма.
Таблица 5.1 Результаты построения системы опорных векторов для разного уровня сегментации
Параметр масштаба (уровень сегментации) |
Достигнутая точность классификации на тестовой выборке (%) |
Количество опорных векторов |
|
20 |
73.17 |
152 |
|
40 |
71.00 |
150 |
|
60 |
70.80 |
155 |
|
80 |
70.21 |
155 |
|
100 |
67.85 |
156 |
|
120 |
66.27 |
159 |
|
140 |
63.11 |
159 |
|
All scales |
75.73 |
159 |
Также для иллюстрации приведены примеры графиков - проекций всего пространства параметров на плоскости «Bright_80 - BrdIndx_80» (Рис.5.1) и «NDVI - Mean_R» (Рис.5.2). Данные параметры являются наиболее значимыми при классификации с помощью деревьев решений для всех значений параметра сегментации.
Рис.5.1- Проекция пространства параметров на плоскость «Bright_80 - BrdIndx_80»
Рис.5.2 - Проекция пространства параметров на плоскость «NDVI - Mean_R»
Заключение
В данной работе рассматривалась задача классификации объектов городского ландшафта по аэрофотоснимкам высокого разрешения. Рассмотрены различные подходы выделения значимых параметров из полученных изображений и их дальнейшее использование для классифи- кации. Особенностью выборки данных является большое число параметров каждого объекта и малый объем самой выборки (15-20 экземпляров на каждый класс).
Были рассмотрены несколько подходов для классификации объектов в данной работе, а именно: деревья решений (CART, пакет «rpart») и построенные на их основе случайные леса Бреймана (пакет «randomForest»). Наибольшая точность классификации была достигнута при использовании сразу всех параметров масштаба (уровней сегментации) для построения случайного леса (?81%). Кроме того, для решения данной задачи классификации был использован алгоритм построения системы опорных векторов, в котором наилучшая точность также была выявлена при использовании сразу всех уровней сегментации, но сам результат хуже, чем при применении случайного леса. Это может объясняться тем, что задача мультиклассовая, поэтому для эффективного применения метода опорных векторов необходи- мы дополнительные допущения (бинарный принцип «один против многих»), которые могут влиять на точность классификации.
При малых значениях параметра масштаба (уровня сегментации) достаточно хорошо классифицируются объекты наибольшего числа классов, в особенности tree (деревья). При больших значениях параметра масштаба приемлемо классифицируются только бетонные конструкции, что может быть связано с их относительно равномерной поверхностью и большой площадью.
Список использованной литературы
1) Хант,Э. Искусственный интеллект / [Текст] Э.Хант. - М.: Мир, 1978.
2) Фу, К. Структурные методы в распознавании образов / [Текст] К.Фу. - М.: Мир, 1977
3) Ту, Дж, Принципы распознавания образов [Текст] / Дж.Ту, Р.Гонсалес. - М.: Мир, 1978.
4) Уоссермен,Ф. Нейрокомпьютерная техника: теория и практика [Текст] / Пер. с англ. Ю.А.Зуев, В.А. Точенов, 1992.
5) Мински, М. Фреймы для представления знаний [Текст] / Пер. с англ. 1979.
6) Журавлёв,Ю.И. Распознавание. Классификация. Прогноз. Математические методы и их применение [Текст] / Ю.И. Журавлев. - Вып.2. М.: Наука, 1989.
7) Арлазаров, В. Л. Адаптивное распознавание символов / В. Л. Арлазаров, В.В. Троянкер, Н.В. Котович [Электронный ресурс] - Режим доступа: http://www.ocrai.narod.ru/adaptive.html, Загл. с экрана.
8) Воскресенский, Е.М., Моделирование и адаптация систем распознавания текстовых меток на видеоизображениях: монография [Текст]/ Е.М. Воскресенский, В.А. Царев, - 2009, -152 с.
9) Лукошенко, Г. Н. Распознавание скелетных образов/ [Электронный ресурс] - Режим доступа: http://www.ocrai.narod.ru/skeletrecognize.html, Загл. с экрана.
10) Каллан,Р. Основные концепции нейронных сетей [Текст] / Р.Каллан. - Пер. с англ. -- М. : Издательский дом "Вильямc", 2001. -- 287 с
Приложение А
Презентационные материалы
Размещено на Allbest.ru
Подобные документы
Виды машинного обучения, его основные задачи и методы. Подходы к классификации: логистическая регрессия, наивный байесовский классификатор, стохастический градиентный спуск, K-ближайший сосед, дерево решений, случайный лес, метод опорных векторов.
курсовая работа [436,9 K], добавлен 14.12.2022Характеристика объекта автоматизации. Создание многоуровневой архитектуры приложения, отладка метода безошибочной идентификации пользователей системы. Разработка нестандартного метода преобразования объектов базы данных в объекты классов приложения.
курсовая работа [395,4 K], добавлен 28.04.2015Моделирование пространства и способы представления пространственных объектов. Хранение и извлечение пространственных объектов. Применение географических баз данных. Классификация объектов на основе размерности. Мозаичное и векторное представление.
презентация [179,5 K], добавлен 11.10.2013Определение понятия трехмерной компьютерной графики. Особенности создания 3D-объектов при помощи булевых операций, редактируемых поверхностей, на основе примитивов. Моделирование трехмерных объектов при помощи программного пакета Autodesk 3ds Max.
дипломная работа [4,2 M], добавлен 13.04.2014Программное обеспечение для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью. Алгоритм метода обратного распространения ошибки. Методика классификации товаров: составление алгоритма, программная реализация.
дипломная работа [2,2 M], добавлен 07.06.2012Обзор алгоритмов распознания объектов на двумерных изображениях. Выбор языка программирования. Обнаружение устойчивых признаков изображения. Исследование алгоритмов поиска объектов на плоскости. Модификация алгоритма поиска максимума дискретной функции.
дипломная работа [1,0 M], добавлен 16.06.2013Моделирующие программы системы GPSS WORLD. Блоки и транзакты - типы объектов системы. Событийный метод моделирования. Проект моделирования работы в библиотеке, его анализ с помощью среды GPSS WORLD. Описание процесса и метода моделирование системы.
курсовая работа [227,4 K], добавлен 16.08.2012Преобразование формулы и решение ее с помощью Метода Эйлера. Моделирование метода оптимизации с функцией Розенброка. Поиск модели зашумленного сигнала. Нахождение минимума заданной целевой функции методом покоординатного спуска нулевого порядка.
курсовая работа [1,2 M], добавлен 21.12.2013Повышение эффективности системы управления информационной безопасностью в корпоративных информационных системах. Разработка структуры процесса классификации объектов защиты и составляющих его процедур; требования к архитектуре программного обеспечения.
дипломная работа [1,8 M], добавлен 19.05.2013Программная реализация метода оптимальной классификации одномерного упорядоченного множества на основе "склеивания с ближайшим". Проверка работоспособности программы на основе алгоритмов классификации, вычислительные эксперименты по оценке эффективности.
курсовая работа [414,4 K], добавлен 24.05.2015