Распознавание дорожного полотна
Применение семантических сегментов для распознавания дороги. Описание метода использования сегментирования изображения. Улучшение качества базовой модели FCN. Применение функции Dice для вычисления перекрытия между предсказанным и фактическим классом.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.06.2021 |
Размер файла | 1,8 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Высшая инженерная школа Набережночелнинский институт Казанский федеральный университет
Распознавание дорожного полотна
Юнусова Лилия Рафиковна - магистрант;
Магсумова Алия Рафиковна - магистрант, направление: информатика и вычислительная техника, магистерская программа: технология разработки программного обеспечения, кафедра информационных систем, отделение информационных технологий и энергетических систем
г. Набережные Челны
Аннотация
В статье рассматривается и анализируется распознавание дорожного полотна, описывается метод использования сегментирования изображения.
Ключевые слова: детектирование, распознавание, разметка, полотно, сегментация.
Введение
Для распознавания дороги используются семантические сегменты. Каждый пиксель становится меткой для лотереи и средства изображения. Это основное отличие от классификации, когда все изображение наносится только на одну метку. Один объект того же класса, что и многие другие произведения. сегментирование изображение функция
Различные объекты того же класса, что и объекты, которые обрабатывают экземпляр, разделяются. Обычно разбиение экземпляра осуществляется с помощью семантического, а не более сложного.
Классический метод сегментации. До эры глубокого обучения для сегментации использовались различные методы обработки изображений, в зависимости от области интересов.
Самым простым способом семантической классификации является присвоение конкретной метки, поскольку необходимо вручную соблюдать правила или характеристики кодирования и область видимости. Эти правила могут быть оформлены как свойства пикселей, например, интенсивность серого. Один из способов использовать эту технику называется алгоритм разделения и слияния. Этот алгоритм рекурсивно делит изображения на субдомены, и, если они не принадлежат определенной метке, смежные субдомены с одинаковой меткой
Проблема этого метода заключается в том, что вы должны написать правила вручную в коде. Тем не менее, может быть очень сложно описать сложные классы типа «человек» только с информацией об интенсивности серого. В этом случае, укажите, какие сложные объекты, функции извлечения и методы оптимизации необходимы соответствующим образом.
Было предложено несколько решений для улучшения качества базовой модели FCN. Ниже приведены некоторые решения, которые доказали свою эффективность:
U-Net
U-Net - это простое улучшение архитектуры FCN. Связь по сети Skype между выходом блока свертки и каждым входом транспонированного блока свертки того же уровня.
Рис. 1. Схема U-Net сети
Различные изображения от градиентов и информативные, так что вы можете убить. От информации к крупномасштабному (верхний уровень) классифицируется по модели от информации к сегменту по более глубокому уровню модели небольшого масштаба.
Работа этой сети по распознаванию проезжей части.
Рис. 2. Модель тирамису
Эта модель похожа на UNet, но, как показано в densenet, плотные блоки используются для прямых и транспонированных извилин. Темный блок - это многократный сверточный слой, который используется в качестве входных данных для всех предыдущих слоев из сопоставления объектов и последующих слоев. В результате сеть функционирует с очень эффективными параметрами от пожилых людей.
Рис. 3. Схема сети Тирамису
Недостаток этого метода является результатом характера комбинаторных операций в нескольких системах машинного обучения и является менее эффективным с точки зрения памяти. Следовательно, это мощный кластерный графический процессор, который требует этой архитектуры.
Мультимасштабный метод
Некоторые модели глубокого обучения явно отличаются от информации о методе представления. Например, ParsNet Scene Parsing (PSPNet) использует ядра разных размеров для вывода сопоставлений объектов из сверточных нейронных сетей (таких как ResNet). Пересчитайте размер вывода и вывод функции дисплея из CNN. Для генерации прогноза на объединенном выводе выполняется окончательная свертка.
Рис. 4. Архитектура сети PSPNet
Метод информации о том, отличается ли глубокое изучение некоторых моделей от других. Например, обязательство поддерживать анализ сцен в анализе Размер чистого ядра выводится из сопоставления объектов в сверточную нейронную сеть ResNet. Выходной размер из CNN и выходной сигнал функции функции пересчитываются. Окончательная свертка выполняется на объединенном выводе для получения прогноза.
Функция потери Дайса
Это также компенсирует крайнюю предвзятость класса к проблеме разделения значения, используемого для решения другой популярной потери и функции. Функция Dice используется для вычисления перекрытия между предсказанным классом и фактическим классом. Коэффициент Dyce (D) рассчитывается по следующей формуле:
Наша цель - максимизировать совпадение между предсказанным классом и истинным (другими словами, мы хотим максимизировать коэффициент кости). Вместо этого мы будем иметь дело с более знакомой минимизацией (1-D), поскольку большинство библиотек машинного обучения предоставляют широкие возможности только для минимизации.
Производная коэффициента Дайса
Рис. 6. Семантическая сегментация
Список литературы
1. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учеб. пособие. Новосибирск.: Изд-во НГТУ, 2003. 352 с.
2. Гонсалес P. Цифровая обработка изображений / P. Гонсалес, Р. Вудс. М.: Техносфера, 2005. 1072 с.
3. Маркелов А.А. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей: Диссертация на соискание ученой степени кандидата технических наук / А.А. Маркелов. Томск, 2007.
Размещено на Allbest.ru
Подобные документы
Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Разработка программной базы для исследований в области распознавания речи и поиска ключевых слов в ней. Расчет mel-фильтров. Скрытые марковские модели. Применение в алгоритме сверточного декодирования Витерби. Методы визуализации и обработки аудиоданных.
курсовая работа [1,1 M], добавлен 01.06.2015Анализ существующих алгоритмов распознавания режимов работы газотурбинного двигателя. Метод группового учета аргументов, метод Байеса. Применение технологий системного моделирования на этапе проектирования интеллектуальной системы распознавания режимов.
курсовая работа [1,4 M], добавлен 11.04.2012Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.
презентация [31,6 K], добавлен 06.01.2014Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.
курсовая работа [4,8 M], добавлен 22.06.2011Фильтрация шумов изображения. Алгоритмы его бинаризации и поворота. Формирование информативных признаков для распознавания нот. Схема программного обеспечения. Описание классов, функций, методов, реализованных в программе. Тестирование приложения.
курсовая работа [2,0 M], добавлен 17.12.2013Применение комплексного математического моделирования в проектировании. Обзор численных методов в моделировании. Решение дифференциальных уравнений в MathCAD. Анализ исходных и результирующих данных. Описание реализации базовой модели в MathCAD.
курсовая работа [240,5 K], добавлен 18.12.2011Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.
курсовая работа [215,2 K], добавлен 19.10.2010