Обзор алгоритмов обнаружения объектов с помощью Matlab

Определение распознавания объектов как метода компьютерного зрения для идентификации объектов на изображениях или видео. Рассмотрение алгоритма обнаружения объекта методом машинного обучения и методом глубокого обучения с помощью средств Matlab.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 24.10.2020
Размер файла 3,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Обзор алгоритмов обнаружения объектов с помощью Matlab

Щекачева А.В., студент магистратуры 2 курс, факультет «Отдел аспирантуры и магистратуры» Поволжский государственный университет телекоммуникаций и информатики Россия, г. Самара

Аннотация

В статье рассматриваются алгоритмы обнаружения объекта: метод машинного обучения, метод глубокого обучения. Подробно рассмотрены алгоритмы обнаружения объектов с помощью средств Matlab.

Ключевые слова: Распознавание объектов, машинное обучение, глубокое обучение, компьютерное моделирование, Matlab.

Abstract

The article discusses object detection algorithms: machine learning method, deep learning method. The algorithms for detecting objects using Matlab tools are considered in detail.

Keywords: Object recognition, machine learning, deep learning, computer modeling, Matlab.

Распознавание объектов - это метод компьютерного зрения для идентификации объектов на изображениях или видео. Распознавание объектов является ключевым результатом алгоритмов глубокого обучения и машинного обучения. Когда мы смотрим на фотографию или смотрим видео, мы можем легко определить людей, объекты, сцены и визуальные детали. Цель состоит в том, чтобы научить компьютер делать то, что естественно для людей: достичь уровня понимания того, что содержит изображение.

Обнаружение объекта и распознавание объекта являются похожими методами идентификации объектов, но они различаются по своему исполнению. Обнаружение объектов - это процесс поиска экземпляров объектов на изображениях. алгоритм matlab распознавание

Мы можем использовать различные подходы для распознавания объектов. В последнее время методы машинного обучения и глубокого обучения стали популярными подходами к проблемам распознавания объектов. Оба метода учатся идентифицировать объекты на изображениях, но они различаются по своему исполнению.

Машинное обучение - это метод анализа данных, который учит компьютеры делать то, что естественно для людей и животных: учиться на собственном опыте. Алгоритмы машинного обучения используют вычислительные методы для «изучения» информации непосредственно из данных, не полагаясь на заранее определенное уравнение в качестве модели. Алгоритмы адаптивно улучшают свою производительность по мере увеличения числа образцов, доступных для обучения. Глубокое обучение является специализированной формой машинного обучения.

Глубокое обучение - это техника машинного обучения, которая учит компьютер делать то, что естественно для человека: учиться на примере. При глубоком обучении компьютерная модель учится выполнять задачи классификации непосредственно из изображений, текста или звука. Модели глубокого обучения могут достигать современной точности, иногда превышая производительность на уровне человека. Модели обучаются с использованием большого набора помеченных данных и архитектур нейронных сетей, которые содержат много слоев.

С помощью всего лишь нескольких строк кода MATLABмы можем создавать модели машинного обучения и глубокого обучения для обнаружения объектов.

MATLABпредоставляет интерактивные приложения для подготовки данных обучения и настройки сверточных нейронных сетей. Маркировка тестовых изображений для детекторов объектов утомительна, и может потребоваться значительное количество времени для получения достаточного количества обучающих данных для создания качественного детектора объектов. Приложение ImageLabelerпозволяет интерактивно маркировать объекты в коллекции изображений и предоставляет встроенные алгоритмы для автоматической маркировки ваших основных данных. Для приложений автоматизированного нахождения мы можем использовать приложение GroundTruthLabeler, а для рабочих процессов обработки видео необходимо использовать приложение VideoLabeler.

Настройка существующего CNNили создание с нуля может привести к архитектурным проблемам, которые могут потратить большое количество времени на обучение. Приложение DeepNetworkDesignerпозволяет в интерактивном режиме создавать, редактировать и визуализировать сети глубокого обучения, а также предоставляет инструмент анализа для проверки архитектурных проблем перед обучением сети.

С MATLABможно взаимодействовать с сетями и сетевыми архитектурами из таких сред, как TensorFlow -Keras, PyTorchи Caffe2, используя возможности импорта и экспорта ONNX (OpenNeuralNetworkExchange).

После создания алгоритмов с помощью MATLAB мы можем использовать автоматизированные рабочие процессы для генерации кода TensorRT или CUDA с помощью GPUCoderдля проведения тестирования аппаратного обеспечения в цикле. Сгенерированный код может быть интегрирован с существующими проектами и может использоваться для проверки алгоритмов обнаружения объектов на настольных графических или встроенных графических процессорах, таких как платформа NVIDIAJetsonили NVIDIADrive.

Приложение ImageLabelerпозволяет пометить наземные данные истинности в коллекции изображений. Используя приложение, мы можем:

* Определить метки прямоугольных областей интереса (ROI), метки ROI полилинии, метки ROI пикселей и метки сцены. Необходимо использовать эти ярлыки для интерактивного обозначения наших основных данных истины.

* Использование встроенных алгоритмов обнаружения или отслеживания, чтобы пометить наши наземные данные истины.

* Написание, импорт и использование своего собственного алгоритма автоматизации, чтобы автоматически пометить основную истину.

* Оценка производительности наших алгоритмов автоматизации маркеров, используя визуальную сводку.

* Экспорт помеченной истины как groundTruthобъект. Мы можем использовать этот объект для проверки системы или для обучения детектора объектов или семантической сегментации сети.

Приложение ImageLabelerподдерживает все форматы файлов изображений, поддерживаемые imread. Чтобы добавить дополнительные форматы файлов imread, необходимо использовать imformats.

Программное использование:

* imageLabelerоткрывает новый сеанс приложения, позволяя пометить наземные данные истинности на изображениях.

* imageLabeler(imageFolder) открывает приложение и загружает все изображения из папки с именем imageFolder.

Изображения в папке могут быть неупорядоченными и могут различаться по размеру. Чтобы пометить видео или набор упорядоченных изображений, похожих на видео, нужно использовать вместо этого приложение VideoLabeler.

* imageLabeler(imageDatastore) открывает приложение и читает все изображения из imageDatastoreобъекта. Эти imageDatastoreфайлы считываются с помощью imread. Например, чтобы открыть приложение с коллекцией изображений стоп-знаков: stopSignsFolder = fullfile(toolboxdir(,vision,),,visiondata,,,stopSignImages'); imds = imageDatastore(stopSignsFolder) imageLabeler(imds)

* imageLabeler(sessionFile) открываетприложениеизагружаетсохраненныеImage Labeler сеансывsessionFile. SessionFileсодержит путь и имя файла. MAT-файл, на который sessionFileуказывает - сохраненный сеанс.

Пример:

Рисунок 1. Входное тестовое изображение и результат обнаружения человека на изображении

Мы можем использовать алгоритмы автоматизации надписей для ускорения надписей в приложении. Мы также можем использовать один из предоставленных встроенных алгоритмов. Сделать это можно следующим образом:

1. Загрузить данные, которые мы хотим пометить, и создать хотя бы одно определение метки.

2. На панели инструментов приложения нажать «SelectAlgorithm» и выбрать один из встроенных алгоритмов автоматизации.

3. Нажмите «Automate», а затем следовать инструкциям по автоматизации на правой панели окна автоматизации

Использованные источники

1. Алерстен К. Введение в Matlab- BookBoon, 2012. - 844 с.

2. Сойфер В.А. Методы компьютерной обработки изображений - М., Физматлит, 2003. - 784 с.

3. Гонсалес Р. Цифровая обработка изображений в среде MATLAB- М., Техносфера, 2006. - 616 с.

4. Форсайт, Д. Компьютерное зрение. Современный подход - М., Издательский дом "Вильямс", 2004. - 928 с.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.