Определение движения в видеопотоке

Видеопоток как цифровое видео множество технологий записи, обработки, хранения и воспроизведения визуального или аудиовизуального материала в цифровом представлении. Разработка программного обеспечения, способного определить движения в видеопотоке.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 09.10.2015
Размер файла 1,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Омский государственный технический университет»

Кафедра «Автоматизированные системы обработки информации и управления»

Курсовой проект

на тему «Определение движения в видеопотоке»

по дисциплине «Информатика»

Выполнил:

студент группы ИВТ-340

В.М. Тюшин

Преподаватель:

Е.Р. Васильев

Омск - 2012

Содержание

  • Введение
  • 1. Постановка задачи курсового проектирования
  • 2. Теоретический анализ
    • 3. Описание алгоритмов
    • 4. Описание разработанной системы
    • 5. Результаты тестирования
  • Заключение
  • Список использованных источников

Введение

Целью данного курсового проекта по дисциплине «Информатика» является разработка программного обеспечения, способного определить движения в видео потоке. видеопоток цифровой программный

Задача распознавания движения имеет широкое применение в системах слежения, и. т. д.

1. Постановка задачи курсового проектирования

Для достижения поставленной задачи необходимо написать приложение, для распознавания движения.

Приложение должно выполнять следующие функции:

1. Получение видеопотока (с веб камеры)

2. Распознание в нем движения

Научиться работать с видеопотоком (вебкамера), распознать в нем движение (наличие движения)

2. Теоретический анализ

В данном курсовом проекте движение будет определяться через сравнение двух кадров. Для того, что бы ускорить сравнение кадров, изображение дробится на блоки (размер блоков определяет пользователь), из каждого блока берется несколько пикселей для анализа. Значения цвета выбранных пикселей складываются и присваивается блоку из которого были взяты пиксели, при сравнении разности значений для соответствующих блоков текущего и предыдущего изображения с пороговым значением (так же может определяться пользователем) будет сделан вывод о наличии движение в данном блоке.

3. Описание алгоритмов

Видеопоток.

Видеопоток получаем с камеры в виде картинок получаемых в данный момент времени.

Анализ.

Для анализа поступают два изображения предыдущий кадр, и текущий кадр. Изображения дробятся на блоки, в соответствии с выбранным размером блока, и для них считаются значения по цвету. Далее вычисляется разности для каждого блока (для текущего изображения и предыдущего). Значения разностей сравниваются с выбранным пороговым значением, и на основе этого определяется наличие движения в кадре.

Получение результатов.

На текущее изображение наносится штриховка на те блоки где было детектировано движение и выводится на экран.

4. Описание разработанной системы

Приложение написано на языке C#.

Изначально приложение записывает человеческий голос в формате Wave. Для записи использовалась библиотека NAudio.

Для конвертирования звука из формата Wave во FLAC использовалась библиотекой Cuetools .

Однако на файлы с высокой частотой дискретизации (44100) Google реагирует ошибкой 400. Необходимо использовать 8 и 16 кГц.

Далее производится запрос к сервису:

http://www.google.com/speech-api/v1/recognize?lang=ru&client=chromium

И десериализация JSON-ответа через DataContractJsonSerializer, результаты всегда приходят в виде:

{"status":0,"id":"4531050901df65542082eacfebf3bb1b-1","hypotheses":[{"utterance":"открыть новая папка", "confidence": 0.89697623}]}.

Извлекаем фразу и отправляем в класс обработки сообщений Action.

Класс разбивает фразу по словам, строит дерево и выполняет команду Windows.

Команды выполняются с помощью библиотеки user32.dll.

Разработанная система способна записывать человеческий голос на русском языке и выполнять команды диктора.

Приложение выполняет такое команды как:

1. Мой компьютер

2. Назад

3. Вперед

4. Открыть (имя папки с рабочего стола)

5. Закрыть (текущее окно)

6. Свернуть (текущее окно)

7. Развернуть (текущее окно)

5. Результаты тестирования

На рисунке 1 представлен интерфейс разработанной системы.

Рисунок 1 - Окно приложения

Запись команды начнется при нажатии кнопки Start до последующего нажатия.

После получения данных с сервиса Google в верхнем окне появляется произнесенная фраза. Нижнее окно отображает текущее окно Windows, на котором сфокусировано дано е приложение.

Командами “назад” и “вперед” пользователь может переключаться между окнами. Команды “закрыть” “открыть” “свернуть” “развернуть” применяются к текущему окну (отображенному в нижнем окне).

Например, выполнив команду “назад”, приложение сменит окно фокусировки (рис. 2)

Рисунок 2 - Выполнение команды

Заключение

В результате выполнения курсового проекта по дисциплине «Информатика» разработано программное обеспечение, способное управлять операционной системой Windows русским голосом при помощи Google Speech API.

Были изучены принципы работы с операционной системой Windows. Изучена технология Google Speech Application Programming Interface (SAPI), предназначенная для распознавания и синтеза речи.

В итоге получено приложение, написанное на языке высокого уровня C#. Данная программа лишь демонстрирует использование Google Speech API для выполнения некоторых команд на компьютере.

Список использованных источников

1. Свободная энциклопедия Википедия [Электронный ресурс] / Microsoft Speech API . - 2012 - Режим доступа: http://ru.wikipedia.org/wiki/Microsoft_Speech_API, свободный. -- Загл. с экрана.-- Яз. рус.

2. Хабрхабр: [Электронный ресурс]. ТМ., 2007-2012. URL:http://habrahabr.ru/. (Дата обращения: 9.01.2013).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.