Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных

Анализ алгоритмов построения траектории движущихся объектов на основе сегментации видеоданных. Разработка методов сжатия за счет новых алгоритмов интерполяции отсчетов сигнала и исследование их эффективности. Построение модели кодека программы.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык русский
Дата добавления 31.07.2018
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Специальность: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных

Рубина Ирина Семеновна

Санкт-Петербург ? 2013

Работа выполнена в Национальном Исследовательском университете информационных технологий, механики и оптики.

Научный руководитель:Тропченко Александр Ювенальевич,

доктор технических наук, профессор.

Официальные оппоненты:Потапов Алексей Сергеевич,

доктор технических наук, доцент, лаборатория интеллектуальных систем компьютерного видения ФГУП «Научно-производственная корпорация «Государственный оптический институт им. С.И. Вавилова» (г. Санкт-Петербург), начальник.

Меженин Александр Владимирович,

кандидат технических наук, доцент, кафедра инженерной и компьютерной графики НИУ ИТМО, доцент.

Ведущая организация:Филиал ФГУП Центральный научно-исследовательский институт связи - Ленинградское отделение ЦНИИС.

Защита диссертации состоится «23» мая 2013 г. в 15 часов 30 минут на заседании диссертационного совета Д 212.227.06 при Национальном исследовательском университете информационных технологий, механики и оптики по адресу: 197101, Санкт-Петербург, Кронверкский пр., д. 49, конференц-зал центра интернет-образования.

С диссертацией можно ознакомиться в библиотеке Национального исследовательского университета информационных технологий, механики и оптики.

Автореферат разослан «22» апреля 2013 г.

Ученый секретарь диссертационного совета Лобанов И.С.

Общая характеристика работы

Актуальность работы

Современный этап развития информационно-вычислительных систем характеризуется широким внедрением технологий мультимедиа, в связи с чем возникает потребность в разработке методов и алгоритмов сжатия цифровых видеоизображений и видеопотоков, основанных на обработке групп изображений, имеющих информационную избыточность. Постоянно растущая вычислительная сложность алгоритмов обработки видеопоследовательностей и высокие затраты на хранение данных требуют значительных вычислительных ресурсов.

Видеокомпрессия не только дает возможность использования цифрового видео в среде передачи, не поддерживающей исходных (несжатых) видеоизображений, но и повышает эффективность использования высокоскоростных каналов связи для передачи видеопотоков высокого разрешения, в том числе при одновременной передаче множества потоков видеоданных высокого уровня качества.

Существенный вклад в теорию сжатия видеоданных внесли Ватолин Д., Сэломон Д., Гонсалес Р., Ричардсон Я. и многие другие видные ученые и специалисты.

Существующие системы обработки видеоданных используют методы сжатия с потерями за счет передачи опорных (I- кадров), сжатых по пространственным координатам, а также ссылочных (P- и B- кадров), сжатых по пространственно-временным координатам, от количества которых зависит степень сжатия видеопоследовательности. При этом учитываются особенности восприятия подобного типа данных человеком. На сегодняшний день в определенной степени решена задача устранения избыточности опорных кадров, тогда как для ссылочных кадров данная задача является актуальной.

Основой кодирования ссылочных кадров является построение векторов движения отдельных пикселов или их групп. Также эффективность работы алгоритмов устранения временной избыточности улучшают путем повышения эффективности алгоритмов кодирования преобразованием и интерполяции. Этим проблемам посвящена данная диссертационная работа.

Цель работы - совершенствование существующих и создание новых методов устранения информационной избыточности видеопоследовательностей, отличающихся пониженными вычислительными затратами при высоких показателях коэффициента сжатия и качества восстановленного видеоряда.

Задачи исследования

В рамках диссертационного исследования решались следующие задачи: сегментация видеоданные алгоритм сигнал

Анализ алгоритмов построения траектории движущихся объектов на основе сегментации видеоданных.

Разработка методов повышения эффективности существующих алгоритмов сжатия, использующих адаптивную сегментацию, на основе нового алгоритма классификации сегментов по маске, получаемой на основе алгоритма выделения опорных пикселов.

Разработка алгоритмов сжатия на основе быстрых трехмерных алгоритмов кодирования преобразованием.

Разработка методов сжатия за счет новых алгоритмов интерполяции отсчетов сигнала и исследование их эффективности.

Построение модели кодека и программная реализация алгоритмов сжатия на основе предложенных подходов.

Методы исследования

Диссертационное исследование основано на ряде теоретических и экспериментальных методов. В рамках теоретической части исследования использовались методы теории информации (RD-теории и устранения избыточности данных), методы распознавания образов и цифровой обработки сигналов, а также методы теории вероятностей. В рамках экспериментального исследования была проведена программная реализация алгоритмов сжатия с последующим сравнением реализованных алгоритмов с уже существующими алгоритмами. Экспериментальные методы подразумевают моделирование и реализацию алгоритмов на языке высокого уровня C++.

На защиту выносятся следующие положения:

Алгоритм выделения объектов видеопоследовательности, основанный на определении опорных пикселов видеокадра.

Алгоритм сжатия на основе классификации сегментов кадра видеопоследовательности адаптивного размера с использованием маски, полученной путем выделения опорных пикселов.

Быстрый трехмерный алгоритм нисходящего кодирования преобразованием с неразделимым ядром, основанный на дискретном преобразовании Хартли с переменным размером матрицы преобразования.

Быстрый трехмерный алгоритм кодирования преобразованием, основанный на дискретном косинусном преобразовании с переменным размером матрицы преобразования.

Алгоритм интерполяции отсчетов видеосигнала с переменным размером ядра.

Метод сжатия видеоданных, основанный на сочетании предложенных алгоритмов.

Научная новизна работы

Разработан алгоритм выделения объектов видеопоследовательности, основанный на определении опорных пикселов видеокадра, отличающийся эффективностью работы для последовательностей с различной динамикой перемещения объектов.

Разработан алгоритм построения траектории движущихся объектов на основе классификации сегментов кадра видеопоследовательности адаптивного размера с использованием маски, полученной путем выделения опорных пикселов, позволяющий сократить временную избыточность при допустимом уровне вычислительных затрат и высоком уровне качества.

Разработан быстрый трехмерный алгоритм нисходящего кодирования преобразованием с неразделимым ядром, основанный на дискретном преобразовании Хартли с переменным размером матрицы преобразования.

Разработан быстрый трехмерный алгоритм кодирования преобразованием, основанный на дискретном косинусном преобразовании с переменным размером матрицы преобразования.

Разработан алгоритм интерполяции отсчетов видеосигнала с переменным размером ядра.

Предложен метод сжатия видеоданных, основанный на сочетании предложенных алгоритмов, позволяющий повысить эффективность сжатия видеоданных.

Практическая ценность результатов работы заключается в следующем:

Предложенный метод, как показали результаты исследования его эффективности, обеспечивает хорошее качество восстановленной видеопоследовательности при более высоком значении коэффициента сжатия по сравнению с существующими методами.

Разработанные быстрые алгоритмы многомерных преобразований Хартли и ДКП позволили сократить объем вычислительных затрат.

Разработаны программно-алгоритмические средства, реализующие предложенную модель кодека, обеспечивающие кодирование и декодирование видео файлов с возможностью изменения параметров кодирования, а также иллюстрирующие процесс функционирования кодека в виде промежуточных результатов его работы в сочетании с дружественным пользователю интерфейсом.

Внедрение результатов работы

Основные результаты работы внедрены в учебном процессе НИУ ИТМО и проведенных в НИУ ИТМО НИР №610481 «Разработка методов и средств системотехнического проектирования информационных и управляющих вычислительных систем с распределенной архитектурой» кафедры ВТ и НИР №211115 «Исследование и разработка методов искусственного интеллекта применительно к задаче построения обобщенного решения мультимодальной биометрической идентификации» кафедры РИС. Программное обеспечение, реализующее предложенные методы и алгоритмы прошло государственную регистрацию пакетов программ для ЭВМ (свидетельство №2013612402). Результаты исследования поддержаны грантами Правительства Санкт-Петербурга в 2010 и 2011 гг.

Апробация результатов работы

Результаты выполненных исследований были представлены на конференциях:

XXXIX научной и учебно-методической конференции СПбГУ ИТМО (2010 г.).

VII Всероссийской межвузовской конференции молодых ученых (2010 г.).

XL научной и учебно-методической конференции СПбГУ ИТМО (2011 г.).

VIII Всероссийской межвузовской конференции молодых ученых (2011 г.).

XLI научной и учебно-методической конференции НИУ ИТМО (2012 г.).

I Всероссийском конгрессе молодых ученых (2012 г.).

Международной научно-практической конференции «Научные исследования и их практическое применение. Современное состояние и пути развития' 2012» (2012 г.).

Публикации

Основные результаты диссертационного исследования опубликованы в 13-ти научных публикациях общим объемом 42 страницы: в том числе в 4-х статьях в изданиях, включенных в Перечень ВАК, 10 работ опубликовано без соавторов.

Структура и объем работы

Диссертационная работа состоит из введения, основной части, содержащей 5 разделов, заключения, списка литературы и 2 приложений. В приложениях представлены порядок тестирования, характер тестовых последовательностей, а также документы, подтверждающие использование диссертационной работы. Основной объем работы - 118 страниц. Объем приложений 26 страниц. Работа содержит 27 иллюстраций и 1 таблицу. Список литературы включает 78 библиографических источников.

Содержание работы

Введение содержит обоснование актуальности рассматриваемых в диссертации вопросов. Формулируются цель, задачи и методы исследования.

В первом разделе рассматриваются общие вопросы сжатия видеопоследовательностей. Определяются существенные особенности такого типа данных, а также возможности по устранению существующей избыточности.

Также определяются основные этапы сжатия и выделяются основные функциональные единицы видеокомпрессора, а именно пространственная и временная модели. Рассматриваются существующие критерии оценки качества восстановленной видеопоследовательности.

Проведен обзор существующих алгоритмов в рамках пространственной и временной модели видеокомпрессора. Выявлены основные недостатки существующих методов сжатия видеопоследовательностей и определены основные подходы к их устранению. В конце раздела формулируются цель и задачи исследования.

Во втором разделе исследуются алгоритмы оценки и компенсации движения на основе сегментации видеоданных.

Подход к устранению временной избыточности видеопоследовательности на основе блоков можно реализовать двумя способами - на основе сегментов фиксированного (FSBM) и переменного размера (VSBM). При этом выбор размера блока всегда является компромиссом между коэффициентом сжатия и уровнем вносимых искажений.

В основу разработанных алгоритмов выбора и классификации блоков положен алгоритм VSBM, поскольку он обеспечивает сокращение потока векторов движения на 60 % по сравнению с алгоритмом FSBM.

Для предложенного алгоритма ортогональной пирамиды (MPO) выбора блоков был использован иерархический поиск алгоритм усредненной пирамиды (MP), а также алгоритм ортогонального поиска (OSA).

В разработанном алгоритме предлагается добавлять к множеству кандидатов на проверку для блока вектор, полученный по алгоритму поиска по шаблону OSA, на уровне 2 иерархического поиска (рисунок 1). В случае если прогноз OSA оказывается лучшим из четырех, то осуществляется поиск для одного окна конечного кадра, иначе осуществляется поиск в рамках трех окон и далее в одном окне конечного кадра.

Для оценки эффективности предложенного алгоритма было выполнено его сравнение со следующими алгоритмами: полного перебора (FS), поиска по принципу «один за раз» (OTA), ортогонального (OSA), трехшагового (TSS), двухмерного логарифмического (TDL), четырехшагового (FSS), иерархического (MP) поиска.

В ходе анализа результатов, представленных на рисунках 2 и 3, было выявлено, что единственный подход, сравнимый по качеству с FS, но снижающий его вычислительную сложность алгоритм иерархического поиска.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Рисунок 1 Схема отбора блоков по алгоритму MPO

При этом в алгоритме MPO поиск вектора движения для каждого блока не зависит от результатов поиска на более ранних итерациях алгоритма, что делает разработанный алгоритм наиболее эффективным для сложных траекторий движения.

В целях сокращения передаваемой информации о движении, было выработано требование объединения блоков в соответствии с выбранным критерием принадлежности локальной области. При этом рассматриваются два случая, приводящих к снижению качества: потеря областей малого движения и небольшое количество пикселов для блоков малого размера. Для первого случая выбрано ограничение размеров блока до 64х64 пиксела, а для второго случая предложено разделение сравниваемых блоков по различным их типам.

Рисунок 2 Значения количества базовых операций (N) для ряда кадров последовательности «Береговая охрана» для перечня рассматриваемых алгоритмов: (а)

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

TSS;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

TDL;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

FSS;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

OTA;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

OSA; (б)

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

FS;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

MP;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

MPO

Рисунок 3 Значения PSNR для тестовых последовательностей:

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

«Дети»;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

«Погода»;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

«Береговая охрана»;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

«Акийо»;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

«Телефон в машине»

Для сокращения передаваемой информации о движении, как комбинация блочного и объектного подхода, были проанализированы следующие алгоритмы разделения блоков:

разделение по направлению движения в соответствии с алгоритмом (VJ - Vectors Joint based), который выполняется в три этапа:

сортировка векторов движения по принципу увеличения параметров движения;

разделение векторов движения в соответствие с допустимым уровнем отклонения параметров движения на группы;

выравнивание поля векторов за счет значений векторов локальной окрестности.

разработанный алгоритм разделения в соответствии с маской классификации по мажоритарному признаку (PoI ? Points of Interest based). При этом маска формируется в соответствии с этапами, приведенными на рисунке 4.

Выбор алгоритма выделения опорных точек основан на исследовании следующих алгоритмов: алгоритм ADC (Absolute Difference Criteria), алгоритм Харриса, а также алгоритм SIFT (Scale Invariant Feature Transform). По результатам проведенного анализа алгоритм SIFT с размером ядра Гаусса 5x5 был выбран в качестве основы для расчета маски классификации.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Рисунок 4 Последовательность этапов алгоритма PoI

На рисунке 5 представлены зависимости PSNR и вычислительных затрат Q, выражаемых количеством базовых операций на блок кадра, от размеров блока, выражаемых минимальным размером S и максимальным приращением по каждой из сторон d, а также RD-характеристика.

Рисунок 5 Зависимости для алгоритмов классификации

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

VSBM+PoI+MPO;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

VSBM+VJ+MPO и

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

алгоритма VSBM для последовательности «Теннис»

Анализ результатов показал, что предложенный алгоритм способствует улучшению показателей сжатия воспроизведенной видеопоследовательности (если PSNR > 30дБ, то качество работы алгоритма оценки и компенсации движения считается хорошим). Алгоритм VSBM+PoI+MPO превзошел существующие алгоритмы VSBM и VSBM+VJ+MPO как с точки зрения качества восстановленной видеопоследовательности, так и с точки зрения коэффициента её сжатия при схожей вычислительной сложности. Необходимо также отметить, что при максимальном значении размера блока, равном 64Ч64, проявляется эффект мажоритарности.

Третий раздел посвящен исследованию алгоритмов кодирования преобразованием.

На основе данных, представленных в разделе 1, разработаны быстрые алгоритмы преобразования Хартли (с наилучшим качеством восстановленной видеопоследовательности) и косинусного преобразования (с наилучшим коэффициентом сжатия).

Для начала сформулируем принципы, на основе которых будут построены предлагаемые быстрые алгоритмы. Данные преобразования допускают разделение области расчета на подобласти. Используя корреляцию соседних областей, можно существенно сократить вычислительные затраты. Кроме того, присутствие симметричных и ассиметричных компонент дает дополнительную возможность декомпозиции сигнала.

Нисходящий алгоритм быстрого трехмерного преобразования Хартли (3D-БПХП) на основе неразделимого ядра преобразования для блоков целой размерности можно сформулировать следующим образом:

,

где u, v, t - размерность вычисляемого целого блока, r - номер частичной суммы,

,

N, M, P - размерность куба-кадра, , а abc - трехбитный двоичный код, определяющий номер формируемой суммы.

Блоки промежуточной размерности формируются иерархически при помощи более крупных блоков целой размерности на основе вычисляемых частичных сумм по формуле:

где u', v', t' - размерность вычисляемого промежуточного блока. Промежуточный блок может иметь размерность, уменьшаемую вдвое хотя бы по одной из координат.

Если размер блока уменьшается по одному или по трем аргументам для функции cas, то знак суммы считается отрицательным. При уменьшении размеров ни по одному или по двум аргументам для функции cas знак не изменяется.

Иерархический процесс продолжается, пока размерность целого блока не составит 2x2 пиксела. Схема одной итерации предложенного алгоритма представлена на рисунке 6.

Алгоритм быстрого трехмерного косинусного преобразования на основе вычисления текущего отсчета по набору

Рисунок 6 Схема итерации алгоритма 3D-БПХП с соответствующими связями вычитания, сложения

предыдущих отсчетов (3D-БКПП) можно сформулировать следующим образом:

где

,,

,

,

а abc- трехбитный троичный код, каждый разряд которого принадлежит множеству {-1, 0, 1}.

Необходимо отметить, что переменный размер матрицы преобразования формируется на основе блочных структур изображений, полученных на этапе оценки и компенсации движения, а временная компонента выбирается равной расстоянию между опорными кадрами.

В ходе исследования было выявлено, что трехмерные алгоритмы позволили вдвое увеличить коэффициент сжатия видеопоследовательности по сравнению с двумерными вариантами алгоритмов при незначительном ухудшении ее качества при восстановлении по сравнению с двухмерными вариантами алгоритмов. Это объясняется тем, что алгоритмы выполняют преобразование не только в пространстве, но и во времени, устраняя соответствующую избыточность.

В результате исследования для кадров последовательности «Теннис» получены зависимости, представленные на рисунках 7 и 8.

Рисунок 7 Вычислительная сложность алгоритмов кодирования преобразованием (Q1, Q2-количество умножений и сложений, V-размер стороны блока).

Рисунок 8 RD-кривые для алгоритмов

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

3D-БПХФ,

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

3D-БПХП,

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

3D-БКПФ,

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

3D-БКПП кодирования преобразованием.

Предложенный быстрый алгоритм 3D-БПХП позволил на 30 % сократить число операций сложения/умножения на пиксел кадра видеопоследовательности за счет иерархического расчета коэффициентов преобразования по сравнению с предложенным Джеонгом И. алгоритмом. Также он позволил повысить качество восстановленной видеопоследовательности на 2 % и коэффициент ее сжатия на 1,5 % по сравнению с алгоритмом на основе фиксированного размера ядра (3D-БПХФ).

Предложенный быстрый алгоритм 3D-БКПП позволил на 40 % сократить число операций умножения на пиксел кадра видеопоследовательности при незначительном увеличении числа сложений по сравнению с предложенным Алшибами Х. алгоритмом. Также он обеспечил повышение качества восстановленной видеопоследовательности и коэффициента ее сжатия на 3 % по сравнению с подходом на основе фиксированного размера ядра (3D-БКПФ).

Преимущество алгоритмов на основе переменного ядра преобразования объясняется использованием адаптивно выбираемого размера матрицы преобразования для областей с мелкими деталями и для областей фона соответственно.

В четвертом разделе исследуется алгоритм адаптивной интерполяции центрального отсчета, а также разработанный алгоритм интерполяции с адаптивным размером ядра.

В ходе исследования было выявлено, что адаптивный алгоритм центрального отсчета (рисунок 9) и разработанный алгоритм с адаптивным размером ядра (рисунок 10) позволяют в лучшей степени сократить блокинг - эффект, полученный в результате кодирования преобразованием на основе блоков.

Рисунок 9 Адаптивная интерполяция центрального отсчета

Рисунок 10 Интерполяция с адаптивным размером ядра: 1 - 2х2, 2 - 4х4, 3 - 8х8, 4 - 16х16, 5 - 32х32, о - опорные отсчеты, с - центральные отсчеты

Алгоритм интерполяции с адаптивным размером ядра является рекурсивным алгоритмом, в рамках которого центральный основной и побочные симметричные отсчеты вычисляются нисходящим образом в рамках адаптивного алгоритма центрального отсчета, причем направление предсказания определяется в целом для блока в соответствии с критерием минимизации суммарной ошибки интерполяции и передается кодовым словом длиной 2 бита на блок. Оставшиеся пикселы являются крайними и вычисляются по алгоритму «прямой крест», преимущества качественных характеристик которого показаны в разделе 1.

Необходимо отметить, что для блоков различного размера, полученного на этапе оценки и компенсации движения, применяются соответствующие ядра интерполяции, обеспечивающие совместимость при стыковке блоков различного размера.

При этом интерполяционный остаток (разностное изображение) предлагается формировать только для опорных кадров, а для ссылочных кадров предлагается полагать все коэффициенты, кроме опорных, равными нулю.

Сравнительные оценки алгоритмов интерполяции, представленные на рисунке 11, показали возможность увеличения коэффициента сжатия видеопоследовательности на 20% за счет алгоритмов интерполяции, и в среднем на 30% за счет предложенного алгоритма интерполяции.

Рисунок 11 Зависимости для алгоритмов интерполяции

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

адаптивной центрального отсчета,

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

VSBM без квантования,

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

адаптивного размера ядра для последовательности «Теннис»

В пятом разделе предлагается комплексный метод сжатия видеоданных, основанный на сочетании предложенных алгоритмов, а также описывается программная реализация предложенного метода.

На рисунке 12 представлена модель кодера. Пунктирной стрелкой обозначена связь по данным блоков временной и пространственной модели.

В рамках пространственной модели отсчеты сигнала поступают на вход анализатора кодирования, затем осуществляется интерполяция отсчетов сигнала по алгоритму, представленному в главе 4, его переупорядочивание зигзаг - сканированием и квантование алгоритмом кодового квантования, являющегося частным случаем сеточного квантования, который использует вектора надежности битовых плоскостей кадра.

Энтропийное кодирование осуществляется модифицированным кодом Хаффмана переменной длины.

Рисунок 12 Модель кодера

Блок анализатора кодирования (АК) представляет собой анализатор движения, описанный в разделе 3 с расширенным функционалом. На основании значений порога анализатора T1 и T2 , равных 4 и 14 соответственно, осуществляется выбор 2D/3D режима. Анализатор кодирования формируется в соответствии с условием:

,

где

,,

при ,,

где с и с' значения яркостей пикселов текущего и предыдущего кадров.

Двухмерные алгоритмы кодирования преобразованием реализуются строчно-столбцовым методом.

В ходе исследования было выявлено, что лучшие значения RD - характеристики показали значения порогов анализатора T3 и T4 , равные 8 и 17.

Благодаря симметричности алгоритма, декодирование осуществляется аналогично в обратном направлении.

В ходе диссертационной работы были разработаны программные средства в среде разработки Visual C++. Блок-схема взаимодействия основных процедур разработанного приложения представлена на рисунке 13.

Рисунок 13 Блок-схема взаимодействия

Программные средства позволяют:

осуществлять выбор основных параметров кодирования;

отображать результаты оценки и компенсации движения в виде кадра, с обозначением блоков и векторов движения;

осуществлять оценку основных показателей сжатия, а именно качества, коэффициента сжатия и битрейта;

осуществлять сжатие видеопоследовательности по заданному набору параметров, воспроизводить и сохранять результаты сжатия в формате mkv. Экспериментальные результаты, представленные на рисунке 14, показали, что качество работы предложенного видеокомпрессора не уступает видеокомпрессору на основе стандарта H.264.

Рис.14 Зависимости коэффициента сжатия и битрейта от качества для различных значений параметра квантования для видеокомпрессоров

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

H.264;

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

VP8 и

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

разработанного метода

Представленные зависимости приведены для двух крайних случаев для последовательностей наименьшей (min) и наибольшей (max) динамичности.

Применение предложенного метода сжатия видеоданных позволило повысить качество восстановленной видеопоследовательности на 5%, коэффициент ее сжатия на 30% по сравнению с методом VP8, а также сократить необходимый битрейт на 30% и вычислительные затраты на 20%.

В заключении представлены основные результаты работы.

Основные результаты работы

В результате исследования алгоритмов выбора блоков для сравнения предложен иерархический алгоритм выбора блоков для сравнения.

В ходе исследования алгоритмов оценки и компенсации движения разработан алгоритм классификации блоков кадра на основе маски, построение которой осуществляется в рамках предложенного алгоритма построения маски.

Предложен иерархический алгоритм быстрого преобразования Хартли на основе неразделимого ядра преобразования переменного размера.

Разработан алгоритм быстрого косинусного преобразования с переменным размером ядра преобразования, базирующийся на расчете коэффициентов преобразования по ряду предыдущих отсчетов.

Предложено использовать интерполяцию отсчетов сигнала для устранения блокинг - эффекта на выходе блока кодирования преобразованием, а также разработан алгоритм интерполяции на основе адаптивного выбора размера ядра.

Разработаны модель и метод сжатия видеоданных, основанные на сочетании предложенных алгоритмов.

Выполнена программная реализация предложенного метода сжатия и получены численные результаты компрессии видеопоследовательностей различной динамичности, согласно которым общий выигрыш от использования предлагаемого метода составляет порядка 25 %.

Список публикаций по теме диссертации

Рубина, И. С. Анализ методов построения траектории движущихся объектов на основе сегментации видеоданных / И. С. Рубина // Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. - 2011. - С. 127-132 (из перечня ВАК).

Рубина, И. С. Анализ сегментного подхода к компенсации движения в задачах детектирования движения и сжатия видеоданных в рамках натуралистических исследований / И. С. Рубина, А. С. Румянцев // Сборник научных трудов Sworld. Материалы международной научно-практической конференции «Научные исследования и их практическое применение. Современное состояние и пути развития `2012». - вып. 3. т. 4. - Одесса: Черноморье. - 2012. - С. 14-24 (из перечня ВАК).

Рубина, И. С. Исследование алгоритмов выбора опорных пикселов в задачах выделения сегментов кадра видеопоследовательности / И. С. Рубина, А. Ю. Тропченко // Научно-технический журнал «Известия вузов. Приборостроение». - 2012. - С. 9-14 (из перечня ВАК).

Рубина, И. С. Исследование алгоритмов кодирования преобразованием в задачах сжатия кадров видеопоследовательности / И. С. Рубина, А. Ю. Тропченко // Научно-Технический журнал «Известия вузов. Приборостроение». - 2012. - С. 26-31 (из перечня ВАК).

Рубина, И. С. Анализ методов построения траектории движущихся объектов на основе сегментации видеоданных / И. С. Рубина // Сборник тезисов VII Всероссийской межвузовской конференции молодых ученых. - 2010. - вып. 1. - С. 24-25.

Рубина, И. С. Анализ проблем передачи видео в существующих системах видеоконференцсвязи / И. С. Рубина // Материалы XXXIX научной и учебно-методической конференции СПбГУ ИТМО. - 2010. - С. 32.

Рубина, И. С. Исследование алгоритмов выделения опорных точек в задачах классификации сегментов кадра видеопоследовательности / И. С. Рубина // Материалы XL научной и учебно-методической конференции СПбГУ ИТМО. - 2011. - С. 32.

Рубина, И. С. Исследование методов устранения временной избыточности в перспективных стандартах сжатия видеоданных / И. С. Рубина // Сборник научно - исследовательских выпускных квалификационных работ студентов СПбГУ ИТМО. - 2010. - С. 51-53.

Рубина, И. С. Исследование пространственно - временных алгоритмов компенсации движения / И. С. Рубина // Материалы XLI научной и учебно-методической конференции НИУ ИТМО. - 2012. - С. 32.

Рубина, И. С. Исследование способов повышения эффективности сжатия видео путем устранения временной избыточности сегментов кадра видеопоследовательности за счет решения апертурной проблемы / И. С. Рубина // Сборник «XVI Санкт-Петербургская ассамблея молодых ученых и специалистов». - 2011. - С. 144.

Рубина, И. С. Методы и алгоритмы построения траектории движущихся объектов на основе сегментации видеоданных / И. С. Рубина // Сборник «XV Санкт-Петербургская ассамблея молодых ученых и специалистов». - 2011. - С. 142.

Рубина, И. С. Устранение временной избыточности на основе сегментного подхода к решению задач оценки и компенсации движения / И. С. Рубина // Сборник тезисов VIII Всероссийской межвузовской конференции молодых ученых. - 2011. - вып. 1. - С. 116-117.

Рубина, И. С. Устранение избыточности видеоданных на основе алгоритмов кодирования преобразованием / И. С. Рубина // Сборник тезисов I Всероссийского конгресса молодых ученых. - 2012. - вып. 1. - С. 48-49.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.