Цифровая обработка изображений
Изучение бинаризации, разложения в RGB, построения гистограммы, гистограммного метода улучшения изображения, поэлементных преобразований, вычисления среднего значения среднеквадратичного отклонения. Особенности поворота изображения, масштабирования.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 26.02.2015 |
Размер файла | 35,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
1. Теоретическая часть
1.1 Растровая графика
1.2 Бинаризация
1.3 Разложение в RGB
1.4 Работа с пикселями
1.4.1 Пространственная фильтрация
1.4.2 Линейная пространственная фильтрация
1.5 Преобразование Фурье9
1.5.1 Непрерывные преобразовани Фурье для изображений
1.5.2 Дискретные преобразования Фурье для изображений
1.6 Вейвлеты
1.6.1 Непрерывное вейвлет-преобразование
1.6.2 Свойства вейвлета
1.6.3 Дискретные вейвлеты
1.6.4 Пакетные вейвлеты
1.6.5 Двумерные вейвлеты
1.7 Энтропия
1.8 Медианная фильтрация
1.9 Сегментация изображений
2. Практическая часть
2.1 Исследование 1: Представление и первичная обработка изображений
2.2 Исследование 2: Вейвлеты и преобразование Фурье
2.3 Исследование 3: Фильтрация изображения
2.4 Исследование 4: Построение графика корреляции
1. Теоретическая часть
бинаризация гистограмма изображение среднеквадратичный
Цель работы: изучение бинаризации, разложения в RGB, построения гистограммы, гистограммного метода улучшения изображения, поэлементных преобразований, вычисления среднего значения среднеквадратичного отклонения, поворота изображения, выделения фрагмента изображения, масштабирования, арифметики изображения, построения дерева вейвлетов, вычисления энтропии, дискретного двумерного вейвлет-преобразования, преобразования Фурье, спектрального анализа, корреляционного анализа.
1.1 Растровая графика
Растровые изображения, применяемые в системе Matlab, могут быть следующего типа:
Бинарные;
Полутоновые;
Палитровые;
Полноцветные.
Пиксель бинарных изображений представлен всего двумя цветами - обычно белый (пиксель не виден на белом фоне) и черный (пиксель виден).
На рисунке 1.1, представленном ниже, приведен фрагмент топографической карты.
Рисунок 1.1: Структура матрицы бинарного изображения.
Каждый элемент матрицы имеет значение 0 или 1 и может быть представлен в виде I(r,c), где r - номер строки и c - номер столбца элемента, соответствующего заданному пикселю.
Полутоновые изображения могут иметь пиксели с рядом оттенков серого цвета. Эти изображения хранятся в виде двумерных массивов - матриц (рисунок 1.2). Индексы матриц задают положение каждого пикселя на экране дисплея,Ю а значение соответствующего элемента матрицы I(r,c) задает его яркость - оттенок серого цвета. Бинарное изображение можно рассматривать как вариант полутонового изображения, в связи, с чем в Matlab, оно самостоятельного значения не имеет.
Рисунок 1.2: Структура матрицы полутонового изображения
Палитровые изображения хранятся в виде двумерных массивов индексов. Для каждого палитрового изображения существует двумерный массив палитры. Массив палитры всегда имеет тип double и в трех его столбцах расположены интенсивности R, G, B. Пример палитрового изображения, использующего формат представления данных uint8, приведен на рис.1.3.
Рисунок 1.3 - Палитровые изображения
Полноцветные изображения хранятся в виде трехмерных массивов, где третье измерение - значения интенсивности R, G, B. Для доступа к значениям интенсивности цветовых составляющих пиксела I надо указать строку r, столбец c и номер составляющей: 1 - для R, 2 - для G, 3 - для B, например, I(r, c, 1) позволяет получить значение красной составляющей.
Рисунок 1.4 - Структура трехмерного массива полноцветного RGB-изображения
1.2 Бинаризация
Бинаризация изображений, т.е. перевод полноцветного или в градациях серого изображения в монохромное, где присутствуют только два типа пикселей (темные и светлые) имеет большое значение при распознавании образов. Особенно это относится к бинарным объектам, таким, как штриховые коды, текст, чертежи и т.п. Существуют различные подходы к бинаризации, которые условно можно разделить на 2 группы:
пороговые;
адаптивные.
Если говорить кратко, то пороговые методы бинаризации работают со всем изображением, находя какую-то характеристику (порог), позволяющую разделить все изображение на чёрное и белое. Адаптивные методы работают с участками изображений и используются при неоднородном освещении объектов. Рассмотрим далее, как работают методы бинаризации на примере изображения, представленного на рисунке 2.1.
Рисунок 2.1 Бинаризация изображения
1.3 Разложение в RGB
В модели RGB (от англ. red - красный, green - зелёный, blue - голубой) все цвета получаются путём смешения трёх базовых (красного, зелёного и синего) цветов в различных пропорциях. Доля каждого базового цвета в итоговом может восприниматься, как координата в соответствующем трёхмерном пространстве, поэтому данную модель часто называют цветовым кубом. На Рис. 1 представлена модель цветового куба (рисунок 3.1).
Рисунок 3.1 Модель цветового куба при разложении RGB.
Чаще всего модель строится так, чтобы куб был единичным. Точки, соответствующие базовым цветам, расположены в вершинах куба, лежащих на осях: красный - (1;0;0), зелёный - (0;1;0), синий - (0;0;1). При этом вторичные цвета (полученные смешением двух базовых) расположены в других вершинах куба: голубой -- (0;1;1), пурпурный -- (1;0;1) и жёлтый - (1;1;0). Чёрный и белые цвета расположены в начале координат (0;0;0) и наиболее удалённой от начала координат точке (1;1;1). Рис 3.2 показывает только вершины куба.
Рисунок 3.2 Разложение цветов RGB.
1.4 Работа с пикселями
1.4.1 Пространственная фильтрация
Воздействие на структуру потока излучения с целью придания желаемых свойств (напр., малой расходимости) либо обработки переносимой этим потоком информации. Чаще всего пространственная фильтрация сводится к преобразованию фурье-спектра двумерного распределения поля по сечению светового пучка. Кроме разложения волны в фурье-спектр применяются и иные виды разложений (напр., с помощью преобразования Френеля), но значительно реже.
Фурье-фильтрация используется во многих традиционных методах исследования объектов, непосредственное наблюдение которых по тем или иным причинам невозможно или затруднено. Стандартная схема оптическая систем с фурье-фильтрацией приведена на рис. Близкий к параллельному пучок света от лазера либо от иного малого источника света 1, помещённого в фокальной плоскости коллимирующей линзы 2, проходит через исследуемый объект 3 и попадает в фурье-фильтр, состоящий из двух положительных софокусных линз 4 и 6 и расположенного в их общей фокальной плоскости фазово-ампли-тудного транспаранта 5. В фокальной плоскости линзы 4 формируется фурье-образ распределения поля перед этой линзой (см. Матричные методы в оптике). Транспарант осуществляет необходимое воздействие на спектр, линза 6- обратное преобразование Фурье. Перевёрнутое изображение объекта находится в плоскости 7 на расстоянии 4f от него, где f - фокусное расстояние линз 4, 6 (для простоты считаем их идентичными).
Рисунок 4.1 Схема пространственной фильтрации: 1- источник света; 2- коллимирующая линза; 3- исследуемый объект; 4 и 6 - софокусные линзы; 5 - транспарант; 7- плоскость изображений объекта.
1.4.2 Линейная пространственная фильтрация
Пространственная фильтрация изображения f (x, y), x?[0,(N ?1)], y?[0,(M ?1)] позволяет применять фильтры. Поскольку в изображении понятия прошлого и будущего времени становятся условными, мы можем использовать амплитуды отсчетов как в направлении увеличения индексов, так и в направлении уменьшения индексов. Пространственная фильтрация выполняется как операция двумерной свертки импульсной характеристики фильтра h(s,t) с изображением f (x, y) , где s - координата характеристики в горизонтальном направлении вдоль оси x, s?[?n / 2,n / 2], t - координата характеристики в вертикальном направлении вдоль оси y, t?[?m/ 2,m/ 2]:
Прямоугольная область размером n Ч m, на которой задана импульсная характеристика, называется маской или ядром фильтра.
1.5 Преобразование Фурье
1.5.1 Непрерывные преобразования Фурье для изображений
Обычно в курсах оптики при рассмотрении дифракционных задач применяется принцип Гюйгенса-Френеля. Фронт волны (или другая поверхность) разбивается на элементарные площадки, излучающие вторичные сферические волны. Суммирование этих волн позволяет построить дифракционное изображение. В то же время во многих задачах, связанных с распространением света, более естественно и удобно вместо принципа Гюйгенса-Френеля использовать метод Рэлея, который состоит в разложении волнового поля не по сферическим, а по плоским волнам.
Важное преимущество разложения по плоским волнам состоит в том, что оно основано на преобразовании Фурье. Его математический аппарат позволяет применять для описания оптических явлений радиофизический язык и перенести в оптику многие идеи, возникшие первоначально в радиофизике. Метод аналогий на основе общих математических моделей позволяет систематизировать широкий круг волновых явлений. Такие известные оптические методы как голография, пространственная фильтрация, метод фазового контраста и т.д. имеют хорошо разработанные радиофизические аналоги. Им отведено большое место в литературе, установилась терминология, выработаны схемы решения типичных задач.
Математическое содержание метода Фурье сводится к представлению произвольных функций в виде дискретной или непрерывной совокупности гармонических функций. Такое представление играет исключительную роль в линейных физических задачах. В радиофизике обычно интерес представляют электрические сигналы, заданные в виде функций времени f(t). В широком круге задач когерентной оптики основной интерес представляет не временной ход процессов, а пространственная структура поля, заданная в некоторой плоскости в виде функции координат f(х, у), или в простейшем (одномерном) случае - в виде функции одной координаты f(x) , называемой комплексной амплитудой поля. Фурье-разложение функции f(x) позволяет представить волновое поле в виде совокупности плоских волн, что упрощает решение многих задач распространения и дифракции волн. С точки зрения математической теории Фурье-преобразования физический смысл аргумента функции f (время t , или координата x ) не играет роли.
Рисунок 5.1 Изображение прямоугольной области
Рисунок 5.2 Спектр прямоугольной области изображения в виде контурного графика
В курсах математики доказывается, что любую периодическую функцию f(t) периода T можно представить в виде дискретного ряда Фурье:
где - круговая частота n-ои гармонической составляющей, Сn - комплексная амплитуда n-ой гармоники:
Совокупность коэффициентов Сn называют спектром функции f(t); при этом есть амплитуда гармоники частоты , a - относительный фазовый сдвиг.
На практике в большинстве случаев приходится сталкиваться с непрерывными функциями, и в общем случае, прямое преобразование Фурье определяется интегралом следующего вида:
При этом называется Фурье-образом (или спектром) функции f(x). Преобразование Фурье является обратимым, то есть если по функции f(x) был рассчитан ее Фурье-образ , то по Фурье-образу можно однозначно восстановить исходную функцию f(x). Под обратным преобразованием Фурье понимают интеграл вида:
Как видно, прямое и обратное преобразования Фурье отличаются друг от друга знаком в показателе экспоненты. Вообще говоря, нет однозначного определения, какое из этих выражений является прямым, а какое - обратным. Выбор знака в показателе экспоненты основывается на специфике решаемой задачи.
Для обозначения преобразования Фурье используются сокращенная запись и операторная запись: для прямого и для обратного.
1.5.2 Дискретные преобразования Фурье для изображений
Дискретные косинусные преобразования представляют изображение в виде суммы синусоид с различной амплитудой и частотой. Функция dct2 в приложении Image Processing Toolbox реализует двумерные дискретные косинусные преобразования изображений. Одна из особенностей дискретного преобразования Фурье состоит в том, что некоторые локальные участки изображения можно охарактеризовать небольшим количеством коэффициентов дискретного преобразования Фурье. Это свойство очень часто используется при разработке методов сжатия изображений. Например, дискретное косинусное преобразование является основой международного стандарта, который используется в алгоритме сжатия изображений с потерями JPEG. Название формата “JPEG” состоит из первых букв названия рабочей группы, которая принимала участие в разработке этого стандарта (Joint Photographic Experts Group).
Двумерное дискретное косинусное преобразование матрицы A с размерами реализуется согласно следующему выражению
где
Значения Bpq называют коэффициентами дискретного косинусного преобразования матрицы A.
(Следует отметить, что индексы матрицы в MATLAB всегда начинаются с 1, а не с 0. Поэтому элементы матрицы, которые представлены в MATLAB как A(1,1) и B(1,1), будут соответствовать элементам A00 и B00 из приведенной выше формулы.)
Обратное дискретное косинусное преобразование реализуется согласно выражениям
где ;
Выражение обратного дискретного косинусного преобразования может интерпретироваться как представление матрицы A с размерами в виде суммы следующих функций
Эти функции называются основными (базовыми) функциями дискретного косинусного преобразования. Коэффициенты дискретного косинусного преобразования Bpq можно рассматривать как весовые при каждой базовой функции. Например, для матрицы с размером элементов существует 64 базовые функции, что продемонстрировано на изображении.
Рисунок 5.3 64 базовые функции, которые получены для матрицы с размерами элементов
Горизонтальные частоты увеличиваются слева направо, а вертикальные - сверху вниз.
1.6 Вейвлеты
Вейвлетное преобразование сигналов является обобщением спектрального анализа, типичный представитель которого - классическое преобразование Фурье. Термин "вейвлет" (wavelet) в переводе с английского означает "маленькая (короткая) волна". Вейвлеты - это обобщенное название семейств математических функций определенной формы, которые локальны во времени и по частоте, и в которых все функции получаются из одной базовой (порождающей) посредством ее сдвигов и растяжений по оси времени. Вейвлет-преобразования рассматривают анализируемые временные функции в терминах колебаний, локализованных по времени и частоте. Как правило, вейвлет-преобразования (WT) подразделяют на дискретное (DWT) и непрерывное (CWT).
DWT используется для преобразований и кодирования сигналов, CWT - для анализа сигналов. Вейвлет-преобразования в настоящее время принимаются на вооружение для огромного числа разнообразных применений, нередко заменяя обычное преобразование Фурье. Это наблюдается во многих областях, включая молекулярную динамику, квантовую механику, астрофизику, геофизику, оптику, компьютерную графику и обработку изображений, анализ ДНК, исследования белков, исследования климата, общую обработку сигналов и распознавание речи.
Вейвлетный анализ представляет собой особый тип линейного преобразования сигналов и физических данных. Базис собственных функций, по которому проводится вейвлетное разложение сигналов, обладает многими специфическими свойствами и возможностями. Вейвлетные функции базиса позволяют сконцентрировать внимание на тех или иных локальных особенностях анализируемых процессов, которые не могут быть выявлены с помощью традиционных преобразований Фурье и Лапласа. К таким процессам в геофизике относятся поля различных физических параметров природных сред. В первую очередь это касается полей температуры, давления, профилей сейсмических трасс и других физических величин.
Вейвлеты имеют вид коротких волновых пакетов с нулевым средним значением, локализованных по оси аргументов (независимых переменных), инвариантных к сдвигу и линейных к операции масштабирования (сжатия/растяжения). По локализации во временном и частотном представлении вейвлеты занимают промежуточное положение между гармоническими функциями, локализованными по частоте, и функцией Дирака, локализованной во времени.
Теория вейвлетов не является фундаментальной физической теорией, но она дает удобный и эффективный инструмент для решения многих практических задач. Основная область применения вейвлетных преобразований - анализ и обработка сигналов и функций, нестационарных во времени или неоднородных в пространстве, когда результаты анализа должны содержать не только частотную характеристику сигнала (распределение энергии сигнала по частотным составляющим), но и сведения о локальных координатах, на которых проявляют себя те или иные группы частотных составляющих или на которых происходят быстрые изменения частотных составляющих сигнала. По сравнению с разложением сигналов на ряды Фурье вейвлеты способны с гораздо более высокой точностью представлять локальные особенности сигналов, вплоть до разрывов 1-го рода (скачков). В отличие от преобразований Фурье, вейвлет-преобразование одномерных сигналов обеспечивает двумерную развертку, при этом частота и координата рассматриваются как независимые переменные, что дает возможность анализа сигналов сразу в двух пространствах.
Одна из главных и особенно плодотворных идей вейвлетного представления сигналов на различных уровнях декомпозиции (разложения) заключается в разделении функций приближения к сигналу на две группы: аппроксимирующую - грубую, с достаточно медленной временной динамикой изменений, и детализирующую - с локальной и быстрой динамикой изменений на фоне плавной динамики, с последующим их дроблением и детализацией на других уровнях декомпозиции сигналов. Это возможно как во временной, так и в частотной областях представления сигналов вейвлетами.
1.6.1 Непрерывное вейвлет-преобразование
Допустим, что мы имеем функции s(t) с конечной энергией в пространстве L2(R), определенные по всей действительной оси R(-, ). Для финитных сигналов с конечной энергией средние значения сигналов должны стремиться к нулю на ±.
Непрерывным вейвлет-преобразованием (или вейвлетным образом) функции s(t) L2(R) называют функцию двух переменных:
С(a,b) = s(t), ?(a,b,t) = s(t)??(а,b,t) dt, a, b R, a ? 0.
где вейвлеты ?(a,b,t) ?ab(t) - масштабированные и сдвинутые копии порождающего вейвлета ?(t) L2(R), совокупность которых создает базис пространства L2(R).
Порождающими функциями могут быть самые различные функции с компактным носителем - ограниченные по времени и местоположению на временной оси, и имеющие спектральный образ, локализованный на частотной оси. Базис пространства L2(R) целесообразно конструировать из одной порождающей функции, норма которой должна быть равна 1. Для перекрытия функцией вейвлета всей временной оси пространства используется операция сдвига (смещения по временной оси): ?(b,t) = ?(t-b), где значение b для НВП является величиной непрерывной. Для перекрытия всего частотного диапазона пространства L2(R) используется операция временного масштабирования вейвлета с непрерывным изменением независимой переменной: ?(a,t) = |а|-1/2?(t/а). На рис. 1.2.1. видно, что если временной образ вейвлета будет расширяться (изменением значения параметра 'а'), то его "средняя частота" будет понижаться, а частотный образ (частотная локализация) перемещаться на более низкие частоты. Таким образом, путем сдвига по независимой переменной (t-b) вейвлет имеет возможность перемещаться по всей числовой оси произвольного сигнала, а путем изменения масштабной переменной 'а' (в фиксированной точке (t-b) оси) "просматривать" частотный спектр сигнала по определенному интервалу окрестностей этой точки.
С использованием этих операций вейвлетный базис функционального пространства образуется путем масштабных преобразований и сдвигов порождающего вейвлета??(t):
?(a,b,t) = |а|-1/2?[(t-b)/а], a, b R, a ? 0, ?(t) L2(R). (1.2.2)
Нетрудно убедиться, что нормы вейвлетов ?(a,b,t) равны норме ?(t), что обеспечивает нормировочный множитель |а|-1/2. При нормировке к 1 порождающего вейвлета ?(t) все семейство вейвлетов также будет нормированным. Если при этом выполняется требование ортогональности функций, то функции ?(a,b,t) образуют ортонормированный базис пространства L2(R).
1.6.2 Свойства вейвлета
Локализация. Вейвлет должен быть непрерывным, интегрируемым, иметь компактный носитель и быть локализованным как во времени (в пространстве), так и по частоте. Если вейвлет в пространстве сужается, то его "средняя" частота повышается, спектр вейвлета перемещается в область более высоких частот и расширяется. Этот процесс должен быть линейным - сужение вейвлета вдвое должно повышать его "среднюю" частоту и ширину спектра также вдвое.
Вейвлетную функцию можно считать хорошо локализованной при выполнении условий:
?(t) ? C/(1+|t|)1+?, ?(f) ? C/(1+|f|)1+?, С=const, при ? > 0.
Нулевое среднее значение, т.е. выполнение условия для нулевого момента:
?(t) dt = 0,
что обеспечивает выделение локальных особенностей сигналов в пределах вейвлетного носителя на уровне региональных изменений и тренда, нулевое усиление постоянной составляющей сигналов, нулевое значение частотного спектра вейвлета при ?=0, и локализацию спектра вейвлета в виде полосового фильтра с центром на определенной (доминирующей) частоте ?0. Для анализа мелкомасштабных флюктуаций и особенностей высокого порядка, как правило, требуются и нулевые значения определенного количества последующих моментов:
tm??(t) dt = 0.
Такие вейвлеты называются вейвлетами m-го порядка.
Ограниченность. Необходимое и достаточное условие:
||?(t)||2 =?|?(t)|2 dt <
Оценка ограниченности и локализации может выполняться с использованием выражений:
|?(t)| < 1/(1+|t|n), или |?(щ)| < 1/(1+|щo|n),
где ?o - средняя частота вейвлета. Число n должно быть как можно больше.
Автомодельность базиса или самоподобие. Форма всех базисных вейвлетов ?ab(t) должна быть подобна материнскому вейвлету ?(t), т.е. должна оставаться одной и той же при сдвигах и масштабировании (растяжении/сжатии), иметь одно и то же число осцилляций.
1.6.3 Дискретные вейвлеты
В принципе, при обработке данных на ПК может выполняться дискретизированная версия непрерывного вейвлет-преобразования с заданием дискретных значений параметров (a,b) вейвлетов с произвольным шагом ?a и ?b. В результате получается избыточное количество коэффициентов, намного превосходящее число отсчетов исходного сигнала, которое не требуется для реконструкции сигналов.
Дискретное вейвлет-преобразование обеспечивает достаточно информации, как для анализа сигнала, так и для его синтеза, являясь вместе с тем экономным по числу операций и по требуемой памяти. ДВП оперирует с дискретными значениями параметров а и b, которые задаются, как правило, в виде степенных функций:
a = ао-m, b = k·ао-m, ao > 1, m, k I,
где I - пространство целых чисел {-, }, m - параметр масштаба, k - параметр сдвига. Базис пространства L2(R) в дискретном представлении:
?mk(t) = |ао|m/2? (аоmt-k), m,k I, ? (t) L2(R).
Вейвлет-коэффициенты прямого преобразования:
Cmk =s(t)???mk(t) dt.
Значение 'a' может быть произвольным, но обычно принимается равным 2, при этом преобразование называется диадным вейвлет-преобразованием. Для диадного преобразования разработан быстрый алгоритм вычислений, аналогичный быстрому преобразованию Фурье, что предопределило его широкое использование при анализе массивов цифровых данных.
Обратное дискретное преобразование для непрерывных сигналов при нормированном ортогональном вейвлетном базисе пространства:
s(t) = Cmk?mk(t).
Число использованных вейвлетов по масштабному коэффициенту m задает уровень декомпозиции сигнала, при этом за нулевой уровень (m = 0) обычно принимается уровень максимального временного разрешения сигнала, т.е. сам сигнал, а последующие уровни (m < 0) образуют ниспадающее вейвлет-дерево. В программном обеспечении вычислений для исключения использования отрицательной нумерации по m знак 'минус' обычно переносится непосредственно в, т.е. используется следующее представление базисных функций:
?mk(t) = |ао|-m/2?(ао-mt-k), m,k I, ?(t) L2(R).
Устойчивость дискретного базиса определяется следующим образом.
Функция ?(t) L2(R) называется R-функцией, если базис на ее основе по является базисом Рисса (Riesz). Для базиса Рисса существуют значения А и В, 0 < A ? B < , для которых выполняется соотношение
A||Cmk||2 ? || Cmk?mk(t)||2 ? B||Cmk||2,
если энергия ряда Cmk конечна. При этом для любой R-функции существует базис ?mk(t), который ортогонален базису ?mk(t). Его называют ортогональным "двойником" базиса ?mk(t), таким, что
?mk(t), ?nl(t) = ?mn·?kl.
Если A = B = 1 и ао = 2, то семейство базисных функций {?mk(t)} является ортонормированным базисом и возможно полное восстановление исходного сигнала, при этом ?mk(t) ? ?mk(t) и для реконструкции сигналов используется формула. Если ?(t) не ортогональный вейвлет, но имеет "двойника", то на базе "двойника" вычисляется семейство ?#mk(t), которое и используется при обратном преобразовании вместо ?mk(t), при этом точное восстановление исходного сигнала не гарантировано, но оно будет близко к нему в среднеквадратическом смысле.
Как и для непрерывного вейвлет-преобразования, обратное дискретное преобразование не может выполнить восстановление нецентрированных сигналов в силу нулевого первого момента вейвлетных функций и, соответственно, центрирования значения вейвлет-коэффициентов Cmk при прямом вейвлет-преобразовании. Поэтому при обработке числовых массивов данных дискретные вейвлеты используются, как правило, в паре со связанными с ними дискретными скейлинг-функциями. Скейлин-функции имеют с вейвлетами общую область задания и определенное соотношение между значениями, но первый момент скейлин-функций по области определения равен 1. Если вейвлеты рассматривать, как аналоги полосовых фильтров сигнала, в основном, высокочастотных при выделении локальных особенностей в сигнале, то скейлин-функции вейвлетов представляет собой аналоги низкочастотных фильтров, которыми из сигнала выделяются в отдельный массив составляющие, не прошедшие вейвлетную фильтрацию. Так, например, порождающая скейлинг-функция вейвлета Хаара задается следующим выражением:
При обозначении скейлинг-функций индексом ?mk(t) аналитика скейлин-функций повторяет выражения и образует дополнительный базис пространства L2(R). Сумма вейвлет-коэффициентов и скейлинг-коэффициентов разложения сигналов соответственно дает возможность выполнять точную реконструкцию сигналов, при этом вместо используется следующее выражение обратного вейвлет-преобразования:
s(t) =Сak ?k(t) + Сdmk?mk(t),
где Cak - скейлин-коэффициенты, которые обычно называют коэффициентами аппроксимации сигнала, Cdmk - вейвлет-коэффициенты или коэффициенты детализации. Более подробно использование скейлинг-функций будет рассмотрено в теме вейвлетного кратномасштабного анализа.
1.6.4 Пакетные вейвлеты
В обычном алгоритме Маллата быстрого вейвлет - преобразования (БВП) при переходе с масштабного уровня m на уровень m+1 функция аппроксимирующих коэффициентов сm,k разделяется на низкочастотную (cm+1,k) и высокочастотную (dm+1.k) части спектрального диапазона, и при дальнейшем увеличении масштабных уровней аналогичному разложению последовательно подвергаются только низкочастотные функции (аппроксимирующие). В пакетном алгоритме БВП операция последовательного частотного расщепления применяется как для низкочастотных, так и для высокочастотных (детализирующих) коэффициентов. В результате возникает дерево расщепления, пример которого (в предельной форме расщепления на всех уровнях) показан на рис. 6.0.1.
Рисунок 6.1
При таком расщеплении вейвлеты каждого последующего уровня образуются из вейвлета предыдущего уровня разделением на два новых вейвлета:
?1(t) =hn?(t-n), ?2(t) =gn?(t-n).
Новые вейвлеты также локализованы в пространстве, но на вдвое более широком интервале. Полный набор вейвлетных функций разложения называют вейвлет-пакетом.
Пакетное вейвлет-преобразование является адаптивным, и широко используется для компрессии сигналов и их очистки от шумов. Оно позволяет более точно приспосабливаться к особенностям сигналов путем выбора соответствующей оптимальной формы дерева разложения, которая обеспечивает минимальное количество вейвлет-коэффициентов при заданной точности реконструкции сигнала, и, тем самым, целенаправленно исключает из обратного БВП незначимые, информационно избыточные или ненужные детали сигналов. Мерой оптимальности обычно служит концентрация числа вейвлет-коэффициентов для реконструкции сигнала с заданной точностью (погрешностью). Оценка информативности набора коэффициентов выполняется по энтропии, под которой обычно понимается величина:
E = exp(-pn·log(pn)), pn = |xn|2 ||x||-2.
1.6.5 Двумерные вейвлеты
Многомасштабный анализ можно проводить и с многомерными функциями. Существует два способа обобщить его на двумерный случай, но чаще используется построение, заданное тензорными произведениями.
Тривиальный путь построения двумерного ортонормального базиса исходя из одномерного ортонормального вейвлет-базиса yj,k(x)=2j/2y(2jx-k) состоит в том, чтобы путем тензорного произведения образовать соответствующие функции из двух одномерных базисов:
.
В этом базисе две переменных x1 и x2 сжимаются по-разному.
Больший интерес для многих приложений имеет другая конструкция, в которой масштабирование полученного ортонормального вейлет-базиса происходит по обеим переменным одинаковым образом и двумерные вейвлеты задаются следующим выражением:
, j,k,lОZ,
но Y уже не является единственной функцией, наоборот, она будет сформирована из трех элементарных вейвлетов. Чтобы создать ортонормальный базис W0, теперь придется использовать три семейства
, , .
Тогда двумерные вейвлеты запишутся в виде
, , .
На двумерной плоскости происходит анализ по горизонталям, вертикалям и диагоналям с одинаковым разрешением в соответствии с тремя выписанными выше вейвлетами.
1.7 Энтропия
Энтропия сигнала используется при выборе оптимального пакетного вейвлет-разложения.
Полное дерево пакетного вейвлет-разложения содержит много коэффициентов. Изучение всех полученных коэффициентов пакета затруднительно ввиду их большого числа. Кроме того, некоторые из коэффициентов могут быть малоинформативные. Поэтому важно получить не все дерево, а некоторое поддерево оптимальной величины в смысле числа коэффициентов и их информативности. Представляет интерес нахождение оптимального разложения относительно удобного критерия. Как известно, энтропия - общая концепция оценки информативности во многих областях, главным образом, а обработке сигналов. Поэтому для оценки дерева разложения естественно использовать классические критерии на основе энтропии, которые обладают свойством аддитивности (объединения) по отношению к сигналам и даст информационные оценки сигнала.
1.8 Медианная фильтрация
Все линейные алгоритмы фильтрации приводят к сглаживанию резких перепадов яркости изображений, прошедших обработку. Этот недостаток, особенно существенный, если потребителем информации является человек, принципиально не может быть исключен в рамках линейной обработки. Дело в том, что линейные процедуры являются оптимальными при гауссовском распределении сигналов, помех и наблюдаемых данных. Реальные изображения, строго говоря, не подчиняются данному распределению вероятностей. Причем, одна из основных причин этого состоит в наличии у изображений разнообразных границ, перепадов яркости, переходов от одной текстуры к другой и т. п. Поддаваясь локальному гауссовскому описанию в пределах ограниченных участков, многие реальные изображения в этой связи плохо представляются как глобально гауссовские объекты. Именно это и служит причиной плохой передачи границ при линейной фильтрации.
При медианной фильтрации используется двумерное окно (апертура фильтра), обычно имеющее центральную симметрию, при этом его центр располагается в текущей точке фильтрации. На рис. 3.10 показаны два примера наиболее часто применяемых вариантов окон в виде креста и в виде квадрата. Размеры апертуры принадлежат к числу параметров, оптимизируемых в процессе анализа эффективности алгоритма. Отсчеты изображения, оказавшиеся в пределах окна, образуют рабочую выборку текущего шага.
Рисунок 8.1 Примеры окон при медианной фильтрации
1.9 Сегментация изображений
Одной из основных задач обработки и анализа изображений является сегментация, т.е. разделение изображения на области, для которых выполняется определенный критерий однородности, например, выделение на изображении областей приблизительно одинаковой яркости. Понятие области изображения используется для определения связной группы элементов изображения, имеющих определенный общий признак (свойство).
Один из основных и простых способов -- это построение сегментации с помощью порога. Порог -- это признак (свойство), которое помогает разделить искомый сигнал на классы. Операция порогового разделения заключается в сопоставлении значения яркости каждого пикселя изображения с заданным значением порога.
Рисунок 9.1 Сегментация изображения
Рисунок 9.2 Схема программы
Представленная в комплексе программ функции имеют один общий алгоритм, представленный на рисунке 9.3
Рисунок 9.3 Общая блок-схема алгоритма комплекса программ
Из приведенного алгоритма следует, что после выбора изображения производится его обработка. Преобразованное изображение выводится на экран и представляет возможность сохранения изменений.
Так же реализована возможность изменения пороговых значений там, где это необходимо. Изменения пороговых значений производится по алгоритму, представленному на рисунке 9.4
Рисунок 9.4 Алгоритм обработки изменения пороговых значений
После считывания значение проверяется на принадлежность допустимому диапазону (при необходимости). Если введенное значение превышает допустимый диапазон, то происходит автоматическая подстановка максимального из допустимых значений. Если введенное значение меньше минимального числа из допустимого диапазона, то автоматически подставляется минимальное из допустимых значений. Далее идет пересчет с новым значением и вывод результата на экран.
2. Практическая часть
Система MATLAB предлагается разработчиками (фирма Math Works, Inc.) как лидирующий на рынке, в первую очередь в системе военно-промышленного комплекса, в аэрокосмической отрасли и автомобилестроении, язык программирования высокого уровня для технических вычислений с большим числом стандартных пакетов.прикладных программ. Система MATLAB вобрала в себя не только передовой опыт развития и компьютерной реализации численных методов, накопленный за последние три десятилетия, но и весь опыт становления математики за всю историю человечества. Около миллиона легально зарегистрированных пользователей уже применяют эту систему. Ее охотно используют в своих научных проектах ведущие университеты и научные центры мира.
MATLAB -- расширяемая система, и ее легко приспособить к решению нужных вам классов задач. Ее огромное достоинство заключается в том, что это расширение достигается естественным путем и реализуется в виде так называемых т-файлов (с расширением .m). Иными словами, расширения системы хранятся на жестком диске компьютера и в нужный момент вызываются для использования точно так же, как встроенные в MATLAB (внутренние) функции и процедуры.
Благодаря текстовому формату m-файлов пользователь может ввести в систему любую новую команду, оператор или функцию и затем пользоваться ими столь же просто, как и встроенными операторами или функциями. При этом в отличие от таких языков программирования, как Бейсик, Си или Паскаль не требуется никакого объявления этих новых функций. Это роднит MATLAB с языками Лого и Форт, имеющими словарную организацию операторов и функций и возможности пополнения словаря новыми определениями-словами. Но, поскольку новые определения в системе MATLAB хранятся в виде файлов на диске, это делает набор операторов и функций практически неограниченным.
В базовый набор слов системы входят спецзнаки, знаки арифметических и логических операций, арифметические, алгебраические, тригонометрические и некоторые специальные функции, функции быстрого преобразования Фурье и фильтрации, векторные и матричные функции, средства для работы с комплексными числами, операторы построения графиков в декартовой и полярной системах координат, трехмерных поверхностей и т. д. Словом, MATLAB предоставляет пользователю обширный набор готовых средств (большая часть из них -- это внешние расширения в виде m-файлов).
Запустим программу Matlab и в командной строке наберем команду «open menu.m». В результате этого действия получим появление нового окна с программным кодом, далее щелкнем по кнопке «Выполнить» на панели инструментов данного окна.
Откроется главное меню программы:
Выбираем изображение, которое будем исследовать:
Далее приступаем к исследованиям.
2.1 Исследование 1: Представление и первичная обработка изображений
Бинаризация
Порог бинаризации 0.2 |
Порог бинаризации 0.5 |
|
Порог бинаризации 0.7 |
Порог бинаризации 0.9 |
|
Разложение в RGB
Исходное изображение |
R |
|
G |
B |
|
Построение гистограммы
Работа с пикселями
Исходное изображение |
Поэлементное преобразование (линейное) |
Поэлементное преобразование (нелинейное) |
Поворот изображения
Поворот изображения на 90 градусов |
Поворот изображения на 180 градусов |
|
Поворот изображения на 270 градусов |
Поворот изображения на 360 градусов |
|
Выделение фрагмента изображения
Масштабирование
Арифметика изображений (Сложение)
Сложение можно производить с положительными или отрицательными числами в диапазоне от -255 до 255.
Сложение с -200 |
Сложение с -100 |
|
Сложение с 100 |
Сложение с 200 |
|
Арифметика изображений (Умножение)
Умножение можно производить на любое число в диапазоне от 0 до 255
Умножение на 5 |
2. Умножение на 10 |
|
3. Умножение на 100 |
4. Умножение на 200 |
|
Арифметика изображений (Деление)
Деление можно производить на любое число в диапазоне от 0 до 255.
Деление на 5 |
2. Деление на 10 |
|
3. Деление на 100 |
4. Деление на 200 |
|
2.2 Исследование 2: Вейвлеты и преобразование Фурье
Дерево Вейвлет-разложения
Вычисление энтропии
Дискретное двумерное вейвлет-преобразование
Преобразование Фурье
2.3 Исследование 3: Фильтрация изображения
Наложение шума
Исходное изображение |
Пиксельный шум плотность шума 0.1 |
|
Гауссовый белый шум среднее значение 0.1 |
Мультипликативный шум среднеквадратичное отклонение 0.1 |
|
Исходное изображение |
Пиксельный шум плотность шума 0.1 |
|
Гауссовый белый шум среднее значение 0.1 |
Мультипликативный шум среднеквадратичное отклонение 0.1 |
|
Медианная фильтрация
2.4 Исследование 4: Построение графика корреляции
Размещено на Allbest.ru
Подобные документы
Анализ существующих методов масштабирования изображений. Повышение скорости обработки и изменения картинок. Алгоритм масштабирования с использованием параллелизма. Отбор пикселей для правильного расчета градиента. Выбор метода интерполяции изображения.
курсовая работа [5,8 M], добавлен 17.06.2017Описание алгоритма поворота изображения. Вычисление синуса и косинуса угла поворота изображения. Алгоритм и реализация функции поворота изображения вокруг центра на заданный пользователем угол. Проверка на соответствие диапазону допустимых значений.
курсовая работа [1,3 M], добавлен 23.01.2015Фильтрация шумов изображения. Алгоритмы его бинаризации и поворота. Формирование информативных признаков для распознавания нот. Схема программного обеспечения. Описание классов, функций, методов, реализованных в программе. Тестирование приложения.
курсовая работа [2,0 M], добавлен 17.12.2013Описание метода обработки "Выделение контурных линий" и особенностей его применения и программной реализации. Способы увеличения контрастности. Значение правильного подбора формы гистограммы для качества компьютерной обработки растрового изображения.
курсовая работа [940,2 K], добавлен 24.06.2013Основные понятия о представлении изображения. Определение величины порога с помощью гистограммы яркостей. Глобальная, локальная, адаптивная пороговая обработка. Метод дискриминантного критерия. Исследования на искусственных и предметных изображениях.
дипломная работа [5,1 M], добавлен 23.12.2012Методика устранения посторонних шумов и коррекции искажения типа дисфокусировки. Обрезка сильно искаженных краев изображения. Построение яркостной гистограммы изображения и его преобразование в индексный формат с восьмицветовой палитрой в пакете Matlab.
контрольная работа [4,7 M], добавлен 13.01.2012Яркость точек и гистограммы изображения. Изменение яркости и контрастности. Метод ранговой фильтрации с оценкой середины диапазона. Наложение шумов на изображение. Преобразование изображения в негатив. Получение матрицы яркостей и построение гистограмм.
курсовая работа [1,5 M], добавлен 11.12.2012Информация о графических форматах. Хранение изображения в программе. Очередь как вспомогательная структура данных. Загрузка изображения из двоичного файла. Операции с изображением. Уменьшение разрешающей способности. Увеличение размера изображения.
курсовая работа [1,1 M], добавлен 29.06.2013Элементы и принципы графического дизайна в художественном образовании. Разработка графических изображений средствами Adobe Photoshop. Обработка изображения с помощью Photoshop. Подготовка изображения с прозрачным фоном. Плавное слияние двух изображений.
курсовая работа [2,5 M], добавлен 27.11.2012Разработка приложения, целью которого ставится преобразование черно-белых полутоновых изображений в цветные. Обзор методики обработки изображения, способов преобразования изображения с помощью нейронной сети. Описания кластеризации цветового пространства.
дипломная работа [6,3 M], добавлен 17.06.2012