Структурный анализ изображений на основе использования функции информативности

Распознавание графических документов как метод обработки изображений. Анализ идеи функции информативности изображений, которая моделирует, комбинирует и фиксирует реакции зрительного анализатора человека, разработанной И.Б. Мучником и Н.В. Завалишиным.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 30.09.2018
Размер файла 617,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

УДК 004.932.2

Структурный анализ изображений на основе использования функции информативности

Юлия Андреевна Вичевская,

Андрей Ильич Мурынов

Ижевский государственный технический университет

Хорошо известно, что более 90% информации человек получает с помощью зрения. И поэтому не удивительно, что технический прогресс затрагивает в первую очередь средства сбора и обработки визуальной информации. Развитие средств и методов обработки, анализа и распознавания изображений в течение последних десятилетий показало, что возможность извлечения полезной информации из изображений определяется их пространственноструктурными свойствами и характеристиками. В то же время, несмотря на достигнутые успехи, изображения попрежнему остаются трудными для анализа объектами [2].

Одним из основных методов обработки изображений является распознавание графических документов. На сегодняшний день существует большое количество методов распознавания изображений. Но результаты применения этих методов не всегда обеспечивают качественный результат. Поэтому актуальным направлением является разработка нового метода распознавания графических документов, основанного на идее функции информативности изображений, которая моделирует реакции зрительного анализатора человека, разработанной И. Б. Мучником и Н. В. Завалишиным [1]. изображение графический анализатор

Человек, глядя на любое изображение, и, комбинируя различные преобразования, практически всегда может выделить на нем какието характерные особенности. Расположение точек фиксации взора существенным образом определяется геометрической структурой анализируемого изображения, причем точки фиксации концентрируются на участках изображения, которые можно было бы назвать локальными геометрическими особенностями изображения (излом, конец линии, перекрестие и т.д. (Рис. 1)) [1].

Рис. 1. Расположение точек фиксации взора на геометрических особенностях изображения (излом, конец линии, перекрестие)

Важной задачей является разработка такого формального способа нахождения геометрических особенностей, который не опирался бы на заранее заданный список типов форм фрагментов. Естественный путь разработки такого способа состоит в разделении процесса на два этапа: этап нахождения геометрических особенностей без анализа или указания типа формы фрагментов и этап узнавания или классификации формы найденных фрагментов.

Для выделения локальных фрагментов изображения используется «окошко», размер которого относительно размера изображения является малым. Предположив, что «окошко» помещено на изображении, оно выделит некоторый фрагмент. Затем необходимо оценить степень «регулярности» изображения в пределах окошка и полученное в результате такой оценки число припишется точке плоскости изображения, совпадающей с центром окошка. Помещая центр окошка в каждую точку плоскости изображения и производя оценку степени изменения «регулярности» изображения в пределах окошка, получают функцию, экстремумы которой располагаются как раз на тех участках, которые являются геометрическими особенностями. После того, как эти экстремумы найдены, происходит узнавание конкретной формы каждой из найденных геометрических особенностей. Фрагменты изображения, в которых находятся экстремумы, называются информативными, а сама функция функцией информативности.

С целью характеристики степени «регулярности» изображения в пределах каждого фрагмента вводится в рассмотрение стандартное изображение пятно, размер которого совпадает с размером окошка, а зачерненность падает от центра к периферии.

Стандартное изображение, по существу, играет роль эталонного фрагмента с «наибольшей возможной нерегулярностью» черным пятном на белом фоне (Рис. 2).

Рис. 2. Стандартное изображение

В качестве числа, характеризующего степень «регулярности» или «сложности» изображения в пределах текущего фрагмента, рассматривается мера различия фрагмента и стандартного изображения, понимаемая как расстояние между этими изображениями. Для определения расстояния необходимо задать пространство. Таким пространством служит пространство значений зачерненности в клетках окошка. Оно называется пространством векторов зачерненности.

Вычисление функции информативности определяется по формуле:

I (t , s ) = I B (t , s ) ? 2 I A (t ,s)

(1)

значение функции информативности; t, s смещение относительно центра.

F ( x ? t , y ? s ) dxdy

Наименьшее значение функция информативности принимает на фрагментах, зачерненность которых распределена так же, как и зачерненностъ стандартного изображения. Другими словами, экстремумы функции информативности должны располагаться в местах существенных изменений зачерненности изображения. На больших однотонных участках функция информативности не имеет экстремумов, так как при передвижении окошка в пределах этих участков вырезаемый им фрагмент не изменяется.

На контурных изображениях местами наибольшего изменения зачерненности являются геометрические особенности типа концов линий, углов, разветвлений и т.д. На Рис. 3 изображен результат поиска экстремумов функции информативности простых геометрических объектов.

а б в

Рис. 3. Поиск экстремумов функции информативности простых геометрических объектов: а) треугольник; б) прямоугольник; в) окружность

Функция информативности дает возможность отбирать в качестве характерных практически все типы фрагментов, соответствующих геометрическим особенностям сложных изображений. Кроме того, характерные фрагменты отбираются единообразно и центрировано независимо от «контекста» изображений.

На Рис. 4 результат поиска экстремумов функции информативности изображения буквы «А». В дальнейшем структуру буквы можно определить, исходя из конфигураций экстремумов: минимумы функции информативности располагаются на концах линий и внешних углах, а максимумы обозначают внутренние углы (Рис. 4в).

а б в

Рис. 4. Поиск экстремумов функции информативности изображения буквы «А»: а) исходное изображение; б) экстремумы функции информативности; в) определение структуры буквы по найденным экстремумам

Вычисляя функцию информативности, можно сформировать структурное описание изображения, которое будет основой для распознавания изображенных объектов.

Таким образом, анализ конфигурации локальных экстремумов функции информативности изображений может быть основой нового метода анализа графических документов. Среди направлений реализации разработанного метода необходимо выделить анализ текстов, изображений и сложных графических документов (карты, чертежи, схемы).

Список литературы

1. Завалишин Н. В., Мучник И. Б. Модели зрительного восприятия и алгоритмы анализа изображений. М.: Наука, 1974. 344 с.

2. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. Т. 1. 790 с.

Размещено на Allbest.ru


Подобные документы

  • Исследование методов обработки информации в системах технического зрения роботов. Описания искусственных нейронных сетей и их использования при идентификации изображений. Определение порогового уровня изображений, техники обработки визуальной информации.

    магистерская работа [2,2 M], добавлен 08.03.2012

  • Геометрическая, радиометрическая, атмосферная коррекция спутниковых изображений. Улучшение изображений путем изменения контраста. Линейная пространственно-инвариантная фильтрация изображений. Нелинейные градиентные фильтры и кепстральная обработка.

    курсовая работа [5,7 M], добавлен 14.02.2012

  • Вейвлетная компрессия в современных алгоритмах компрессии изображений. Алгоритм фрактального сжатия изображения. Применение алгоритма SPIHT для оптимальной прогрессирующей передачи изображений и их сжатия. Основные черты алгоритма и структура его данных.

    реферат [78,4 K], добавлен 28.03.2011

  • Кодирование длин участков (или повторений) один из элементов известного алгоритма сжатия изображений JPEG. Широко используется для сжатия изображений и звуковых сигналов метод неразрушающего кодирования, им является метод дифференциального кодирования.

    реферат [26,0 K], добавлен 11.02.2009

  • Модель обработки радиоголографических изображений. Изображение объекта, находящегося за препятствием. Фильтр для практической реализации метода. Исследование эффективности метода пространственной фильтрации при малом поглощении и преломлении в стене.

    дипломная работа [4,1 M], добавлен 19.06.2013

  • Алгоритмы, учитывающие систему визуального восприятия человека. Мультиразмерная ошибка. Мера качества видео на основе дискретного косинусного преобразования. Модификация алгоритмов оценки качества изображения с применением предварительной обработки.

    реферат [62,6 K], добавлен 19.11.2008

  • Основные понятия оптики. Построение изображений с помощью интегральных линз Френеля. Защита интеллектуальной собственности, водяные знаки. Методика расчета кремниевых фотодиодов. Обработка и реконструкция изображений. Камеры и приборы с зарядовой связью.

    реферат [554,3 K], добавлен 19.07.2010

  • Передаточные функции дискретных систем как отношение z-изображений выходной и входной величин при нулевых начальных условиях. Определение передаточной функции дискретной системы при нулевом значении флюктуационной составляющей. Использование фиксатора.

    реферат [90,8 K], добавлен 21.01.2009

  • Новый подход оценки значений утраченных пикселей, основанный на минимизации энтропии коэффициентов дискретного косинусного преобразования (ДКП) блока изображения. Задача устранения импульсного шума и реконструкции утерянных участков изображений.

    контрольная работа [8,8 M], добавлен 29.03.2011

  • Недостатки цифровых систем: сложность, ограниченное быстродействие. Этапы цифровой обработки радиолокационных изображений: первичная и вторичная, объединение информации. Особенности процесса двоичного квантования. Анализ схем логических обнаружителей.

    дипломная работа [3,5 M], добавлен 09.04.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.