Моделирование систем обработки информации
Требования точности, экономичности и универсальности моделей. Использование нейронных сетей для моделирования в полиграфии. Постановка задач оптимизации и выбор целевой функции. Виды методов поиска экстремума. Дискретизация и квантование изображений.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курс лекций |
Язык | русский |
Дата добавления | 07.09.2012 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru/
Учреждение образования
«Белорусский государственный технологический университет»
Моделирование систем обработки информации
Электронный конспект лекций
Минск 2012
УДК 004.652(075.8)
ББК 32.973.я75
Б26
Рецензенты:
профессор кафедры сопротивления материалов машиностроительного профиля БНТУ, д. т. н. А. И. Дудяк
доцент кафедры «Машины и технология обработки металлов давлением» БНТУ кандидат технических наук В.И. Любимов
Барташевич С. А.
Б26 Моделирование систем обработки информации: электронный курс лекций для студентов учреждений высшего образования по специальностям 1-36 06 01 Полиграфическое оборудование и систем обработки информации и 1-40 01 02-03 информационные системы и технологии (издательско-полиграфический комплекс)
Конспект лекций представляет собой системное изложение основных представлений по теоретическим основам обработки и управления потоками информации методами и средствами постарения и анализа моделей систем обработки информации для различных практических задач полиграфического комплекса.
Предназначено для студентов специальностей «Полиграфическое оборудование и систем обработки информации» и «Информационные системы и технологии (издательско-полиграфический комплекс)» дневной и заочной формы обучения. Может быть использовано студентами для подготовки к лекционным и практическим занятиям, а также для подготовки к экзамену или зачету и выполнения контрольных работ.
УДК 004.652(075.8)
ББК 32.973.я75
©УО «Белорусский государственный
технологический университет», 2012
© Барташевич С. А., 2012
Оглавление
Лекция № 1. ПОНЯТИЕ «МОДЕЛИ», ПРОЦЕССА МОДЕЛИРОВАНИЯ И ЦЕЛИ ЭТОГО ПРОЦЕССА
Лекция № 2. ОСНОВНЫЕ ТРЕБОВАНИЯ, ПРЕДЪЯВЛЯЕМЫЕ К МАТЕМАТИЧЕСКИМ МОДЕЛЯМ И МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
2.1 Требования точности, экономичности и универсальности
2.2 Методы обработки результатов
Лекция № 3. ПРИНЦИПЫ ПОСТРОЕНИЯ МОДЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ. МЕТОДОВ РАСПОЗНАВАНИЯ ОБРАЗОВ
Лекция № 4 ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ МОДЕЛИРОВАНИЯ В ПОЛИГРАФИИ
4.1 Задачи искусственных нейронных сетей
4.2 Основные функции активации
4.3 Классификация нейронных сетей
Лекция № 5
5.1 Однослойные сети прямого распространения
5.2 Многослойные сети прямого распространения
5.3 Сети с обратными связями (рекуррентные)
5.4 Обучение нейронных сетей
Лекция № 6. МЕТОДЫ ПОЛУЧЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ И ОСОБЕННОСТИ ИХ МОДЕЛИРОВАНИЯ НА РАЗНЫХ УРОВНЯХ
6.1 Классификация математических моделей
6.2 Особенности математического моделирования на микроуровне
6.3 Особенности математического моделирования на макроуровне
Лекция № 7. ПОСТАНОВКА ЗАДАЧ ОПТИМИЗАЦИИ И ВЫБОР ЦЕЛЕВОЙ ФУНКЦИИ
7.1 Постановка и решение задач оптимизации
7.2 Частные критерии оптимальности, примеры их использования, достоинства и недостатки этого подхода
7.3 Взвешенный аддитивный и мультипликативный критерии, их использование и недостатки
7.4 Минимаксные (максиминные) критерии, их применение при проектировании
Лекция № 8. МЕТОДЫ БЕЗУСЛОВНОЙ ОПТИМИЗАЦИИ
8.1 Классификация методов поиска экстремума
8.2 Методы одномерного поиска
8.3 Метод дихотомии
8.4 Метод золотого сечения
8.5 Особенности поиска при максиминных постановках задач оптимизации
Лекция № 9. МЕТОДЫ СЛУЧАЙНОГО ПОИСКА
9.1 Схема использования метода Монте-Карло при исследовании систем со случайными параметрами
9.2 Генератор случайных чисел (ГСЧ)
9.3 Метод серединных квадратов
9.4 Метод серединных произведений
9.5 Проверка качества работы датчика ГСЧ
Лекция № 10. РЕГРЕССИЯ И ОСОБЕННОСТИ ЕЕ ИСПОЛЬЗОВАН ПРИ МОДЕЛИРОВАНИИ
10.1 Динамическая модель и ее характеристика
Лекция № 11. КОДИРОВАНИЕ ИЗОБРАЗИТЕЛЬНОЙ ИНФОРМАЦИИ
10.1 Дискретизация и квантование изображений
10.2 Общие принципы кодирования изображений
10.3 Методы кодирования тоновых изображений
Лекция № 12
12.1 Кодирование с образованием блоков
12.2 Кодирование штриховых изображений
Лекция № 13. КОДИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ
13.1 Оптимальные системы счисления
13.2 Основные параметры кодов
13.3 Способы представления кодов
13.4 Эффективное кодирование
Лекция № 14
14.1 Код Хаффмена
Лекция № 15. ПОМЕХОУСТОЙЧИВОЕ КОДИРОВАНИЕ
15.1 Пути совершенствования эффективного кодирования
15.2 Общий принцип построения помехозащитных кодов
15.3 Код Хемминга
Лекция № 16. ИНФОРМАЦИЯ И ЕЕ ВИДЫ
16.1 Количественная мера информации
16.2 Энтропия как мера неопределенности
16.3 Свойства энтропии и их доказательства
16.4 Энтропия взаимосвязанных событий и их свойства
16.5 Свойства энтропии взаимосвязанных событий
16.6 Количество информации в дискретных сообщениях
16.7 Количество информации во взаимосвязанных объектах
16.8 Количество информации в непрерывных сигналах
Лекция № 17. ПЕРЕДАЧА ИНФОРМАЦИИ ПО КАНАЛАМ СВЯЗИ
17.1 Классификация каналов передачи информации
17.2 Передача информации при отсутствии помех
ЛИТЕРАТУРА
Лекция № 1. ПОНЯТИЕ «МОДЕЛИ», ПРОЦЕССА МОДЕЛИРОВАНИЯ И ЦЕЛИ ЭТОГО ПРОЦЕССА
Модель Ї это совокупность физических или математических элементов и связей между ними, которые адекватно отображают определенные свойства объекта исследования или проектирования. Необходимо помнить, что, несмотря на адекватное отражение некоторых явлений действительности, модель не есть сама действительность. Обычно модель беднее объекта и отражает лишь приближенно некоторые исследуемые стороны и свойства объекта.
Моделирование предполагает построение действующей материальной, математической или виртуальной модели, обладающей свойствами, подобными (адекватными) свойствам рассматриваемой системы. Поэтому, с помощью моделей можно имитировать, изучать функциональные системы и принимать решения относительно их наилучшего варианта, фактически не имея действующего образца.
Задача курса Ї изучить приемы и способы, необходимые для постановки задачи, формализации, изучения и интерпретации систем и процессов с целью их моделирования.
На практике исходным пунктом для моделирования является некоторая эмпирическая ситуация, выдвигающая перед инженером задачу, на которую требуется найти «ответ». Прежде всего, необходимо установить, в чем именно заключается «задача». Это связано с тем, что реальные ситуации редко бывают четко обозначенными и понятными, а сложное взаимодействие с окружающей средой часто делает точное описание таких ситуаций затруднительным. Процесс определения задачи, поддающийся математическому анализу, часто бывает продолжительным и требует владения новыми навыками, не имеющими отношения к математике (например, беседы с математиками, работающими в данной области, чтение всевозможной литературы, имеющей отношение к делу Ї это все является элементом процесса моделирования).
Часто, но не всегда параллельно со стадией постановки задачи идет процесс выявления основных или существенных особенностей явления. Этот процесс схематизации, упрощения (идеализации) играет решающую роль в переводе существенных факторов на язык математических понятий и величин. Как правило, это самая трудная ситуация процесса моделирования. После построения моделей и формулировки ее качественной стороны исследователь приступает к количественному описанию модели, которая заканчивается проверкой адекватности (соответствия) опытных данных, полученной модели. В действительности адекватность модели до некоторой степени проверяется обычно в ходе постановки задачи. Уравнения или другие математические соотношения, сформулированные в модели, постоянно сопоставляются с исходной ситуацией.
Существует несколько аспектов проверки адекватности. Во-первых, сама математическая основа модели (которая и составляет ее существо) должна не противоречить законам физики и подчиняться законам математической логики. Во-вторых, справедливость модели зависит от ее способности адекватно описывать исходную ситуацию. Статистическая проверка адекватности модели осуществляется с использованием статистического критерия, называемого критерием Фишера. Для его определения применяются данные по воспроизводимости эксперимента и по отклонению экспериментальных величин от значений, предсказанных моделью. Методика расчета этого критерия описана в различных статистических руководствах. Однако, ответ на вопрос успешно ли проходит предложенная модель такую проверку не совсем объективен и полон. В любом случае следует стремиться к соответствию между определяющими элементами модели и самого явления или процесса, а также к сохранению между ними постоянных соотношений. Например, при изучении в лабораторных условиях процессах, связанных с нагревом или с сушкой при моделировании их мощность теплового источника берется с большим запасом, что значительно завышает производительность процесса. При масштабировании такой модели заданная температура может достигаться за время соизмеримое со временем самого процесса. В результате нарушения этих соотношений (времени нагрева и времени технологического процесса) модель не может эффективно управлять объектом, а, следовательно, она не адекватна.
Исходя из понятия полноты и адекватности отражения моделью исследуемых процессов, модели можно разделить на упрощенные и полные, истинные модели.
Понятие модели в качестве истинной, т.е. правильно отражающей работу системы на всех этапах основывается на решении вопроса о ее адекватности и зависит от критериев, выдвинутых автором модели в такой же степени, как и от установления физических, экономических или любых других характеристик исходной ситуации.
Приближенный ответ, который получается быстрее, может оказаться более эффективным, чем более точный ответ, на получение которого уходит больше времени и средств. В этом сила упрощенной модели и в этом случае понятие адекватности может сводиться к качественному определению, годится модель для описанного объекта или нет. Слабость же приближенной модели в силу ее упрощенности, заключается в том, что такая модель может занести систематическую ошибку в результате моделирования объекта. Несмотря на это, упрощенная модель свидетельствует в пользу непосредственного численного приближенного решения, позволяющего избежать затрат времени и средств на поиск наиболее изящного аналитического решения.
Поскольку полная модель является выражением конечного ряда и только важнейших для конкретного исследования аспектов сущности, то она не может быть абсолютно идентичной моделируемому объекту или процессу. Кроме того, реальный объект бесконечен для познания. Поэтому моделирование производят с помощь нескольких моделей. Первое моделирование осуществляется на каком-либо существующем универсальном моделирующем пакете. После качественной оценки модели, пишется специализированный пакет под полученную модель для количественной ее оценки. Необходимость в двух моделях возникает в случае, если функционирование модели в универсальной среде моделирования не удовлетворяет некоторым требованиям, Например быстродействия или точности, либо другим каким-либо свойствам.
Процесс моделирования состоит из трех стадий:
1. Формализации (переход от реального объекта к модели).
2. Моделирование (процесс исследования и преобразования модели).
3. Интерпретации (перевод результатов моделирования в область реальности).
Моделирование Ї прикладная инженерная наука и существует ее непосредственная связь с другими инженерными науками. В частности, моделирование связано напрямую с программированием.
Программирование Ї способ изложения алгоритма в языковой форме. Алгоритм один из способов представления (отражения) мысли, процесса, явления в искусственной вычислительной среде, которой является компьютер. Специфика алгоритма состоит в отражении последовательности действий. Моделирование может использовать программирование, если моделируемый объект легко описать с точки зрения его поведения. Если необходимо описывать свойства объекта, то программирование использовать затруднительно.
Связь моделирования с математикой очевидна. Математика Ї наука, представляющая возможность исчисления описания моделей, приводимых к стандартному (каноническому) виду. Это в равной степени относится и к другим наукам, например к физике, химии. Наука о нахождении решений аналитических моделей - это матанализ. Он реализует способы исследования моделей с точки зрения нахождения наилучших управляющих воздействий на модели. Имеет дело, большей частью, с аналитическими моделями.
Конструирование Ї это комплекс наук, включающих механику, теорию механизмов и машин, сопротивления материалов, электротехнику, гидравлику.
Проектирование Ї процесс создания модели объекта. Моделирование Ї оценка результата проектирования. Моделирования без проектирования не существует.
Моделирование Ї дисциплина, ставящая целью построение моделей и их исследования посредством собственных универсальных методов, а также специфических методов смежных с ней наук.
Моделирование производится с целью:
- предсказания последствий изменения параметров системы или условий ее работы, когда осуществление такого изменения в реальной обстановке связано с большими материальными затратами или большим риском;
- изучения, переделки и усовершенствования существующих систем, познание и изучение систем, которые пока еще не существуют в реальной действительности;
- обучения персонала и демонстрации методов работы моделей и систем.
Таким образом, процессы и явления моделируют для разных целей, главное из них необходимость предсказать новые результаты или новые свойства и явления. Эти предсказания могут быть связаны с распространением уже известных результатов или иметь более принципиальный характер - прогноза. Многие модели в исследовании операций или техники имеют целью облегчить администрации процесс принятия решений, а также моделирование, в некоторых случаях, используется и в учебном процессе для обучения персонала.
Лекция № 2. ОСНОВНЫЕ ТРЕБОВАНИЯ, ПРЕДЪЯВЛЯЕМЫЕ К МАТЕМАТИЧЕСКИМ МОДЕЛЯМ И МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
моделирование кодирование информация изображение
2.1 Требования точности, экономичности и универсальности
К моделям предъявляются требования точности, экономичности и универсальности.
1. Точность математической модели - это свойство, отражающее степень совпадения параметров, рассчитанных с помощью модели и истинных значений этих параметров. Однако при количественной оценке точности различных моделей необходимо учитывать следующие особенности этого сравнения:
? как правило, объекты и их модели характеризуются многими параметрами и для сопоставимости оценки точности таких моделей необходимо приведение параметров моделей к одному или нескольким безразмерным параметрам.
? в некоторых случаях модели составляются и используются для различных типов объектов и даже вариантов их использования. Например, математическая модель двухповодковой группы может применяться при анализе различных механизмов, содержащих эти двухповодковые группы, так как, характер проявления свойств объекта и соответственно показатели точности этих свойств модели будут во многом определять условия функционирования модели. В результате оценка точности таких моделей перестает быть однозначной.
? в некоторых случаях результаты математического моделирования и оценка их точности сравниваются с экспериментально полученными значениями. Однако погрешности эксперимента, во многих случаях оказываются соизмеримыми с погрешностями математического моделирования. Чтобы уменьшить влияние указанной погрешности, следует сравнивать результаты моделирования и эксперимента в некоторых, так называемых, стандартных ситуациях, тем самым преодолевая разночтения между значениями, полученными моделированием и экспериментом.
2. Экономичность математических моделей оценивается затратами машинного времени ЭВМ. Показателем экономичности модели можно считать число параметров, используемое в ней. Чем больше параметров, тем большее количество арифметических действий необходимо производить и большее количество оперативной памяти потребуется для расчета уравнения модели.
3. Степень универсальности математических моделей определяется их применяемостью к анализу более или менее многочисленной группы в одном или многих режимов функционирования.
Анализируя приведенные основные требования, можно заметить некоторую противоречивость, а именно, чем детальнее в модели отражаются различные закономерности процессов, тем точнее и универсальнее модель, но и тем большее число параметров в ней используется, а, следовательно, и больший объем вычислений необходим для ее реализации.
2.2 Методы обработки результатов
Обработка данных, полученных в результате наблюдений включает в себя несколько стадий:
Анализ данных на предмет обнаружения и исключения систематических ошибок.
Обнаружение и исключение промахов.
Вычисление среднего, дисперсии.
Установление доверительного интервала.
В начале, приведем некоторые необходимые для лучшего понимания определения.
Измеренное значение какой либо величины (Хэ) всегда отличается от истинного значения измеряемой величины (Хи). Разница между этими двумя значениями называется абсолютной ошибкой измерения (д). Относительная ошибка измерений называется величина равная отношению (Хэ - Хи) / Хи, представляемая в процентах. Очевидно, что задачей хорошего измерения является уменьшение относительной погрешности. Сделать это можно либо уменьшив абсолютную погрешность, либо увеличив измеряемую величину. В первом случае это связано с переходом на приборы или методики, позволяющие увеличить точность измерения, что не всегда возможно. Во втором случае, можно увеличить измеряемую величину, но в этом случае величина абсолютной погрешности может оказаться зависимой от значения измеряемой величины. Например, если увеличить измеряемую величину со 100 г до 1 кг, тогда в первом случае при измерении 100 г использовались аналитические весы с диапазоном взвешивания 200 г и точностью 0,0001 г, а с увеличением измеряемой величины до 1 кг взвешивание необходимо проводить на технических весах с точностью 0,1 г. В результате, мы только потеряем в точности и не получим ожидаемого результата, поскольку истинное значение измеряемой величины не всегда известно, то его оценкой таком случае, является среднее арифметическое из ряда проведенных измерений: Хср = У Хi / n. Это казалось бы простая истина, требует пояснений. Почему необходимо проводить несколько измерений? Условия, при которых проводятся каждое измерение неидентичны. Например, изменились температура, давление, дрогнула рука, хлопнула дверь, «прыгнуло» напряжение в сети. Эти явления случайны и, следовательно, результат измерений носит также случайный характер, а представление данных в виде среднего значения компенсирует возможные ошибки, которые возникли при этом и носят название случайных.
Наряду со случайными, в процессе измерения возникают и систематические ошибки, причины которых можно установить. Для их выявления необходимо производить тщательный анализ как методик измерений, так и теоретических положений, заложенных в них. Тем не менее, существую ошибки, которые повторяются наиболее часто, Это ошибки, возникающие из-за личностных свойств человека. Если в методике рекомендуется продолжать измерения в течение 1 часа, а экспериментатор в силу своего характера сделал это за Ѕ часа или показывающая часть прибора при измерении установлена не на уровне глаз экспериментатора, то в результате и в первом и во втором случае вносится постоянная систематическая ошибка, связанная с неправильным отсчетом. Еще одной не менее важной причиной может быть явление дрейфа, свойств измеряемого объекта. Например, некоторые измерения необходимо проводить после термостатирования измеряемого объекта. Чтобы избежать систематических ошибок нужно либо устранить их причины, либо ввести поправочные коэффициенты. Еще одной причиной систематических ошибок является неудачная организация опыта. Например, если измерительный датчик обладает высокой чувствительностью, то он начинает фиксировать и побочные шумы, а при низкой чувствительности он не полностью отражает все особенности процесса. Одним из способов, позволяющих избежать систематической ошибки, является прием, связанный с ее вычитанием. Например, при весовом анализе сначала взвешивается пустая бюкса, а потом с навеской исследуемого вещества. В результате систематическая ошибка, вызванная неверной юстировкой весов, устраняется путем вычитания.
Рассмотрим еще один пример, в котором систематическая ошибка легко распознается. Так, например, если калибровочная кривая, записанная в виде Y = a•X и очевидно должна выходить из начала координат, но имеет вид, представленный на рис. 1 (кривая 1), то существующую систематическую ошибку можно учесть с помощью уравнения Х = а Х + b.
Рис. 1 Калибровочная кривая, полученная с непосредственным учетом систематической ошибки (1) и путем вычитания значения систематической ошибки из каждой экспериментальной точки (2)
Очевидно, что если создать условия, при которых Х = 0, то значение Y = b и будет являться величиной систематической ошибки. Теперь от каждого значения Y можно отнимать значение b, причем наиболее целесообразно определять систематическую ошибку b по результатам всей калибровки, т. е. в каждой точке.
В некоторых случаях систематическую ошибку можно перенести в разряд случайных. Для этого используется прием рандомизации. Например, если намечено поставить пять опытов по два параллельных экспериментов в каждом, то рандомезация заключается в том, чтобы параллельные эксперименты проводились в разное время.
Необходимо построить гистограмму распределения значительного числа параллельных измерений одной и той же величины (при условии отсутствия систематических ошибок), то она будет иметь вид, представленный на рис. 2.
Рис. 2 Распределение результатов эксперимента при большом числе измерений
Для построения такой гистограммы весь интервал изменения значений измеряемой величины X разбивают на одинаковые промежутки шириной ДX. Затем определяют число результатов ДN попавших в каждый интервал, которые изображают в виде прямоугольников. Если увеличить количество измерений и уменьшить интервал, то можно получить плавную кривую. Вид этой кривой хорошо известен в теории статистики и называется Гауссовой кривой нормального распределения. Площадь под кривой, ограниченная интервалом Xср±д будет соответствовать доверительной вероятности оценки Xср. Таким образом, неопределенность, возникающая в результате ряда случайных воздействий, приводит к тому, что для ее характеристик выбирают доверительный интервал, в пределах которого с данной доверительной вероятностью P можно обнаружить значение исследуемой случайной величины. Величина называется уравнением значимости.
Точки на кривой нормального распределения подчиняются уравнению
где у2 ? генеральная дисперсия (среднее квадратичное отклонение Х). При обработке наблюдений наиболее часто пользуются доверительной вероятностью 95 %. Это означает, что случайная ошибка не превышает величины ±2у.
В соответствующей литературе весьма подробно описано, как проверить экспериментальные данные на соответствие нормальному закону распределения. В большинстве методов статистического анализа используется предположение о том, что оценки изучаемых явлений имеют нормальное распределение. Эта уверенность базируется на так называемой центральной предельной теореме, сущность которой состоит в том, что распределение случайной величины, являющейся суммой большого числа других величин и имеющих любое распределение, близко к нормальному распределению.
Однако бывают и исключения. Результаты радиометрических измерений подчиняются другому закону - закону распределения Пуассона. В данном случае доверительные границы, например, космического излучения несимметричны.
В этом случае вместо значений генеральной дисперсии у2 пользуются ее оценкой sІ вычисляемой по формуле
Для оценки дисперсии необходима проверка годности первичных данных. Она может проводиться разными методами. По одному из них все параллельные определения располагают в порядке их возрастания. Очевидно, что сомнения может вызывать первое X1 или последняя Xn величина.
Вычисляют величины Q1 по формуле если сомнение вызывает первая величина или , если сомнение вызывает последняя величина.
Вычисленную величину Q1 сравнивают с табличным значением величины Q для данного значения параллельных опытов и при доверительной вероятности 95 или 99 % (табл. 1).
Таблица 1
n |
Q при б, равном |
n |
Q при б, равном |
|||
0,95 |
0,99 |
0,95 |
0,99 |
|||
3 |
0,94 |
0,99 |
6 |
0,56 |
0,70 |
|
4 |
0,77 |
0,89 |
7 |
0,51 |
0,64 |
|
5 |
0,64 |
0,76 |
8 |
0,48 |
0,58 |
Если Q1>Q, то сомнительное значение следует исключить; в противном случае его принимают в расчет. Если сомнение вызывает несколько значений, то указанную процедуру проводят для наиболее подозрительного значения, а после его исключения повторяют расчет для следующего сомнительного значения. Исключив сомнительные данные можно вычислить погрешности измерений. Величина погрешности с надежностью 95 % определяется по формуле
где t95,n коэффициент Стьюдента для вероятности 95 % и числа параллельных опытов n.
Результаты вычислений означают, что с вероятностью 95 % истинное значение определяемой величины лежит в пределах от до
Точность нового метода характеризуется величиной, Которая называется коэффициентом вариации и измеряется в процентах
При разработке методики возникает необходимость сравнивать ее результаты с результатами, полученными другими методами. Рассмотрим один из возможных вариантов такой проверки. Пусть при проведении анализа по методике 1 было осуществлено n1 параллельных опытов с дисперсией и получено среднее значение Xср. Соответственно методика 2 характеризуется числом параллельных опытов n2 дисперсией и средним значением Xср. Требуется определить, совместимы ли методики. Для этого проверяется, близка ли точность данных методик. Для этого вычисляют критерий Фишера равный , и сопоставляют его с табличным значением для . Если вычисленное значение меньше или равно табличному, то считают точность обоих методик одинаковый. В этом случае для проверки совместимости X1 и X2 вычисляют величину погрешности по формуле
,
где , а tбn находят по статистическим таблицам для .
При считают X1 и X2 совместимы и расхождение в результатах следует принимать незначимым. В противном случае эти данные несовместимы и одно из двух значений (необязательно, что в новой методике) является ошибочным. Несовместимость может также трактоваться как непригодность обоих методик. Иногда бывает необходимым проверить собственную методику. Для этого вначале определяют погрешность собственного анализа по формуле
а за тем находят абсолютное значение разницы между собственным результатом (Xсоб) и контрольным (Xк). Если величина , то результат принимается.
Лекция № 3. ПРИНЦИПЫ ПОСТРОЕНИЯ МОДЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ РАСПОЗНАВАНИЯ ОБРАЗОВ
Длительное время методы распознавания использовались в таких плохо формализованных областях, как медицина, биология, социология, психология и т.д. При этом использовались в основном качественные характеристики, не позволяющие точно описать соответствующие явления. Если и получались числовые характеристики, то они, как правило, были основаны на работе органов чувств, таких как зрение, слух, осязание.
На начальных этапах для построения алгоритмов распознавания использовалось классическая теория статистических решений, основанная на экспериментальных исследованиях и не имеющая математического обоснования, что позволяло обеспечить лишь определение класса, к которому может быть отнесен исследуемый объект. Приведем примеры, поясняющие вышесказанное.
Так в медицине на основании ряда косвенных анализов возникает возможность распознать заболевание, т.е. отнести его к одному из известных. В метеорологии по накопленным результатам о давлении воздуха, температуре различных слоев атмосферы, скорости движения воздушных потоков можно дать прогноз погоды. В химии, пользуясь спектральным анализом можно отнести вещество к тому или иному классу химических соединений. В геологии данный метод используется при прогнозировании возможности оценки залегания новых месторождений по данным геохимического и геофизического анализа, а также в таких областях, как криминалистика, экономика, психология, лингвистика.
В настоящее время, математический аппарат, привлекаемый для решения задач распознавания, существенно расширился, за счет использования методов алгебры логики, некоторых разделов математического программирования, а также использовании нейросетевых технологий. Это не только породило множество алгоритмов распознавания, но и привело к возникновению значительного количества новых методов распознавания.
Распознавание представляет собой задачу преобразования входной информации, предназначенную для решения на основе специальных алгоритмов, задач распознавания. Процесс разработки систем распознавания требует построения модели системы. Рассмотрим задачи, возникающие при построении системы распознавания.
Первая из них заключается в определении полного перечня признаков, так называемого словаря признаков, для априорного описания классов. Признаки могут быть подразделены на детерминированные, вероятностные, логические, структурные.
Детерминированные Ї имеют конкретные числовые значения и могут рассматриваться в качестве координат точки в признаковом пространстве, соответствующем данному объекту. Например, размер знака, координаты его расположения, оптическая плотность.
Вероятностные Ї это признаки, принимающие случайные значения, например, уровни шума при диагностике работающей машины, или признаки знаков при рукописном их написании, когда начертание знаков зависит от личности человека.
Логические признаки Ї это элементарные высказывания, принимающие два значения («да», «нет» или «истина», «ложь») с полной определенностью и не имеющие количественного выражения. В качестве логических признаков можно рассматривать наличие некоторых свойств у распознаваемых объектов, например, засечек у некоторых гарнитур или наличие увлажняющего или фальцевального аппаратов в исследуемой полиграфической машине, а также признаки, у которых важна не величина признака, а лишь факт его наличия или отсутствия. На практике логические признаки используются тогда, когда ошибками измерения можно пренебречь или интервалы значений признаков выбраны так, что ошибки измерений практически не влияют на достоверность принимаемых решений. Так, например, при техническом диагностировании машины (станка) решение о выходе его из строя принимается лишь тогда, когда фактические значения определенных параметров (признаков) выходят за пределы признанных интервалов.
Структурные Ї это признаки, представляющие собой элементы структуры объекта, иначе называемые терминалами. Каждый объект может рассматриваться как цепочка терминала. Например, слово имеет набор знаков, знак - набор линий или примитивов и т. д.
Вторая задача Ї описание классов распознаваемых объектов или явлений, составление априорного алфавита класса. Основное в данной задаче - выбор надлежащего принципа классификаций. При решении этой задачи необходимо каждому классу назначить соответствующие числовые параметры детерминированных и вероятностных признаков и определить значения логических признаков. Причем, в зависимости от объема исходной априорной информации могут быть использованы методы непосредственной обработки и назначения числовых значений признаков или их определения, а также формирования алфавита классов в результате обучения или самообучения.
Следующий этап связан с разработкой априорного словаря признаков. Словарь разрабатывается на основе результатов решения первой задачи. Необходимо также описание всех классов априорного алфавита классов на языке признаков, включенных в априорный словарь признаков. Такая задача не имеет однозначного решения. Так, если признаки детерминированные, то описаниями классовых объектов на языке этих признаков, являются их эталоны.
Если признаки распознаваемых объектов логические, имеющие количественное выражения, то для описания классов состояния объекта на языке признаков необходимо определить диапазоны значений признаков, соответствующие этим классам.
Если признаки распознаваемых объектов структурные, то описанием классов объектов являются языки, состоящие из предложений, каждое из которых характеризует особенности объектов, принадлежащих исключительно одному из классов. Априорные пространства признаков разбиваются на области, соответствующие классам априорного алфавита. Это разбиение должно быть выполнено таким образом, чтобы обеспечивались минимальные значения ошибок отнесения классифицируемых состояний объекта к чужим классам.
Третья ключевая задача Ї выбор алгоритмов распознавания, обеспечивающих отнесение распознаваемого объекта или явления к тому или другому классу или к их некоторой совокупности. Алгоритмы распознавания основываются на сравнении той или другой меры сходства состояния распознаваемого объекта с каждым из имеющихся классов.
В большинстве алгоритмов многомерной классификации используется понятие, которое носит название «мера сходства» или «мера подобия» между объектами. В практической работе применяются три меры сходства: показатели расстояния; коэффициент корреляции, коэффициент подобия.
Наиболее простой и понятной мерой сходства является расстояние между объектами. Для двух и трехмерного пространства признаков она имеет простой и наглядный вид. Предположим, у нас имеется два объекта А и В, каждый из которых характеризуется набором из двух признаков для первого объекта и для второго объекта.
Рис. 3.1
Здесь верхние индексы -- это номер объекта, а нижние - это свойства этих объектов в координатах X1 и X2.
Расстояние, соединяющее по прямой две точки, называется евклидовым расстоянием. Способ расчета такого расстояния известен нам из школьной математики. При переходе к пространству более высокой размерности расстояние между объектами i и j рассчитывается по формуле:
Эта мера близости еще называется среднеквадратичным расстоянием между сравниваемыми объектами, где m - число признаков.
Другой наиболее часто употребляемой мерой расстояния является расстояние по Хэммингу:
Существуют и более сложные метрики расстояния, определяющие меру сходства. Рассчитанные по Евклиду и Хэммингу расстояния для ранее приведенного примера будут равны соответственно:
Использование коэффициента корреляции поясним следующим примером. Имеется географическая карта, на которую нанесены изолинии двух явлений высоты и заселенности. Если изолинии совпадают, то связь между ними полная, если они пересекаются под прямым углом, то связь отсутствует. Таким образом, корреляцию можно выразить с помощью геометрической интерпретации. На рис. 2 изображены вектора X и Y, угол между которыми равен б. Связь между этими двумя переменными можно представить, как произведение длин этих векторов (h1 h2) на косинус угла между ними:
Рис. 3.2
Очевидно, что если угол между векторами равен нулю, то коэффициент корреляции равен 1. Здесь же видно и определенный недостаток этой меры близости. Очевидно, что если длины векторов сильно различаются, а угол мал, то сходство достаточно сомнительное.
Коэффициенты корреляции применяются в методах распознавания, которые базируются на теории факторного анализа.
Коэффициенты подобия используются для описания объектов, признаки которых имеют дихотомические (0 или 1) значения. Формулы для их вычисления выглядят следующим образом
где -- число совпадений признаков со значением 1; - число единичных признаков у i-го и j-го объектов соответственно; pij - общее число совпадающих признаков; qij - общее число несовпадающих признаков; m - общее число признаков.
Если признаки являются дихотомическими, то определение меры сходства можно проводить по косинусу угла, используя формулу:
Рассмотрим пример расчета. Согласно исходным данным, приведенным в таблице 3.1:
Таблица 3.1
Объект |
Признак |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
1 |
0 |
0 |
0 |
1 |
0 |
1 |
1 |
|
2 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
|
3 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
Как следует из таблицы:
Таким образом, наибольшее сходство имеется между объектами 1 и 3, наименьшее между 2 и 3.
Выбор метода подобия определяется характером решаемой задачи и во многом произволен.
Рассмотренные выше меры сходства, в сущности, ничем не обоснованы и иногда могут противоречить друг другу, и являются эвристическими. Некоторым большим преимуществом обладают меры сходства, основанные на понятии, связанным с количеством информации.
На четвертом этапе необходимо разработать алгоритмы управления работой системы распознавания. Их назначение в том, чтобы процесс функционирования системы распознавания был в определенном смысле оптимальным и выбранный критерий качества этого процесса достигал экстремального значения. В качестве такого критерия может использоваться, например, вероятность правильного решения задачи, среднее время ее решения, расходы на ее решение и, наконец, должен быть выбран показатель или система показателей эффективности системы распознавания и оценки их значений. Оценка значений выбранных показателей эффективности производится на основе экспериментальных исследований реальной системы распознавания или ее модели (физической или математической).
С учетом вышесказанного, системы распознавания можно подразделить на простые и сложные, без обучения, с обучением, а также при создании моделей и алгоритмов распознавания могут использоваться различные методы: детерминированные, вероятностные, логические и т. д.
Простые системы, как правило, используют для распознавания физически однородной информации. Например, автоматы, использующие в качестве признака вес жетона или монеты, автоматы для обработки деталей, в которых в качестве признаков для описания классов используются линейные размеры. Сложные системы могут использовать физически неоднородную информацию. Например, система медицинской диагностики, которая использует в качестве признаков температуру, динамику кровяного давления, состав крови, кардиограмму т. п., системы, предназначенные для распознавания военной техники вероятного противника; встроенные системы мониторинга и управления сложным технологическим оборудованием и т. д.
Сложные системы по способу получения информации о признаках распознаваемых объектов или явлений можно подразделить на одноуровневые и многоуровневые. В одноуровневых системах информацию о признаках распознаваемых объектов получают в результате непосредственной обработки прямых измерений используемых технических средств (датчики перемещений, температуры, давления и т. д.).
В многоуровневых системах информацию о признаках получают на основе косвенных измерений, для которых используются специализированные локальные распознающие системы. Признаки, полученные от использования данных систем, называются первичными или признаками первого уровня. Они используются распознающими устройствами второго уровня в качестве исходной информации для получения признаков второго уровня. Признаки второго уровня, в свою очередь, используются для получения признаков третьего уровня и т. д. К последней группе относятся признаки, непосредственно используемые в процессе распознавания, т. е. признаки, входящие в рабочий словарь признаков системы распознавания.
Если классифицировать системы распознаванию по объему и способу использования первоначальной априорной информации об объектах, то как простые, так и сложные системы можно разделить на системы без обучения, обучающиеся и самообучающиеся.
Системы без обучения. В этих системах первоначальной априорной информации достаточно для того, чтобы в соответствии с выбранным принципом классификации разделить все множество состояний объектов на классы, составить словарь признаков и на основе непосредственной обработки исходных данных описать каждый класс объектов на языке этих признаков.
Обучающиеся системы. В этих системах первоначальной априорной информации достаточно лишь для того, чтобы в соответствии с заданным принципом классификации разделить все множество состояния объектов на классы и составить словарь признаков. Но этой информации недостаточно для описания самих классов на языке признаков. Но на основе исходной информации можно сформулировать обучающие последовательности, с помощью которых можно организовать процесс обучения. Цель обучения -- найти разделяющие функции путем многократного предъявления системе распознавания различных наборов данных, описывающих состояния исследуемых объектов, с указанием классов к которым эти данные принадлежат. После обучения систему распознавания необходимо проверить (проэкзаменовать), корректируя полученные результаты, до тех пор, пока количество ошибок в среднем не достигнет необходимого уровня.
Самообучающиеся системы. В этих системах первоначальной априорной информации достаточно, лишь для определения словаря признаков, но недостаточно для проведения классификации. На стадии обучения системы ей предъявляют исходную совокупность состояний объектов, заданных значениями своих признаков, но из-за ограниченного объема первоначальной информации система не получает указаний о том, к какому классу принадлежат исходные наборы признаков. Эти указания заменяются набором правил в соответствии с которыми, на стадии самообучения система распознавания сама вырабатывает набор решающих правил и классификацию, которая, может отличаться от общепринятой и в дальнейшем ее придерживаться.
Системы с обучением или с самообучением получают недостаточную априорную информацию в процессе обучения или самообучения, т.е. цель обучения или самообучения получить такое количество информации, которое достаточно для функционирования системы распознавания.
В настоящее время получили широкое распространение обучающиеся и самообучающиеся системы распознавания на основе нейронных сетей, хорошо зарекомендовавшие себя в условиях отсутствия полной первоначальной априорной информации.
Если классифицировать системы по характеру признаков, характеризующих объекты и явления, то можно системы распознавания подразделить на логические, вероятностные, детерминированные, структурные, комбинированные.
В логических системах для построения алгоритмов распознавания используются логические методы распознавания, основанные на дискретном анализе и булевой алгебре. Применение логических методов распознавания предусматривает наличие в описании объекта формализованных логических связей, в которых переменные - логические признаки распознаваемых объектов или их состояний, а неизвестные величины -- классы, к которым эти объекты (состояния) относятся.
Вероятностные системы, в которых используются вероятностные методы распознавания, основанные на теории статистических решений. Применение вероятностных методов распознавания предусматривает наличие вероятностных зависимостей между признаками распознаваемых объектов и классами, к которым эти объекты относятся.
Детерминированные системы Ї это системы с применением детерминированных методов распознавания, которые предусматривают наличие координат эталонов классов в признаковом пространстве, либо координат объектов, принадлежащих к соответствующим классам.
Комбинированные системы Ї это системы, которые для построения алгоритмов используют специальный разработанный метод вычисления оценок, который называется АВО - алгоритм вычисления оценок. При этом используются таблицы, где содержатся объекты, принадлежащие соответствующим классам, а также значения признаков, которыми характеризуются эти объекты.
Структурные системы Ї это системы, использующие структурные методы распознавания, использование которых требует наличие совокупностей предложений, описывающих все множество объектов, принадлежащих всем класса алфавита классов системы распознавания.
Построение и функционирование систем распознавания связано с накоплением и анализом больших объемов априорной информации. Для диагностики полиграфического оборудования могут быть использованы в зависимости от сложности поставленных задач, как простые и сложные системы распознавания без обучения, так и системы с обучением.
Лекция № 4. ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ МОДЕЛИРОВАНИЯ В ПОЛИГРАФИИ
4.1 Задачи искусственных нейронных сетей
Искусственные нейронные сети (ИНС) получают все большее распространение. В последние годы разработки в этой области представляют большой интерес не только для теоретиков, работающих в области искусственного интеллекта, но и для инженеров. Областей применения ИНС множество.
Нейросетевой подход показал свою эффективность при решении следующих задач в полиграфии:
1. Распознавание образов. Задача состоит в отнесении входного набора данных, представляющего распознаваемый объект к одному из заранее известных классов. В число этих задач входит распознавание рукописных и печатных символов при оптическом их вводе в ЭВМ, техническая диагностика и другие.
2. Кластеризация данных. Задача состоит в группировке входных данных по присущему им сходству. Алгоритм определения признаков сходства данных (определение расстояния между векторами, вычисление коэффициента корреляции и другие способы обучения) закладывается в нейросеть при ее построении и обучении. Сеть кластеризует данные на заранее неустановленное число кластеров. Наиболее известные применения кластеризации, связаны со сжатием данных, анализом данных и поиском в них закономерностей.
3. Аппроксимация функций. Имеется набор экспериментальных данных, представляющий значение Yi неизвестной функции от аргумента Хi, где i = l, ..., n. Требуется найти аппроксимирующую функцию, удовлетворяющую некоторым критериям. Эта задача актуальна при моделировании сложных систем и создании систем управления сложными динамическими объектами.
Предсказания. Имеется набор Y(t1), Y(t2), …, Y(tn). Значение Y представляет поведение системы в моменты времени t1, t2, ..., tn. Требуется по предыдущему поведению системы предсказать ее поведение в момент времени tn+1. Эта задача актуальна для технической диагностики, для систем принятия решений.
Особенности построения нейронных сетей
Основу каждой нейронной сети составляют относительно простые, в большинстве случаев, однотипные, элементы, имитирующие работу нейронов мозга.
Таким образом, нейронная сеть Ї это сеть с конечным числом слоев из однотипных элементов - аналогов нейронов человеческого мозга с различными типами связей между слоями. При этом число элементов в слоях выбирается исходя из сложности решаемой задачи, а число слоев берется как можно меньше для сокращения времени вычислений.
Математическая модель нейрона выглядит следующим образом (рис. 4.1):
Рис. 4.1. Математическая модель нейрона
Биологический нейрон моделируется как устройство, имеющее несколько входов (дендриты) и один выход (аксон). Нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов -- одновременных входных связей, соединенных с выходами других нейронов, а также имеет аксон - выходную связь, с которой сигнал поступает на синапсы следующих нейронов.
Каждому входу ставится в соответствие некоторый весовой коэффициент wi, характеризующий пропускную способность канала и определяющий степень влияния сигнала с этого входа на сигнал на выходе. Входные сигналы умножаются на соответствующие весовые коэффициенты, все произведения суммируются, определяя уровень активации нейрона. Нейрон осуществляет взвешенное суммирование входных воздействий и далее это значение является аргументом активационной функции нейрона. В зависимости от конкретной реализации, обрабатываемые нейроном сигналы, могут быть аналоговыми или цифровыми.
Здесь множество входных сигналов обозначено вектором X. Совокупность весовых коэффициентов, обозначена вектором W. Нейрон состоит из взвешенного сумматора и нелинейного элемента. Сумматор (аналог биологического нейрона) складывает взвешенные входы алгебраически.
,
где xi - входные сигналы X; wi - весовые коэффициенты.
Выход нейрона является функцией его состояния Y=F(С), где F - нелинейная функция, называемая функцией активации.
4.2 Основные функции активации
Функция активации определяет выходной сигнал нейрона. Если функция активации одна и та же для всех нейронов сети, сеть называют однородной (гомогенной). Если же активационная функция зависит еще от одного или нескольких параметров значения, которых меняются от нейрона к нейрону, то сеть называют неоднородной (гетерогенной). На рис. 4.2 представлены различные виды активационных функций.
Рис. 4.2. Типы активных функций: а) функция единичного скачка; б) линейный порог (гистерезис); в) гиперболический тангенс; г) сигмоид.
Рассмотрим три основных типа функций активации:
Функция единичного скачка или пороговая функция, описывается следующим выражением:
В литературе эта функция обычно называется функцией Хевисаида. При использовании этой функции выходной сигнал нейрона принимает значение 1, если сигнал на выходе сумматора неотрицательный; и 0 - в противном случае.
Кусочно-линейная функция описывается выражением
Эту функцию активации можно рассматривать как аппроксимацию нелинейного усилителя.
3. Сигмоидальная функция (т.е. функция S-образного вида). Одной из наиболее распространенных сигмоидальных функций является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (рис. 4.2, г).
,
где a - параметр наклона сигмоидальной функции.
При уменьшении a сигмоид становится более пологим в пределе, при a = 0 он вырождается в горизонтальную линию на уровне 0,5. При увеличении a, сигмоид приближается по внешнему виду к функции единичного скачка с порогом Т в точке х = 0. Как видно из представленного выражения выходные значения нейрона лежат в диапазоне (0, 1). Одно из ценных свойств сигмоидной функции - простое выражение для ее производной.
Подобные документы
Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.
дипломная работа [2,3 M], добавлен 13.10.2015Выбор наиболее эффективного метода поиска экстремума для функции. Оценка погрешности определения точки минимума. Проверка унимодальности уравнения аналитическим методом и по графику. Сравнение алгоритмов по количеству обращений к функции и по точности.
контрольная работа [909,0 K], добавлен 14.08.2019Моделирование бизнес-процессов как средство поиска путей оптимизации деятельности компании. Методология SADT (структурный анализ и проектирование), семейство стандартов IDEF и алгоритмические языки в основе методологий моделирования бизнес-процессов.
реферат [21,7 K], добавлен 14.12.2011Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Методика разработки программной модели числового метода поиска экстремума функции двух переменных, конструирование ввода исходных данных и вывода с сохранением. Исследование ограничений на функцию, обусловленные методом поиска и средствами моделирования.
курсовая работа [195,4 K], добавлен 17.04.2010Использование библиотеки готовых компонентов как основы процесса построения моделей организационных систем. Характеристика качественных методов принятия решений. Применение порядковой классификации в процессе UFO-моделирования систем телемеханики.
магистерская работа [732,7 K], добавлен 26.04.2011Эффективность построения и использования корпоративных информационных систем. Описание программных систем имитационного моделирования сетей. Обозначения и интерфейс программы "Net-Emul". Использование маршрутизатора (роутера) как сетевого устройства.
контрольная работа [1,9 M], добавлен 22.12.2011Преобразование "естественной" информации в дискретную форму. Анализ процессов дискретизации и квантования изображения. Векторные и растровые процедуры, применяемые в компьютерной графике. Законы математического описания цвета и виды цветовых моделей.
презентация [208,4 K], добавлен 29.01.2016Изучение аналитических и численных методов поиска одномерного и многомерного безусловного экстремума. Решение поставленной задачи с помощью Mathcad и Excel. Реализация стандартных алгоритмов безусловной оптимизации средствами языка программирования С++.
курсовая работа [488,5 K], добавлен 21.10.2012Программирование численных методов одномерной оптимизации. Решение одномерных задач оптимизации методами последовательного поиска. Градиентные методы и их применение для оптимизации на ЭВМ математических моделей объектов. Методы нулевого порядка.
контрольная работа [257,9 K], добавлен 15.01.2009