Метод Байеса
Недостатки метода Байеса среди методов технической диагностики. Условия независимости признаков при наличии корреляционных связей между ними. Детерминистская логика установления диагноза в вероятностной логике. Процесс принятия решения в методе Байеса.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 20.03.2016 |
Размер файла | 52,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
Метод Байеса относится к статистическим методам распознавания, основное преимущество которых состоит в возможности одновременного учета признаков различной физической природы. Это связано с тем, что все признаки характеризуются безразмерными величинами - вероятностями их появления при различных состояниях системы.
Метод Байеса благодаря своей простоте и эффективности занимает особое место среди методов технической диагностики, хотя имеет и недостатки, например большой объем предварительной информации, «угнетение» редко встречающихся диагнозов и др. Однако в случаях, когда объем статистической информации позволяет применить метод Байеса, его целесообразно использовать как один из наиболее надежных и эффективных методов.
1. Основы метода Байеса
Метод основан на формуле Байеса (формуле вероятности гипотез).
Если имеется диагноз Di и простой признак kj, встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния Di и признака kj), определяется по формуле:
P (Dikj) = P (Di) P (kj/Di) = P (kj) P (Di/kj). (1.1.)
Из этого равенства вытекает формула Байеса:
P(Di/kj) = P(Di) P(ki/Di)/P(kj) (1.2.)
Очень важно определить точный смысл всех входящих в эту формулу величин.
P(Di) --вероятность диагноза Di, определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у Ni объектов имелось состояние Di, то
P(Di) = Ni/N. (1.3.)
P (kj/Di) --вероятность появления признака kj у объектов с состоянием Di.
Если среди Ni объектов, имеющих диагноз Di, у Nij проявился признак kj, то байес корреляционный вероятностный
P(kj/Di) = Nij/Ni. (1.4.)
P(kj) --вероятность появления признака kj во всех объектах независимо от состояния (диагноза)объекта. Пусть из общего числа N объектов признак kj был обнаружен у Nj объектов, тогда
P(kj) = Nj/N. (1.5.)
Для установления диагноза специальное вычисление P(kj) не требуется. Как будет ясно из дальнейшего, значения P(Di)и P (kj/Di), известные для всех возможных состояний, определяют величину P(kj).
В равенстве P (Di/kj)--вероятность диагноза Di после того, как стало известно наличие у рассматриваемого объекта признака kj(апостериорная вероятность диагноза).
2. Обобщенная формула Байеса
Эта формула относится к случаю, когда обследование проводится по комплексу признаков К, включающему признаки k1,k2, ..., kv. Каждый из признаков kj имеет mj разрядов (kjl, kj2, ..., kjs, ..., ). В результате обследования становится известной реализация признака
kj*= kjs (1.5.)
и всего комплекса признаков K*. Индекс *, как и раньше, означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид
P(Di/К*)= P(Di)P(К*/Di)/P(К*)(i = 1, 2, ..., n), (1.6.)
где P (Di/К*) --вероятность диагноза Di после того, как стали известны результаты обследования по комплексу признаков К,P (Di) --предварительная вероятность диагноза Di (по предшествующей статистике).
Формула (1.6.) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому
(1.7.)
В практических задачах нередко допускается возможность существования нескольких состояний А1, ….., Аr, причем некоторые из них могут встретиться в комбинации друг с другом.
P(К*/Di) = P(k1*/Di)P (k2*/k1*Di)...P (kv*/kl*...k*v-1 Di), (1.8.)
где kj* =kjs --разряд признака, выявившийся в результате обследования. Для диагностически независимых признаков
P (К*/Di) = P (k1*/Di) P (k2*/Di)... P (kv*/Di). (1.9.)
В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.
Вероятность появления комплекса признаков К*
P(К*)= P(Ds)P(К*/Ds).(1.10.)
Обобщенная формула Байеса может быть записана так:
P(Di/K*) (1.11.)
где P (К*/Di)определяется равенством (1.8.) или (1.9.). Из соотношения (1.11.) вытекает
P(Di/К*)=l, (1.12.)
что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна. Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-гo диагноза и данной реализации комплекса признаков
P(DiК*) = P(Di)P(К*/Di) (1.13.)
и затем апостериорную вероятность диагноза
P (Di/К*) = P(DiК*)/P(DsК*). (1.14.)
Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (1.11.), так как выражение (1.9.) содержит произведения малых величин.
Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза Dp, то этот комплекс не встречается при других диагнозах:
Тогда, в силу равенства (1.11.)
(1.14.)
Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть -- непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.
3. Диагностическая матрица
Для определения вероятности диагнозов по методу Байеса необходимо составить диагностическую матрицу (табл. 1.1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах.
Таблица 1.1
Диагностическая матрица в методе Байеса
ДиагнозDi |
Признак kj |
|||||||||
k1 |
k2 |
|||||||||
P(k11/Di) |
P(k12/Di) |
P(k21/Di) |
P(k22/Di) |
P(k23/Di) |
P(k24/Di) |
P(k31/Di) |
P(k32/Di) |
|||
D1 |
0,8 |
0,1 |
0,1 |
0,6 |
0,2 |
0,2 |
0,8 |
0,3 |
||
D2 |
0,1 |
0,2 |
0,3 |
0,7 |
0,1 |
0,9 |
0,1 |
Если признаки двухразрядные (простые признаки «да -- нет»), то в таблице достаточно указать вероятность появления признака Р (ki/Di). Вероятность отсутствия признака Р (/D,-) = 1 - Р (ki/Di).
Однако более удобно использовать единообразную форму, полагая, например, для двухразрядного признака Р (kj/Di) = Р (ki1/Di); Р (/D,) = Р (ki2 /Di).
Отметим, что P(kjs/Di) = 1, где т, -- число разрядов признака kj. Сумма вероятностей всех возможных реализаций признака равна единице.
В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения P(kjs/Di), но и следующие величины: N -- общее число объектов, использованных для составления диагностической матрицы; Ni -- число объектов с диагнозом Di; Nij -- число объектов с диагнозом Di, обследованных по признаку kj. Если поступает новый объект с диагнозом Dм, то проводится корректировка прежних априорных вероятностей диагнозов.
Далее вводятся поправки к вероятностям признаков. Пусть у нового объекта с диагнозом Dм выявлен разряд r признака kj. Тогда для дальнейшей диагностики принимаются новые значения вероятности интервалов признака kj при диагнозе Dм:
(1.16.)
Условные вероятности признаков при других диагнозах корректировки не требуют.
Заключение
В методе Байеса объект с комплексом признаков К* относится к диагнозу с наибольшей (апостериорной) вероятностью
K*Di, если P(Di/K*) > P(Dj/K*) (j = 1, 2,..., n; i ? j). (1.17.)
Символ , применяемый в функциональном анализе, означает принадлежность множеству. Условие (1.17.) указывает, что объект, обладающий данной реализацией комплекса признаков К* или, короче, реализация К* принадлежит диагнозу (состоянию) Di. Правило (1.17.) обычно уточняется введением порогового значения для вероятности диагноза:
P (Di/K*) ? Pi, (1.18.)
где Pi. -- заранее выбранный уровень распознавания для диагноза Di. При этом вероятность ближайшего конкурирующего диагноза не выше 1 - Pi. Обычно принимается Pi ? 0,9. При условии
P(Di/K*)<Pi (1.19.)
решение о диагнозе не принимается (отказ от распознавания) и требуется поступление дополнительной информации.
Процесс принятия решения в методе Байеса при расчете на ЭВМ происходит достаточно быстро. Например, постановка диагноза для 24 состояний при 80 многоразрядных признаках занимает на ЭВМ с быстродействием 10 - 20 тысяч операций в секунду всего несколько минут.
Как указывалось, методу Байеса присущи некоторые недостатки, например погрешности при распознавании редких диагнозов. При практических расчетах целесообразно провести диагностику и для случая равновероятностных диагнозов, положив
P(Di) = l / n (1.20.)
Тогда наибольшим значением апостериорной вероятности будет обладать диагноз Di, для которого Р (K*/Di) максимальна:
K*Di, если P(K*/Di) > P(K*/Dj) (j = 1, 2,..., n; i ? j). (1.21.)
Иными словами, устанавливается диагноз Di если данная совокупность признаков чаще встречается при диагнозе Di, чем при других диагнозах. Такое решающее правило соответствует методу максимального правдоподобия. Из предыдущего вытекает, что этот метод является частным случаем метода Байеса при одинаковых априорных вероятностях диагнозов. В методе максимального правдоподобия «частые» и «редкие» диагнозы равноправны.
Список использованных источников
1. Горелик, А. Л. Методы распознавания [Текст] : учеб. пособие для вузов / А. Л. Горелик, В. А. Скрипкин. - М. : Высш. шк., 2004. - 261 с.
2. Сапожников, В. В. Основы технической диагностики [Текст] : учеб. пособие / В. В. Сапожников, Вл. В. Сапожников. - М. : Маршрут, 2004. - 318 с.
3. Сердаков, А. С. Автоматический контроль и техническая диагностика [Текст] / А. С. Сердаков. - Киев : Техника, 1971. - 244 с.
4. Стецюк. А. Е. «Основы технической диагностики. Теория распознавания» : учеб. пособие / А. Е. Стецюк, Я. Ю. Бобровников. - Хабаровск : Изд-во ДВГУПС, 2012. - 69 с.
Размещено на Allbest.ru
Подобные документы
Изучение наиболее типичных алгоритмов решения задач, имеющих вероятностный характер. Ознакомление с элементами комбинаторики, теорией урн, формулой Байеса, способами нахождения дискретных, непрерывных случайных величин. Рассмотрение основ алгебры событий.
методичка [543,1 K], добавлен 06.05.2010Определение и оценка вероятности наступления заданного события. Методика решения задачи, с использованием теоремы сложения и умножения, формулы полной вероятности или Байеса. Применение схемы Бернулли при решении задач. Расчет квадратического отклонения.
практическая работа [55,0 K], добавлен 23.08.2015Статистическое, аксиоматическое и классическое определение вероятности. Дискретные случайные величины. Предельные теоремы Лапласа и Пуассона. Функция распределения вероятностей для многомерных случайных величин. Формула Байеса. Точечная оценка дисперсии.
шпаргалка [328,7 K], добавлен 04.05.2015Вычисление вероятности непогашения кредита юридическим и физическим лицом, с помощью формулы Байеса. Расчет выборочной дисперсии, его методика, основные этапы. Определение вероятности выпадания белого шара из трех, взятых наудачу, обоснование результата.
контрольная работа [419,7 K], добавлен 11.02.2014Применение формул и законов теории вероятности при решении задач. Формула Байеса, позволяющая определить вероятность какого-либо события при условии, что произошло другое статистически взаимозависимое с ним событие. Центральная предельная теорема.
курсовая работа [460,7 K], добавлен 04.11.2015Опыт со случайным исходом. Статистическая устойчивость. Понятие вероятности. Алгебра событий. Принцип двойственности для событий. Условные вероятности. Формулы сложения и умножения вероятностей. Формула Байеса. Пространство элементарных событий.
реферат [402,7 K], добавлен 03.12.2007Определение вероятности выпадения не менее 4-х очков на игральной кости при кидании ее один раз. Определение вероятности изготовления детали (если наудачу взятая сборщиком деталь оказалась отличного качества) первым заводом из используя формулу Байеса.
контрольная работа [11,3 K], добавлен 29.05.2012Показатели безотказности как показатели надежности невосстанавливаемых объектов. Классическое и геометрическое определение вероятности. Частота случайного события и "статистическое определение" вероятности. Теоремы сложения и умножения вероятностей.
курсовая работа [328,1 K], добавлен 18.11.2011Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.
контрольная работа [33,8 K], добавлен 13.12.2010Математические модели явлений или процессов. Сходимость метода простой итерации. Апостериорная оценка погрешности. Метод вращений линейных систем. Контроль точности и приближенного решения в рамках прямого метода. Метод релаксации и метод Гаусса.
курсовая работа [96,7 K], добавлен 13.04.2011