Главная Коллекция "Otherreferats" Математика Метод Байеса

Метод Байеса

Недостатки метода Байеса среди методов технической диагностики. Условия независимости признаков при наличии корреляционных связей между ними. Детерминистская логика установления диагноза в вероятностной логике. Процесс принятия решения в методе Байеса.

Рубрика	Математика
Вид	контрольная работа
Язык	русский
Дата добавления	20.03.2016
Размер файла	52,4 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Метод Байеса относится к статистическим методам распознавания, основное преимущество которых состоит в возможности одновременного учета признаков различной физической природы. Это связано с тем, что все признаки характеризуются безразмерными величинами - вероятностями их появления при различных состояниях системы.

Метод Байеса благодаря своей простоте и эффективности занимает особое место среди методов технической диагностики, хотя имеет и недостатки, например большой объем предварительной информации, «угнетение» редко встречающихся диагнозов и др. Однако в случаях, когда объем статистической информации позволяет применить метод Байеса, его целесообразно использовать как один из наиболее надежных и эффективных методов.

1. Основы метода Байеса

Метод основан на формуле Байеса (формуле вероятности гипотез).

Если имеется диагноз D_i и простой признак k_j, встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния D_i и признака k_j), определяется по формуле:

P (D_ik_j) = P (D_i) P (k_j/D_i) = P (k_j) P (D_i/k_j). (1.1.)

Из этого равенства вытекает формула Байеса:

P(D_i/k_j) = P(D_i) P(k_i/D_i)/P(k_j) (1.2.)

Очень важно определить точный смысл всех входящих в эту формулу величин.

P(D_i) --вероятность диагноза D_i, определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у N_i объектов имелось состояние D_i, то

P(D_i) = N_i/N. (1.3.)

P (k_j/D_i) --вероятность появления признака k_j у объектов с состоянием D_i.

Если среди N_i объектов, имеющих диагноз D_i, у N_ij проявился признак k_j, то байес корреляционный вероятностный

P(k_j/D_i) = N_ij/N_i. (1.4.)

P(k_j) --вероятность появления признака k_j во всех объектах независимо от состояния (диагноза)объекта. Пусть из общего числа N объектов признак k_j был обнаружен у N_j объектов, тогда

P(k_j) = N_j/N. (1.5.)

Для установления диагноза специальное вычисление P(kj) не требуется. Как будет ясно из дальнейшего, значения P(D_i)и P (k_j/D_i), известные для всех возможных состояний, определяют величину P(k_j).

В равенстве P (D_i/k_j)--вероятность диагноза D_iпосле того, как стало известно наличие у рассматриваемого объекта признака k_j(апостериорная вероятность диагноза).

2. Обобщенная формула Байеса

Эта формула относится к случаю, когда обследование проводится по комплексу признаков К, включающему признаки k₁,k₂, ..., k_v. Каждый из признаков k_jимеет m_j разрядов (k_j_l, k_j₂, ..., k_js, ..., ). В результате обследования становится известной реализация признака

k_j^*= k_js(1.5.)

и всего комплекса признаков K*. Индекс *, как и раньше, означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид

P(D_i/К*)= P(D_i)P(К*/D_i)/P(К*)(i = 1, 2, ..., n), (1.6.)

где P (D_i/К*) --вероятность диагноза D_i после того, как стали известны результаты обследования по комплексу признаков К,P (D_i) --предварительная вероятность диагноза D_i (по предшествующей статистике).

Формула (1.6.) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому

(1.7.)

В практических задачах нередко допускается возможность существования нескольких состояний А1, ….., Аr, причем некоторые из них могут встретиться в комбинации друг с другом.

P(К*/D_i) = P(k₁*/D_i)P (k₂*/k₁*D_i)...P (k_v*/k_l*...k*_v-₁ D_i), (1.8.)

где k_j* =k_js --разряд признака, выявившийся в результате обследования. Для диагностически независимых признаков

P (К*/D_i) = P (k₁*/D_i) P (k₂*/D_i)... P (k_v*/D_i). (1.9.)

В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.

Вероятность появления комплекса признаков К*

P(К*)= P(D_s)P(К*/D_s).(1.10.)

Обобщенная формула Байеса может быть записана так:

P(D_i/K*) (1.11.)

где P (К*/D_i)определяется равенством (1.8.) или (1.9.). Из соотношения (1.11.) вытекает

P(D_i/К*)=l, (1.12.)

что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна. Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-гo диагноза и данной реализации комплекса признаков

P(D_iК*) = P(D_i)P(К*/D_i) (1.13.)

и затем апостериорную вероятность диагноза

P (D_i/К*) = P(D_iК*)/P(D_sК*). (1.14.)

Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (1.11.), так как выражение (1.9.) содержит произведения малых величин.

Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза D_p, то этот комплекс не встречается при других диагнозах:

Тогда, в силу равенства (1.11.)

(1.14.)

Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть -- непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.

3. Диагностическая матрица

Для определения вероятности диагнозов по методу Байеса необходимо составить диагностическую матрицу (табл. 1.1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах.

Таблица 1.1

Диагностическая матрица в методе Байеса

ДиагнозD_i	Признак k_j
k₁	k₂
P(k₁₁/D_i)	P(k₁₂/D_i)	P(k₂₁/D_i)	P(k₂₂/D_i)	P(k₂₃/D_i)	P(k₂₄/D_i)	P(k₃₁/D_i)	P(k₃₂/D_i)
D₁	0,8		0,1	0,1	0,6	0,2	0,2	0,8	0,3
D₂	0,1	0,2			0,3	0,7	0,1	0,9	0,1

Если признаки двухразрядные (простые признаки «да -- нет»), то в таблице достаточно указать вероятность появления признака Р (k_i/D_i). Вероятность отсутствия признака Р (/D,-) = 1 - Р (k_i/D_i).

Однако более удобно использовать единообразную форму, полагая, например, для двухразрядного признака Р (k_j/D_i) = Р (k_i₁/D_i); Р (/D,) = Р (k_i₂/D_i).

Отметим, что P(k_js/Di) = 1, где т, -- число разрядов признака k_j. Сумма вероятностей всех возможных реализаций признака равна единице.

В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения P(k_js/Di), но и следующие величины: N -- общее число объектов, использованных для составления диагностической матрицы; N_i -- число объектов с диагнозом D_i; N_ij -- число объектов с диагнозом D_i, обследованных по признаку k_j. Если поступает новый объект с диагнозом D_м, то проводится корректировка прежних априорных вероятностей диагнозов.

Далее вводятся поправки к вероятностям признаков. Пусть у нового объекта с диагнозом D_м выявлен разряд r признака k_j. Тогда для дальнейшей диагностики принимаются новые значения вероятности интервалов признака k_j при диагнозе D_м:

(1.16.)

Условные вероятности признаков при других диагнозах корректировки не требуют.

Заключение

В методе Байеса объект с комплексом признаков К* относится к диагнозу с наибольшей (апостериорной) вероятностью

K*D_i, если P(D_i/K*) > P(D_j/K*) (j = 1, 2,..., n; i ? j). (1.17.)

Символ , применяемый в функциональном анализе, означает принадлежность множеству. Условие (1.17.) указывает, что объект, обладающий данной реализацией комплекса признаков К* или, короче, реализация К* принадлежит диагнозу (состоянию) D_i. Правило (1.17.) обычно уточняется введением порогового значения для вероятности диагноза:

P (D_i/K*) ? P_i, (1.18.)

где P_i. -- заранее выбранный уровень распознавания для диагноза D_i. При этом вероятность ближайшего конкурирующего диагноза не выше 1 - P_i. Обычно принимается P_i ? 0,9. При условии

P(D_i/K*)<P_i (1.19.)

решение о диагнозе не принимается (отказ от распознавания) и требуется поступление дополнительной информации.

Процесс принятия решения в методе Байеса при расчете на ЭВМ происходит достаточно быстро. Например, постановка диагноза для 24 состояний при 80 многоразрядных признаках занимает на ЭВМ с быстродействием 10 - 20 тысяч операций в секунду всего несколько минут.

Как указывалось, методу Байеса присущи некоторые недостатки, например погрешности при распознавании редких диагнозов. При практических расчетах целесообразно провести диагностику и для случая равновероятностных диагнозов, положив

P(D_i) = l / n (1.20.)

Тогда наибольшим значением апостериорной вероятности будет обладать диагноз D_i, для которого Р (K*/D_i) максимальна:

K*D_i, если P(K*/D_i) > P(K*/D_j) (j = 1, 2,..., n; i ? j). (1.21.)

Иными словами, устанавливается диагноз D_i если данная совокупность признаков чаще встречается при диагнозе D_i, чем при других диагнозах. Такое решающее правило соответствует методу максимального правдоподобия. Из предыдущего вытекает, что этот метод является частным случаем метода Байеса при одинаковых априорных вероятностях диагнозов. В методе максимального правдоподобия «частые» и «редкие» диагнозы равноправны.

Список использованных источников

1. Горелик, А. Л. Методы распознавания [Текст] : учеб. пособие для вузов / А. Л. Горелик, В. А. Скрипкин. - М. : Высш. шк., 2004. - 261 с.

2. Сапожников, В. В. Основы технической диагностики [Текст] : учеб. пособие / В. В. Сапожников, Вл. В. Сапожников. - М. : Маршрут, 2004. - 318 с.

3. Сердаков, А. С. Автоматический контроль и техническая диагностика [Текст] / А. С. Сердаков. - Киев : Техника, 1971. - 244 с.

4. Стецюк. А. Е. «Основы технической диагностики. Теория распознавания» : учеб. пособие / А. Е. Стецюк, Я. Ю. Бобровников. - Хабаровск : Изд-во ДВГУПС, 2012. - 69 с.

Размещено на Allbest.ru

контрольная работа "Метод Байеса" скачать

Подобные документы

Основы теории вероятности
Изучение наиболее типичных алгоритмов решения задач, имеющих вероятностный характер. Ознакомление с элементами комбинаторики, теорией урн, формулой Байеса, способами нахождения дискретных, непрерывных случайных величин. Рассмотрение основ алгебры событий.

методичка [543,1 K], добавлен 06.05.2010
Элементы теории вероятностей
Определение и оценка вероятности наступления заданного события. Методика решения задачи, с использованием теоремы сложения и умножения, формулы полной вероятности или Байеса. Применение схемы Бернулли при решении задач. Расчет квадратического отклонения.

практическая работа [55,0 K], добавлен 23.08.2015
Теория вероятностей и математическая статистика
Статистическое, аксиоматическое и классическое определение вероятности. Дискретные случайные величины. Предельные теоремы Лапласа и Пуассона. Функция распределения вероятностей для многомерных случайных величин. Формула Байеса. Точечная оценка дисперсии.

шпаргалка [328,7 K], добавлен 04.05.2015
Определения вероятностей
Вычисление вероятности непогашения кредита юридическим и физическим лицом, с помощью формулы Байеса. Расчет выборочной дисперсии, его методика, основные этапы. Определение вероятности выпадания белого шара из трех, взятых наудачу, обоснование результата.

контрольная работа [419,7 K], добавлен 11.02.2014
Теория вероятностей
Применение формул и законов теории вероятности при решении задач. Формула Байеса, позволяющая определить вероятность какого-либо события при условии, что произошло другое статистически взаимозависимое с ним событие. Центральная предельная теорема.

курсовая работа [460,7 K], добавлен 04.11.2015
Случайные события
Опыт со случайным исходом. Статистическая устойчивость. Понятие вероятности. Алгебра событий. Принцип двойственности для событий. Условные вероятности. Формулы сложения и умножения вероятностей. Формула Байеса. Пространство элементарных событий.

реферат [402,7 K], добавлен 03.12.2007
Определение вероятности события
Определение вероятности выпадения не менее 4-х очков на игральной кости при кидании ее один раз. Определение вероятности изготовления детали (если наудачу взятая сборщиком деталь оказалась отличного качества) первым заводом из используя формулу Байеса.

контрольная работа [11,3 K], добавлен 29.05.2012
Формула полной вероятности. Теорема гипотез (формула Байеса)
Показатели безотказности как показатели надежности невосстанавливаемых объектов. Классическое и геометрическое определение вероятности. Частота случайного события и "статистическое определение" вероятности. Теоремы сложения и умножения вероятностей.

курсовая работа [328,1 K], добавлен 18.11.2011
Теория вероятности
Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.

контрольная работа [33,8 K], добавлен 13.12.2010
Метод вращений решения СЛАУ
Математические модели явлений или процессов. Сходимость метода простой итерации. Апостериорная оценка погрешности. Метод вращений линейных систем. Контроль точности и приближенного решения в рамках прямого метода. Метод релаксации и метод Гаусса.

курсовая работа [96,7 K], добавлен 13.04.2011

Другие документы, подобные "Метод Байеса"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.