Нечёткие вероятностные распределения данных медицинской статистики

Рассмотрение варианта перехода от классической математической статистики к нечётко-логической интерпретации данных медицинской статистики. Плотность распределения частоты заболеваний. Анализ функции ошибки, с выделением интервалов правдоподобия.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 24.07.2018
Размер файла 99,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Нечёткие вероятностные распределения данных медицинской статистики

Абдулаева Зинаида Игоревна

В статье рассматривается вариант перехода от классической математической статистики к нечётко-логической интерпретации данных медицинской статистики.

Похожие материалы

· Применение нечётких множеств и мягких вычислений в медицинской статистике

· Спортивный травматизм: причины и профилактика

· Сравнение языков программирования на примере сортировки массива

· Атлетическая гимнастика как одно из средств оздоровительной физической культуры

· Проблема здорового образа жизни в современном обществе

В статье [1] были оговорены условия, когда традиционные методы медицинской статистики не могут быть применены безоговорочно (когда нет массовости или однородности данных). В этом случае, мы можем называть полученную выборку из генеральной совокупности квазистатистикой, по аналогии с тем, как это сделано в [2].

Характерным примером нарушения классического вида нормального распределения являются "толстые хвосты", когда значительный объём выборки прижимается к левой и правой границам рассматриваемого интервала определения параметра. Такие "выплески" по данным могут свидетельствовать о возникновении анормальных условий для измерения. Например, если оценивать заболеваемость гриппом по Санкт-Петербургу в сентябре (по данным обращений в поликлиники города), от года к году, то ясно, что месяц на месяц не приходится, и будут сформированы кластеры "очень хорошего сентября", когда простудных заболеваний очень мало, и "очень плохого сентября", когда заболеваемость приближается к эпидемическому порогу и переходит через него. С точки зрения плотности распределения частоты заболеваний, это отвечает "толстым хвостам", деформирующим исходное нормальное распределение. Если факт "толстых хвостов" подтверждается, то классического нормального распределения нет, и работа с этим распределением в дальнейшем оказывается бесполезной.

Другое дело, если не отказываться от гипотезы "нормальности", но больше говорить о "размытой нормальности" или "нормальности с оговорками". В этом случае, мы имеем дело с размытыми параметрами распределения: размытым матожиданием m и размытым среднеквадратическим отклонением (СКО) s. Размытие параметров может проходить с применением следующих алгоритмов:

1. анализ экспертных суждений о границах параметров распределения;

2. анализ функции ошибки, с выделением интервалов правдоподобия.

При реализации этих алгоритмов, параметры матожидания и СКО могут приобрести интервальный или треугольный вид, а исходное вероятностное распределение замещается полем распределений с расплывчатыми границами (нечёткой функцией распределения).

Сохранение нормальности распределения, даже при переходе от отдельного распределения к полю распределений, имеет свои выраженные плюсы. Например, сумма или разность нормально распределённых случайных величин также обладает нормальным распределением. То же самое свойство сохраняется при умножении случайной величины на число (в том числе нечёткое). Тем самым, не вызывает методических затруднений агрегирование данных, полученных на разных территориях, за разные периоды времени, и нет нужды объединять полученные отдельные выборки в новую агрегированную выборку, с повторным статистическим анализом; достаточно просто поработать с параметрами исходных распределений (пусть даже нечёткими).

Например, пусть агрегируются две выборки Х 1 и Х 2 с верифицированными нечётко-нормальными распределениями, характеризующимися параметрами (m1, s1) и (m2, s2), при этом m1 = {m1min, m1av, m1max }, m2 = {m2min, m2av, m2max }, s1 = {s1min, s1av, s1max }, s2 = {s2min, s2av, s2max } - треугольные нечёткие числа. Тогда результирующая выборка Х = Х 1 + Х 2 обладает нечётко-нормальным распределением с параметрами:

(1)

Поскольку сумма треугольных чисел - это треугольное число, то матожидание результирующей выборки m также является треугольным числом. Этого уже нельзя сказать об СКО результирующей выборки (исходная треугольность параметров теряется). Чтобы получить вид s, необходимо перейти к сегментным представлениям нечётких чисел и воспользоваться правилами арифметики Дюбуа-Прада. Примем, для определённости: m1 = {10, 12, 14 }, m2 = {20, 25, 30 }, s1 = {4, 5, 6 }, s2 = {8, 10, 12 }. Сразу можно отметить, что m = m1 + m2 ={10, 12, 14 }+{20, 25, 30 } = {10+20, 12+25, 14+30 } = {30, 37, 44}

Что же касается s, то данные по сегментным интервалам принадлежности этого параметра и образующих его параметров s1 и s2 представлены в таблице 1, с использованием формулы (1). Уровни принадлежности a нечётких чисел находятся в диапазоне от 0 до 1, с уровнем дискретизации 0,1. математический статистика медицинский

Таблица 1. Вид нечёткого числа s

a

s1

s2

s

min

max

min

max

min

max

0

4

6

8

12

8.9

13.4

0.1

4.1

5.9

8.2

11.8

9.2

13.2

0.2

4.2

5.8

8.4

11.6

9.4

13.0

0.3

4.3

5.7

8.6

11.4

9.6

12.7

0.4

4.4

5.6

8.8

11.2

9.8

12.5

0.5

4.5

5.5

9

11

10.1

12.3

0.6

4.6

5.4

9.2

10.8

10.3

12.1

0.7

4.7

5.3

9.4

10.6

10.5

11.9

0.8

4.8

5.2

9.6

10.4

10.7

11.6

0.9

4.9

5.1

9.8

10.2

11.0

11.4

1

5

5

10

10

11.2

11.2

Если построить график нечёткого числа s в координатах "s - a", то убеждаемся, что по форме оно очень близко к треугольному виду.

Если вернуться к проблеме "толстых хвостов", то нужно сразу отметить, что она не решается с помощью размытия параметров нормального распределения (так как теряется сам вид нормальности). Здесь было бы целесообразно брать за основу устойчивые распределения класса Леви [3], см. рис. 1, в которых как раз заложено отставание в убывании плотности (относительно нормального случая), по мере удаления параметра от центра к хвостам. Естественно, все привилегии, отвечающие нормальному распределению, в этом случае не работают.

Рисунок 1. Соотношение нормального распределения и распределения Леви

Рассмотрим также вариант, когда выполняется условие s > m, когда обрабатываемая медицинская статистика теряет свойство надёжности. В предельном случае, когда s = Ґ, мы имеем дело с максимальной неопределённостью анализируемого фактора, а распределение переходит в вид винеровского белого шума. Чем сильнее выполняется условие (s > m), тем меньше резонов "цепляться" за нормальное распределение, в попытке приблизить им генеральную совокупность, и тем больше смысла в том, чтобы интерпретировать собранную статистику как нечёткое число, которое может быть построено по результатам обработки соответствующей гистограммы. Наиболее удачной формой интерпретации является кусочно-линейный BL-вид числа (от BL - broken line). Тогда, если Х 1 и Х 2 - это нечёткие числа BL-вида, то Х - тоже нечёткое число BL-вида.

Список литературы

1. Абдулаева З.И. Применение нечётких множеств и мягких вычислений в медицинской статистике/ З.И. Абдулаева НоваИнфо - NovaInfo.Ru (Электронный журнал.) - 2016 г. - № 51; URL: http://novainfo.ru/article/7714

2. Недосекин А.О. Методологические основы моделирования финансовой деятельности с использованием нечетко-множественных описаний. - Диссертация доктора экономических наук / Недосекин А.О. - СПб., СПбГУЭФ, 2004. - 280 с. - Также в режиме доступа: http://www.mirkin.ru/_docs/doctor005.pdf. Дата обращения: 18.09.2016.

3. Леви П. Конкретные проблемы функционального анализа / П. Леви - М.: Главная редакция физико-математической литературы издательства "Наука", 1967. - 512 с.

Размещено на Allbest.ru


Подобные документы

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.

    практическая работа [132,1 K], добавлен 24.05.2013

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.