Гипотеза нормального распределения

Проверка гипотезы нормального распределения концентрации примесей в органическом веществе. Расчет оценок для математического ожидания, среднеквадратического отклонения, коэффициентов асимметрии и эксцесса. Определение эмпирической функции распределения.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 25.02.2012
Размер файла 190,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

СЕВЕРО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ ЗАОЧНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра химической технологии органических веществ

Курсовая работа

БУДЕННОВСК - 2010 г.

1 ИСХОДНЫЕ СТАТИСТИЧЕСКИЕ ДАННЫЕ ДЛЯ ВЫПОЛНЕНИЯ КУРСОВОЙ РАБОТЫ

Требуется проверить гипотезу нормального распределения концентрации (г / л) примесей в органическом веществе по результатам определения в 40 пробах (таблица 1).

Таблица 1 - Данные по содержанию примесей в органическом веществе

Номер пробы

Номер задания

Номер пробы

Номер задания

7

7

1

5,97

21

4,09

2

5,56

22

4,87

3

4,51

23

2,93

4

5,28

24

3,86

5

5,35

25

5,74

6

4,82

26

5,26

7

5,61

27

6,45

8

4,79

28

5,13

9

4,69

29

5,18

10

5,30

30

4,94

11

4,28

31

4,56

12

4,32

32

3,84

13

3,17

33

2,86

14

4,41

34

4,00

15

5,66

35

3,95

16

5,19

36

3,98

17

5,02

37

3,87

18

4,35

38

4,64

19

5,10

39

4,63

20

5,17

40

4,14

На основании данных, приведенных в таблице 1, необходимо:

- вычислить точечные оценки для математического ожидания, среднеквадратического отклонения, коэффициентов асимметрии и эксцесса;

- составить интервальный статистический ряд распределения относительных частот и построить гистограмму и полигон относительных частот;

- найти эмпирическую функцию распределения и построить ее график и график кумуляты.

Исходя из общих представлений о механизме образования СВ Х, а также по виду гистограммы и полигона относительных частот и вычисленным числовым характеристикам необходимо:

- выдвинуть гипотезу о виде распределения СВ Х; записать плотность распределения вероятностей и функцию распределения для выдвинутого гипотетического закона, заменяя параметры закона вычисленными для них оценками;

- по критерию согласия Пирсона проверить соответствие выборочного распределения гипотетическому закону для уровня значимости

- вычислить интервальные оценки для математического ожидания и среднеквадратического отклонения, которые наблюдаются, в доверительных вероятностных интервалах.

2 АЛГОРИТМ ВЫПОЛНЕНИЯ КУРСОВОЙ РАБОТЫ

Анализ непрерывных случайных величин начинается с группировки статистического материала, т. е. разбиения интервала наблюдаемых значений случайных величин Х на k частичных интервалов равной длины и подсчета частот попадания наблюдаемых значений СВ Х в частичные интервалы.

Количество выбираем равным 4 (

Разобьем весь диапазон значений на 4 интервала (разрядов).

Длину частичного интервала определим по формуле:

Шкала интервалов и группировка исходных статистических данных сведены в таблицу 2. В результате получили статистический ряд распределения частот ():

Для построения гистограммы частостей на оси Ox откладываются частичные интервалы, на каждом из них строится прямоугольник, площадь которого равна частости данного частичного интервала. Если частости отнести к серединам частичных интервалов, то полученная замкнутая линия образует полигон частостей. На рисунке 1 изображена гистограмма и полигон частостей.

Таблица 2 - Статистический ряд распределения частостей

интервалы

2;3

3;4

4;5

5;6

6;7

2

7

15

15

1

Для получения статистического ряда частостей разделим частоты mi на объем выборки n.

В результате получим интервальный статистический ряд распределений частостей , который представлен в таблице 3.

Таблица 3 - Интервальный статистический ряд распределений частостей

Интервалы наблюдаемых значений CD X, МПа

2;3

3;4

4;5

5;6

6;7

Частости mi / n

0,05

0,175

0,375

0,375

0,025

Значения эмпирической функции распределения выписаны в последней строке статистического ряда распределения частостей. Запишем значения эмпирической функции распределения в аналитическом виде:

График эмпирической функции изображен на рисунке 1.

Рисунок 1 - Зависимость частостей от Х.

В тех случаях, когда наблюдаемые значения случайной величины задаются многозначными числами и объем выборки достаточно велик (n > 25), вначале целесообразно найти среднее арифметическое по формуле:

Рисунок 2 - Зависимость накопленных частостей от Х.

Ну а затем переходим к вычислению центральных моментов порядка ( = 2, 3, 4).

Все вычисления сводим в таблицу 4.

Таблица 4

Интервалы

Середины интервалов xi

Частоты mi

(xi-x)mi

(xi-x)2mi

(xi-x)3mi

(xi-x)4mi

2;3

2,5

2

-4,3

9,245

-19,87

42,73

3;4

3,5

7

-8,05

9,2575

-10,64

12,24

4;5

4,5

15

-2,25

0,3375

-0,05

0,007

5;6

5,5

15

12,75

10,8375

9,21

7,83

6;7

6,5

1

1,85

3,4225

6,33

11,71

итого

40

0

33,1

-15,02

74,52

Следовательно,

Для определения выбора закона распределения вычислим вначале средние квадратические ошибки определения асимметрии и эксцесса

Критерием «нормальности» распределения значения концентрации примесей в органическом веществе является равенство нулю асимметрии и эксцесса. Из приведенных расчетов видно, что выборочные коэффициенты асимметрии и эксцесса Э отличаются от нуля не более чем на удвоенные средние квадратические ошибки их определения, что соответствует нормальному распределению. Вид полигона и гистограммы частостей также напоминает нормальную кривую (кривую Гаусса).

Можно предположить, значения концентрации примесей в органическом веществе (СВ Х) изменяются под влиянием большого числа факторов, примерно равнозначных по силе. Поэтому, исходя из «технологии» образования СВ Х, т. е. механизма образования отклонений от некоторого номинального значения, можно предположить, что распределение значения концентрации в органическом веществе является нормальным.

Плотность вероятности нормального распределения имеет вид

Найдём точечные оценки параметров a и у нормального распределения методом моментов:

Следовательно, плотность вероятности предполагаемого нормального распределения имеет вид:

Функция распределения предполагаемого нормального распределения имеет вид:

Используя нормированную функцию Лапласа

,

Функцию нормального распределения можно записать в виде

Проведем проверку гипотезы о нормальном распределении СВ Х.

Проверку гипотезы о нормальном распределении СВ Х проведем с помощью критерия согласия для этого интервалы наблюдаемых значений нормируют, т.е. выражают их в единицах среднего квадратического отклонения причем наименьшее значение полагают равным, наибольшее. Далее вычисляют вероятности попадания СВ Х, имеющей нормальное распределение, с параметрами, в частичные интервалы по формуле:

Например, вероятность того, что СВ Х (значения концентрации примесей в органическом веществе) попадает в первый частичный интервал равна

P5 = 0,0347

После этого вычисляют теоретические (модельные) частоты нормального распределения и наблюдаемое значение критерия

Затем по таблицам квантилей распределения по уровню математической значимости и числу степеней свободы‚ (- число интервалов; - число параметров предполагаемого распределения СВ Х) находят критическое значение.

Если, то считают, что нет оснований для отклонения гипотезы о нормальном распределении значений концентрации примесей в органическом веществе.

В противном случае, т. е. если, считается, что гипотеза нормального распределения значений концентрации примесей в органическом веществе согласуется с экспериментальными данными.

Вычисления, необходимые для определения наблюдаемого значения выборочной статистики приведем в таблице 5.

Таблица 5 - Значения выборочной статистики

Интервалы

Частоты

Нормированные интервалы

pi

npi

(mi-npi)2

(mi-npi)2/npi

2;3

2

-?; -1,81

0,0176

0,704

1,679

2,38

3;4

7

-1,81; -0,71

0,1019

4,076

8,549

2,09

4;5

15

-0,71; 0,38

0,7045

28,180

173,7

6,16

5;6

15

0,38; 1,5

0,1413

5,652

87,38

15,46

6;7

1

1,5; +?

0,0347

1,388

0,150

0,10

В результате вычислений получили Найдем по таблице квантилей распределения по уровню значимости и числу степеней критическое значение.

Так как то нет оснований для отклонения гипотезы о нормальном распределении значений концентрации примесей в органическом веществе.

Замечание. Наименьшее значение стандартизованной переменной заменено, наибольшее значение заменено. Эта замена произведена для того, чтобы сумма теоретических (модельных) частот была равна объему выборки.

Построим нормальную кривую.

Для этого из середин частичных интервалов восстании перпендикуляры высотой ( - вероятность попадания СВ Х в частичный интервал; - длина интервала). На рисунке 3 концы этих перпендикуляров отмечены кружками. Полученные точки соединены плавной кривой. Сравнение гистограммы и нормальной кривой наглядно показывает, что нормальная кривая хорошо сглаживает гистограмму относительных частот.

Найдем интервальные оценки параметров нормального распределения. Для вычисления доверительного интервала накрывающего математическое ожидание (СВ Х), найдем по таблицам квантилей распределения Стьюдента по заданной доверительной вероятности и числу степеней свободы квантиль .

Рисунок 3 - Зависимость накопленных частостей от Х.

Вычислим предельную погрешность интервального оценивания

Искомый доверительный интервал для математического ожидания

Смысл полученного результата: если будет произведено достаточно большое число выборок по 40 исследований концентрации примесей в органическом веществе, то в 95% из них доверительный интервал накроет математическое ожидание и только в 5% случаев математическое ожидание может выйти за границы доверительного интервала.

Для нахождения доверительного интервала, накрывающего неизвестное среднее квадратическое отклонение у с заданной вероятностью , найдем по доверительной вероятности и числу степеней свободы ‚ два числа: и . Искомый доверительный интервал

Полученный результат означает, что если будет произведено достаточно большое число выборок по 40 исследований данные измерения концентрации примесей в органическом веществе, то в 95% из них доверительный интервал накроет среднее квадратическое отклонение и только в 5% среднее квадратическое отклонение может выйти за границы доверительного интервала.

3 ИСПОЛЬЗОВАНИЕ ПЭВМ ПРИ СТАТИСТИЧЕСКОЙ ОБРАБОТКЕ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ

В настоящее время электронные вычислительные машины широко используются многими организациями для выполнения разнообразных трудоемких расчетов. Статистическая обработка результатов исследований физико-механических свойств неорганических и органических соединений также является трудоемким процессом, в особенности в тех случаях, когда требуется оценить параметры распределений сразу многих случайных величин, вычислить коэффициенты корреляции, оценивающие, насколько близка к линейной связь нормально распределенных случайных величин, и провести другие расчеты. Удобство использования ПЭВМ для такой полной обработки материалов исследований заключается в том, что сейчас все операции вычисления статистических показателей сведены в единые программы, которые занесены в память машин на магнитные ленты или диски.

Такие программы разработаны многими организациями (единой стандартной программы пока нет), но все они позволяют быстро получать для каждой выборки объемом определений такие параметры, как: и другие, в том числе расчетные при заданной доверительной вероятности

Кроме обработки каждой выборки в нормальном масштабе одновременно может быть выполнена обработка в логарифмическом масштабе. Для каждой выборки проверяется близость распределения к нормальному и логарифмически нормальному.

В общем, использование ПЭВМ целесообразно и необходимо при статистической обработке физико-химических свойств органических и неорганических соединений.

Рассмотрим выполнение отельных операций с использованием ПЭВМ при обработке 40 значений концентрации примесей в органическом веществе.

На рисунке 4 приведены графические значения 40 образцов проб концентрации примесей в органическом веществе.

Данный график представленный на рисунке 4 был получен при использовании стандартной программы .

Рисунок 4 - Элемент программы Microsoft Excel, на котором представлены` данные измерений, позволяющий определять уравнение зависимости концентрации примесей в органическом веществе от номера

Рисунок 5 - Элемент программы Microsoft Excel, на котором представлен элемент программы, позволяющий определять уравнение зависимости концентрации примесей в органическом веществе от номера измерения

Полученные значения показателей концентраций группируют по равным интервалам которое приведено в таблице 4. После чего определяют их средние значения частоты частости плотности распределения или относительное число определений, попадающих на единицу длины каждого малого интервала т. е. и накопленные частости %, значения которых приведены в таблице 4.

Рисунок 6 - Построение графика зависимости частостей от концентрации (г / л) примесей в органическом веществе

Обработка полученных данных с использованием программы Microsoft Excel позволило достоверно определить достоверное значение концентрации (г / л) примесей в органическом веществе.

Из данных рисунков 4, 5…7 видно: общее число определений, составляющих выборку, т. е. массовость, значений, на которых базируется характеристика концентрации примесей в органическом веществе, являются достоверными, поскольку это значение подтверждено результатами с использованием программы Microsoft Excel ПЭВМ.

Рисунок 7 - Значения частостей от концентрации (г / л) примесей в органическом веществе, определенные с использованием программы Microsoft Excel и полученное математическое уравнение

гипотеза нормальный распределение

ЛИТЕРАТУРА

1. А.А. Алексеев, Статистические методы расчета и обработки результатов исследований, - СПб.: СЗТУ, 2008.

2. А.А. Алексеев, А.И. Алексеев, Химическая информатика, - СПб.: СЗТУ, 2008.

Размещено на Allbest.ru


Подобные документы

  • Оценка параметров шестимерного нормального закона распределения с помощью векторов средних арифметических и среднеквадратического отклонений и матрицы парных коэффициентов корреляции (по программе Statistica). Методика определения Z-преобразования Фишера.

    контрольная работа [33,6 K], добавлен 13.09.2010

  • Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.

    курсовая работа [1,7 M], добавлен 29.11.2014

  • Разработка алгоритма и программы на одном из алгоритмических языков для построения эмпирической плотности распределения случайных величин. Осуществление проверки гипотезы об идентичности двух плотностей распределения, используя критерий Пирсонга.

    лабораторная работа [227,8 K], добавлен 19.02.2014

  • Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.

    контрольная работа [2,0 M], добавлен 05.04.2014

  • Расчет коэффициентов регрессии. Теоретическая и экспериментальная зависимость параметров а и b. Определение значений статистической дисперсии и среднеквадратического отклонения. Составление графика гистограммы распределения признака и кумулятивной прямой.

    контрольная работа [679,1 K], добавлен 12.05.2014

  • Вид одномерного распределения для номинальной шкалы с совместимыми альтернативами. Меры центральной тенденции. Математическое ожидание, отклонение. Показатели асимметрии, эксцесса. Построение распределений в пакете ОСА и SPSS, визуальное представление.

    курс лекций [2,4 M], добавлен 09.10.2013

  • Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.

    контрольная работа [172,2 K], добавлен 27.02.2011

  • Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.

    курсовая работа [151,4 K], добавлен 11.09.2010

  • Теоретические основы первичной обработки статистической информации. Особенности определения минимального числа объектов наблюдения при оценке показателей надежности. Анализ вероятностной бумаги законов нормального распределения и распределения Вейбулла.

    курсовая работа [163,5 K], добавлен 22.03.2010

  • Описание оборудования предприятия автосервиса. Построение интервального ряда экспериментального распределения. Проверка адекватности математической модели экспериментальным данным. Расчет значений интегральной и дифференциальной функции распределения.

    курсовая работа [522,9 K], добавлен 03.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.