Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины
Выполнение основных расчетов, связанных с оценкой факторов, влияющих на процесс, получение его математического описания, выполнение статистического анализа имеющейся информации, определение параметров процесса и создание математической модели процесса.
Рубрика | Математика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 24.04.2014 |
Размер файла | 426,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
Введение
1 Построение непрерывного вариационного ряда в виде гистограммы
2. Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины
2.1 Расчет показателей описательной статистики.
2.2 Критерий пирсона
2.3 Критерий колмогорова
2.4 Критерий мизеса
2.5 Проверка на нормальность распределения графическим методом
3.Биномиальное распределение
4. Расчет корреляционных зависимостей
5. Регрессионный анализ
6. Дисперсионный анализ
7. Анализ временных рядов
Введение
В настоящее время для обработки экспериментальных данных применяются методы математической статистики и теории вероятностей, основной целью которых является получение выводов о массовых явлениях и процессах по данным наблюдений и экспериментов. Такие методы применяются в различных отраслях знаний (медицине, технике, экономике и др.). статистика информация математическая модель
Основные этапы обработки экспериментальных данных - это оценка значений показателей качества средств, комплексов или системы в целом; сжатие информации о функционировании объекта, ее обобщение для последующего применения в интересах исследования подобных объектов, обоснования данных для создания новых систем; выявление закономерностей функционирования объекта в конкретных условиях эксплуатации, т.е. установление зависимостей между параметрами объекта, внешней среды и показателями качества объекта; выявление существенных параметров системы и внешней среды; изучение типологии объектов (распознавание образов, классификация объектов); прогнозирование развития объектов в интересах организационного и технологического управления.
Однако, результаты обработки экспериментальных данных не гарантируют достоверного описания неизвестных показателей или закономерностей.
Целью курсовой работы является выполнение расчетов, связанных с оценкой факторов, влияющих на тот или иной процесс, получение его математического описания, выполнение статистического анализа имеющейся информации, определение параметров процесса и создание математической модели процесса.
Основная часть курсовой работы разбита на 6 разделов и включает следующие расчеты:
- построение непрерывного вариационного ряда в виде гистограммы;
- расчет показателей описательной статистики, проверка нормальности распределения случайной величины с использованием критериев Пирсона, Колмогорова-Смирнова, Мизеса, а также графическим методом ;
- решение задач с использованием дискретных и непрерывных распределений случайных величин;
- расчет корреляционных зависимостей и построение регрессионной модели;
- анализ влияния факторных признаков на результирующую переменную методом дисперсионного анализа;
- анализ данных временного ряда.
1. Построение непрерывного вариационного ряда в виде гистограммы
Основой для построения гистограммы служит вариационный ряд - это представленный в виде таблицы ряд значений изучаемого признака и соответствующими частотами его встречаемости в выборке (Таблица 1).
Таблица 1 - Исходные данные
4040,3920 |
4040,4425 |
4040,4925 |
4040,5221 |
4040,4681 |
|
4040,3925 |
4040,4453 |
4040,4967 |
4040,5251 |
4040,4716 |
|
4040,3942 |
4040,4478 |
4040,5001 |
4040,5281 |
4040,4745 |
|
4040,3968 |
4040,4502 |
4040,5040 |
4040,5311 |
4040,4769 |
|
4040,3993 |
4040,4521 |
4040,5068 |
4040,5340 |
4040,4798 |
|
4040,4021 |
4040,4547 |
4040,5090 |
4040,5362 |
4040,4832 |
|
4040,4048 |
4040,4572 |
4040,5114 |
4040,5400 |
4040,4856 |
|
4040,4073 |
4040,4609 |
4040,5144 |
4040,4367 |
4040,4886 |
|
4040,4109 |
4040,4645 |
4040,5175 |
4040,4395 |
4040,4327 |
|
4040,4146 |
4040,4214 |
4040,5199 |
4040,4288 |
4040,4249 |
Находим объем выборки исходных данных: ;
Определяем число классов вариационного ряда по формуле:
, (1)
где - объем выборки.
.
Находим минимальное и максимальное значение выборки
,
.
, (2)
.
Рассчитываем длину интервала по формуле:
, (3)
где - размах выборки;
- число классов вариационного ряда.
.
Результаты представлены в таблице 2.
Таблица 2 - Границы классовых интервалов и подсчет частот
№ интервала |
Нижняя граница интервала |
Верхняя граница интервала |
Среднее значение признака в классе |
||
1 |
4040,3920 |
4040,4142 |
4040,4031 |
0 |
|
2 |
4040,4142 |
4040,4365 |
4040,4254 |
9 |
|
3 |
4040,4365 |
4040,4588 |
4040,4477 |
5 |
|
4 |
4040,4588 |
4040,4811 |
4040,4700 |
9 |
|
5 |
4040,4811 |
4040,5034 |
4040,4922 |
7 |
|
6 |
4040,5034 |
4040,5257 |
4040,5145 |
6 |
|
7 |
4040,5257 |
4040,5480 |
4040,5368 |
9 |
На основании проведенных расчетов строим гистограмму распределения исходных значений признака.
Рисунок 1 - Гистограмма распределения исходных значений признака
Форма полученной гистограммы не соответствует нормальному закону распределения случайной величины. Вид гистограммы соответствует гистограмме с прогалами («гребенка»), которая получается когда ширина интервала не кратна единице измерения или при ошибках оператора.
2. Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины
2.1 Расчет показателей описательной статистики
Параметры распределения - числовые характеристики, показывающие, где в среднем располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака.
На основании исходных данных мы определили:
- объем выборки
;
- минимальное и максимальное значения выборки
;
;
- размах выборки
.
Рассчитываем среднее значение выборки - это среднее арифметическое, рассчитанное путем сложения группы чисел и деления на количество этих чисел.
(4)
Рассчитываем стандартное отклонение - это мера того, насколько широко разбросаны точки данных относительно их среднего.
(5)
.
Определяем медиану - это число, которое является серединой множества чисел. Если множество содержит четное количество чисел, то вычисляют среднее для двух чисел, находящихся в середине множества.
.
Определяем моду - это число, наиболее часто встречающееся в данном множестве чисел.
В таблице исходных данных повторяющихся значений не выявлено.
Рассчитываем дисперсию, характеризующую меру отклонения (рассеивания) результатов параллельных определений от их среднего значения.
(6)
.
Определяем коэффициент асимметрии, характеризующий степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.
(7)
.
Определяем коэффициент эксцесса, характеризующий относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением.
(8)
.
Выводы:
Среднее значение и медиана незначительно отличаются друг от друга, что соответствует не симметричному, но близкому к нему распределению.
Распределение случайной величины сосредоточено на положительном направлении оси ОХ, поскольку .
Коэффициент асимметрии , следовательно для распределения характерна левосторонняя асимметрия. Асимметрия несущественна.
Коэффициент эксцесса , следовательно распределение сглажено и не является островершинным.
Таким образом, наблюдается несоответствие нормальному закону распределения случайной величины.
2.2 Критерий Пирсона
С помощью критерия проверим гипотезу о нормальности распределения случайной величины, при уровне значимости .
с помощью функции для правых границ классовых интервалов .
Рассчитываем теоретические значения вероятности попадания случайной величины в интервал:
(9)
(10)
Рассчитываем взвешенные квадраты отклонения по формуле:
(11)
где частоты классов вариационного ряда.
Подсчитываем сумму взвешенных квадратов отклонений - расчетное значение критерия . Все рассчитанные значения представлены в таблице 3.
Таблица 3 - Рассчитанные значения для критерия
0,259431 |
0,259431 |
12,97156 |
12,97156 |
|
0,438689 |
0,179258 |
8,962893 |
0,000154 |
|
0,631758 |
0,193069 |
9,653435 |
2,243187 |
|
0,795972 |
0,164214 |
8,210699 |
0,075876 |
|
0,906269 |
0,110297 |
5,514864 |
0,399942 |
|
0,964769 |
0,0585 |
2,925003 |
3,232684 |
|
18,92341 |
Определяем число степеней свободы параметров распределения:
, (12)
где количество классов, ;
число параметров распределения, (предполагается, что распределение нормальное).
.
По справочной таблице распределения определяем .
Вывод: поскольку гипотеза о нормальном распределении генеральной совокупности при уровне значимости противоречит экспериментальным данным.
2.3 Критерий Колмогорова
С помощью критерия Колмогорова проверим гипотезу о том, что экспериментальные данные подчиняются нормальному распределению при уровне значимости .
Рассчитываем значения эмпирической функции распределения для всех исходных значений:
, (13)
где объем выборки.
Рассчитываем значение теоретической функции нормального распределения с помощью функции .
Рассчитываем величины и по следующим формулам:
(14)
(15)
Все рассчитанные значения представлены в таблице 4.
Таблица 4 - Рассчитанные значения для критерия Колмогорова
4040,3920 |
0,02 |
0,052016 |
0,032016 |
0,052016 |
|
4040,3925 |
0,04 |
0,053199 |
0,013199 |
0,033199 |
|
4040,3942 |
0,06 |
0,057379 |
0,002621 |
0,017379 |
|
4040,3968 |
0,08 |
0,064267 |
0,015733 |
0,004267 |
|
4040,3993 |
0,1 |
0,071481 |
0,028519 |
0,008519 |
|
4040,4021 |
0,12 |
0,08028 |
0,03972 |
0,01972 |
|
4040,4048 |
0,14 |
0,089518 |
0,050482 |
0,030482 |
|
4040,4073 |
0,16 |
0,098755 |
0,061245 |
0,041245 |
|
4040,4109 |
0,18 |
0,113255 |
0,066745 |
0,046745 |
|
4040,4146 |
0,2 |
0,129678 |
0,070322 |
0,050322 |
|
4040,4425 |
0,22 |
0,303799 |
0,083799 |
0,103799 |
|
4040,4453 |
0,24 |
0,32569 |
0,08569 |
0,10569 |
|
4040,4478 |
0,26 |
0,345761 |
0,085761 |
0,105761 |
|
4040,4502 |
0,28 |
0,365447 |
0,085447 |
0,105447 |
|
4040,4521 |
0,3 |
0,381289 |
0,081289 |
0,101289 |
|
4040,4547 |
0,32 |
0,40329 |
0,08329 |
0,10329 |
|
4040,4572 |
0,34 |
0,424739 |
0,084739 |
0,104739 |
|
4040,4609 |
0,36 |
0,456877 |
0,096877 |
0,116877 |
|
4040,4645 |
0,38 |
0,488422 |
0,108422 |
0,128422 |
|
4040,4214 |
0,4 |
0,163996 |
0,236004 |
0,216004 |
|
4040,4925 |
0,42 |
0,721595 |
0,301595 |
0,321595 |
|
4040,4967 |
0,44 |
0,751773 |
0,311773 |
0,331773 |
|
4040,5001 |
0,46 |
0,774862 |
0,314862 |
0,334862 |
|
4040,5040 |
0,48 |
0,799781 |
0,319781 |
0,339781 |
|
4040,5068 |
0,5 |
0,816604 |
0,316604 |
0,336604 |
|
4040,5090 |
0,52 |
0,829185 |
0,309185 |
0,329185 |
|
4040,5114 |
0,54 |
0,842263 |
0,302263 |
0,322263 |
|
4040,5144 |
0,56 |
0,85766 |
0,29766 |
0,31766 |
|
4040,5175 |
0,58 |
0,872468 |
0,292468 |
0,312468 |
|
4040,5199 |
0,6 |
0,883171 |
0,283171 |
0,303171 |
|
4040,5221 |
0,62 |
0,892408 |
0,272408 |
0,292408 |
|
4040,5251 |
0,64 |
0,904139 |
0,264139 |
0,284139 |
|
4040,5281 |
0,66 |
0,914901 |
0,254901 |
0,274901 |
|
4040,5311 |
0,68 |
0,924731 |
0,244731 |
0,264731 |
|
4040,5340 |
0,7 |
0,933386 |
0,233386 |
0,253386 |
|
4040,5362 |
0,72 |
0,939422 |
0,219422 |
0,239422 |
|
4040,5400 |
0,74 |
0,948831 |
0,208831 |
0,228831 |
|
4040,4367 |
0,76 |
0,260686 |
0,499314 |
0,479314 |
|
4040,4395 |
0,78 |
0,281102 |
0,498898 |
0,478898 |
|
4040,4288 |
0,8 |
0,207477 |
0,592523 |
0,572523 |
|
4040,4681 |
0,82 |
0,52004 |
0,29996 |
0,27996 |
|
4040,4716 |
0,84 |
0,550661 |
0,289339 |
0,269339 |
|
4040,4745 |
0,86 |
0,575813 |
0,284187 |
0,264187 |
|
4040,4769 |
0,88 |
0,596403 |
0,283597 |
0,263597 |
|
4040,4798 |
0,9 |
0,620925 |
0,279075 |
0,259075 |
|
4040,4832 |
0,92 |
0,64906 |
0,27094 |
0,25094 |
|
4040,4856 |
0,94 |
0,66845 |
0,27155 |
0,25155 |
|
4040,4886 |
0,96 |
0,692062 |
0,267938 |
0,247938 |
|
4040,4327 |
0,98 |
0,232903 |
0,747097 |
0,727097 |
|
4040,4249 |
1 |
0,18377 |
0,81623 |
0,79623 |
Выбираем из рассчитанных значений и максимальные значения , .
По справочной таблице определяем значения параметра при заданном уровне значимости , далее рассчитываем значение модуля максимальной разности по формуле:
, (16)
.
Вывод: поскольку расчетные величины и модуля максимальной разности больше критического значения , гипотеза о принадлежности выборки нормальному закону распределения при уровне значимости отвергается.
2.4 Критерий Мизеса
Проверим с помощью критерия Мизеса гипотезу о том, что экспериментальные данные подчиняются нормальному закону распределения при уровне значимости .
Рассчитываем значения эмпирической функции
. (17)
Рассчитываем средний квадрат отклонения по формуле:
. (18)
Рассчитанные значения представлены в таблице 5.
Таблица 5 - Рассчитанные значения для критерия Мизеса
1 |
4040,3920 |
0,01 |
0,052016 |
1,765363 |
26 |
4040,5090 |
0,51 |
0,829185 |
101,8789 |
|
2 |
4040,3925 |
0,03 |
0,053199 |
0,538178 |
27 |
4040,5114 |
0,53 |
0,842263 |
97,50805 |
|
3 |
4040,3942 |
0,05 |
0,057379 |
0,05445 |
28 |
4040,5144 |
0,55 |
0,85766 |
94,65491 |
|
4 |
4040,3968 |
0,07 |
0,064267 |
0,032864 |
29 |
4040,5175 |
0,57 |
0,872468 |
91,48682 |
|
5 |
4040,3993 |
0,09 |
0,071481 |
0,342963 |
30 |
4040,5199 |
0,59 |
0,883171 |
85,94906 |
|
6 |
4040,4021 |
0,11 |
0,08028 |
0,883273 |
31 |
4040,5221 |
0,61 |
0,892408 |
79,75419 |
|
7 |
4040,4048 |
0,13 |
0,089518 |
1,638816 |
32 |
4040,5251 |
0,63 |
0,904139 |
75,1521 |
|
8 |
4040,4073 |
0,15 |
0,098755 |
2,626016 |
33 |
4040,5281 |
0,65 |
0,914901 |
70,17243 |
|
9 |
4040,4109 |
0,17 |
0,113255 |
3,219985 |
34 |
4040,5311 |
0,67 |
0,924731 |
64,88777 |
|
10 |
4040,4146 |
0,19 |
0,129678 |
3,638794 |
35 |
4040,5340 |
0,69 |
0,933386 |
59,23689 |
|
11 |
4040,4425 |
0,21 |
0,303799 |
8,798188 |
36 |
4040,5362 |
0,71 |
0,939422 |
52,63468 |
|
12 |
4040,4453 |
0,23 |
0,32569 |
9,156646 |
37 |
4040,5400 |
0,73 |
0,948831 |
47,88718 |
|
13 |
4040,4478 |
0,25 |
0,345761 |
9,170186 |
38 |
4040,4367 |
0,75 |
0,260686 |
239,4285 |
|
14 |
4040,4502 |
0,27 |
0,365447 |
9,110048 |
39 |
4040,4395 |
0,77 |
0,281102 |
239,0215 |
|
15 |
4040,4521 |
0,29 |
0,381289 |
8,333754 |
40 |
4040,4288 |
0,79 |
0,207477 |
339,3328 |
|
16 |
4040,4547 |
0,31 |
0,40329 |
8,703109 |
41 |
4040,4681 |
0,81 |
0,52004 |
84,07681 |
|
17 |
4040,4572 |
0,33 |
0,424739 |
8,975475 |
42 |
4040,4716 |
0,83 |
0,550661 |
78,03051 |
|
18 |
4040,4609 |
0,35 |
0,456877 |
11,42279 |
43 |
4040,4745 |
0,85 |
0,575813 |
75,17841 |
|
19 |
4040,4645 |
0,37 |
0,488422 |
14,02386 |
44 |
4040,4769 |
0,87 |
0,596403 |
74,85555 |
|
20 |
4040,4214 |
0,39 |
0,163996 |
51,07795 |
45 |
4040,4798 |
0,89 |
0,620925 |
72,4016 |
|
21 |
4040,4925 |
0,41 |
0,721595 |
97,09174 |
46 |
4040,4832 |
0,91 |
0,64906 |
68,08961 |
|
22 |
4040,4967 |
0,43 |
0,751773 |
103,5379 |
47 |
4040,4856 |
0,93 |
0,66845 |
68,40847 |
|
23 |
4040,5001 |
0,45 |
0,774862 |
105,5351 |
48 |
4040,4886 |
0,95 |
0,692062 |
66,53223 |
|
24 |
4040,5040 |
0,47 |
0,799781 |
108,7555 |
49 |
4040,4327 |
0,97 |
0,232903 |
543,3123 |
|
25 |
4040,5068 |
0,49 |
0,816604 |
106,6705 |
50 |
4040,4249 |
0,99 |
0,18377 |
650,0069 |
Рассчитываем фактическое значение статистики критерия Мизеса по формуле:
. (19)
.
Определяем по справочной таблице при заданном уровне значимости критическое значение статистики критерия Мизеса .
Вывод: поскольку гипотеза о принадлежности выборки нормальному закону распределения при уровне значимости отвергается.
2.5 Проверка на нормальность распределения графическим методом
Графический метод является наиболее простым способом проверки на нормальность распределения. По этому методу результаты располагают в вариационном ряду, затем для каждого результата рассчитывают накопленную частость по формуле:
, (20)
где номер результата в вариационном ряду;
объем выборки.
Для нормального распределения нашли квантили стандартного нормального распределения .
Результаты расчетов вносим в таблицу 6
Таблица 6 - Результаты расчетов
1 |
4040,3920 |
0,019608 |
-2,061917 |
26 |
4040,5090 |
0,509804 |
0,024577 |
|
2 |
4040,3925 |
0,039216 |
-1,759861 |
27 |
4040,5114 |
0,529412 |
0,073791 |
|
3 |
4040,3942 |
0,058824 |
-1,564726 |
28 |
4040,5144 |
0,54902 |
0,123185 |
|
4 |
4040,3968 |
0,078431 |
-1,415702 |
29 |
4040,5175 |
0,568627 |
0,172881 |
|
5 |
4040,3993 |
0,098039 |
-1,292805 |
30 |
4040,5199 |
0,588235 |
0,223008 |
|
6 |
4040,4021 |
0,117647 |
-1,186831 |
31 |
4040,5221 |
0,607843 |
0,273702 |
|
7 |
4040,4048 |
0,137255 |
-1,092736 |
32 |
4040,5251 |
0,627451 |
0,32511 |
|
8 |
4040,4073 |
0,156863 |
-1,007436 |
33 |
4040,5281 |
0,647059 |
0,377392 |
|
9 |
4040,4109 |
0,176471 |
-0,928899 |
34 |
4040,5311 |
0,666667 |
0,430727 |
|
10 |
4040,4146 |
0,196078 |
-0,855712 |
35 |
4040,5340 |
0,686275 |
0,485318 |
|
11 |
4040,4425 |
0,215686 |
-0,786845 |
36 |
4040,5362 |
0,705882 |
0,541395 |
|
12 |
4040,4453 |
0,235294 |
-0,721522 |
37 |
4040,5400 |
0,72549 |
0,59923 |
|
13 |
4040,4478 |
0,254902 |
-0,659143 |
38 |
4040,4367 |
0,745098 |
0,659143 |
|
14 |
4040,4502 |
0,27451 |
-0,59923 |
39 |
4040,4395 |
0,764706 |
0,721522 |
|
15 |
4040,4521 |
0,294118 |
-0,541395 |
40 |
4040,4288 |
0,784314 |
0,786845 |
|
16 |
4040,4547 |
0,313725 |
-0,485318 |
41 |
4040,4681 |
0,803922 |
0,855712 |
|
17 |
4040,4572 |
0,333333 |
-0,430727 |
42 |
4040,4716 |
0,823529 |
0,928899 |
|
18 |
4040,4609 |
0,352941 |
-0,377392 |
43 |
4040,4745 |
0,843137 |
1,007436 |
|
19 |
4040,4645 |
0,372549 |
-0,32511 |
44 |
4040,4769 |
0,862745 |
1,092736 |
|
20 |
4040,4214 |
0,392157 |
-0,273702 |
45 |
4040,4798 |
0,882353 |
1,186831 |
|
21 |
4040,4925 |
0,411765 |
-0,223008 |
46 |
4040,4832 |
0,901961 |
1,292805 |
|
22 |
4040,4967 |
0,431373 |
-0,172881 |
47 |
4040,4856 |
0,921569 |
1,415702 |
|
23 |
4040,5001 |
0,45098 |
-0,123185 |
48 |
4040,4886 |
0,941176 |
1,564726 |
|
24 |
4040,5040 |
0,470588 |
-0,073791 |
49 |
4040,4327 |
0,960784 |
1,759861 |
|
25 |
4040,5068 |
0,490196 |
-0,024577 |
50 |
4040,4249 |
0,980392 |
2,061917 |
По результатам расчетов построили точечную диаграмму (Рисунок 2), используя в качестве данных значения изучаемого признака и квантили стандартного нормального распределения. Затем добавили на диаграмму линейную линию тренда.
Рисунок 2 - Проверка нормальности распределения графическим методом
Вывод: поскольку нанесенные на график точки не полностью укладываются вдоль линии тренда, то считается, что результаты неудовлетворительно описываются выбранным теоретическим распределением, и гипотеза о нормальном распределении случайной величины отвергается.
3. Биномиальное распределение
Случайная величина Y имеет дискретное распределение, если она принимает не более чем счетное число значений. К дискретным распределениям относят распределение Бернулли, биноминальное распределение, гипергеометрическое распределение, распределение Пуассона.
Биномиальное распределение. Это то же распределение Бернулли, но в данном случае необходимо знать вероятность появления определенного числа (или не менее этого числа) успешных исходов уже при независимых событиях.
Случайная величина имеет биномиальное распределение в следующих случаях: если в каждой из попыток вероятность наступления события одна и та же, и если все попытки независимы друг от друга.
А) Рабочий обслуживает 12 станков одного типа. Вероятность того, что станок потребует внимания рабочего в течение часа, равна 1/3. Найдите: а) вероятность того, что в течение часа 3 станка потребуют внимания рабочего; б) наиболее вероятное число станков, которые потребуют внимания рабочего в течение часа. Дать геометрическую иллюстрацию.
В данной задаче мы имеем биномиальное распределение, расчет производим с помощью функции =БИНОМРАСП(число успехов; число испытаний; вероятность успеха; интегральная)
- число успехов -- количество успешных испытаний.
- число испытаний -- число независимых испытаний.
- вероятность успеха -- вероятность успеха каждого испытания.
- интегральная -- логическое значение, определяющее вид функции. Если аргумент «интегральная» имеет значение ИСТИНА, функция БИНОМРАСП возвращает интегральную функцию распределения, то есть вероятность того, что число успешных испытаний не меньше значения аргумента «число успехов»; если этот аргумент имеет значение ЛОЖЬ, то возвращается функция вероятностной меры, то есть вероятность того, что число успешных испытаний равно значению аргумента «число успехов».
Таким образом, мы получаем значения, представленные в таблице 7.
Таблица 7 - Расчетные значения
Число успехов Y |
Вероятность P=Y |
Вероятность P?Y |
|
0 |
0,007707 |
0,007707 |
|
1 |
0,046244 |
0,053951 |
|
2 |
0,127171 |
0,181123 |
|
3 |
0,211952 |
0,393075 |
|
4 |
0,238446 |
0,631521 |
|
5 |
0,190757 |
0,822278 |
|
6 |
0,111275 |
0,933552 |
|
7 |
0,047689 |
0,981242 |
|
8 |
0,014903 |
0,996144 |
|
9 |
0,003312 |
0,999456 |
|
10 |
0,000497 |
0,999953 |
|
11 |
4,52E-05 |
0,999998 |
|
12 |
1,88E-06 |
1 |
а) вероятность того, что в течение часа 3 станка потребуют внимания рабочего составляет 0,2;
Представим полученные значения графически (Рисунок 3)
Рисунок 3 - Биномиальное распределение числа станков
Б) При передаче сообщения вероятность искажения для каждого знака равна 0,1. Какова вероятность того, что сообщение из 5 знаков: а) не будет искажено; б) содержит ровно одно искажение; в) содержит не более 3 искажений.
В данной задаче мы имеем биномиальное распределение, расчет производим с помощью функции =БИНОМРАСП(число успехов; число испытаний; вероятность успеха; интегральная)
Таким образом, мы получаем значения, представленные в таблице 8.
Таблица 8 - Расчетные значения
Число успехов Y |
Вероятность P=Y |
Вероятность P?Y |
|
0 |
0,59049 |
0,59049 |
|
1 |
0,32805 |
0,91854 |
|
2 |
0,0729 |
0,99144 |
|
3 |
0,0081 |
0,99954 |
|
4 |
0,00045 |
0,99999 |
|
5 |
0,00001 |
1 |
а) вероятность того, что сообщение из 5 знаков не будет искажено, составляет 0,6;
б) вероятность того, что сообщение из 5 знаков содержит ровно одно искажение, составляет 0,3;
в) вероятность того, что сообщение из 5 знаков содержит не более 3 искажений, составляет 1.
4. Расчет корреляционных зависимостей
Исходные данные для проведения корреляционного анализа и построения регрессионной модели приведены в таблице 9.
Таблица 9 - Исходные данные
Тревога |
Самочувствие |
Активность |
Тревога |
Самочувствие |
Активность |
||
52 |
5,5 |
3,4 |
38 |
4,9 |
5 |
||
47 |
4,2 |
4,6 |
48 |
4,1 |
3,5 |
||
35 |
6,2 |
3,2 |
42 |
5,5 |
4,6 |
||
53 |
5,8 |
6,2 |
57 |
3,8 |
4,8 |
||
33 |
5,8 |
6,6 |
41 |
5 |
4,2 |
||
36 |
4,7 |
4,1 |
49 |
5,7 |
5,1 |
||
49 |
3,5 |
3,6 |
54 |
4,3 |
3 |
||
47 |
4,7 |
3,2 |
44 |
4,5 |
4,9 |
||
30 |
5,7 |
5,6 |
35 |
6,3 |
4,5 |
||
31 |
5,6 |
5,4 |
46 |
2,5 |
2,9 |
||
41 |
5,4 |
4,8 |
30 |
6,8 |
7 |
||
53 |
3,9 |
4 |
38 |
5,6 |
4,1 |
||
50 |
4,7 |
4,8 |
43 |
5,9 |
5,2 |
||
26 |
6,5 |
6,4 |
38 |
6,1 |
5,7 |
||
45 |
4,5 |
4,7 |
33 |
6,2 |
4,4 |
||
33 |
4,3 |
5,3 |
36 |
5,2 |
5,4 |
||
35 |
5,1 |
6 |
58 |
3,2 |
3,1 |
||
56 |
4,9 |
4,2 |
44 |
4 |
4 |
||
51 |
4,8 |
5,3 |
42 |
5,3 |
4,9 |
||
33 |
5,3 |
4,6 |
46 |
5,5 |
6,3 |
||
25 |
6,4 |
6,4 |
44 |
4,1 |
3,6 |
||
41 |
4,4 |
4,1 |
36 |
4,8 |
5,8 |
||
72 |
2,6 |
2,7 |
37 |
3,6 |
4,9 |
||
51 |
3,5 |
4,8 |
34 |
6 |
6,1 |
||
63 |
2,6 |
3,2 |
44 |
4,1 |
3,8 |
Корреляционный анализ позволяет оценить степень взаимосвязи между 2 факторами (если такая взаимосвязь вообще существует).
Необходимо определить наличие линейных корреляционных связей между такими факторами, как тревога, самочувствие и активность. Предполагаем, что выборки по всем вариантам подчиняются нормальному закону. Проверку гипотезы о значимости оценок коэффициентов корреляции проводим с уровнем значимости .
Стандартизацию исходной матрицы начинаем с вычисления математического ожидания ? и среднеквадратического отклонения ? по каждой варианте, которые представлены в таблице 10.
Таблица 10 - Оценки параметров распределения
Оценка параметра распределения |
Варианта |
|||
Тревога |
Самочувствие |
Активность |
||
м |
42,90 |
4,87 |
4,68 |
|
у |
9,69 |
1,06 |
1,08 |
Затем формируем стандартизованную матрицу исходных данных, используя формулу:
, (23)
Далее определяем оценки коэффициентов корреляции по формуле:
. (24)
После чего определяем значения критерия Стьюдента для вычисления оценок коэффициентов корреляции:
. (25)
Полученные данные заносим в таблицу 11.
Таблица 11 - Значения коэффициентов корреляции и критерия Стьюдента
Зависимость |
Тревога - Самочувствие |
Тревога - Активность |
Самочувствие - Активность |
|
-0,7±0,08 |
-0,6±0,09 |
0,6±0,08 (*) |
||
6,3 |
5,0 |
5,7 |
(*) - достоверный коэффициент корреляции
Критическое значение .
Таким образом, для каждой оценки коэффициента корреляции. Это означает, что для указанных коэффициентов оценка значима (коэффициент корреляции генеральной совокупности не равен нулю при уровне значимости ).
Между величинами «Тревога» и «Самочувствие» существует сильная отрицательная (обратная) связь.
Между величинами «Тревога» и «Активность» существует средняя отрицательная (обратная) связь.
Между величинами «Активность» и «Самочувствие» существует средняя положительная (прямая) связь.
Для наиболее сильной корреляционной зависимости построена диаграммы рассеяния, изображенная на рисунке 3.
Рисунок 4 - Диаграмма рассеяния, отображающая корреляционную взаимосвязь между «Тревогой» и «Самочувствием»
5. Регрессионный анализ
Регрессионный анализ позволяет получить функциональную зависимость между некоторой случайной величиной Y и некоторыми влияющими на Y величинами X. Такая зависимость получила название уравнения регрессии.
Рассмотрим результаты регрессионного анализа.
Таблица 12 - Регрессионный анализ
Факторы |
bi |
Уровень значимости б |
|
Тревога |
|||
b0 |
76,84626446 |
0,00000000000000000006<0,001 |
|
Самочувствие=Х1 |
-4,732326035 |
0,00037398251960960900<0,001 |
|
Активность=Х2 |
-2,327002567 |
0,06040555662951250000>0,05 |
|
Самочувствие |
|||
b0 |
5,31535972 |
0,0000029<0,001 |
|
Активность |
0,366753996 |
0,0031922<0,005 |
|
Тревога |
-0,050344252 |
0,0003740<0,001 |
|
Активность |
|||
b0 |
3,761249107 |
0,006318786<0,05 |
|
Тревога |
-0,031379323 |
0,060405557>0,5 |
|
Самочувствие |
0,464885848 |
0,003192185<0,05 |
- линейный коэффициент детерминации. Величина показывает, какая часть (доля) вариации объясняемой переменной обусловлена вариацией объясняющей переменной.
, что свидетельствует о том, что вариация «Тревоги» на 51% обусловлена линейным влиянием величин «Самочувствие» и «Активность».
, что свидетельствует о том, что вариация «Самочувствия» на 56% обусловлена линейным влиянием величин «Тревога» и «Активность».
, что свидетельствует о том, что вариация «Активности» на 46% обусловлена линейным влиянием величин «Тревога» и «Самочувствие».
В итоге получили следующие математические модели:
,
,
Полученные уравнения регрессии являются аналитическим описанием, имеющихся экспериментальных данных.
6. Дисперсионный анализ
Дисперсионный анализ - метод математической статистики, который позволяет изучить влияние одного или нескольких факторов на рассматриваемый признак.
Мы оцениваем влияние «Тревоги» на «Самочувствие» и «Активность», «Самочувствия» на «Тревогу» и «Активность», «Активности» на «Тревогу» и «Самочувствие».
Подготовим исходные данные, представленные в таблице 9, для проведения однофакторного дисперсионного анализа, распределив значения выборок по уровням. Нулевая гипотеза в однофакторном дисперсионном анализе утверждает, что все средние значения из различных генеральных совокупностей, которые представлены выборочными средними, равны между собой:
. (26)
Альтернативная гипотеза утверждает, что хотя бы 2 любых средних не равны между собой:
. (27)
Результаты однофакторного дисперсионного анализа приведены в таблице 12.
Таблица 12 - Результаты однофакторного дисперсионного анализа
Влияние |
Уровень значимости б |
|||
«Тревоги» на «Самочувствие» |
8,9128069 |
0,005227 |
3,1950563 |
|
«Тревоги» на «Активность» |
7,8092785 |
0,0011797 |
||
«Самочувствия» на «Тревогу» |
10,7790026 |
0,0001403 |
||
«Самочувствия» на «Активность» |
10,8411025 |
0,0001344 |
||
«Активности» на «Тревогу» |
11,8912620 |
0,0000662 |
||
«Активности» на «Самочувствие» |
15,1374215 |
0,0000084 |
На основании рассчитанных значений мы сформулировали следующие выводы, и построили диаграмму влияния «Активности» на «Самочувствие» (Рисунок 5).
Для всех значений , следовательно «Тревога» оказывает влияние на «Самочувствие» и «Активность», «Самочувствие» влияет на «Тревогу» и «Активность», «Активность» оказывает влияние на «Тревогу» и «Самочувствие».
Рисунок 5 - Диаграмма, отображающая зависимость среднего значения «Самочувствия» от степени выраженности фактора «Активность»
7. Анализ временных рядов
Временной ряд представляет собой последовательность данных, описывающих исследуемое явление в последовательные моменты времени (за какой-то период). Составными элементами ряда динамики являются показатели уровней ряда и периоды времени( годы, кварталы, месяцы, сутки) или моменты(даты) времени. Статистические показатели, характеризующие изучаемый объект называют уровнями ряда.
Исследуем динамику продолжительности залегания снежного покрова (в днях) в одном из регионов РФ.
Исходные данные для проведения анализа временного ряда представлены в таблице 13.
Таблица 13 - Исходные данные
Год |
Количество дней |
Год |
Количество дней |
||
1953 |
106 |
1966 |
144 |
||
1954 |
150 |
1967 |
133 |
||
1955 |
100 |
1968 |
150 |
||
1956 |
159 |
1969 |
136 |
||
1957 |
144 |
1970 |
135 |
||
1958 |
131 |
1971 |
146 |
||
1959 |
151 |
1972 |
125 |
||
1960 |
141 |
1973 |
153 |
||
1961 |
141 |
1974 |
116 |
||
1962 |
148 |
1975 |
143 |
||
1963 |
142 |
1976 |
145 |
||
1964 |
127 |
1977 |
134 |
||
1965 |
143 |
1978 |
140 |
Рисунок 4 - График зависимости дней залегания снежногопокрова от года
Данные расчетов представлены в таблицах 14, 15.
Год |
Кол-во дней |
? |
Кр |
Тр |
Тпр |
Год |
Кол-во дней |
? |
Кр |
Тр |
Тпр |
||
Цепные показатели |
Базисные показатели |
||||||||||||
1953 |
106 |
1953 |
106 |
||||||||||
1954 |
150 |
44 |
13 |
141,5 |
41,5 |
1954 |
150 |
44 |
1,4 |
141,5 |
41,5 |
||
1955 |
100 |
-50 |
0,7 |
66,7 |
-33,3 |
1955 |
100 |
-6 |
0,9 |
94,3 |
-5,7 |
||
1956 |
159 |
59 |
1,6 |
159,0 |
59,0 |
1956 |
159 |
53 |
1,5 |
150,0 |
50,0 |
||
1957 |
144 |
-15 |
0,9 |
90,6 |
-9,4 |
1957 |
144 |
38 |
1,4 |
135,8 |
35,8 |
||
1958 |
131 |
-13 |
0,9 |
91,0 |
-9,0 |
1958 |
131 |
25 |
1,2 |
123,6 |
23,6 |
||
1959 |
151 |
20 |
1,2 |
115,3 |
15,3 |
1959 |
151 |
45 |
1,4 |
142,5 |
42,5 |
||
1960 |
141 |
-10 |
0,9 |
93,4 |
-6,6 |
1960 |
141 |
35 |
1,3 |
133,0 |
33,0 |
||
1961 |
141 |
0 |
1,0 |
100,0 |
0,0 |
1961 |
141 |
35 |
1,3 |
133,0 |
33,0 |
||
1962 |
148 |
7 |
1,0 |
105,0 |
5,0 |
1962 |
148 |
42 |
1,4 |
139,6 |
39,6 |
||
1963 |
142 |
-6 |
1,0 |
95,9 |
-4,1 |
1963 |
142 |
36 |
1,3 |
134,0 |
34,0 |
||
1964 |
127 |
-15 |
0,9 |
89,4 |
-10,6 |
1964 |
127 |
21 |
1,2 |
119,8 |
19,8 |
||
1965 |
143 |
16 |
1,1 |
112,6 |
12,6 |
1965 |
143 |
37 |
1,3 |
134,9 |
34,9 |
||
1966 |
144 |
1 |
1,0 |
100,7 |
0,7 |
1966 |
144 |
38 |
1,4 |
135,8 |
35,8 |
||
1967 |
133 |
-11 |
0,9 |
92,4 |
-7,6 |
1967 |
133 |
27 |
1,3 |
125,5 |
25,5 |
||
1968 |
150 |
17 |
1,1 |
112,8 |
12,8 |
1968 |
150 |
44 |
1,4 |
141,5 |
41,5 |
||
1969 |
136 |
-14 |
0,9 |
90,7 |
-9,3 |
1969 |
136 |
30 |
1,3 |
128,3 |
28,3 |
||
1970 |
135 |
-1 |
1,0 |
99,3 |
-0,7 |
1970 |
135 |
29 |
1,3 |
127,4 |
27,4 |
||
1971 |
146 |
11 |
1,1 |
108,1 |
8,1 |
1971 |
146 |
40 |
1,4 |
137,7 |
37,7 |
||
1972 |
125 |
-21 |
0,9 |
85,6 |
-14,4 |
1972 |
125 |
19 |
1,2 |
117,9 |
17,9 |
||
1973 |
153 |
28 |
1,2 |
122,4 |
22,4 |
1973 |
153 |
47 |
1,4 |
144,3 |
44,3 |
||
1974 |
116 |
-37 |
0,8 |
75,8 |
-24,2 |
1974 |
116 |
10 |
1,1 |
109,4 |
9,4 |
||
1975 |
143 |
27 |
1,2 |
123,3 |
23,3 |
1975 |
143 |
37 |
1,3 |
134,9 |
34,9 |
||
1976 |
145 |
2 |
1,0 |
101,4 |
1,4 |
1976 |
145 |
39 |
1,4 |
136,8 |
36,8 |
||
1977 |
134 |
-11 |
0,9 |
92,4 |
-7,6 |
1977 |
134 |
28 |
1,3 |
126,4 |
26,4 |
||
1978 |
140 |
6 |
1,0 |
104,5 |
4,5 |
1978 |
140 |
34 |
1,3 |
132,1 |
32,1 |
Таблица 15 - Средние значения
В ходе анализа временных рядов были рассчитаны показатели динамики с постоянной и переменной базой, а также их средние значения. Также было выявлено, что в период с1953 по 1960 года наблюдалось четкое увеличение количества дней залегания снежного покрова, в период с 1960 по 1970 года наблюдалось незначительное уменьшение количества дней залегания снежного покрова и в период с 1970 по 1978 года наблюдалось незначительное увеличение количества дней залегания снежного покрова.
Таким образом было выявлено, что продолжительность залегания снежного покрова в период 1953 по 1978 года увеличилась на 1,1%.
Заключение
В работе был построен непрерывный вариационный ряд в виде гистограммы, которая имеет вид «гребенки». В ходе проверки на нормальность распределения случайной величины с помощью критериев Пирсона, Колмогорова, Мизеса и графического метода сделан вывод, что распределение анормально. Произведено решение задач с помощью дискретного распределения случайной величины. Совершены корреляционный, регрессионный и дисперсионный анализы, в ходе которых найдена взаимосвязь между результирующим признаком и входными факторами. Исследована динамика продолжительности залегания снежного покрова в период с1953 по 1978 года.
Размещено на Allbest.ru
Подобные документы
Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.
курсовая работа [57,0 K], добавлен 13.10.2009Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015Решение задач по определению вероятности событий, ряда и функции распределения с помощью формулы умножения вероятностей. Нахождение константы, математического описания и дисперсии непрерывной случайной величины из функции распределения случайной величины.
контрольная работа [57,3 K], добавлен 07.09.2010Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.
контрольная работа [97,1 K], добавлен 26.02.2012Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.
контрольная работа [38,5 K], добавлен 25.03.2015Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.
контрольная работа [33,8 K], добавлен 13.12.2010Определение математического ожидания и дисперсии параметров распределения Гаусса. Расчет функции распределения случайной величины Х, замена переменной. Значения функций Лапласа и Пуассона, их графики. Правило трех сигм, пример решения данной задачи.
презентация [131,8 K], добавлен 01.11.2013Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.
курсовая работа [147,0 K], добавлен 10.04.2011Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.
контрольная работа [91,7 K], добавлен 15.11.2011