Построение вариационного ряда
Таблица нумерованных денормализованных чисел с четырьмя верными знаками у наибольшего по модулю числа. Построение нумерованного вариационного ряда. Оценка математического ожидания, дисперсии, медианы. Построение полигона, гистограммы, ступенчатой кривой.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 02.05.2012 |
Размер файла | 236,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
1. Выборка. Вариационный ряд. Оценка параметров по всей выборке
Рассматриваем случайную величину, определенную на некоторой генеральной совокупности, вид распределения которой неизвестен. По выборке из этой генеральной совокупности необходимо сделать заключение относительно свойств закона распределения этой случайной величины. В данной курсовой работе будут рассмотрены наиболее часто встречающиеся задачи математической статистики такие, как задача построения оценок параметров распределения, построения доверительных интервалов для этих параметров, проверка гипотезы о принадлежности распределения случайной величины к тому или иному классу и др.
Из некоторой генеральной совокупности произведена выборка объемом 100 элементов. Нас будет интересовать только один качественный признак элементов, попавших в выборку. Данные выборки представлены в табл. 1.
Табл. 1. Таблица нумерованных денормализованных чисел
№ |
xi |
№ |
xi |
№ |
xi |
№ |
xi |
№ |
xi |
|
1 |
0,6651 |
21 |
1,8457 |
41 |
-0,4692 |
61 |
0,3336 |
81 |
0,0962 |
|
2 |
0,6580 |
22 |
-1,0784 |
42 |
1,0037 |
62 |
-1,7251 |
82 |
0,4900 |
|
3 |
-0,8756 |
23 |
0,6042 |
43 |
-0,3717 |
63 |
0,2155 |
83 |
-1,3309 |
|
4 |
-0,9608 |
24 |
-0,2606 |
44 |
-0,0846 |
64 |
-0,4276 |
84 |
-0,8346 |
|
5 |
-0,8011 |
25 |
-1,4051 |
45 |
2,7783 |
65 |
1,2564 |
85 |
1,4345 |
|
6 |
0,9035 |
26 |
1,5529 |
46 |
-0,0553 |
66 |
-1,3470 |
86 |
-0,0749 |
|
7 |
1,0438 |
27 |
0,4995 |
47 |
0,3645 |
67 |
-0,5551 |
87 |
-0,3202 |
|
8 |
0,0695 |
28 |
-0,1259 |
48 |
-0,0004 |
68 |
-1,5139 |
88 |
-0,9161 |
|
9 |
-1,0066 |
29 |
0,0601 |
49 |
-0,0029 |
69 |
0,5182 |
89 |
-0,4128 |
|
10 |
-0,7016 |
30 |
0,1875 |
50 |
-1,0033 |
70 |
1,2895 |
90 |
-1,3041 |
|
11 |
-0,0530 |
31 |
-0,2316 |
51 |
2,0325 |
71 |
-0,2736 |
91 |
-0,6175 |
|
12 |
0,2502 |
32 |
-0,4140 |
52 |
0,3678 |
72 |
0,2683 |
92 |
-2,1372 |
|
13 |
-0,1297 |
33 |
1,2534 |
53 |
-0,9871 |
73 |
-0,5026 |
93 |
0,9104 |
|
14 |
-0,3666 |
34 |
-0,4099 |
54 |
-1,5151 |
74 |
1,9664 |
94 |
-0,1616 |
|
15 |
0,1807 |
35 |
0,5031 |
55 |
1,0652 |
75 |
0,3214 |
95 |
0,0245 |
|
16 |
-1,6464 |
36 |
2,0602 |
56 |
0,8077 |
76 |
1,1852 |
96 |
0,9177 |
|
17 |
-0,0034 |
37 |
-1,7713 |
57 |
-0,5921 |
77 |
-0,2945 |
97 |
-1,1162 |
|
18 |
0,7800 |
38 |
0,4693 |
58 |
-0,5994 |
78 |
-0,6606 |
98 |
-1,2239 |
|
19 |
-0,2145 |
39 |
-0,3675 |
59 |
-0,4684 |
79 |
-0,2728 |
99 |
0,0088 |
|
20 |
1,8001 |
40 |
0,7668 |
60 |
-1,3123 |
80 |
0,0561 |
100 |
1,2809 |
а) Вариационный ряд. Вариационным рядом (упорядоченной выборкой) называют совокупность значений признака, записанных в порядке их возрастания, а сам признак называется вариантой (случайной величиной).
Вариационный ряд, построенный по данным табл. 1, приведен в табл. 2.
денормализованный вариационный дисперсия полигон
Табл. 2. Нумерованный вариационный ряд
№ |
xi |
x2i |
№ |
xi |
x2i |
№ |
xi |
x2i |
№ |
xi |
x2i |
№ |
xi |
x2i |
|
1 |
-2,1372 |
4,5676 |
21 |
-0,8346 |
0,6966 |
41 |
-0,2736 |
0,0749 |
61 |
0,0962 |
0,0093 |
81 |
0,8077 |
0,6524 |
|
2 |
-1,7713 |
3,1375 |
22 |
-0,8011 |
0,6418 |
42 |
-0,2728 |
0,0744 |
62 |
0,1807 |
0,0327 |
82 |
0,9035 |
0,8163 |
|
3 |
-1,7251 |
2,9760 |
23 |
-0,7016 |
0,4922 |
43 |
-0,2606 |
0,0679 |
63 |
0,1875 |
0,0352 |
83 |
0,9104 |
0,8288 |
|
4 |
-1,6464 |
2,7106 |
24 |
-0,6606 |
0,4364 |
44 |
-0,2316 |
0,0536 |
64 |
0,2155 |
0,0464 |
84 |
0,9177 |
0,8422 |
|
5 |
-1,5151 |
2,2955 |
25 |
-0,6175 |
0,3813 |
45 |
-0,2145 |
0,0460 |
65 |
0,2502 |
0,0626 |
85 |
1,0037 |
1,0074 |
|
6 |
-1,5139 |
2,2919 |
26 |
-0,5994 |
0,3593 |
46 |
-0,1616 |
0,0261 |
66 |
0,2683 |
0,0720 |
86 |
1,0438 |
1,0895 |
|
7 |
-1,4051 |
1,9743 |
27 |
-0,5921 |
0,3506 |
47 |
-0,1297 |
0,0168 |
67 |
0,3214 |
0,1033 |
87 |
1,0652 |
1,1347 |
|
8 |
-1,3470 |
1,8144 |
28 |
-0,5551 |
0,3081 |
48 |
-0,1259 |
0,0159 |
68 |
0,3336 |
0,1113 |
88 |
1,1852 |
1,4047 |
|
9 |
-1,3309 |
1,7713 |
29 |
-0,5026 |
0,2526 |
49 |
-0,0846 |
0,0072 |
69 |
0,3645 |
0,1329 |
89 |
1,2534 |
1,5710 |
|
10 |
-1,3123 |
1,7221 |
30 |
-0,4692 |
0,2201 |
50 |
-0,0749 |
0,0056 |
70 |
0,3678 |
0,1353 |
90 |
1,2564 |
1,5785 |
|
11 |
-1,3041 |
1,7007 |
31 |
-0,4684 |
0,2194 |
51 |
-0,0553 |
0,0031 |
71 |
0,4693 |
0,2202 |
91 |
1,2809 |
1,6407 |
|
12 |
-1,2239 |
1,4979 |
32 |
-0,4276 |
0,1828 |
52 |
-0,0530 |
0,0028 |
72 |
0,4900 |
0,2401 |
92 |
1,2895 |
1,6628 |
|
13 |
-1,1162 |
1,2459 |
33 |
-0,4140 |
0,1714 |
53 |
-0,0034 |
0,0000 |
73 |
0,4995 |
0,2495 |
93 |
1,4345 |
2,0578 |
|
14 |
-1,0784 |
1,1629 |
34 |
-0,4128 |
0,1704 |
54 |
-0,0029 |
0,0000 |
74 |
0,5031 |
0,2531 |
94 |
1,5529 |
2,4115 |
|
15 |
-1,0066 |
1,0132 |
35 |
-0,4099 |
0,1680 |
55 |
-0,0004 |
0,0000 |
75 |
0,5182 |
0,2685 |
95 |
1,8001 |
3,2404 |
|
16 |
-1,0033 |
1,0066 |
36 |
-0,3717 |
0,1382 |
56 |
0,0088 |
0,0001 |
76 |
0,6042 |
0,3651 |
96 |
1,8457 |
3,4066 |
|
17 |
-0,9871 |
0,9744 |
37 |
-0,3675 |
0,1351 |
57 |
0,0245 |
0,0006 |
77 |
0,6580 |
0,4330 |
97 |
1,9664 |
3,8667 |
|
18 |
-0,9608 |
0,9231 |
38 |
-0,3666 |
0,1344 |
58 |
0,0561 |
0,0031 |
78 |
0,6651 |
0,4424 |
98 |
2,0325 |
4,1311 |
|
19 |
-0,9161 |
0,8392 |
39 |
-0,3202 |
0,1025 |
59 |
0,0601 |
0,0036 |
79 |
0,7668 |
0,5880 |
99 |
2,0602 |
4,2444 |
|
20 |
-0,8756 |
0,7667 |
40 |
-0,2945 |
0,0867 |
60 |
0,0695 |
0,0048 |
80 |
0,7800 |
0,6084 |
100 |
2,7783 |
7,7190 |
б) Оценка параметров распределения по всей выборке. Оценка математического ожидания - среднее арифметическое - вычисляется по формуле:
= - 0,0116
Смещенную оценку дисперсии по всей выборке вычисляем по сокращенной формуле:
1/100*92,1485=0,9214
=0,9599
Несмещенную оценку дисперсии вычисляют то формуле:
100*0,9214/99=0,9308
0,9648
Оценка медианы - значение варианты, которое делит вариационный ряд на две равные по числу членов части. При четном числе членов (n=2k) в качестве медианы принимают:
В нашем случае:
-0,0651
в) Размах варьирования. Размахом варьирования R (широтой распределения) называют разность между наибольшим и наименьшим значениями варианты:
2,7783+2,1372=4,9155
2. Группирование, графики статистических распределений
При большом объеме выборки для удобства вычислений прибегают к группированию данных в интервалы. Число таких интервалов при объеме выборки, превышающем 100 - 300 элементов, рекомендуется брать в пределах от 10 до 20. Возьмем число интервалов l=12. Тогда ширина интервала (шаг разбиения) будет равна:
=4,9155/12=0,4096
Таблица подсчета. Таблицу подсчета частот и частотностей по интервалам вариационного ряда удобно представить в виде табл. 3
Табл. 3. Таблица подсчета
№ |
Границы интервала |
Частота |
Частотность |
Середина интервала |
|
1 |
-2,1372 |
2 |
0,02 |
-1,9323 |
|
-1,7275 |
|||||
2 |
-1,7275 |
7 |
0,07 |
-1,5227 |
|
-1,3179 |
|||||
3 |
-1,3179 |
10 |
0,1 |
-1,1131 |
|
-0,9083 |
|||||
4 |
-0,9083 |
10 |
0,1 |
-0,7035 |
|
-0,4987 |
|||||
5 |
-0,4987 |
19 |
0,19 |
-0,2938 |
|
-0,0890 |
|||||
6 |
-0,0890 |
18 |
0,18 |
0,1157 |
|
0,3205 |
|||||
7 |
0,3205 |
12 |
0,12 |
0,5253 |
|
0,7301 |
|||||
8 |
0,7301 |
9 |
0,09 |
0,9349 |
|
1,1398 |
|||||
9 |
1,1398 |
6 |
0,06 |
1,3446 |
|
1,5494 |
|||||
10 |
1,5494 |
3 |
0,03 |
1,7542 |
|
1,9590 |
|||||
11 |
1,9590 |
3 |
0,03 |
2,1638 |
|
2,3686 |
|||||
12 |
2,3686 |
1 |
0,01 |
2,5735 |
|
2,7783 |
Графики статистических распределений. Для наглядности выборочное распределение изображают графически несколькими способами. Наиболее распространенными являются полигон, гистограмма и ступенчатая кривая. Они строятся следующим образом:
Полигон. На оси абсцисс откладываются интервалы значений величины х, в серединах интервалов строятся ординаты, пропорциональные частостям (или частотам), и концы ординат соединяются отрезками прямых линий. На рис. 1 показан полигон распределения, построенный по данным табл. 3.
Рис. 1. Полигон распределения
Гистограмма. Над. каждым отрезком оси абсцисс, изображающим интервал значений х, строится прямоугольник, площадь которого пропорциональна частости (или частоте) в данном интервале. На рис. 2 показана гистограмма распределения, построенная по данным табл. 3.
Рис. 2. Гистограмма распределения
Ступенчатая кривая. Над каждым отрезком оси абсцисс, изображающим расстояние между серединами интервалов значений х, проводится отрезок горизонтальной прямой на высоте, пропорциональной накопленной частости (или накопленной частоте) в данном интервале. Концы отрезков соединяются. Накопленной частостью в данном интервале называется сумма всех частостеи, начиная с первого интервала до данного интервала включительно. На рис. 3 показана ступенчатая кривая распределения, построенная по данным табл. 3.
Рис. 3. Ступенчатая кривая распределения
3. Точечная оценка характеристик распределения
по сгруппированным данным
Среднее арифметическое. Для нахождения среднего арифметического значения выборки воспользуемся формулой:
где xi - середина интервала;
l - число интервалов;
- частота в интервале;
n - число элементов в выборке.
Мода. Оценкой моды является середина самого многочисленного интервала:
-0,294
Эмпирическая дисперсия s2 и среднее квадратическое отклонение s вычисляются по формулам:
В нашем случае:
1/100*94,85-0,00922=0,9484
0,9738
Коэффициент вариации считается по формуле:
(при )
0,9738/0,0092=105,4547
Оценка дисперсии, полученная по группированным данным, оказывается смещенной. Исправляют это смещение введением поправки Шеппарда. Тогда
=0,9484
Вычисление математического ожидания и дисперсии по табл. 3 достаточно сложно. Громоздких вычислений, особенно при вычислении моментов более высокого порядка, можно избежать, используя «ложный нуль». Вычислим оценки математического ожидания, дисперсии, асимметрии и эксцесса, пользуясь этим приемом.
При большом числе интервалов с нецелочисленными границами целесообразно за начало отсчета («ложный нуль») принять значение, отвечающее наиболее многочисленному интервалу, и одновременно выразить значение всех интервалов в долях ширины интервала . В результате середине каждого интервала будет отвечать простое целое число, с которым можно просто оперировать. Проведя все операции, предусмотренные табл. 4, каждый результат умножают на в соответствующей степени, а для получения еще прибавляют «ложный нуль». Вычисления удобно представить в виде табл. 4.
Табл. 4
№ инт. |
середины |
yi |
yi2 |
yi3 |
yi4 |
? |
?*yi |
?*yi2 |
?*yi3 |
?*yi4 |
|
1 |
-1,9324 |
-4 |
16 |
-64 |
256 |
2 |
-8 |
32 |
-128 |
512 |
|
2 |
-1,5228 |
-3 |
9 |
-27 |
81 |
7 |
-21 |
63 |
-189 |
567 |
|
3 |
-1,1131 |
-2 |
4 |
-8 |
16 |
10 |
-20 |
40 |
-80 |
160 |
|
4 |
-0,7035 |
-1 |
1 |
-1 |
1 |
10 |
-10 |
10 |
-10 |
10 |
|
5 |
-0,2939 |
0 |
0 |
0 |
0 |
19 |
0 |
0 |
0 |
0 |
|
6 |
0,1157 |
1 |
1 |
1 |
1 |
18 |
18 |
18 |
18 |
18 |
|
7 |
0,5254 |
2 |
4 |
8 |
16 |
12 |
24 |
48 |
96 |
192 |
|
8 |
0,9350 |
3 |
9 |
27 |
81 |
9 |
27 |
81 |
243 |
729 |
|
9 |
1,3446 |
4 |
16 |
64 |
256 |
6 |
24 |
96 |
384 |
1536 |
|
10 |
1,7542 |
5 |
25 |
125 |
625 |
3 |
15 |
75 |
375 |
1875 |
|
11 |
2,1639 |
6 |
36 |
216 |
1296 |
3 |
18 |
108 |
648 |
3888 |
|
12 |
2,5735 |
7 |
49 |
343 |
2401 |
1 |
7 |
49 |
343 |
2401 |
|
Суммы |
1 |
100 |
74 |
620 |
1700 |
11888 |
|||||
Обозначение сумм |
У0 |
У1 |
У2 |
У3 |
У4 |
||||||
Нач. моменты в относительном выражении |
0,74 |
6,20 |
17,00 |
118,88 |
|||||||
Обозначения относительных нач. моментов |
h1 |
h2 |
h3 |
h4 |
В табл. 4 относительные середины интервалов, приведенные в третьей графе, получены по формуле:
,
где с - «ложный нуль» (с=-0,2939), а -ширина интервала (=0,4096).
Относительные начальные моменты рассчитываются по формуле:
Среднее арифметическое и центральные эмпирические моменты m2, m3 и m4 определим по формулам:
Проведя вычисления, получим:
0,0092
0,9484
0,2781
2,4785
Далее вычислим оценки асимметрии и эксцесса по формулам:
= 0,3474
=0,3344
4. Оценка параметров распределения методом квантилей
Предположим, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Определим оценки пара метров этого закона математического ожидания m и среднего квадратического отклонения у, используя метод квантилей. Квантилем, отвечающим заданному уровню вероятности р, называют такое значение варианты x=xp, при котором функция распределения принимает значение, равное р, т.е.:
F(xp)=p
Для определения оценок двух неизвестных параметров m и у составим, два уравнения, используя формулу:
Из вариационного ряда возьмем два любых значения варианты хр' и хр» с соответствующими им вероятностями р' и р». Вероятности р' и р» соответствуют порядковому номеру выбранных вариант, деленному на 100. Подставляя эти величины в формулу функции Лапласа, получим уравнения:
Решение системы дает в результате:
=-0,1125; =0,728
5. Построение доверительных интервалов
Для того чтобы иметь представление о точности и надежности полученной в § 5 оценки некоторого параметра распределения, необходимо построить для данного параметра доверительный интервал.
Доверительный интервал для математического ожидания. Рассмотрим выборку малого объема из первых двадцати значений табл. 1.
Построим таблицу, вариационный ряд (табл. 5 и 6). Найдем оценки математического ожидания и дисперсии (смещенную и несмещенную) как в § 3, б.
Табл .5 Табл. 6
№ |
xi |
№ |
xi |
xi2 |
xi2-x2ср |
||
1 |
0,6651 |
1 |
-1,6464 |
2,710633 |
2,710216 |
||
2 |
0,6580 |
2 |
-1,0066 |
1,013244 |
1,012827 |
||
3 |
-0,8756 |
3 |
-0,9608 |
0,923137 |
0,922720 |
||
4 |
-0,9608 |
4 |
-0,8756 |
0,766675 |
0,766258 |
||
5 |
-0,8011 |
5 |
-0,8011 |
0,641761 |
0,641344 |
||
6 |
0,9035 |
6 |
-0,7016 |
0,492243 |
0,491826 |
||
7 |
1,0438 |
7 |
-0,3666 |
0,134396 |
0,133979 |
||
8 |
0,0695 |
8 |
-0,2145 |
0,046010 |
0,045593 |
||
9 |
-1,0066 |
9 |
-0,1297 |
0,016822 |
0,016405 |
||
10 |
-0,7016 |
10 |
-0,0530 |
0,002809 |
0,002392 |
||
11 |
-0,0530 |
11 |
-0,0034 |
1,16E-05 |
-0,00041 |
||
12 |
0,2502 |
12 |
0,0695 |
0,004830 |
0,004413 |
||
13 |
-0,1297 |
13 |
0,1807 |
0,032652 |
0,032236 |
||
14 |
-0,3666 |
14 |
0,2502 |
0,062600 |
0,062183 |
||
15 |
0,1807 |
15 |
0,6580 |
0,432964 |
0,432547 |
||
16 |
-1,6464 |
16 |
0,6651 |
0,442358 |
0,441941 |
||
17 |
-0,0034 |
17 |
0,7800 |
0,608400 |
0,607983 |
||
18 |
0,7800 |
18 |
0,9035 |
0,816312 |
0,815895 |
||
19 |
-0,2145 |
19 |
1,0438 |
1,089518 |
1,089101 |
||
20 |
1,8001 |
20 |
1,8001 |
3,240360 |
3,239943 |
В предположении нормального распределения отклонения случайной величины от среднего построим доверительный интервал для математического ожидания при неизвестном у по значениям данной выборки по формуле:
где
В нашем примере после вычислений получим:
-0,0204
0,6735, 0,8206
0,7089, 0,8419
Определим доверительные интервалы для математического ожидания mx, задаваясь различными уровнями значимости q (т.е. при разных значениях доверительной вероятности p). Значения квантилей берутся из таблиц распределения Стьюдента по двум входам: по числу степеней свободы (n-1) и уровнями значимости q. Уровень значимости q здесь и в дальнейшем предполагается заданным. Число степеней свободы (n-1)=19.
· 1%; р=1-q/100=1-1/100=0,99; 2,8615
Доверительный интервал: -0,5592<mx<0,5183
· 5%; р=1-q/100=1-5/100=0,95; 2,093
Доверительный интервал: -0,4145<mx<0,3736
· 10%; р=1-q/100=1-10/100=0,90; 1,7295
Доверительный интервал: -0,346<mx<0,3052
Доверительный интервал для дисперсии ух2 и среднего квадратического отклонения ух. Доверительный интервал для параметров ух2 и ух строятся также по первым двадцати значениям выборки по формулам:
,
где пределы и берутся из таблиц распределения хи-квадрат по двум входам: по числу степеней свободы (n-1) и вероятностям р1=1-1/2*q/100 для и р2=1/2*q/100 для .
· 1%
р1=1-1/2*q/100=1-1/2*1/100=0,995 => =6,84
р2=1/2*q/100=1/2*1/100=0,005 => =38,58
Доверительные интервалы: 0,3491< ух2 <1,9692
0,5908< ух< 1,4032
4%
р1=1-1/2*q/100=1-1/2*4/100=0,98 => =8,57
р2=1/2*q/100=1/2*4/100=0,02 => =33,69
Доверительные интервалы: 0,3997< ух2 <1,5722
0,6322< ух< 1,2538
· 5%
р1=1-1/2*q/100=1-1/2*5/100=0,975 => =8,91
р2=1/2*q/100=1/2*5/100=0,025 => =32,85
Доверительные интервалы: 0,4100< ух2 <1,5117
0,6403< ух< 1,2295
10%;
р1=1-1/2*q/100=1-1/2*10/100=0,95 => =10,12
р2=1/2*q/100=1/2*10/100=0,05 => =30,14
Доверительные интервалы: 0,4468< ух2 <1,3309
0,6685< ух< 1,1536
Такие методы построения доверительных интервалов для m и у оправданы лишь в случае нормального распределения отклонений. Следовательно, пользоваться ими можно только после проверки гипотезы о нормальном распределении случайной величины X с помощью некоторого критерия (например, как в § 8, 9).
6. Приближенный метод проверки гипотезы о нормальном распределении
Примем гипотезу о том, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Для приближенной проверки этой гипотезы могут быть использованы эмпирические асимметрия и эксцесс .
Для нормального распределения, как известно=0 и =0. Поэтому показатели асимметрии и эксцесса, отличные от нуля, указывают на отклонение рассматриваемого распределения от нормального.
Выборочные асимметрия и эксцесс, как и все оценки, являются случайными величинами и могут не совпадать с теоретическими. Можно показать, что при данном объеме выборки применить здесь общие методы критериев значимости трудно, так как распределения оценок асимметрии и эксцесса очень сложны. Однако среднеквадратические отклонения этих характеристик при заданном объеме выборки n вычисляются по достаточно простым формулам:
В нашем случае будет:
Зная эти величины, можно оценить, существенно ли отличаются оценки от оцениваемых асимметрии и эксцесса , т.е. от нуля. Критические области для асимметрии и для эксцесса получены на основании неравенства Чебышева.
=0,3474 => =0,72
=0,3344 => =2,3
Видим, что и , не попадают в критическую область, т.о. гипотеза нормальности не противоречит данным табл. 1.
7. Критерий хи-квадрат для проверки статистических гипотез
Примем гипотезу о том, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Для проверки этой гипотезы воспользуемся критерием
Значение критерия определяется по данным выборки. Если это значение попадет в область допустимых значений , то следует признать, что данные выборки не противоречат гипотезе о нормальности распределения.
Если же численное значение критерия попадает в критическую область , то гипотеза отвергается. Вычисления критерия удобно свести в табл. 7.
Сумма, называемая критерием , асимптотически распределена как хи-квадрат. При практических расчетах для нахождения критического значения этой суммы можно пользоваться таблицами распределения хи-квадрат только в том случае, если для всех интервалов > 5 (более строгое требование > 10). Поэтому в табл. 7 интервалы 2, 3; 8 и 9 объединены.
Оценку вероятности попадания в интервал находим по формуле:
,
где и - границы интервалов, и вычислены в § 5 по данной выборке, а значения функции Лапласа берутся из таблицы.
Табл. 7
№ инт |
Границы интервалов |
Ф(Zi) |
Ф(Zi) |
Pi |
npi |
?? |
?i-npi |
(?i-npi)2/ |
||||
истинные |
в долях ско |
npi |
||||||||||
1 |
-? |
-1,728 |
-? |
-1,87 |
-0,5000 |
-0,4693 |
0,0307 |
7,6360 |
9 |
1,364 |
0,2436 |
|
2 |
-1,728 |
-1,318 |
-1,87 |
-1,43 |
-0,4693 |
-0,4236 |
0,0456 |
|||||
3 |
-1,318 |
-0,908 |
-1,43 |
-0,99 |
-0,4236 |
-0,3389 |
0,0847 |
8,4730 |
10 |
1,527 |
0,2752 |
|
4 |
-0,908 |
-0,499 |
-0,99 |
-0,55 |
-0,3389 |
-0,2088 |
0,1301 |
13,007 |
10 |
-3,007 |
0,6952 |
|
5 |
-0,499 |
-0,089 |
-0,55 |
-0,11 |
-0,2088 |
-0,0438 |
0,1650 |
16,504 |
19 |
2,496 |
0,3775 |
|
6 |
-0,089 |
0,3206 |
-0,11 |
0,34 |
-0,0438 |
0,1331 |
0,1769 |
17,687 |
18 |
0,313 |
0,0055 |
|
7 |
0,3206 |
0,7302 |
0,34 |
0,78 |
0,1331 |
0,2823 |
0,1492 |
14,923 |
12 |
-2,923 |
0,5725 |
|
8 |
0,7302 |
1,1398 |
0,78 |
1,22 |
0,2823 |
0,3888 |
0,1065 |
10,647 |
9 |
-1,647 |
0,2548 |
|
9 |
1,1398 |
1,5494 |
1,22 |
1,66 |
0,3888 |
0,4515 |
0,0628 |
11,123 |
13 |
1,877 |
0,3167 |
|
10 |
1,5494 |
1,9591 |
1,66 |
2,10 |
0,4515 |
0,4812 |
0,0297 |
|||||
11 |
1,9591 |
2,3687 |
2,10 |
2,54 |
0,4812 |
0,4945 |
0,0132 |
|||||
12 |
2,3687 |
+? |
2,54 |
+? |
0,4945 |
0,500 |
0,0055 |
|||||
Суммы |
1,0000 |
100 |
100 |
2,7411 |
Крайние границы самого левого и самого правого интервалов, расширены до -? и +? соответственно.
Так как по данным выборки мы оценили два параметра mx и ух нормального закона (т.е. с=2), то в нашем случае число степеней свободы будет равно k=l' - c-1=8-2-1=5, где l'=8 - число интервалов, получившихся после объединения интервалов 1,2 и 9,10,11 и 12.
По таблице распределения хи-квадрат найдем значения для числа степеней свободы k=5 и уровней значимости q, равным 1%, 5% и 10%:
· 1%, тогда=15,086
Поскольку (2,7411<15,086), то гипотеза о нормальности выборки не противоречит данным измерений.
· 5%, тогда =11,07.
Поскольку (2,7411<11,07), то гипотеза о нормальности выборки не противоречит данным измерений.
10%, тогда =9,236
Поскольку (2,7411<9,236), то гипотеза о нормальности выборки не противоречит данным измерений.
8. Проверка гипотезы об однородности выборки
с помощью критерия знаков и критерия Вилкоксона
Введем нулевую гипотезу Н0 о том, что выборка, данная в табл. 1, является однородной. Для проверки этой гипотезы возьмем две выборки из двадцати первых и двадцати последних значений табл. 1 и представим данные в табл. 8. Воспользуемся непараметрическими (независимыми от формы распределения) критериями: критерием знаков и критерием Вилкоксона.
Критерий знаков. Составим разность zi=xi - yi, где i= 1, 2., 20 - порядковые номера первых xi и последних yi двадцати значений выборки. Подсчитаем число положительных kn(+) и отрицательных kn (-) знаков разностей zi (n=20). Затем, выбрав уровень значимости q, находим по q и n в соответствующей таблице критическое значение меньшего из чисел положительных и отрицательных знаков zi. Если теперь меньшее из чисел знаков разностей окажется меньше , то гипотеза об однородности выборки отвергается, а если меньшее из чисел знаков разностей окажется больше , то следует признать, что гипотеза не противоречит данным выборки.
Табл. 8
xi |
yi |
zi=xi-yi |
|
0,6651 |
0,0962 |
0,5689 |
|
0,6580 |
0,4900 |
0,1680 |
|
-0,8756 |
-1,3309 |
0,4553 |
|
-0,9608 |
-0,8346 |
-0,1262 |
|
-0,8011 |
1,4345 |
-2,2356 |
|
0,9035 |
-0,0749 |
0,9784 |
|
1,0438 |
-0,3202 |
1,3640 |
|
0,0695 |
-0,9161 |
0,9856 |
|
-1,0066 |
-0,4128 |
-0,5938 |
|
-0,7016 |
-1,3041 |
0,6025 |
|
-0,0530 |
-0,6175 |
0,5645 |
|
0,2502 |
-2,1372 |
2,3874 |
|
-0,1297 |
0,9104 |
-1,0401 |
|
-0,3666 |
-0,1616 |
-0,2050 |
|
0,1807 |
0,0245 |
0,1562 |
|
-1,6464 |
0,9177 |
-2,5641 |
|
-0,0034 |
-1,1162 |
1,1128 |
|
0,7800 |
-1,2239 |
2,0039 |
|
-0,2145 |
0,0088 |
-0,2233 |
|
1,8001 |
1,2809 |
0,5192 |
Для данных табл. 1 имеем: k20(+)=13 и k20(-)=7.
Из таблицы для n=20 и уровней значимости q, равным 1%, 5% и 10% находим:
· 1%; =3
· 5%; =5
· 10%; =5
Т.к. меньшее из чисел знаков разностей k20(-)=7 при всех рассмотренных уровнях значимости оказалось больше значения , то нулевая гипотеза Н0 об однородности выборки не противоречит данным выборки.
Критерий Вилкоксона основан на числе инверсий.
Элементы двух выборок из двадцати первых и двадцати последних значений табл. 1 располагаются в общую последовательность в порядке возрастания их значений. Если какому-либо значению x из общей последовательности предшествует некоторый y, то говорят, что эта пара дает инверсию. Суммарное число инверсий обозначим за u.
Далее введем нулевую гипотезу Н0 о том, что выборка, данная в табл. 1, является однородной. Эта гипотеза отвергается, если число инверсий u превосходит выбранную в соответствии с уровнем значимости границу, определяемую из того, что при объемах n>10 и m>10 выборок число инверсий u распределено приблизительно нормально с центром:
дисперсией:
и средним квадратическим отклонением:
В нашем случае получим:
200
1367
37,0
Задавшись уровнем значимости q, построим критическую область, используя соотношение:
где - функция Лапласа.
Используя эту формулу и таблицу нормального распределения, находим значение . Критическая область для гипотезы Н0:
денормализованный вариационный дисперсия полигон
В нашем примере число инверсий:
u=231
Найдем критические области для выдвинутой нулевой гипотезы, задавшись уровнем значимости q, равным 1%, 5% и 10%:
· 1%
·
· 5%
·
· 10%
·
При всех рассмотренных уровнях значимости число инверсий u не лежит в критической области, а потому нулевая гипотеза Н0 об однородности выборки не противоречит данным выборки.
Размещено на Allbest.ru
Подобные документы
Методика расчета показателей вариации по средней арифметической взвешенной. Произведение расчетов по данным интервального вариационного ряда. Построение полигона и гистограммы. Элементы и проведение дисперсионного анализа. Правило сложения дисперсий.
лабораторная работа [67,2 K], добавлен 21.06.2009Группировка статистических показателей, описывающих выборку. Этапы построения вариационного ряда, группировки данных. Определение частости и эмпирической плотности вероятностей. Построение полигона, гистограммы и эмпирической функции распределения.
практическая работа [71,6 K], добавлен 27.06.2010Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.
контрольная работа [354,6 K], добавлен 26.04.2010Анализ эффективности деятельности предприятий. Построение статистического ряда распределения организаций по выручке от продажи продукции. Вычисление медианы для интервального вариационного ряда. Группировка предприятий по выручке от продажи продукции.
контрольная работа [82,4 K], добавлен 30.04.2014Построение дискретного и интервального вариационного ряда работы горных предприятий. Вычисление характеристик меры и степени вариации. Определение основных показателей, показывающих направление и интенсивность количественных изменений динамического ряда.
курсовая работа [381,0 K], добавлен 13.12.2011Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.
курсовая работа [344,1 K], добавлен 21.03.2014Определение для вариационного ряда: средней арифметической, дисперсии, моды, медианы, относительных показателей вариации. Проведение смыкания рядов динамики c использованием коэффициента сопоставимости. Вычисление агрегатных индексов цен и стоимости.
контрольная работа [23,0 K], добавлен 29.01.2011Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.
курсовая работа [403,2 K], добавлен 17.11.2014Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.
контрольная работа [69,3 K], добавлен 16.11.2011Формирование информационной базы – начальной стадии экономико-статистического исследования. Расчеты средней и предельной ошибок выборки. Оценка распространения выборочных данных на генеральную совокупность. Построение вариационного возрастающего ряда.
контрольная работа [79,1 K], добавлен 09.12.2009