Бизнес-аналитика и статистика
Построение уравнения тренда методами регрессионного анализа. Определение величины остаточной дисперсии и коэффициентов корреляции. Построение уравнения регрессии разными способами, сравнительная характеристика полученных оценок и построенных графиков.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 10.03.2016 |
Размер файла | 459,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
УФИМСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра автоматизированных систем управления
Курсовое проектирование
по дисциплине «Бизнес-аналитика и статистика»
Выполнил: Нафикова Л.И.
Уфа-2014 г.
ИСХОДНЫЕ ДАННЫЕ
Таблица 1. Исходные данные
N |
X |
Y |
Z |
G |
|
1 |
44 |
-8 |
-75 |
60 |
|
2 |
48 |
-9 |
-127 |
54 |
|
3 |
16 |
0 |
4 |
53 |
|
4 |
46 |
-11 |
-10 |
48 |
|
5 |
38 |
-6 |
-75 |
49 |
|
6 |
0 |
6 |
48 |
49 |
|
7 |
47 |
-9 |
-130 |
55 |
|
8 |
23 |
-1 |
-57 |
61 |
|
9 |
6 |
2 |
-102 |
72 |
|
10 |
5 |
3 |
-101 |
77 |
|
11 |
26 |
-4 |
-115 |
65 |
|
12 |
18 |
1 |
-60 |
69 |
|
13 |
21 |
-2 |
-110 |
73 |
|
14 |
5 |
3 |
14 |
67 |
|
15 |
43 |
-9 |
-159 |
65 |
|
16 |
21 |
-2 |
-25 |
56 |
|
17 |
27 |
-3 |
-22 |
60 |
|
18 |
6 |
2 |
-75 |
72 |
|
19 |
36 |
-6 |
-106 |
67 |
|
20 |
44 |
-8 |
-135 |
77 |
|
21 |
37 |
-7 |
68 |
82 |
|
22 |
42 |
-9 |
117 |
88 |
|
23 |
25 |
-2 |
-100 |
92 |
|
24 |
49 |
-10 |
-64 |
92 |
|
25 |
7 |
3 |
-36 |
81 |
|
26 |
24 |
-2 |
27 |
81 |
|
27 |
15 |
0 |
-3 |
78 |
|
28 |
41 |
-8 |
-10 |
74 |
|
29 |
28 |
-4 |
-74 |
69 |
|
30 |
32 |
-5 |
-11 |
74 |
|
31 |
5 |
3 |
-104 |
80 |
|
32 |
26 |
-4 |
-58 |
82 |
|
Итого |
26,6129 |
-3,29032 |
-50,1333 |
69,4375 |
Задача 1.
Вычислите показатели вариации по каждой из выборок X, Y, Z:
- среднее арифметическое;
- моду;
- медиану;
- размах вариации;
- дисперсию;
- стандартное отклонение;
- среднее линейное отклонение;
- коэффициенты осцилляции и вариации.
Решение
Таблица 2. Расчет среднего значения
N |
X |
Y |
Z |
|
1 |
44 |
-8 |
-75 |
|
2 |
48 |
-9 |
-127 |
|
3 |
16 |
0 |
4 |
|
4 |
46 |
-11 |
-10 |
|
5 |
38 |
-6 |
-75 |
|
6 |
0 |
6 |
48 |
|
7 |
47 |
-9 |
-130 |
|
8 |
23 |
-1 |
-57 |
|
9 |
6 |
2 |
-102 |
|
10 |
5 |
3 |
-101 |
|
11 |
26 |
-4 |
-115 |
|
12 |
18 |
1 |
-60 |
|
13 |
21 |
-2 |
-110 |
|
14 |
5 |
3 |
14 |
|
15 |
43 |
-9 |
-159 |
|
16 |
21 |
-2 |
-25 |
|
17 |
27 |
-3 |
-22 |
|
18 |
6 |
2 |
-75 |
|
19 |
36 |
-6 |
-106 |
|
20 |
44 |
-8 |
-135 |
|
21 |
37 |
-7 |
68 |
|
22 |
42 |
-9 |
117 |
|
23 |
25 |
-2 |
-100 |
|
24 |
49 |
-10 |
-64 |
|
25 |
7 |
3 |
-36 |
|
26 |
24 |
-2 |
27 |
|
27 |
15 |
0 |
-3 |
|
28 |
41 |
-8 |
-10 |
|
29 |
28 |
-4 |
-74 |
|
30 |
32 |
-5 |
-11 |
|
31 |
5 |
3 |
-104 |
|
32 |
26 |
-4 |
-58 |
|
Итого |
26,6129 |
-3,29032 |
-50,1333 |
1) Среднее арифметическое:
;
(X) ==0,83
(Y) ==-0,10
(Z) ==1,56
Таблица 3
Исходные данные в порядке возрастания
Мода
Mo = .
Mo (X) = 16
Mo (Y) = - (нет данных)
Mo (Z) = -16
Медиана:
Ме= |
, если n - нечетное , если n - четное |
Так как объем выборки равен 32, то берем среднее арифметическое двух центральных значений: № 16 и № 17
Mе (X) = =22
Mе (Y) = = -184,5
Mе (Z) = =13,5
Размах вариации.
R= xmax -xmin.
X |
Y |
Z |
||
xmax |
45 |
-58 |
57 |
|
xmin |
6 |
-421 |
-16 |
R(X) = 45-6=39
R(Y) =-58-(-421)=363
R(Z) = 57-(-16)=73
Дисперсия
Таблица 4. Расчет исходных данных дисперсии
N |
X |
Y |
Z |
(Xi-Xср) |
(Xi-Xср)^2 |
(Yi-Yср) |
(Yi-Yср)^2 |
(Zi-Zср) |
(Zi-Zср)^2 |
|
1 |
44 |
-8 |
-75 |
17,41 |
302,98 |
-4,69 |
21,97 |
-22,94 |
526,13 |
|
2 |
48 |
-9 |
-127 |
21,41 |
458,23 |
-5,69 |
32,35 |
-74,94 |
5615,63 |
|
3 |
16 |
0 |
4 |
-10,59 |
112,23 |
3,31 |
10,97 |
56,06 |
3143,00 |
|
4 |
46 |
-11 |
-10 |
19,41 |
376,60 |
-7,69 |
59,10 |
42,06 |
1769,25 |
|
5 |
38 |
-6 |
-75 |
11,41 |
130,10 |
-2,69 |
7,22 |
-22,94 |
526,13 |
|
6 |
0 |
6 |
48 |
-26,59 |
707,23 |
9,31 |
86,72 |
100,06 |
10012,50 |
|
7 |
47 |
-9 |
-130 |
20,41 |
416,42 |
-5,69 |
32,35 |
-77,94 |
6074,25 |
|
8 |
23 |
-1 |
-57 |
-3,59 |
12,92 |
2,31 |
5,35 |
-4,94 |
24,38 |
|
9 |
6 |
2 |
-102 |
-20,59 |
424,10 |
5,31 |
28,22 |
-49,94 |
2493,75 |
|
10 |
5 |
3 |
-101 |
-21,59 |
466,29 |
6,31 |
39,85 |
-48,94 |
2394,88 |
|
11 |
26 |
-4 |
-115 |
-0,59 |
0,35 |
-0,69 |
0,47 |
-62,94 |
3961,13 |
|
12 |
18 |
1 |
-60 |
-8,59 |
73,85 |
4,31 |
18,60 |
-7,94 |
63,00 |
|
13 |
21 |
-2 |
-110 |
-5,59 |
31,29 |
1,31 |
1,72 |
-57,94 |
3356,75 |
|
14 |
5 |
3 |
14 |
-21,59 |
466,29 |
6,31 |
39,85 |
66,06 |
4364,25 |
|
15 |
43 |
-9 |
-159 |
16,41 |
269,17 |
-5,69 |
32,35 |
##### |
11435,63 |
|
16 |
21 |
-2 |
-25 |
-5,59 |
31,29 |
1,31 |
1,72 |
27,06 |
732,38 |
|
17 |
27 |
-3 |
-22 |
0,41 |
0,17 |
0,31 |
0,10 |
30,06 |
903,75 |
|
18 |
6 |
2 |
-75 |
-20,59 |
424,10 |
5,31 |
28,22 |
-22,94 |
526,13 |
|
19 |
36 |
-6 |
-106 |
9,41 |
88,48 |
-2,69 |
7,22 |
-53,94 |
2909,25 |
|
20 |
44 |
-8 |
-135 |
17,41 |
302,98 |
-4,69 |
21,97 |
-82,94 |
6878,63 |
|
21 |
37 |
-7 |
68 |
10,41 |
108,29 |
-3,69 |
13,60 |
120,06 |
14415,00 |
|
22 |
42 |
-9 |
117 |
15,41 |
237,35 |
-5,69 |
32,35 |
169,06 |
28582,13 |
|
23 |
25 |
-2 |
-100 |
-1,59 |
2,54 |
1,31 |
1,72 |
-47,94 |
2298,00 |
|
24 |
49 |
-10 |
-64 |
22,41 |
502,04 |
-6,69 |
44,72 |
-11,94 |
142,50 |
|
25 |
7 |
3 |
-36 |
-19,59 |
383,92 |
6,31 |
39,85 |
16,06 |
258,00 |
|
26 |
24 |
-2 |
27 |
-2,59 |
6,73 |
1,31 |
1,72 |
79,06 |
6250,88 |
|
27 |
15 |
0 |
-3 |
-11,59 |
134,42 |
3,31 |
10,97 |
49,06 |
2407,13 |
|
28 |
41 |
-8 |
-10 |
14,41 |
207,54 |
-4,69 |
21,97 |
42,06 |
1769,25 |
|
29 |
28 |
-4 |
-74 |
1,41 |
1,98 |
-0,69 |
0,47 |
-21,94 |
481,25 |
|
30 |
32 |
-5 |
-11 |
5,41 |
29,23 |
-1,69 |
2,85 |
41,06 |
1686,13 |
|
31 |
5 |
3 |
-104 |
-21,59 |
466,29 |
6,31 |
39,85 |
-51,94 |
2697,50 |
|
32 |
26 |
-4 |
-58 |
-0,59 |
0,35 |
-0,69 |
0,47 |
-5,94 |
35,25 |
|
Итого |
851 |
-106 |
-1666 |
7175,72 |
686,88 |
128733,88 |
||||
Среднее значение |
26,59 |
-3,31 |
-52,06 |
D(X)==231,47
D(Y)= =22,15
D(Z)==4152,70
Стандартное отклонение
=
==15,21
==4,70.
==64,44.
Среднее линейное отклонение
Таблица 5. Расчет среднего линейного отклонения
N |
X |
Y |
Z |
Xi-Xср |
|Xi-Xср| |
Yi-Yср |
|Yi-Yср| |
Zi-Zср |
|Zi-Zср| |
|
1 |
44 |
-8 |
-75 |
17,41 |
17,41 |
-4,69 |
4,69 |
-22,94 |
22,94 |
|
2 |
48 |
-9 |
-127 |
21,41 |
21,41 |
-5,69 |
5,69 |
-74,94 |
74,94 |
|
3 |
16 |
0 |
4 |
-10,59 |
10,59 |
3,31 |
3,31 |
56,06 |
56,06 |
|
4 |
46 |
-11 |
-10 |
19,41 |
19,41 |
-7,69 |
7,69 |
42,06 |
42,06 |
|
5 |
38 |
-6 |
-75 |
11,41 |
11,41 |
-2,69 |
2,69 |
-22,94 |
22,94 |
|
6 |
0 |
6 |
48 |
-26,59 |
26,59 |
9,31 |
9,31 |
100,06 |
100,06 |
|
7 |
47 |
-9 |
-130 |
20,41 |
20,41 |
-5,69 |
5,69 |
-77,94 |
77,94 |
|
8 |
23 |
-1 |
-57 |
-3,59 |
3,59 |
2,31 |
2,31 |
-4,94 |
4,94 |
|
9 |
6 |
2 |
-102 |
-20,59 |
20,59 |
5,31 |
5,31 |
-49,94 |
49,94 |
|
10 |
5 |
3 |
-101 |
-21,59 |
21,59 |
6,31 |
6,31 |
-48,94 |
48,94 |
|
11 |
26 |
-4 |
-115 |
-0,59 |
0,59 |
-0,69 |
0,69 |
-62,94 |
62,94 |
|
12 |
18 |
1 |
-60 |
-8,59 |
8,59 |
4,31 |
4,31 |
-7,94 |
7,94 |
|
13 |
21 |
-2 |
-110 |
-5,59 |
5,59 |
1,31 |
1,31 |
-57,94 |
57,94 |
|
14 |
5 |
3 |
14 |
-21,59 |
21,59 |
6,31 |
6,31 |
66,06 |
66,06 |
|
15 |
43 |
-9 |
-159 |
16,41 |
16,41 |
-5,69 |
5,69 |
-106,94 |
106,94 |
|
16 |
21 |
-2 |
-25 |
-5,59 |
5,59 |
1,31 |
1,31 |
27,06 |
27,06 |
|
17 |
27 |
-3 |
-22 |
0,41 |
0,41 |
0,31 |
0,31 |
30,06 |
30,06 |
|
18 |
6 |
2 |
-75 |
-20,59 |
20,59 |
5,31 |
5,31 |
-22,94 |
22,94 |
|
19 |
36 |
-6 |
-106 |
9,41 |
9,41 |
-2,69 |
2,69 |
-53,94 |
53,94 |
|
20 |
44 |
-8 |
-135 |
17,41 |
17,41 |
-4,69 |
4,69 |
-82,94 |
82,94 |
|
21 |
37 |
-7 |
68 |
10,41 |
10,41 |
-3,69 |
3,69 |
120,06 |
120,06 |
|
22 |
42 |
-9 |
117 |
15,41 |
15,41 |
-5,69 |
5,69 |
169,06 |
169,06 |
|
23 |
25 |
-2 |
-100 |
-1,59 |
1,59 |
1,31 |
1,31 |
-47,94 |
47,94 |
|
24 |
49 |
-10 |
-64 |
22,41 |
22,41 |
-6,69 |
6,69 |
-11,94 |
11,94 |
|
25 |
7 |
3 |
-36 |
-19,59 |
19,59 |
6,31 |
6,31 |
16,06 |
16,06 |
|
26 |
24 |
-2 |
27 |
-2,59 |
2,59 |
1,31 |
1,31 |
79,06 |
79,06 |
|
27 |
15 |
0 |
-3 |
-11,59 |
11,59 |
3,31 |
3,31 |
49,06 |
49,06 |
|
28 |
41 |
-8 |
-10 |
14,41 |
14,41 |
-4,69 |
4,69 |
42,06 |
42,06 |
|
29 |
28 |
-4 |
-74 |
1,41 |
1,41 |
-0,69 |
0,69 |
-21,94 |
21,94 |
|
30 |
32 |
-5 |
-11 |
5,41 |
5,41 |
-1,69 |
1,69 |
41,06 |
41,06 |
|
31 |
5 |
3 |
-104 |
-21,59 |
21,59 |
6,31 |
6,31 |
-51,94 |
51,94 |
|
32 |
26 |
-4 |
-58 |
-0,59 |
0,59 |
-0,69 |
0,69 |
-5,94 |
5,94 |
|
Итого |
851 |
-106 |
-1666 |
406,19 |
128,00 |
1675,63 |
||||
Среднее значение |
26,59 |
-3,31 |
-52,06 |
12,69 |
4,00 |
52,36 |
(X)= 12,69
(Y)== 4
(Z)== 52,36
Относительные показатели вариации вычисляют как отношение абсолютного показателя к среднему значению, выраженное в процентах.
Коэффициент осцилляции:
VR(X) ==146,65%
VR(Y) == -10958,49%
VR(Z) == -140,22%
Линейный коэффициент вариации:
Vd(X) ==47,73%
Vd (Y) == -120,75%
Vd (Z) == 114,71%
Коэффициент вариации:
Vd(X) ==47,75%
Vd (Y) == -53,49%
Vd (Z) == 139,84%
Выборка считается однородной, если V < 30 %.
Выборка в данном случае ни для одного из показателей X, Y, Z не является однородной.
Задача 2.
По каждой из выборок X, Y, Z:
- проведите группировку данных по интервалам равной длины;
- составьте вариационный ряд;
- вычислите относительные частоты и накопленные частости;
- постройте полигон, гистограмму и кумуляту;
- нанесите на график кумуляты график накопленных частот без группировки.
Решение
Сгруппируем данные. Расположив их в порядке возрастания, и подсчитав, сколько раз встречалось каждое значение признака, получим следующее статистическое распределение в табличном виде.
Таблица 6. Статистическое распределение данных
Xi |
ni |
Yi |
ni |
Zi |
ni |
|
6 |
1 |
-421 |
1 |
-16 |
2 |
|
9 |
2 |
-420 |
1 |
-15 |
1 |
|
12 |
2 |
-376 |
1 |
-14 |
1 |
|
14 |
2 |
-373 |
1 |
-8 |
2 |
|
15 |
1 |
-359 |
1 |
-6 |
1 |
|
16 |
3 |
-347 |
1 |
-5 |
1 |
|
17 |
2 |
-317 |
1 |
2 |
2 |
|
21 |
1 |
-308 |
1 |
4 |
1 |
|
22 |
3 |
-305 |
1 |
5 |
1 |
|
24 |
2 |
-264 |
1 |
8 |
1 |
|
26 |
1 |
-251 |
1 |
10 |
1 |
|
29 |
1 |
-248 |
1 |
11 |
1 |
|
30 |
1 |
-225 |
1 |
13 |
1 |
|
32 |
2 |
-223 |
1 |
14 |
1 |
|
33 |
1 |
-217 |
1 |
17 |
2 |
|
37 |
1 |
-195 |
1 |
24 |
2 |
|
40 |
1 |
-174 |
1 |
25 |
2 |
|
41 |
2 |
-171 |
1 |
27 |
1 |
|
43 |
1 |
-166 |
1 |
28 |
2 |
|
45 |
2 |
-151 |
1 |
31 |
1 |
|
-137 |
1 |
34 |
1 |
|||
-134 |
1 |
39 |
1 |
|||
-124 |
1 |
43 |
1 |
|||
-121 |
1 |
49 |
1 |
|||
-115 |
1 |
57 |
1 |
|||
-103 |
1 |
|||||
-94 |
1 |
|||||
-84 |
1 |
|||||
-80 |
1 |
|||||
-69 |
1 |
|||||
-59 |
1 |
|||||
-58 |
1 |
Признак X принимает любые значения от 6 до 45, признак Y принимает значения от -421 до -58, признак Z принимает значения от -16 до 57.
Ориентировочное число интервалов группирования определим по формуле Стерджесса:
k = 1 + 3,32?lg n,
где k - число групп;
n - объем выборки (число единиц совокупности).
k = 1 + 3,32?lg 32=1 +4,997=5,997.
Разобьем весь интервал на 6 интервалов одинаковой длиной:
для признака X интервал равен:
h = (45-6)/6 = 6,5
для признака Y интервал равен:
h = (-58-(-421))/6 = 60,5
для признака Z интервал равен:
h = (57-(-16))/6 = 12,7
и подсчитаем, сколько значений признака попадает в каждый частичный интервал (значения, совпадающие с граничными, будем относить к левому интервалу). Статистическое распределение частот оказывается следующим в табличном виде.
Частости - относительные частоты, выраженные в процентах:
ni (%) =*100%.
Накопленные (кумулятивные) частости:
Ki=.
Для значений X интервалы выглядят следующим образом: [6 .. 12,5], (12,5 .. 19], (19 .. 25,5], (25,5 .. 32], (32 .. 38,5] и (38,5 .. 45] (табл. 7, 8).
Таблица 7. Группировка данных
Группы X |
Xi |
ni |
Группы Y |
Yi |
ni |
Группы Z |
Zi |
ni |
|
[6 .. 12,5] |
6 |
1 |
[-421 .. -360,5] |
-421 |
1 |
[-16 .. -3,83] |
-16 |
2 |
|
9 |
2 |
-420 |
1 |
-15 |
1 |
||||
12 |
2 |
-376 |
1 |
-14 |
1 |
||||
(12,5 .. 19] |
14 |
2 |
-373 |
1 |
-8 |
2 |
|||
15 |
1 |
(-360,5 .. -300] |
-359 |
1 |
-6 |
1 |
|||
16 |
3 |
-347 |
1 |
-5 |
1 |
||||
17 |
2 |
-317 |
1 |
(-3,83 .. 8,33] |
2 |
2 |
|||
(19 .. 25,5] |
21 |
1 |
-308 |
1 |
4 |
1 |
|||
22 |
3 |
-305 |
1 |
5 |
1 |
||||
24 |
2 |
(-300 .. -239,5] |
-264 |
1 |
8 |
1 |
|||
(25,5 .. 32] |
26 |
1 |
-251 |
1 |
(8,33 .. 20,50] |
10 |
1 |
||
29 |
1 |
-248 |
1 |
11 |
1 |
||||
30 |
1 |
(-239,5 .. -179] |
-225 |
1 |
13 |
1 |
|||
32 |
2 |
-223 |
1 |
14 |
1 |
||||
(32 .. 38,5] |
33 |
1 |
-217 |
1 |
17 |
2 |
|||
37 |
1 |
-195 |
1 |
(20,50 .. 32,67] |
24 |
2 |
|||
(38,5 .. 45] |
40 |
1 |
(-179 .. -118,5] |
-174 |
1 |
25 |
2 |
||
41 |
2 |
-171 |
1 |
27 |
1 |
||||
43 |
1 |
-166 |
1 |
28 |
2 |
||||
45 |
2 |
-151 |
1 |
31 |
1 |
||||
-137 |
1 |
(32,67 .. 44,83] |
34 |
1 |
|||||
-134 |
1 |
39 |
1 |
||||||
-124 |
1 |
43 |
1 |
||||||
-121 |
1 |
(44,83 .. 57] |
49 |
1 |
|||||
(-118,5 .. -58] |
-115 |
1 |
57 |
1 |
|||||
-103 |
1 |
||||||||
-94 |
1 |
||||||||
-84 |
1 |
||||||||
-80 |
1 |
||||||||
-69 |
1 |
||||||||
-59 |
1 |
||||||||
-58 |
1 |
Таблица 8. Группировка данных X
xi |
ni |
ni, % |
Ki, % |
||
6; |
12,5 |
5 |
15,625 |
15,63 |
|
12,5; |
19 |
8 |
25 |
40,63 |
|
19; |
25,5 |
6 |
18,75 |
59,38 |
|
25,5; |
32 |
5 |
15,625 |
75,00 |
|
32; |
38,5 |
2 |
6,25 |
81,25 |
|
38,5; |
45 |
6 |
18,75 |
100 |
|
У |
32 |
100 |
- |
Рисунок 1 - График кумуляты X
Для значений Y интервалы выглядят следующим образом:
[-421 .. -360,5], (-360,5 .. -300], (-300 .. -239,5], (-239,5 .. -179], (-179 .. -118,5] и (-118,5 .. -58] (табл. 9).
Таблица 9. Группировка данных Y
Yi |
ni |
ni, % |
Ki, % |
||
-421; |
-360,5 |
4 |
12,5 |
12,50 |
|
-360,5; |
-300,0 |
5 |
15,625 |
28,13 |
|
-300,0; |
-239,5 |
3 |
9,375 |
37,50 |
|
-239,5; |
-179,0 |
4 |
12,5 |
50,00 |
|
-179,0; |
-118,5 |
8 |
25 |
75,00 |
|
-118,5; |
-58,0 |
8 |
25 |
100 |
|
У |
32 |
100 |
- |
Рисунок 2 - График кумуляты Y
Для значений Z интервалы выглядят следующим образом: [-16 .. -3,83], (-3,83 .. 8,33], (8,33 .. 20,50], (20,50 .. 32,67], (32,67 .. 44,83] и (44,83 .. 57] (табл.).
Таблица 10. Группировка данных Z
Zi |
ni |
ni, % |
Ki, % |
||
-16; |
-3,83 |
8 |
25,00 |
25,00 |
|
-3,83; |
8,33 |
5 |
15,63 |
40,63 |
|
8,33; |
20,50 |
6 |
18,75 |
59,38 |
|
20,50; |
32,67 |
8 |
25,00 |
84,38 |
|
32,67; |
44,83 |
3 |
9,38 |
93,75 |
|
44,83; |
57,00 |
2 |
6,25 |
100 |
|
У |
32 |
100 |
- |
Рисунок 3 - График кумуляты Z
Гистограмма - столбиковая диаграмма частот. Основание каждого прямоугольника соответствует интервалу группировки. Высота столбика - частость.
Рисунок 4 - Гистограмма группировки X
Рисунок 5 - Гистограмма группировки Y
Рисунок 6 - Гистограмма группировки Z
Полигон частот - изображение вариационного ряда с помощью ломаной линии. Для построения полигона достаточно соединить отрезками прямых линий верхние стороны прямоугольников (рис. 1, 2, 3).
Рисунок 9 - Полигон распределения группировки X
Рисунок 10 - Полигон распределения группировки Y
Рисунок 11 - Полигон распределения группировки Z
Таблица 11. Накопленные частоты
Группы X |
Xi |
ni |
ni, % |
Ki, % |
Группы Y |
Yi |
ni |
ni, % |
Ki, % |
Группы Z |
Zi |
ni |
ni, % |
Ki, % |
|
[6 .. 12,5) |
6 |
1 |
3,13 |
3,13 |
[-421 .. -360,5) |
-421 |
1 |
3,13 |
3,13 |
[-16 .. -3,83) |
-16 |
2 |
6,25 |
6,25 |
|
9 |
2 |
6,25 |
9,38 |
-420 |
1 |
3,13 |
6,25 |
-15 |
1 |
3,13 |
9,38 |
||||
12 |
2 |
6,25 |
15,63 |
-376 |
1 |
3,13 |
9,38 |
-14 |
1 |
3,13 |
12,50 |
||||
(12,5 .. 19] |
14 |
2 |
6,25 |
21,88 |
-373 |
1 |
3,13 |
12,50 |
-8 |
2 |
6,25 |
18,75 |
|||
15 |
1 |
3,13 |
25,00 |
(-360,5 .. -300] |
-359 |
1 |
3,13 |
15,63 |
-6 |
1 |
3,13 |
21,88 |
|||
16 |
3 |
9,38 |
34,38 |
-347 |
1 |
3,13 |
18,75 |
-5 |
1 |
3,13 |
25,00 |
||||
17 |
2 |
6,25 |
40,63 |
-317 |
1 |
3,13 |
21,88 |
(-3,83 .. 8,33] |
2 |
2 |
6,25 |
31,25 |
|||
(19 .. 25,5] |
21 |
1 |
3,13 |
43,75 |
-308 |
1 |
3,13 |
25,00 |
4 |
1 |
3,13 |
34,38 |
|||
22 |
3 |
9,38 |
53,13 |
-305 |
1 |
3,13 |
28,13 |
5 |
1 |
3,13 |
37,50 |
||||
24 |
2 |
6,25 |
59,38 |
(-300 .. -239,5] |
-264 |
1 |
3,13 |
31,25 |
8 |
1 |
3,13 |
40,63 |
|||
(25,5 .. 32] |
26 |
1 |
3,13 |
62,50 |
-251 |
1 |
3,13 |
34,38 |
(8,33 .. 20,50] |
10 |
1 |
3,13 |
43,75 |
||
29 |
1 |
3,13 |
65,63 |
-248 |
1 |
3,13 |
37,50 |
11 |
1 |
3,13 |
46,88 |
||||
30 |
1 |
3,13 |
68,75 |
(-239,5 .. -179] |
-225 |
1 |
3,13 |
40,63 |
13 |
1 |
3,13 |
50,00 |
|||
32 |
2 |
6,25 |
75,00 |
-223 |
1 |
3,13 |
43,75 |
14 |
1 |
3,13 |
53,13 |
||||
(32 .. 38,5] |
33 |
1 |
3,13 |
78,13 |
-217 |
1 |
3,13 |
46,88 |
17 |
2 |
6,25 |
59,38 |
|||
37 |
1 |
3,13 |
81,25 |
-195 |
1 |
3,13 |
50,00 |
(20,50 .. 32,67] |
24 |
2 |
6,25 |
65,63 |
|||
(38,5 .. 45] |
40 |
1 |
3,13 |
84,38 |
(-179 .. -118,5] |
-174 |
1 |
3,13 |
53,13 |
25 |
2 |
6,25 |
71,88 |
||
41 |
2 |
6,25 |
90,63 |
-171 |
1 |
3,13 |
56,25 |
27 |
1 |
3,13 |
75,00 |
||||
43 |
1 |
3,13 |
93,75 |
-166 |
1 |
3,13 |
59,38 |
28 |
2 |
6,25 |
81,25 |
||||
45 |
2 |
6,25 |
100,00 |
-151 |
1 |
3,13 |
62,50 |
31 |
1 |
3,13 |
84,38 |
||||
32 |
100 |
-137 |
1 |
3,13 |
65,63 |
(32,67 .. 44,83] |
34 |
1 |
3,13 |
87,50 |
|||||
-134 |
1 |
3,13 |
68,75 |
39 |
1 |
3,13 |
90,63 |
||||||||
-124 |
1 |
3,13 |
71,88 |
43 |
1 |
3,13 |
93,75 |
||||||||
-121 |
1 |
3,13 |
75,00 |
(44,83 .. 57] |
49 |
1 |
3,13 |
96,88 |
|||||||
(-118,5 .. -58] |
-115 |
1 |
3,13 |
78,13 |
57 |
1 |
3,13 |
100,00 |
|||||||
-103 |
1 |
3,13 |
81,25 |
32 |
100,00 |
||||||||||
-94 |
1 |
3,13 |
84,38 |
||||||||||||
-84 |
1 |
3,13 |
87,50 |
||||||||||||
-80 |
1 |
3,13 |
90,63 |
||||||||||||
-69 |
1 |
3,13 |
93,75 |
||||||||||||
-59 |
1 |
3,13 |
96,88 |
||||||||||||
-58 |
1 |
3,13 |
100,00 |
Кумулята - изображение накопленных частостей, обычно в виде ломаной линии. По существу, кумулята - это интеграл от гистограммы (рис.4, 5, 6).
Рисунок 12. Кумулята X
Рисунок 13. Кумулята Y
Рисунок 14. Кумулята Z
Задача 3.
По сгруппированным данным и графикам определите:
- среднее арифметическое;
- моду;
- медиану.
Сравните результаты с решением Задачи 1.
Решение
При расчетах по группированным данным учитывается относительная частота появления каждого варианта (табл.12). Среднее значение - средняя арифметическая взвешенная:
Таблица 12. Расчет среднего значения по группированным данным выборки X
xi |
ni |
?ni |
||
[6 .. 12,5) |
9,25 |
5 |
46,25 |
|
(12,5 .. 19] |
15,75 |
8 |
126 |
|
(19 .. 25,5] |
22,25 |
6 |
133,5 |
|
(25,5 .. 32] |
28,75 |
5 |
143,75 |
|
(32 .. 38,5] |
35,25 |
2 |
70,5 |
|
(38,5 .. 45] |
41,75 |
6 |
250,5 |
|
У |
- |
32 |
770,5 |
=770,5/32=24,08
Таблица 13. Расчет среднего значения по группированным данным выборки Y
yi |
ni |
?ni |
||
[-421 .. -360,5) |
-390,75 |
4 |
-1563 |
|
(-360,5 .. -300] |
-330,25 |
5 |
-1651,3 |
|
(-300 .. -239,5] |
-269,75 |
3 |
-809,25 |
|
(-239,5 .. -179] |
-209,25 |
4 |
-837 |
|
(-179 .. -118,5] |
-148,75 |
8 |
-1190 |
|
(-118,5 .. -58] |
-88,25 |
8 |
-706 |
|
У |
- |
32 |
-6756,5 |
=-6756,5/32= -211,14
Таблица 14. Расчет среднего значения по группированным данным выборки Z
zi |
ni |
?ni |
||
[-16 .. -3,83) |
-9,92 |
8 |
-79,333 |
|
(-3,83 .. 8,33] |
2,25 |
5 |
11,25 |
|
(8,33 .. 20,50] |
14,42 |
6 |
86,5 |
|
(20,50 .. 32,67] |
26,58 |
8 |
212,667 |
|
(32,67 .. 44,83] |
38,75 |
3 |
116,25 |
|
(44,83 .. 57] |
50,92 |
2 |
101,833 |
|
У |
- |
32 |
449,167 |
=449,167/32=14,04
В качестве среднего значения по интервалам ,, приближенно принят центр интервала группирования.
Мода - это координата основания самого высокого столбика гистограммы, т.е. модального интервала. Распределение может иметь несколько мод. В качестве оценки моды используют не середину модального интервала, а скорректированное значение.
Медиана определяется как 50 %-й квантиль (рис. 7, 8, 9). Это аргумент функции распределения, при котором вероятность равна 0,5 = 50 %:
Me: F(Me) = 0,5 = 50%;
Me = F-1(0,5).
Медиана делит упорядоченную совокупность пополам.
Рисунок 15. Графическое определение медианы (x)
Рисунок 16. Графическое определение медианы (y)
Рисунок 17. Графическое определение медианы (z)
Из графиков найдем для группировки X:
=16,5, =22 (в задаче 1 получено Mo (X) = 16 Mе (X) =22), т.е. практически сходится с решением, полученным без группировки исходных данных.
для группировки Y:
=-(нет данных), =-247,2
(в задаче 1 получено Mo (X) = - (нет данных), Mе (Y) = -184,5). В данном случае имеется расхождение с данными (медиана), полученными при решении без группировки исходных данных по формулам. В данном случае группировка данных помогла выявить влияние отдельных единиц на средние итоговые показатели.
для группировки Z:
=-16, =24,5, = 14,4 (в задаче 1 получено Mo (Z) = -16, Mе (Z) = 13,5), т.е. практически сходится с решением, полученным без группировки исходных данных с учетом погрешности.
Задача 4.
Постройте корреляционное поле. Проведите группировку Y и Z , используя X как группировочный признак. Вычислите условные средние x, x. Нанесите линию эмпирической регрессии на корреляционное поле.
Решение
Корреляционное поле (поле корреляции, диаграмма рассеяния) - это графическое изображение исходных данных.
Рисунок 18 Корреляционное поле {xi , yi}
Рисунок 19 Корреляционное поле {xi , zi}
Условное среднее значение - это среднее значение одного признака при условии, что другой признак принимает заранее заданное фиксированное значение:
При вычислении условных средних значений подсчитывают средние x и x для каждой группы единиц в зависимости от значения группировочного признака х (табл.15).
Таблица 15. Условные средние
xi |
i |
ni |
? y j |
x |
? z j |
x |
|
[6 .. 12,5) |
9,25 |
5 |
-1590 |
-397,5 |
-64 |
-8,0 |
|
(12,5 .. 19] |
15,75 |
8 |
-1636 |
-327,2 |
19 |
3,8 |
|
(19 .. 25,5] |
22,25 |
6 |
-763 |
-254,3 |
65 |
10,8 |
|
(25,5 .. 32] |
28,75 |
5 |
-860 |
-215,0 |
135 |
16,9 |
|
(32 .. 38,5] |
35,25 |
2 |
-1178 |
-147,3 |
116 |
38,7 |
|
(38,5 .. 45] |
41,75 |
6 |
-662 |
-82,8 |
106 |
53,0 |
|
У |
- |
32 |
-6689 |
-1424,0 |
115,2 |
На поле корреляции наносят линию условного среднего (эмпирической регрессии). Для этого наносят точки с координатами {i, xi} и соединяют их отрезками прямых линий (рис.12).
Рисунок 20 Поле корреляции и эмпирическая регрессия
Рисунок 21 Поле корреляции и эмпирическая регрессия
По внешнему виду графика можно выявить возможный характер взаимосвязи между признаками и оценить погрешность построения уравнения регрессии.
Задача 5.
Найдите предельную ошибку выборки X, Y, Z; постройте доверительные интервалы для среднего, дисперсии и стандартного отклонения генеральной совокупности при доверительной вероятности р = 68 %; 95 %; 99,7 %.
Решение.
Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения µx , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и математическим ожиданием (генеральным средним) называется ошибкой выборки:
=|-|.
Ошибка выборочного наблюдения пропорциональна стандартному отклонению и обратно пропорциональна квадратному корню из объема выборки:
=t•=t•.
Стандартное отклонение выборочного среднего составляет:
= .
=
=
=
Коэффициент доверия t находят по распределению Стьюдента (табл. 16) с учетом объема выборки и заданного значения доверительной вероятности:
t=t.
Таблица 16 Процентные точки распределения Стьюдента t(n, p) и нормального распределения
p |
|||||||||
n |
0,5 |
0,6 |
0,7 |
0,8 |
0,9 |
0,95 |
0,99 |
0,999 |
|
5 |
0 |
0,2672 |
0,5594 |
0,9195 |
1,4759 |
2,015 |
3,3649 |
5,8934 |
|
10 |
0 |
0,2602 |
0,5415 |
0,8791 |
1,3722 |
1,8125 |
2,7638 |
4,1437 |
|
20 |
0 |
0,2567 |
0,5329 |
0,86 |
1,3253 |
1,7247 |
2,528 |
3,5518 |
|
30 |
0 |
0,2556 |
0,53 |
0,8538 |
1,3104 |
1,6973 |
2,4573 |
3,3852 |
|
40 |
0 |
0,255 |
0,5286 |
0,8507 |
1,3031 |
1,6839 |
2,4233 |
3,3069 |
|
50 |
0 |
0,2547 |
0,5278 |
0,8489 |
1,2987 |
1,6759 |
2,4033 |
3,2614 |
|
100 |
0 |
0,254 |
0,5261 |
0,8452 |
1,2901 |
1,6602 |
2,3642 |
3,1737 |
|
1000 |
0 |
0,2534 |
0,5246 |
0,842 |
1,2824 |
1,6464 |
2,3301 |
3,0984 |
|
z |
0 |
0,2533 |
0,5244 |
0,8416 |
1,2816 |
1,6449 |
2,3263 |
3,0902 |
Для симметричного распределения достаточно определить одно значение квантиля, например, для верхней границы доверительного интервала. Противоположная граница симметрична относительно точки {0; 0,5}:
t=-t.
t= t1+ (t2-t1) / (p2-p1) * (p-p1)
Найдем предельные ошибки выборки используя таблицу распределения Стьюдента.
Коэффициенты доверия по распределению Стьюдента:
При р=68%
При р=95%
При р=0,997
Предельные ошибки выборки:
Доверительный интервал для генерального среднего:
-t•+ t•.
Значение t определяет, «сколько сигм» нужно взять для построения доверительного интервала.
При р=68%
x
y
z
При р=95%
x
y
z
При р=99,7%
x
y
z
При использовании табулированного распределения приходится проводить интерполяцию, т.е. находить приближенное значение функции между известными точками.
Исходные данные для интерполяции:
t1( p1) и t2( p2).
Требуется найти значение t между точками p1 и p2 :
t(p): p1 < p< p2.
Искомое значение t для заданного p находим по формуле:
t= t1+•(p-p1).
Интерполяция может проводиться дважды - по p, затем по n.
Доверительный интервал для генеральной дисперсии:
где - выборочная дисперсия;
- квантиль распределения Пирсона (табл. 17). |
Квантили распределения Пирсона:
Доверительный интервал для генеральной дисперсии:
При р=68%
При р=95%
При р=99,7%
Доверительный интервал для среднеквадратичного отклонения:
При р=68%
При р=95%
При р=99,7%
Задача 6.
Постройте доверительные интервалы для генерального среднего µx , µy и µz при доверительной вероятности р = 68 %; 95 %; 99,7 % упрощенным способом: «одна/две/три сигмы».
Решение
=
=
=
Величину коэффициента t выбираем для «стандартных» значений вероятности (табл. 17).
Таблица 17. Процентные точки распределения 2n
p |
n |
|||||||
5 |
10 |
20 |
30 |
40 |
50 |
100 |
||
0,001 |
0,2102 |
1,478 |
5,921 |
11,58 |
17,91 |
24,67 |
61,92 |
|
0,010 |
0,5543 |
2,558 |
8,260 |
14,95 |
22,16 |
29,70 |
70,07 |
|
0,050 |
1,145 |
3,940 |
10,85 |
18,49 |
26,50 |
34,76 |
77,93 |
|
0,100 |
1,610 |
4,865 |
12,44 |
20,59 |
29,05 |
37,68 |
82,36 |
|
0,200 |
2,342 |
6,179 |
14,57 |
23,36 |
32,34 |
41,44 |
87,95 |
|
0,300 |
2,999 |
7,267 |
16,26 |
25,50 |
34,87 |
44,31 |
92,13 |
|
0,400 |
3,655 |
8,295 |
17,80 |
27,44 |
37,13 |
46,86 |
95,81 |
|
0,500 |
4,351 |
9,341 |
19,33 |
29,33 |
39,33 |
49,33 |
99,33 |
|
0,600 |
5,131 |
10,47 |
20,95 |
31,31 |
41,62 |
51,89 |
102,9 |
|
0,700 |
6,064 |
11,78 |
22,77 |
33,53 |
44,16 |
54,72 |
106,9 |
|
0,800 |
7,289 |
13,44 |
25,03 |
36,25 |
47,26 |
58,16 |
111,7 |
|
0,900 |
9,236 |
15,98 |
28,41 |
40,25 |
51,80 |
63,16 |
118,5 |
|
0,950 |
11,07 |
18,30 |
31,41 |
43,77 |
55,75 |
67,50 |
124,3 |
|
0,990 |
15,08 |
23,20 |
37,56 |
50,89 |
63,69 |
76,15 |
135,8 |
|
0,999 |
20,51 |
29,58 |
45,31 |
59,70 |
73,40 |
86,66 |
149,4 |
Подставляем в доверительный интервал, получаем приближенные границы доверительных интервалов:
р=68%
р=95%
р=99,7%
Форма распределения Стьюдента приближается к нормальному распределению при большом объеме выборки, начиная с нескольких десятков единиц. При этом погрешность от замены распределения Стьюдента нормальным не превышает единиц процентов.
Таблица 18. Стандартные квантили нормального распределения
Вероятность (округленно) |
Вероятность |
Коэффициент доверия |
Ошибка выборки |
Доверительный интервал |
|
68 % |
0,682689 |
1,000 |
одна сигма |
µ = ±у |
|
95 % |
0,954500 |
2,000 |
две сигмы |
µ = ±2у |
|
99,7 % |
0,997300 |
3,000 |
три сигмы |
µ = ±3у |
Таким образом, получаем приближенные границы доверительных интервалов:
p = 68%: µ = ±у; -у?µ?+у
p = 95%: µ = ±2у; -2у?µ ? +2у
p = 99,7%: µ = ±3у; -3у?µ?+3у
Таблица 19. Доверительные интервалы для генерального среднего мY
P |
t |
мX |
мY |
мZ |
||||
68% |
1у |
22,39 |
26,49 |
-228,80 |
-189,26 |
10,56 |
17,50 |
|
95% |
2у |
20,34 |
28,54 |
-248,57 |
-169,50 |
7,09 |
20,97 |
|
99,70% |
3у |
18,29 |
30,59 |
-268,33 |
-149,73 |
3,63 |
24,44 |
Задача 7
При уровне значимости б = 32%; 5%; 0,3% проверьте гипотезы:
у2x = у2y;
µx = +5;
µx = µy.
Решение
Сравнение дисперсий
При заданном уровне значимости б должно выполняться следующее неравенство:
В табл. 20 приводится верхняя половина распределения.
Таблица 20. Процентные точки распределения Фишера для выборок равного объема: n1=n2
p |
|||||||||
n |
0,5 |
0,6 |
0,7 |
0,8 |
0,9 |
0,95 |
0,99 |
0,999 |
|
5 |
1,0 |
1,2692 |
1,641 |
2,2275 |
3,453 |
5,0503 |
10,967 |
29,752 |
|
10 |
1,0 |
1,1787 |
1,4061 |
1,7316 |
2,3226 |
2,9782 |
4,8491 |
8,7539 |
|
20 |
1,0 |
1,1216 |
1,2684 |
1,4656 |
1,7938 |
2,1242 |
2,9377 |
4,29 |
|
30 |
1,0 |
1,0978 |
1,2132 |
1,3641 |
1,6065 |
1,8409 |
2,386 |
3,2171 |
|
40 |
1,0 |
1,084 |
1,1817 |
1,3076 |
1,5056 |
1,6928 |
2,1142 |
2,7268 |
|
50 |
1,0 |
1,0747 |
1,1608 |
1,2706 |
1,4409 |
1,5995 |
1,949 |
2,4413 |
=0,721
=0,511
=0,371
Распределение Фишера для уровней значимости б=32%; 5%; 0,3%:
Уровни значимости б |
||||
32% |
0,721 |
1,387 |
0,0108 |
|
5% |
0,511 |
1,956 |
0,0108 |
|
0,30% |
0,371 |
2,693 |
0,0108 |
- гипотеза не верна при 32%;
- гипотеза не верна при 5%;
- гипотеза не верна при 0,3%.
Проверка гипотезы о среднем значении :
Н0: µ 1 = A.
Рассмотрим случайную величину
.
Для проверки вычислим фактическую t - статистику:
tфакт.=
tкр=;
- гипотезу отвергаем при 32%.
- гипотезу отвергаем при 5%.
- гипотезу отвергаем при 0,3%.
Проверка гипотезы о среднем значении
б |
tкр. |
Сравнение |
tфакт. |
|
0,32 |
2,1146 |
< |
7,0888 |
|
0,05 |
4,3988 |
< |
7,0888 |
|
0,003 |
6,6777 |
< |
7,0888 |
Из расчетов видно, что для всех уровней значимости б=32%; 5%; 0,3% tфакт> tкр, следовательно гипотезу отвергаем.
Гипотеза о равенстве средних мx = мy.
H0: µ1 =µ2 или µ1-µ2 =0.
Гипотеза о равенстве средних отвергается, если фактическая статистика больше табличной:
|tфакт|>tтабл.
При изучении выборочных оценок используется распределение Стьюдента с числом степеней свободы df=n1+n2-2:
При 32%
> - значит, гипотезу отвергаем.
При 5%:
> - значит, гипотезу отвергаем.
При 0,3%:
> - значит, гипотезу отвергаем.
Сравнение средних
б |
tкр. |
Сравнение |
tфакт. |
|
0,32 |
1,444 |
< |
28,25 |
|
0,05 |
2,320 |
< |
28,25 |
|
0,003 |
3,334 |
< |
28,25 |
Из расчетов видно, что для всех уровней значимости б=32%; 5%; 0.3% tфакт> tкр , следовательно гипотезу отвергаем.
Задача 8.
Вычислите линейные коэффициенты корреляции rух и rzх. Сделайте вывод о тесноте линейной связи между признаками.
Решение
Линейный коэффициент корреляции вычисляется следующим образом:
=
Таблица 21. Расчет показателей для коэффициента корреляции rух
N |
Xi |
Yi |
X2 |
XY |
Y2 |
|
1 |
16 |
-134 |
256 |
-2144 |
17956 |
|
2 |
22 |
-174 |
484 |
-3828 |
30276 |
|
3 |
17 |
-124 |
289 |
-2108 |
15376 |
|
4 |
22 |
-171 |
484 |
-3762 |
29241 |
|
5 |
12 |
-94 |
144 |
-1128 |
8836 |
|
6 |
22 |
-195 |
484 |
-4290 |
38025 |
|
7 |
9 |
-69 |
81 |
-621 |
4761 |
|
8 |
45 |
-421 |
2025 |
-18945 |
177241 |
|
9 |
29 |
-251 |
841 |
-7279 |
63001 |
|
10 |
40 |
-373 |
1600 |
-14920 |
139129 |
|
11 |
41 |
-308 |
1681 |
-12628 |
94864 |
|
12 |
16 |
-151 |
256 |
-2416 |
22801 |
|
13 |
32 |
-264 |
1024 |
-8448 |
69696 |
|
14 |
33 |
-305 |
1089 |
-10065 |
93025 |
|
15 |
6 |
-59 |
36 |
-354 |
3481 |
|
16 |
26 |
-217 |
676 |
-5642 |
47089 |
|
17 |
24 |
-225 |
576 |
-5400 |
50625 |
|
18 |
15 |
-84 |
225 |
-1260 |
7056 |
|
19 |
37 |
-347 |
1369 |
-12839 |
120409 |
|
20 |
17 |
-121 |
289 |
-2057 |
14641 |
|
21 |
12 |
-103 |
144 |
-1236 |
10609 |
|
22 |
21 |
-166 |
441 |
-3486 |
27556 |
|
23 |
14 |
-115 |
196 |
-1610 |
13225 |
|
24 |
14 |
-80 |
196 |
-1120 |
6400 |
|
25 |
9 |
-58 |
81 |
-522 |
3364 |
|
26 |
32 |
-317 |
1024 |
-10144 |
100489 |
|
27 |
24 |
-223 |
576 |
-5352 |
49729 |
|
28 |
43 |
-420 |
1849 |
-18060 |
176400 |
|
29 |
41 |
-359 |
1681 |
-14719 |
128881 |
|
30 |
45 |
-376 |
2025 |
-16920 |
141376 |
|
31 |
30 |
-248 |
900 |
-7440 |
61504 |
|
32 |
16 |
-137 |
256 |
-2192 |
18769 |
|
итого |
782 |
-6689 |
23278 |
-202935 |
1785831 |
|
среднее значение |
24,44 |
-209,03 |
727,44 |
-6341,72 |
55807,22 |
=-0,95136
Отрицательная (обратная) зависимость.
|rxy|>0,7 - существенная линейная зависимость
Таблица 22. Расчет показателей для коэффициента корреляции и rzх
N |
Xi |
Zi |
X2 |
XZ |
Z2 |
|
1 |
16 |
11 |
256 |
176 |
121 |
|
2 |
22 |
28 |
484 |
616 |
784 |
|
3 |
17 |
10 |
289 |
170 |
100 |
|
4 |
22 |
17 |
484 |
374 |
289 |
|
5 |
12 |
-16 |
144 |
-192 |
256 |
|
6 |
22 |
-15 |
484 |
-330 |
225 |
|
7 |
9 |
2 |
81 |
18 |
4 |
|
8 |
45 |
57 |
2025 |
2565 |
3249 |
|
9 |
29 |
31 |
841 |
899 |
961 |
|
10 |
40 |
43 |
1600 |
1720 |
1849 |
|
11 |
41 |
28 |
1681 |
1148 |
784 |
|
12 |
16 |
-16 |
256 |
-256 |
256 |
|
13 |
32 |
2 |
1024 |
64 |
4 |
|
14 |
33 |
49 |
1089 |
1617 |
2401 |
|
15 |
6 |
8 |
36 |
48 |
64 |
|
16 |
26 |
13 |
676 |
338 |
169 |
|
17 |
24 |
17 |
576 |
408 |
289 |
|
18 |
15 |
-8 |
225 |
-120 |
64 |
|
19 |
37 |
-14 |
1369 |
-518 |
196 |
|
20 |
17 |
4 |
289 |
68 |
16 |
|
21 |
12 |
24 |
144 |
288 |
576 |
|
22 |
21 |
27 |
441 |
567 |
729 |
|
23 |
14 |
39 |
196 |
546 |
1521 |
|
24 |
14 |
-5 |
196 |
-70 |
25 |
|
25 |
9 |
5 |
81 |
45 |
25 |
|
26 |
32 |
14 |
1024 |
448 |
196 |
|
27 |
24 |
25 |
576 |
600 |
625 |
|
28 |
43 |
24 |
1849 |
1032 |
576 |
|
29 |
41 |
34 |
1681 |
1394 |
1156 |
|
30 |
45 |
25 |
2025 |
1125 |
625 |
|
31 |
30 |
-6 |
900 |
-180 |
36 |
|
32 |
16 |
-8 |
256 |
-128 |
64 |
|
итого |
782 |
449 |
23278 |
14480 |
18235 |
|
среднее значение |
24,44 |
14,03 |
727,44 |
452,50 |
569,84 |
= 0,48178
Положительная (прямая) зависимость.
0<|ryx|<1 - линейная зависимость на фоне случайных отклонений.
Задача 9.
Вычислите коэффициенты корреляции рангов Спирмена и Кендалла Y(X) и Z(X). Сделайте вывод о тесноте связи.
Решение
Для вычисления коэффициентов корреляции рангов Спирмена исходные данные ранжируют, т.е. расставляют по порядку возрастания/убывания. Рангом является порядковый номер.
Коэффициент корреляции рангов Спирмена.
, -1? ? +1.
где di = R(Xl) -R(yt) - разность рангов X и Y;
n - число наблюдений (число пар, число разностей рангов);
6 - число шесть (не путать с сигмой!).
Для вычисления ранговых коэффициентов исходные данные ранжируют, т.е. расставляют по порядку возрастания или убывания, а затем нумеруют (табл. 23). Ранг - это порядковый номер. Если встречаются два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.
Таблица 23. Ранжирование данных
Rx |
x |
Ry |
y |
Rz |
z |
|
1 |
6 |
1 |
-421 |
1,5 |
-16 |
|
2,5 |
9 |
2 |
-420 |
1,5 |
-16 |
|
2,5 |
9 |
3 |
-376 |
3 |
-15 |
|
4,5 |
12 |
4 |
-373 |
4 |
-14 |
|
4,5 |
12 |
5 |
-359 |
5,5 |
-8 |
|
6,5 |
14 |
6 |
-347 |
5,5 |
-8 |
|
6,5 |
14 |
7 |
-317 |
7 |
-6 |
|
8 |
15 |
8 |
-308 |
8 |
-5 |
|
10 |
16 |
9 |
-305 |
9,5 |
2 |
|
10 |
16 |
10 |
-264 |
9,5 |
2 |
|
10 |
16 |
11 |
-251 |
11 |
4 |
|
12,5 |
17 |
12 |
-248 |
12 |
5 |
|
12,5 |
17 |
13 |
-225 |
13 |
8 |
|
14 |
21 |
14 |
-223 |
14 |
10 |
|
16 |
22 |
15 |
-217 |
15 |
11 |
|
16 |
22 |
16 |
-195 |
16 |
13 |
|
16 |
22 |
17 |
-174 |
17 |
14 |
|
18,5 |
24 |
18 |
-171 |
18,5 |
17 |
|
18,5 |
24 |
19 |
-166 |
18,5 |
17 |
|
20 |
26 |
20 |
-151 |
20,5 |
24 |
|
21 |
29 |
21 |
-137 |
20,5 |
24 |
|
22 |
30 |
22 |
-134 |
22,5 |
25 |
|
23,5 |
32 |
23 |
-124 |
22,5 |
25 |
|
23,5 |
32 |
24 |
-121 |
24 |
27 |
|
25 |
33 |
25 |
-115 |
25,5 |
28 |
|
26 |
37 |
26 |
-103 |
25,5 |
28 |
|
27 |
40 |
27 |
-94 |
27 |
31 |
|
28,5 |
41 |
28 |
-84 |
28 |
34 |
|
28,5 |
41 |
29 |
-80 |
29 |
39 |
|
30 |
43 |
30 |
-69 |
30 |
43 |
|
31,5 |
45 |
31 |
-59 |
31 |
49 |
|
31,5 |
45 |
32 |
-58 |
32 |
57 |
Затем рассматриваются пары значений {xi , yi } исходных данных, каждое значение со своим рангом. В табл. 24 столбцы x и y соответствуют исходным, неупорядоченным данным.
Таблица 24. Коэффициент корреляции рангов Спирмена для У (Х)
N п\п |
x |
y |
Rx |
Ry |
d |
d2 |
|
1 |
16 |
-134 |
10 |
22 |
-12 |
144 |
|
2 |
22 |
-174 |
16 |
17 |
-1 |
1 |
|
3 |
17 |
-124 |
12,5 |
23 |
-10,5 |
110,25 |
|
4 |
22 |
-171 |
16 |
18 |
-2 |
4 |
|
5 |
12 |
-94 |
4,5 |
27 |
-22,5 |
506,25 |
|
6 |
22 |
-195 |
16 |
16 |
0 |
0 |
|
7 |
9 |
-69 |
2,5 |
30 |
-27,5 |
756,25 |
|
8 |
45 |
-421 |
31,5 |
1 |
30,5 |
930,25 |
|
9 |
29 |
-251 |
21 |
11 |
10 |
100 |
|
10 |
40 |
-373 |
27 |
4 |
23 |
529 |
|
11 |
41 |
-308 |
28,5 |
8 |
20,5 |
420,25 |
|
12 |
16 |
-151 |
10 |
20 |
-10 |
100 |
|
13 |
32 |
-264 |
23,5 |
10 |
13,5 |
182,25 |
|
14 |
33 |
-305 |
25 |
9 |
16 |
256 |
|
15 |
6 |
-59 |
1 |
31 |
-30 |
900 |
|
16 |
26 |
-217 |
20 |
15 |
5 |
25 |
|
17 |
24 |
-225 |
18,5 |
13 |
5,5 |
30,25 |
|
18 |
15 |
-84 |
8 |
28 |
-20 |
400 |
|
19 |
37 |
-347 |
26 |
6 |
20 |
400 |
|
20 |
17 |
-121 |
12,5 |
24 |
-11,5 |
132,25 |
|
21 |
12 |
-103 |
4,5 |
26 |
-21,5 |
462,25 |
|
22 |
21 |
-166 |
14 |
19 |
-5 |
25 |
|
23 |
14 |
-115 |
6,5 |
25 |
-18,5 |
342,25 |
|
24 |
14 |
-80 |
6,5 |
29 |
-22,5 |
506,25 |
|
25 |
9 |
-58 |
2,5 |
32 |
-29,5 |
870,25 |
|
26 |
32 |
-317 |
23,5 |
7 |
16,5 |
272,25 |
|
27 |
24 |
-223 |
18,5 |
14 |
4,5 |
20,25 |
|
28 |
43 |
-420 |
30 |
2 |
28 |
784 |
|
29 |
41 |
-359 |
28,5 |
5 |
23,5 |
552,25 |
|
30 |
45 |
-376 |
31,5 |
3 |
28,5 |
812,25 |
|
31 |
30 |
-248 |
22 |
12 |
10 |
100 |
|
32 |
16 |
-137 |
10 |
21 |
-11 |
121 |
|
итого |
782 |
-6689 |
528 |
528 |
0 |
10795 |
=1,97856 - связь статистически значима.
Таблица 25. Коэффициент корреляции рангов Спирмена для Z(X)
N п\п |
x |
z |
Rx |
Rz |
d |
d2 |
|
1 |
16 |
11 |
10 |
15 |
-5 |
25 |
|
2 |
22 |
28 |
16 |
25,5 |
-9,5 |
90,25 |
|
3 |
17 |
10 |
12,5 |
14 |
-1,5 |
2,25 |
|
4 |
22 |
17 |
16 |
18,5 |
-2,5 |
6,25 |
|
5 |
12 |
-16 |
4,5 |
1,5 |
3 |
9 |
|
6 |
22 |
-15 |
16 |
3 |
13 |
169 |
|
7 |
9 |
2 |
2,5 |
9,5 |
-7 |
49 |
|
8 |
45 |
57 |
31,5 |
32 |
-0,5 |
0,25 |
|
9 |
29 |
31 |
21 |
27 |
-6 |
36 |
|
10 |
40 |
43 |
27 |
30 |
-3 |
9 |
|
11 |
41 |
28 |
28,5 |
25,5 |
3 |
9 |
|
12 |
16 |
-16 |
10 |
1,5 |
8,5 |
72,25 |
|
13 |
32 |
2 |
23,5 |
9,5 |
14 |
196 |
|
14 |
33 |
49 |
25 |
31 |
-6 |
36 |
|
15 |
6 |
8 |
1 |
13 |
-12 |
144 |
|
16 |
26 |
13 |
20 |
16 |
4 |
16 |
|
17 |
24 |
17 |
18,5 |
18,5 |
0 |
0 |
|
18 |
15 |
-8 |
8 |
5,5 |
2,5 |
6,25 |
|
19 |
37 |
-14 |
26 |
4 |
22 |
484 |
|
20 |
17 |
4 |
12,5 |
11 |
1,5 |
2,25 |
|
21 |
12 |
24 |
4,5 |
20,5 |
-16 |
256 |
|
22 |
21 |
27 |
14 |
24 |
-10 |
100 |
|
23 |
14 |
39 |
6,5 |
29 |
-22,5 |
506,25 |
|
24 |
14 |
-5 |
6,5 |
8 |
-1,5 |
2,25 |
|
25 |
9 |
5 |
2,5 |
12 |
-9,5 |
90,25 |
|
26 |
32 |
14 |
23,5 |
17 |
6,5 |
42,25 |
|
27 |
24 |
25 |
18,5 |
22,5 |
-4 |
16 |
|
28 |
43 |
24 |
30 |
20,5 |
9,5 |
90,25 |
|
29 |
41 |
34 |
28,5 |
28 |
0,5 |
0,25 |
|
30 |
45 |
25 |
31,5 |
22,5 |
9 |
81 |
|
31 |
30 |
-6 |
22 |
7 |
15 |
225 |
|
32 |
16 |
-8 |
10 |
5,5 |
4,5 |
20,25 |
|
итого |
782 |
449 |
528 |
528 |
0 |
2791,5 |
=0,51164 - связь статистически незначима.
Ранговый коэффициент корреляции Кендалла:
,
где n - число наблюдений;
S = P - Q - разность сумм числа последовательностей и инверсий результативного признака.
В процессе вычислений факторный признак X упорядочивается по возрастанию с присвоением порядкового номера (ранжируется). Затем результативный признак Y упорядочивается по возрастанию факторного признака X.
Число последовательностей P для каждого ранга Y - это число следующих рангов, превышающих эту величину.
Число инверсий Q для каждого ранга Y - это число следующих рангов, меньших выбранного.
Таблица 26. Вычисление рангового коэффициента корреляции Кендалла
N п\п |
X |
Y соот. зн Х |
Ранги Y |
P |
Q |
|
1 |
6 |
-59 |
31 |
1 |
30 |
|
2 |
9 |
-69 |
30 |
1 |
29 |
|
3 |
9 |
-58 |
32 |
0 |
29 |
|
4 |
12 |
-94 |
27 |
2 |
26 |
|
5 |
12 |
-103 |
26 |
2 |
25 |
|
6 |
14 |
-115 |
25 |
2 |
24 |
|
7 |
14 |
-80 |
29 |
0 |
25 |
|
8 |
15 |
-84 |
28 |
0 |
24 |
|
9 |
16 |
-134 |
22 |
2 |
21 |
|
10 |
16 |
-151 |
20 |
3 |
19 |
|
11 |
16 |
-137 |
21 |
2 |
19 |
|
12 |
17 |
-124 |
23 |
1 |
19 |
|
13 |
17 |
-121 |
24 |
0 |
19 |
|
14 |
21 |
-166 |
19 |
0 |
18 |
|
15 |
22 |
-174 |
17 |
1 |
16 |
|
16 |
22 |
-171 |
18 |
0 |
16 |
|
17 |
22 |
-195 |
16 |
0 |
15 |
|
18 |
24 |
-225 |
13 |
2 |
12 |
|
19 |
24 |
-223 |
14 |
1 |
12 |
|
20 |
26 |
-217 |
15 |
0 |
12 |
|
21 |
29 |
-251 |
11 |
1 |
10 |
|
22 |
30 |
-248 |
12 |
0 |
10 |
|
23 |
32 |
-264 |
10 |
0 |
9 |
|
24 |
32 |
-317 |
7 |
2 |
6 |
|
25 |
33 |
-305 |
9 |
0 |
7 |
|
26 |
37 |
-347 |
6 |
1 |
5 |
|
27 |
40 |
-373 |
4 |
2 |
3 |
|
28 |
41 |
-308 |
8 |
0 |
4 |
|
29 |
41 |
-359 |
5 |
0 |
3 |
|
30 |
43 |
-420 |
2 |
1 |
1 |
|
31 |
45 |
-421 |
1 |
1 |
0 |
|
32 |
45 |
-376 |
3 |
0 |
0 |
|
Итого |
782 |
-6689 |
528 |
28 |
468 |
S = 28 - 468= - 440
=-0,8871 - связь статистически значима.
Таблица 27. Вычисление рангового коэффициента корреляции Кендалла
N п\п |
X |
Z соот. зн Х |
Ранги Z |
P |
Q |
|
1 |
6 |
8 |
13 |
12 |
19 |
|
2 |
9 |
2 |
9,5 |
8 |
21 |
|
3 |
9 |
5 |
12 |
10 |
19 |
|
4 |
12 |
-16 |
1,5 |
0 |
27 |
|
5 |
12 |
24 |
20,5 |
15 |
11 |
|
6 |
14 |
39 |
29 |
23 |
3 |
|
7 |
14 |
-5 |
8 |
6 |
19 |
|
8 |
15 |
-8 |
5,5 |
3 |
20 |
|
9 |
16 |
11 |
15 |
8 |
15 |
|
10 |
16 |
-16 |
1,5 |
0 |
22 |
|
11 |
16 |
-8 |
5,5 |
2 |
19 |
|
12 |
17 |
10 |
14 |
5 |
15 |
|
13 |
17 |
4 |
11 |
4 |
15 |
|
14 |
21 |
27 |
24 |
11 |
7 |
|
15 |
22 |
28 |
25,5 |
11 |
5 |
|
16 |
22 |
17 |
18,5 |
6 |
9 |
|
17 |
22 |
-15 |
3 |
0 |
15 |
|
18 |
24 |
17 |
18,5 |
5 |
9 |
|
19 |
24 |
25 |
22,5 |
6 |
6 |
|
20 |
26 |
13 |
16 |
3 |
3 |
|
21 |
29 |
31 |
27 |
7 |
4 |
|
22 |
30 |
-6 |
7 |
1 |
9 |
|
23 |
32 |
2 |
9,5 |
1 |
8 |
|
24 |
32 |
14 |
17 |
1 |
7 |
|
25 |
33 |
49 |
31 |
6 |
1 |
|
26 |
37 |
-14 |
4 |
0 |
6 |
|
27 |
40 |
43 |
30 |
4 |
1 |
|
28 |
41 |
28 |
25,5 |
2 |
2 |
|
29 |
41 |
34 |
28 |
2 |
1 |
|
30 |
43 |
24 |
20,5 |
0 |
2 |
|
31 |
45 |
57 |
32 |
1 |
0 |
|
32 |
45 |
25 |
22,5 |
0 |
0 |
|
Итого |
782 |
449 |
528 |
163 |
320 |
S = 163 - 320= - 157
= -0,31653 - связь статистически незначима.
Коэффициент Кендалла ф дает более осторожную оценку корреляции, чем коэффициент Спирмена с (числовое значение ф всегда меньше, чем с). Хотя вычисление коэффициента с менее трудоемко, чем вычисление коэффициента ф, последний легче пересчитать, если к ряду добавляется новый член.
регрессионный тренд дисперсия корреляция
Задача 10.
Постройте уравнения регрессии Y(X), Z(X) графическим способом.
Решение
Проведем линии регрессии «на глаз» - по местам «сгущения» точек. На линиях регрессии и выберем по две точки, ближе к краям диапазона значений. Составим систему уравнений - два уравнения с двумя неизвестными:
Из построенной линии регрессии по Y (X) получим:
(x1; y1) = (12; - 94);
(x2; y2) = (45; - 400).
Y(X)= -92,7059-0,10784*x.
Из построенной линии регрессии по Z(X) получим:
(x1; z1) = (12; 4);
(x2; z2) = (45; 31).
Z(X) = -5,81818-0,818182*x.
Задача 11.
C помощью метода наименьших квадратов (МНК) постройте уравнения регрессии Y(X), X(Y), Z (X), X(Z). Нанесите линии регрессии на корреляционное поле.
Решение
Построение парной линейной регрессии по МНК сводится к решению системы нормальных уравнений.
Для уравнения
y= a + b? x
нужно решить следующую систему:
Решая систему, получаем оценки неизвестных коэффициентов a€ и b€. Затем записываем уравнение регрессии, подставляя найденные коэффициенты:
y= a€ + b€? x.
Таблица 28. Расчет значений
n |
x |
x^2 |
y |
y^2 |
z |
z^2 |
x*y |
x*z |
|
1 |
16 |
256 |
-134 |
17956 |
11 |
121 |
-2144 |
176 |
|
2 |
22 |
484 |
-174 |
30276 |
28 |
784 |
-3828 |
616 |
|
3 |
17 |
289 |
-124 |
15376 |
10 |
100 |
-2108 |
170 |
|
4 |
22 |
484 |
-171 |
29241 |
17 |
289 |
-3762 |
374 |
|
5 |
12 |
144 |
-94 |
8836 |
-16 |
256 |
-1128 |
-192 |
|
6 |
22 |
484 |
-195 |
38025 |
-15 |
225 |
-4290 |
-330 |
|
7 |
9 |
81 |
-69 |
4761 |
2 |
4 |
-621 |
18 |
|
8 |
45 |
2025 |
-421 |
177241 |
57 |
3249 |
-18945 |
2565 |
|
9 |
29 |
841 |
-251 |
63001 |
31 |
961 |
-7279 |
899 |
|
10 |
40 |
1600 |
-373 |
139129 |
43 |
1849 |
-14920 |
1720 |
|
11 |
41 |
1681 |
-308 |
94864 |
28 |
784 |
-12628 |
1148 |
|
12 |
16 |
256 |
-151 |
22801 |
-16 |
256 |
-2416 |
-256 |
|
13 |
32 |
1024 |
-264 |
69696 |
2 |
4 |
-8448 |
64 |
|
14 |
33 |
1089 |
-305 |
93025 |
49 |
2401 |
-10065 |
1617 |
|
15 |
6 |
36 |
-59 |
3481 |
8 |
64 |
-354 |
48 |
|
16 |
26 |
676 |
-217 |
47089 |
13 |
169 |
-5642 |
338 |
|
17 |
24 |
576 |
-225 |
50625 |
17 |
289 |
-5400 |
408 |
|
18 |
15 |
225 |
-84 |
7056 |
-8 |
64 |
-1260 |
-120 |
|
19 |
37 |
1369 |
-347 |
120409 |
-14 |
196 |
-12839 |
-518 |
|
20 |
17 |
289 |
-121 |
14641 |
4 |
16 |
-2057 |
68 |
|
21 |
12 |
144 |
-103 |
10609 |
24 |
576 |
-1236 |
288 |
|
22 |
21 |
441 |
-166 |
27556 |
27 |
729 |
-3486 |
567 |
|
23 |
14 |
196 |
-115 |
13225 |
39 |
1521 |
-1610 |
546 |
|
24 |
14 |
196 |
-80 |
6400 |
-5 |
25 |
-1120 |
-70 |
|
25 |
9 |
81 |
-58 |
3364 |
5 |
25 |
-522 |
45 |
|
26 |
32 |
1024 |
-317 |
100489 |
14 |
196 |
-10144 |
448 |
|
27 |
24 |
576 |
-223 |
49729 |
25 |
625 |
-5352 |
600 |
|
28 |
43 |
1849 |
-420 |
176400 |
24 |
576 |
-18060 |
1032 |
|
29 |
41 |
1681 |
-359 |
128881 |
34 |
1156 |
-14719 |
1394 |
|
30 |
45 |
2025 |
-376 |
141376 |
25 |
625 |
-16920 |
1125 |
|
31 |
30 |
900 |
-248 |
61504 |
-6 |
36 |
-7440 |
-180 |
|
32 |
16 |
256 |
-137 |
18769 |
-8 |
64 |
-2192 |
-128 |
|
Сумма |
782 |
23278 |
-6689 |
1785831 |
449 |
18235 |
-202935 |
14480 |
Для Y (X)
Итак, Y(X)=22,41 -9,4707x
Для построения графика возьмем две точки с координатами (9; - 63) и
(48; - 432)
Для X (Y)
Для уравнения
x = a + b? y
нужно решить следующую систему:
Итак, X (Y)=3,15-0,10183y
Для построения графика возьмем две точки с координатами (-23; 5) и
(-414; 45)
Для Z (X)
Для уравнения
z= a + b? x
нужно решить следующую систему:
Итак, Z (X)=-6,53464+0,841571x
Для построения графика возьмем две точки с координатами (3; -4) и
(45; 31)
Для X(Z)
Для уравнения
x= a + b? z
нужно решить следующую систему:
Итак, X(Z)=20,31386+0,29389z
Для построения графика возьмем две точки с координатами (4; 21) и
(52; 36)
Таблица 29. Расчет значений из уравнений парной линейной регрессии по МНК
n |
y(x) |
x(y) |
z(x) |
x(z) |
|
1 |
-129,122 |
16,79685 |
6,930495 |
23,54665 |
|
2 |
-185,95 |
20,87 |
11,98 |
28,54 |
|
3 |
-138,59 |
15,78 |
7,77 |
23,25 |
|
4 |
-185,95 |
20,56 |
11,98 |
25,31 |
|
5 |
-91,24 |
12,72 |
3,56 |
15,61 |
|
6 |
-185,95 |
23,01 |
11,98 |
15,91 |
|
7 |
-62,83 |
10,18 |
1,04 |
20,90 |
|
8 |
-403,77 |
46,02 |
31,34 |
37,07 |
|
9 |
-252,24 |
28,71 |
17,87 |
29,42 |
|
10 |
-356,42 |
41,13 |
27,13 |
32,95 |
|
11 |
-365,89 |
34,52 |
27,97 |
28,54 |
|
12 |
-129,12 |
18,53 |
6,93 |
15,61 |
|
13 |
-280,65 |
30,04 |
20,40 |
20,90 |
|
14 |
-290,12 |
34,21 |
21,24 |
34,71 |
|
15 |
-34,42 |
9,16 |
-1,49 |
22,66 |
|
16 |
-223,83 |
25,25 |
15,35 |
24,13 |
|
17 |
-204,89 |
26,06 |
13,66 |
25,31 |
|
18 |
-119,65 |
11,71 |
6,09 |
17,96 |
|
19 |
-328,01 |
38,49 |
24,60 |
16,20 |
|
20 |
-138,59 |
15,47 |
7,77 |
21,49 |
|
21 |
-91,24 |
13,64 |
3,56 |
27,37 |
|
22 |
-176,48 |
20,06 |
11,14 |
28,25 |
|
23 |
-110,18 |
14,86 |
5,25 |
31,78 |
|
24 |
-110,18 |
11,30 |
5,25 |
18,84 |
|
25 |
-62,83 |
9,06 |
1,04 |
21,78 |
|
26 |
-280,65 |
35,43 |
20,40 |
24,43 |
|
27 |
-204,89 |
25,86 |
13,66 |
27,66 |
|
28 |
-384,83 |
45,92 |
29,65 |
27,37 |
|
29 |
-365,89 |
39,71 |
27,97 |
30,31 |
|
30 |
-403,77 |
41,44 |
31,34 |
27,66 |
|
31 |
-261,71 |
28,41 |
18,71 |
18,55 |
|
32 |
-129,12 |
17,10 |
6,93 |
17,96 |
|
n |
- |
- |
- |
- |
Задача 12.
После определения коэффициентов корреляции и построения уравнения регрессии разными способами провести сравнение полученных оценок и построенных графиков.
Решение
Сравним построенные уравнения регрессии
Y(X)
Графическим способом: Y(X)= -92,7059-0,10784*x.
С помощью МНК: Y(X)=22,41 -9,4707
Z(X)
Графическим способом: Z(X) = -5,81818-0,818182*x.
С помощью МНК: Z (X)=-6,53464+0,841571x
Построенные графики совпадают, с небольшими различиями, связанными с погрешностями построения линий «на глаз». Погрешность вполне допустимая.
Задача 13.
Проведите сглаживание ряда динамики Gt с помощью простой и взвешенной скользящей средней, а также скользящей медианы по трем, пяти и двенадцати точкам. В качестве номера месяца t используется столбец N. Постройте графики исходного ряда динамики (ИРД) и сглаженных рядов следующим образом. Для нечетных вариантов:
1) ИРД, ССП(3), ССП(5), ССП(12);
2) ИРД, ССВ(3), ССВ(5), ССВ(12);
3) ИРД, СМ(3), СМ(5), СМ(12).
Для четных вариантов:
1) ИРД, ССП(3), ССВ(3), СМ(3);
2) ИРД, ССП(5), ССВ(5), СМ(5);
3) ИРД, ССП(12), ССВ(12), СМ(12).
Сравните результаты сглаживания.
Решение
Для вычисления значений таблицы используем формулу для расчета простой скользящей средней:
И формулу для расчета скользящей средней взвешенной:
В качестве весов wk используем биноминальные коэффициенты.
Простая скользящая средняя
- по 3 точкам.
Скользящая средняя взвешенная
- по 3 точкам.
Скользящая медиана - по 3 точкам.
Таблица 30. Сглаживание ряда динамики Gt по трем точкам
t |
G |
ссп (3) |
ccв (3) |
см (3) |
|
1 |
46 |
- |
- |
- |
|
2 |
40 |
41,3 |
41,0 |
40 |
|
3 |
38 |
40,3 |
39,8 |
40 |
|
4 |
43 |
41,3 |
41,8 |
43 |
|
5 |
43 |
45,0 |
44,5 |
43 |
|
6 |
49 |
48,0 |
48,3 |
49 |
|
7 |
52 |
56,3 |
55,3 |
52 |
|
8 |
68 |
64,0 |
65,0 |
68 |
|
9 |
72 |
70,3 |
70,8 |
71 |
|
10 |
71 |
74,0 |
73,3 |
72 |
|
11 |
79 |
72,0 |
73,8 |
71 |
|
12 |
66 |
68,3 |
67,8 |
66 |
|
13 |
60 |
61,3 |
61,0 |
60 |
|
14 |
58 |
60,3 |
59,8 |
60 |
|
15 |
63 |
60,0 |
60,8 |
59 |
|
16 |
59 |
64,3 |
63,0 |
63 |
|
17 |
71 |
67,0 |
68,0 |
71 |
|
18 |
71 |
73,7 |
73,0 |
71 |
|
19 |
79 |
77,3 |
77,8 |
79 |
|
20 |
82 |
85,7 |
84,8 |
82 |
|
21 |
96 |
89,3 |
91,0 |
90 |
|
22 |
90 |
95,3 |
94,0 |
96 |
|
23 |
100 |
94,0 |
95,5 |
92 |
|
24 |
92 |
90,7 |
91,0 |
92 |
|
25 |
80 |
82,7 |
82,0 |
80 |
|
26 |
76 |
76,3 |
76,3 |
76 |
|
27 |
73 |
77,7 |
76,5 |
76 |
|
28 |
84 |
79,3 |
80,5 |
81 |
|
29 |
81 |
82,7 |
82,3 |
83 |
|
30 |
83 |
86,7 |
85,8 |
83 |
|
31 |
96 |
95,0 |
95,3 |
96 |
|
32 |
106 |
- |
- |
- |
Рисунок 22 - Сглаживание ряда динамики Gt по трем точкам
Простая скользящая средняя
- по 5 точкам.
Скользящая средняя взвешенная
- по 5 точкам.
Скользящая медиана - по 5 точкам.
Таблица 31. Сглаживание ряда динамики Gt по пяти точкам
t |
G |
ссп (5) |
ссв (5) |
см (5) |
|
1 |
46 |
- |
- |
- |
|
2 |
40 |
- |
- |
- |
|
3 |
38 |
42,0 |
41,3 |
43 |
|
4 |
43 |
42,6 |
42,7 |
43 |
|
5 |
43 |
45,0 |
44,7 |
43 |
|
6 |
49 |
51,0 |
50,7 |
49 |
|
7 |
52 |
56,8 |
56,0 |
52 |
|
8 |
68 |
62,4 |
63,3 |
68 |
|
9 |
72 |
68,4 |
69,0 |
71 |
|
10 |
71 |
71,2 |
71,2 |
71 |
|
11 |
79 |
69,6 |
71,2 |
71 |
|
12 |
66 |
66,8 |
66,7 |
66 |
|
13 |
60 |
65,2 |
64,3 |
63 |
|
14 |
58 |
61,2 |
60,7 |
60 |
|
15 |
63 |
62,2 |
62,3 |
60 |
|
16 |
59 |
64,4 |
63,5 |
63 |
|
17 |
71 |
68,6 |
69,0 |
71 |
|
18 |
71 |
72,4 |
72,2 |
71 |
|
19 |
79 |
79,8 |
79,7 |
79 |
|
20 |
82 |
83,6 |
83,3 |
82 |
|
21 |
96 |
89,4 |
90,5 |
90 |
|
22 |
90 |
92,0 |
91,7 |
92 |
|
23 |
100 |
91,6 |
93,0 |
92 |
|
24 |
92 |
87,6 |
88,3 |
90 |
|
25 |
80 |
84,2 |
83,5 |
80 |
|
26 |
76 |
81,0 |
80,2 |
80 |
|
27 |
73 |
78,8 |
77,8 |
80 |
|
28 |
84 |
79,4 |
80,2 |
81 |
|
29 |
81 |
83,4 |
83,0 |
83 |
|
30 |
83 |
90,0 |
88,8 |
84 |
|
31 |
96 |
- |
- |
- |
|
32 |
106 |
- |
- |
- |
Рисунок 23 - Сглаживание ряда динамики Gt по пяти точкам
Простая скользящая средняя
- по 12 точкам.
Скользящая средняя взвешенная
- по 12 точкам.
Скользящая медиана - по 12 точкам.
Таблица 32. Сглаживание ряда динамики Gt по двенадцати точкам
t |
G |
ссп (12) |
ссв (12) |
см (12) |
|
1 |
46 |
- |
- |
- |
|
2 |
40 |
- |
- |
- |
|
3 |
38 |
- |
- |
- |
|
4 |
43 |
- |
- |
- |
|
5 |
43 |
- |
- |
- |
|
6 |
49 |
55,6 |
55,1 |
50,5 |
|
7 |
52 |
56,8 |
56,4 |
56 |
|
8 |
68 |
58,3 |
59,0 |
59 |
|
9 |
72 |
60,3 |
61,2 |
61,5 |
|
10 |
71 |
61,7 |
62,4 |
61,5 |
|
11 |
79 |
64,0 |
65,2 |
64,5 |
|
12 |
66 |
65,8 |
65,8 |
67 |
|
13 |
60 |
68,1 |
67,5 |
69,5 |
|
14 |
58 |
69,3 |
68,4 |
71 |
|
15 |
63 |
71,3 |
70,6 |
71 |
|
16 |
59 |
72,8 |
71,8 |
71 |
|
17 |
71 |
74,6 |
74,3 |
71 |
|
18 |
71 |
76,8 |
76,3 |
75 |
|
19 |
79 |
78,4 |
78,5 |
79,5 |
|
20 |
82 |
79,9 |
80,1 |
79,5 |
|
21 |
96 |
80,8 |
81,9 |
79,5 |
|
22 |
90 |
82,8 |
83,4 |
81 |
|
23 |
100 |
83,7 |
84,9 |
81,5 |
|
24 |
92 |
84,7 |
85,2 |
82,5 |
|
25 |
80 |
86,1 |
85,6 |
83,5 |
|
26 |
76 |
88,1 |
87,2 |
87 |
|
27 |
73 |
- |
- |
- |
|
28 |
84 |
- |
- |
- |
|
29 |
81 |
- |
- |
- |
|
30 |
83 |
- |
- |
- |
|
31 |
96 |
- |
- |
- |
|
32 |
106 |
- |
- |
- |
Рисунок 24 - Сглаживание ряда динамики Gt по двенадцати точкам
Наиболее сглаженным получился ряд при первом способе, т.е. по трем точкам.
Задача 14.
Вычислите показатели динамики для ряда G:
* средний уровень ряда динамики;
* абсолютный прирост;
* темп (коэффициент) роста;
* темп прироста;
* средний абсолютный прирост;
* средний темп (коэффициент) роста;
* средний темп прироста.
Решение
Средний уровень ряда динамики:
,
Абсолютный прирост:
- цепной
- базисный
Коэффициент роста:
- цепной
- базисный
Темп роста:
- цепной
- базисный
Темп прироста:
Таблица 33. Расчеты абсолютного прироста, коэффициента роста и темпа роста:
t |
G |
Абсол. прирост |
Темп роста |
Темп прироста, % |
|||
цепной |
базисный |
цепной |
базисный |
||||
1 |
46 |
||||||
2 |
40 |
-6 |
-6 |
0,870 |
0,870 |
-13,04 |
|
3 |
38 |
-2 |
-8 |
0,950 |
0,826 |
-5,00 |
|
4 |
43 |
5 |
-3 |
1,132 |
0,935 |
13,16 |
|
5 |
43 |
0 |
-3 |
1,000 |
0,935 |
0,00 |
|
6 |
49 |
6 |
3 |
1,140 |
1,065 |
13,95 |
|
7 |
52 |
3 |
6 |
1,061 |
1,130 |
6,12 |
|
8 |
68 |
16 |
22 |
1,308 |
1,478 |
30,77 |
|
9 |
72 |
4 |
26 |
1,059 |
1,565 |
5,88 |
|
10 |
71 |
-1 |
25 |
0,986 |
1,543 |
-1,39 |
|
11 |
79 |
8 |
33 |
1,113 |
1,717 |
11,27 |
|
12 |
66 |
-13 |
20 |
0,835 |
1,435 |
-16,46 |
|
13 |
60 |
-6 |
14 |
0,909 |
1,304 |
-9,09 |
|
14 |
58 |
-2 |
12 |
0,967 |
1,261 |
-3,33 |
|
15 |
63 |
5 |
17 |
1,086 |
1,370 |
8,62 |
|
16 |
59 |
-4 |
13 |
0,937 |
1,283 |
-6,35 |
|
17 |
71 |
12 |
25 |
1,203 |
1,543 |
20,34 |
|
18 |
71 |
0 |
25 |
1,000 |
1,543 |
0,00 |
|
19 |
79 |
8 |
33 |
1,113 |
1,717 |
11,27 |
|
20 |
82 |
3 |
36 |
1,038 |
1,783 |
3,80 |
|
21 |
96 |
14 |
50 |
1,171 |
2,087 |
17,07 |
|
22 |
90 |
-6 |
44 |
0,938 |
1,957 |
-6,25 |
|
23 |
100 |
10 |
54 |
1,111 |
2,174 |
11,11 |
|
24 |
92 |
-8 |
46 |
0,920 |
2,000 |
-8,00 |
|
25 |
80 |
-12 |
34 |
0,870 |
1,739 |
-13,04 |
|
26 |
76 |
-4 |
30 |
0,950 |
1,652 |
-5,00 |
|
27 |
73 |
-3 |
27 |
0,961 |
1,587 |
-3,95 |
|
28 |
84 |
11 |
38 |
1,151 |
1,826 |
15,07 |
|
29 |
81 |
-3 |
35 |
0,964 |
1,761 |
-3,57 |
|
30 |
83 |
2 |
37 |
1,025 |
1,804 |
2,47 |
|
31 |
96 |
13 |
50 |
1,157 |
2,087 |
15,66 |
|
32 |
106 |
10 |
60 |
1,104 |
2,304 |
10,42 |
|
? |
2267 |
60 |
Средние показатели вычисляют по цепным показателям динамики.
Средний абсолютный прирост:
=
Средний коэффициент роста:
1,027295
Средний темп роста:
%
Средний темп прироста:
Задача 15.
Постройте уравнение тренда с помощью МНК двумя способами и нанесите линию тренда на график исходного ряда динамики. Определите величину остаточной дисперсии.
Методика решения
Уравнение тренда строят методами регрессионного анализа. Линейный тренд описывается с помощью линейного уравнения относительно времени:
g(t) = a + b?t.
Первый способ. Составляется система нормальных уравнений по МНК:
Таблица 34. Первый способ
t |
g |
t^2 |
g*t |
||
1 |
46 |
1 |
46 |
||
2 |
40 |
4 |
80 |
||
3 |
38 |
9 |
114 |
||
4 |
43 |
16 |
172 |
||
5 |
43 |
25 |
215 |
||
6 |
49 |
36 |
294 |
||
7 |
52 |
49 |
364 |
||
8 |
68 |
64 |
544 |
||
9 |
72 |
81 |
648 |
||
10 |
71 |
100 |
710 |
||
11 |
79 |
121 |
869 |
||
12 |
66 |
144 |
792 |
||
13 |
60 |
169 |
780 |
||
14 |
58 |
196 |
812 |
||
15 |
63 |
225 |
945 |
||
16 |
59 |
256 |
944 |
||
17 |
71 |
289 |
1207 |
||
18 |
71 |
324 |
1278 |
||
19 |
79 |
361 |
1501 |
||
20 |
82 |
400 |
1640 |
||
21 |
96 |
441 |
2016 |
||
22 |
90 |
484 |
1980 |
||
23 |
100 |
529 |
2300 |
||
24 |
92 |
576 |
2208 |
||
25 |
80 |
625 |
2000 |
||
26 |
76 |
676 |
1976 |
||
27 |
73 |
729 |
1971 |
||
28 |
84 |
784 |
2352 |
||
29 |
81 |
841 |
2349 |
||
30 |
83 |
900 |
2490 |
||
31 |
96 |
961 |
2976 |
||
32 |
106 |
1024 |
3392 |
||
Сумма |
528 |
2267 |
11440 |
41965 |
Составим систему нормальных уравнений:
g(t) = 43,26613 + 1,671371?t.
Нанесем линию тренда на график используя две точки: (4; 50) и (30; 93).
Второй способ. Вычисления упрощаются, если сместить начало координат в середину ряда:
t? = t-t: {...;-3; -2; -1; 0; 1; 2; 3;...}.
В результате сумма значений нового аргумента t? равна нулю, а система нормальных уравнений принимает вид:
где
Таблица 35. Второй способ
t* |
g |
t*^2 |
g*t* |
||
-15,5 |
46 |
240,25 |
-713 |
||
-14,5 |
40 |
210,25 |
-580 |
||
-13,5 |
38 |
182,25 |
-513 |
||
-12,5 |
43 |
156,25 |
-537,5 |
||
-11,5 |
43 |
132,25 |
-494,5 |
||
-10,5 |
49 |
110,25 |
-514,5 |
||
-9,5 |
52 |
90,25 |
-494 |
||
-8,5 |
68 |
72,25 |
-578 |
||
-7,5 |
72 |
56,25 |
-540 |
||
-6,5 |
71 |
42,25 |
-461,5 |
||
-5,5 |
79 |
30,25 |
-434,5 |
||
-4,5 |
66 |
20,25 |
-297 |
||
-3,5 |
60 |
12,25 |
-210 |
||
-2,5 |
58 |
6,25 |
-145 |
||
-1,5 |
63 |
2,25 |
-94,5 |
||
-0,5 |
59 |
0,25 |
-29,5 |
||
0,5 |
71 |
0,25 |
35,5 |
||
1,5 |
71 |
2,25 |
106,5 |
||
2,5 |
79 |
6,25 |
197,5 |
||
3,5 |
82 |
12,25 |
287 |
||
4,5 |
96 |
20,25 |
432 |
||
5,5 |
90 |
30,25 |
495 |
||
6,5 |
100 |
42,25 |
650 |
||
7,5 |
92 |
56,25 |
690 |
||
8,5 |
80 |
72,25 |
680 |
||
9,5 |
76 |
90,25 |
722 |
||
10,5 |
73 |
110,25 |
766,5 |
||
11,5 |
84 |
132,25 |
966 |
||
12,5 |
81 |
156,25 |
1012,5 |
||
13,5 |
83 |
182,25 |
1120,5 |
||
14,5 |
96 |
210,25 |
1392 |
||
15,5 |
106 |
240,25 |
1643 |
||
Сумма |
0 |
2267 |
2728 |
4559,5 |
Расчет значений:
1,671
g(t) =70,843+1,671t
Нанесем линию тренда на график используя две точки:
(4; 78,5) и (30; 121).
Таблица 36. Расчеты для вычисления остаточной дисперсии
t |
g |
g(t) |
(g(t)-gt)^2 |
|
1 |
46 |
44,9375 |
1,128906 |
|
2 |
40 |
46,60887 |
43,67718 |
|
3 |
38 |
48,28024 |
105,6834 |
|
4 |
43 |
49,95161 |
48,32492 |
|
5 |
43 |
51,62298 |
74,35585 |
|
6 |
49 |
53,29435 |
18,44148 |
|
7 |
52 |
54,96573 |
8,79553 |
|
8 |
68 |
56,6371 |
129,1156 |
|
9 |
72 |
58,30847 |
187,4581 |
|
10 |
71 |
59,97984 |
121,444 |
|
11 |
79 |
61,65121 |
300,9805 |
|
12 |
66 |
63,32258 |
7,168574 |
|
13 |
60 |
64,99395 |
24,93955 |
|
14 |
58 |
66,66532 |
75,08782 |
|
15 |
63 |
68,33669 |
28,4803 |
|
16 |
59 |
70,00806 |
121,1775 |
|
17 |
71 |
71,67944 |
0,461633 |
|
18 |
71 |
73,35081 |
5,526291 |
|
19 |
79 |
75,02218 |
15,82307 |
|
20 |
82 |
76,69355 |
28,15843 |
|
21 |
96 |
78,36492 |
310,9961 |
|
22 |
90 |
80,03629 |
99,27551 |
|
23 |
100 |
81,70766 |
334,6097 |
|
24 |
92 |
83,37903 |
74,32108 |
|
25 |
80 |
85,0504 |
25,50657 |
|
26 |
76 |
86,72177 |
114,9564 |
|
27 |
73 |
88,39315 |
236,9489 |
|
28 |
84 |
90,06452 |
36,77836 |
|
29 |
81 |
91,73589 |
115,2593 |
|
30 |
83 |
93,40726 |
108,311 |
|
31 |
96 |
95,07863 |
0,848924 |
|
32 |
106 |
96,75 |
85,5625 |
|
Сумма |
2889,603 |
СПИСОК ЛИТЕРАТУРЫ
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях.- М.: Юнити-Дана, 2011.- 270 с.
2. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика.- М.: Юнити-Дана, 2011.- 656 с.
3. Гмурман В.Е. Теория вероятностей и математическая статистика.- М.: Высш. школа, 2010.-479 с.
4. ГОСТ 2.304-81. Шрифты чертежные.
5. Кремер Н.Ш. Теория вероятностей и математическая статистика.- М.: ЮНИТИ-ДАНА, 2010.-573 с.
6. Шмойлова Р.А. Практикум по теории статистики.- М.: Финансы и статистика, 2009.- 416 с.
7. Шмойлова Р.А. Теория статистики.- М.: Финансы и статистика, 2010.- 656 с.
Размещено на Allbest.ru
Подобные документы
Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.
реферат [57,4 K], добавлен 25.01.2009Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.
контрольная работа [216,6 K], добавлен 12.05.2010Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.
контрольная работа [75,1 K], добавлен 29.01.2010Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Исследование зависимости сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии. Построение поля корреляции. Определение интервальных оценок заданных коэффициентов. Средняя ошибка аппроксимации.
контрольная работа [2,1 M], добавлен 09.08.2013Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.
курсовая работа [1,1 M], добавлен 22.05.2015