Типовой расчёт по математической статистике
Вычисление точечных оценок: выборочные средние и несмещённые выборочные средние квадратичного отклонения. Нахождение выборочных уравнений прямых линий регрессии. Закон распределения случайных величин. Вычисление выборочного коэффициента корреляции.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 17.06.2012 |
Размер файла | 245,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Задание (вариант 25)
В качестве исходных данных предлагаются результаты опроса людей об их весе Х (в килограммах) и росте Y (в сантиметрах). Данные выборочной совокупности содержат результаты опроса 50 человек, проживающих в Европе.
Для обработки этих данных в типовом расчёте требуется выполнить следующую работу:
1. Для величин Х и Y составить сгруппированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для Х и Y.
2. Вычислить точечные оценки: выборочные средние и ; несмещённые выборочные средние квадратичные отклонения sx и sy.
3. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости = 0,05.
4. Найти доверительные интервалы для M[X], M[Y], D[X], D[Y] с надёжностью = 0,95.
5. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между Х и Y (о незначимости отклонения rв от нуля).
6. Найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi, yi), i = 1, ..., n и эмпирическими линиями регрессии.
Таблица 1 - Статистические данные для 25-го варианта
Вариант 14 |
|||
№ |
X |
Y |
|
1) 87.7 190 |
|||
2) 87.6 192 |
|||
3) 89.2 191 |
|||
4) 88.2 195 |
|||
5) 87.6 193 |
|||
6) 84.8 185 |
|||
7) 86.1 185 |
|||
8) 85.7 186 |
|||
9) 90.4 197 |
|||
10) 90.7 202 |
|||
11) 93.5 207 |
|||
12) 90.0 195 |
|||
13) 91.8 200 |
|||
14) 86.0 185 |
|||
15) 87.6 192 |
|||
16) 88.0 191 |
|||
17) 87.3 188 |
|||
18) 93.4 206 |
|||
19) 86.6 191 |
|||
20) 86.5 187 |
|||
21) 87.7 188 |
|||
22) 85.7 190 |
|||
23) 86.4 188 |
|||
24) 87.6 191 |
|||
25) 84.5 179 |
|||
26) 89.7 195 |
|||
27) 81.8 176 |
|||
28) 92.4 205 |
|||
29) 87.0 190 |
|||
30) 89.4 195 |
|||
31) 89.7 197 |
|||
32) 89.6 195 |
|||
33) 90.0 202 |
|||
34) 91.2 200 |
|||
35) 89.4 197 |
|||
36) 87.2 188 |
|||
37) 92.1 201 |
|||
38) 91.9 205 |
|||
39) 90.8 200 |
|||
40) 88.4 192 |
|||
41) 93.4 203 |
|||
42) 89.7 197 |
|||
43) 87.0 188 |
|||
44) 82.6 176 |
|||
45) 84.3 183 |
|||
46) 87.4 191 |
|||
47) 83.8 183 |
|||
48) 88.4 193 |
|||
49) 88.2 191 |
|||
50) 88.1 191 |
1. Из предложенной генеральной совокупности объёма N = 100 сформировать выборку объёма n = 50 с помощью таблицы случайных чисел. Вариационные и статистические ряды для X и Y
Таблица 2 - Выборки x, y
Выборка Х |
Выборка Y |
|
87,7 |
190 |
|
87,6 |
192 |
|
89,2 |
191 |
|
88,2 |
195 |
|
87,6 |
193 |
|
84,8 |
185 |
|
86,1 |
185 |
|
85,7 |
186 |
|
90,4 |
197 |
|
90,7 |
202 |
|
93,5 |
207 |
|
90 |
195 |
|
91,8 |
200 |
|
86 |
185 |
|
87,6 |
192 |
|
88 |
191 |
|
87,3 |
188 |
|
93,4 |
206 |
|
86,6 |
191 |
|
86,5 |
187 |
|
87,7 |
188 |
|
85,7 |
190 |
|
86,4 |
188 |
|
87,6 |
191 |
|
84,5 |
179 |
|
89,7 |
195 |
|
81,8 |
176 |
|
92,4 |
205 |
|
87 |
190 |
|
89,4 |
195 |
|
89,7 |
197 |
|
89,6 |
195 |
|
90 |
202 |
|
91,2 |
200 |
|
89,4 |
197 |
|
87,2 |
188 |
|
92,1 |
201 |
|
91,9 |
205 |
|
90,8 |
200 |
|
88,4 |
192 |
|
93,4 |
203 |
|
89,7 |
197 |
|
87 |
188 |
|
82,6 |
176 |
|
84,3 |
183 |
|
87,4 |
191 |
|
83,8 |
183 |
|
88,4 |
193 |
|
88,2 |
191 |
|
88,1 |
191 |
Таблица 3 - Вариационные ряды x, y
Вариационный ряд для Х |
Вариационный ряд для Y |
|
81,8 |
176 |
|
82,6 |
176 |
|
83,8 |
179 |
|
84,3 |
183 |
|
84,5 |
183 |
|
84,8 |
185 |
|
85,7 |
185 |
|
85,7 |
185 |
|
86 |
186 |
|
86 |
187 |
|
86,1 |
188 |
|
86,4 |
188 |
|
86,5 |
188 |
|
86,6 |
188 |
|
87 |
188 |
|
87 |
190 |
|
87,2 |
190 |
|
87,3 |
190 |
|
87,4 |
191 |
|
87,6 |
191 |
|
87,6 |
191 |
|
87,6 |
191 |
|
87,6 |
191 |
|
87,7 |
191 |
|
87,7 |
191 |
|
88,1 |
192 |
|
88,2 |
192 |
|
88,2 |
192 |
|
88,4 |
193 |
|
88,4 |
193 |
|
89,2 |
195 |
|
89,4 |
195 |
|
89,4 |
195 |
|
89,6 |
195 |
|
89,7 |
195 |
|
89,7 |
197 |
|
89,7 |
197 |
|
90 |
197 |
|
90 |
197 |
|
90,4 |
200 |
|
90,7 |
200 |
|
90,8 |
200 |
|
91,2 |
201 |
|
91,8 |
202 |
|
91,9 |
202 |
|
92,1 |
203 |
|
92,4 |
205 |
|
93,4 |
205 |
|
93,4 |
206 |
|
93,5 |
207 |
Таблица 4 - Статистические ряды x, y
Статистический ряд для Х |
||
81,8 |
1 |
|
82,6 |
1 |
|
83,8 |
1 |
|
84,3 |
1 |
|
84,8 |
1 |
|
84,5 |
1 |
|
85,7 |
2 |
|
86,0 |
2 |
|
86,1 |
1 |
|
86,4 |
1 |
|
86,5 |
1 |
|
86,6 |
1 |
|
87,0 |
2 |
|
87,2 |
1 |
|
87,3 |
1 |
|
87,4 |
1 |
|
87,6 |
4 |
|
87,7 |
2 |
|
88,1 |
1 |
|
88,2 |
2 |
|
88,4 |
2 |
|
89,2 |
1 |
|
89,4 |
2 |
|
89,6 |
1 |
|
89,7 |
3 |
|
90,0 |
2 |
|
90,4 |
1 |
|
90,7 |
1 |
|
90,8 |
1 |
|
91,2 |
1 |
|
91,8 |
1 |
|
91,9 |
1 |
|
92,1 |
1 |
|
92,4 |
1 |
|
93,4 |
2 |
|
93,5 |
1 |
|
|
50 |
|
Статистический ряд для Y |
||
176,0 |
2 |
|
179,0 |
1 |
|
183,0 |
2 |
|
185,0 |
3 |
|
186,0 |
1 |
|
187,0 |
1 |
|
188,0 |
5 |
|
190,0 |
3 |
|
191,0 |
7 |
|
192,0 |
3 |
|
193,0 |
2 |
|
195,0 |
5 |
|
197,0 |
4 |
|
200,0 |
3 |
|
201,0 |
1 |
|
202,0 |
2 |
|
203,0 |
1 |
|
205,0 |
2 |
|
206,0 |
1 |
|
207,0 |
1 |
|
|
50 |
2. Для величин Х и Y составить сгруппированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для Х и Y
Для Х:
Число интервалов
k=1+3,322*ln(n)=1+3,322*ln(50)=6,64?7
Длина интервала hx:
hx==1,67
Число интервалов k= |
7 |
|
Xmin= |
81,8 |
|
Xmax= |
93,5 |
|
Размах выборки Rx= |
11,7 |
|
Длина интервала hx= |
1,671429 |
|
= |
5,2 |
|
Превышение |
24,7 |
|
|
12,35 |
N |
Границы интервалов |
Частота ni |
ni/n |
ni/(n*hx) |
nx/n |
Xi сред |
||
1 |
69,5 |
74,7 |
0 |
0,00 |
0,000 |
0,00 |
72,05 |
|
2 |
74,7 |
79,9 |
1 |
0,02 |
0,004 |
0,00 |
77,25 |
|
3 |
79,9 |
85,1 |
5 |
0,10 |
0,019 |
0,02 |
82,45 |
|
4 |
85,1 |
90,3 |
32 |
0,64 |
0,123 |
0,12 |
87,65 |
|
5 |
90,3 |
95,5 |
11 |
0,22 |
0,042 |
0,76 |
92,85 |
|
6 |
95,5 |
100,7 |
1 |
0,02 |
0,004 |
0,98 |
98,05 |
|
7 |
100,7 |
105,9 |
0 |
0,00 |
0,000 |
1,00 |
103,25 |
|
50 |
1,00 |
0,192 |
1,00 |
Для Y:
Число интервалов
k=1+3,322*ln(n)=1+3,322*ln(50)=6,64?7
Длина интервала hy:
hy==4,428
Число интервалов k= |
7 |
|
Ymin= |
176 |
|
Ymax= |
207 |
|
Размах выборки Ry= |
31 |
|
Длина интервала hy= |
4,428571 |
|
= |
5,2 |
|
Превышение |
5,4 |
|
|
2,7 |
N |
Границы интервалов |
Частота ni |
ni/n |
ni/(n*hy) |
ny/n |
Yi сред |
||
1 |
173,3 |
178,5 |
2 |
0,04 |
0,00769 |
0,00 |
175,9 |
|
2 |
178,5 |
183,7 |
3 |
0,06 |
0,01154 |
0,04 |
181,1 |
|
3 |
183,7 |
188,9 |
10 |
0,20 |
0,03846 |
0,10 |
186,3 |
|
4 |
188,9 |
194,1 |
15 |
0,30 |
0,05769 |
0,30 |
191,5 |
|
5 |
194,1 |
199,3 |
9 |
0,18 |
0,03462 |
0,60 |
196,7 |
|
6 |
199,3 |
204,5 |
6 |
0,12 |
0,02308 |
0,78 |
201,9 |
|
7 |
204,5 |
209,7 |
5 |
0,10 |
0,01923 |
0,90 |
207,1 |
|
50 |
1,00 |
0,19231 |
1,00 |
3. Вычислить точечные оценки: выборочные средние и ; несмещённые выборочные средние квадратичные отклонения sx и sy. Точечные оценки
Выборочное среднее по всему массиву |
||
X |
Y |
|
88,282 |
192,56 |
|
Выборочное среднее по сгруппированному ряду |
||
X |
Y |
|
88,274 |
192,956 |
|
Относительная ошибка |
||
X |
Y |
|
0,01% |
0,21% |
|
Среднее кв. откл. по всему массиву |
||
X |
Y |
|
Дисперсия: 7,395138776 |
Дисперсия: 53,76163265 |
|
СКО: 2,719400444 |
СКО: 7,332232447 |
|
Среднее кв. откл. для сгруп.-го ряда |
||
X |
Y |
|
12,84675918 |
62,95353469 |
|
3,584237601 |
7,934326354 |
|
Для сгруппированного ряда с поправкой Шеппарда |
||
X |
Y |
|
Дисперсия: 10,59342585 |
Дисперсия: 60,70020136 |
|
СКО: 3,254754346 |
СКО: 7,791033395 |
|
Относительная ошибка |
||
X |
Y |
|
19,69% |
6,26% |
Выборочное среднее:
1. по всему массиву X=88,282, Y=192,56
2. по сгруппированному ряду X=88,274, Y=192,956
3. относительные погрешности Ex=0,01% Ey=0,21%
Среднеквадратичные отклонения
1. по всему массиву Sx= 2,719400444, Sy=7,332232447
2. по сгруппированному ряду Sx=3,584237601, Sy=7,934326354
3. относительные погрешности Esx=19,69%, Esy=6,26%
4. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости = 0,05
Проверяется гипотеза Н0 при альтернативе Н1:
Н0-случайная величина, подчиняется нормальному закону
Н1-случайная величина, подчиняется нормальному закону
,
Ф(zi)- функция Лапласа
p(
Для X:
N |
Границы интервалов |
Частота ni |
Zi |
Ф(Zi) |
Pi |
n*Pi |
Критерий |
||
1 |
69,5 |
76,8 |
1 |
-5,77 |
-0,4979 |
0,1767 |
8,835 |
6,948186 |
|
2 |
76,8 |
84,1 |
5 |
-3,53 |
-0,3212 |
0,2148 |
10,74 |
3,067747 |
|
3 |
84,1 |
91,3 |
24 |
-1,29 |
-0,1064 |
0,2544 |
12,72 |
10,00302 |
|
4 |
91,3 |
98,6 |
12 |
0,94 |
0,148 |
0,2005 |
10,025 |
0,38909 |
|
5 |
98,6 |
105,9 |
7 |
3,18 |
0,3485 |
0,1515 |
7,575 |
0,043647 |
|
|
|
|
49 |
+ |
0,5 |
|
|
20,45169 |
При заданном уровне значимости 0,95 и количестве степеней свободы 2 табличное значение(2;0,95) = 5.991, суммарная мера расхождения 20,45169 превышает данную меру расхождения, значит, данное распределение нельзя считать нормальным с уровнем доверительной вероятности 0,95.
Для Y:
N |
Границы интервалов |
Частота ni |
Zi |
Ф(Zi) |
Pi |
n*Pi |
Критерий |
||
1 |
173,3 |
179,54 |
5 |
- |
-0,5 |
0,25780 |
12,89 |
4,829488 |
|
2 |
179,54 |
185,78 |
12 |
-1,72 |
-0,2422 |
0,22226 |
11,113 |
0,070797 |
|
3 |
185,78 |
192,02 |
16 |
-0,92 |
-0,0199 |
0,22874 |
11,437 |
1,820492 |
|
4 |
192,02 |
198,26 |
10 |
-0,12 |
0,2088 |
0,29120 |
14,56 |
1,428132 |
|
5 |
198,26 |
204,5 |
8 |
0,68 |
0,3749 |
0,12510 |
6,255 |
0,486815 |
|
|
|
|
51 |
+ |
0,5 |
|
|
8,635724 |
При заданной доверительной вероятности 0,95 и количестве степеней свободы 2 табличное значение(2;0,95) = 5.991, суммарная мера расхождения 8,635724 превышает данную меру расхождения, значит, данное распределение нельзя считать нормальным с уровнем доверительной вероятности 0,95. распределение квадратичный регрессия корреляция
5. Найти доверительные интервалы для M[X], M[Y], D[X], D[Y] с надёжностью = 0,95
Надежность |
0,95 |
|||||
Уровень значимости |
0,05 |
0,025 |
||||
t крит |
2,01 |
|||||
X-> |
Доверительный интервал |
|
Y-> |
Доверительный интервал |
|
|
87,509 |
< a < |
89,055 |
190,476 |
< a < |
194,644 |
|
c 1 |
71,4 |
|||||
c 2 |
32,4 |
|||||
X-> |
Доверительный интервал |
|
Y-> |
Доверительный интервал |
|
|
5,075 |
< s в квадрате < |
11,184 |
36,895 |
< s в квадрате < |
81,306 |
Для Х:
Уровень значимости б=1-г=1-0,95=0,05; б/2=0,025
Число степеней свободы n-1=50-1=49
Выборочное среднее X=88,282
Среднее квадратичное Sx=2,719400444
По таблице распределения Стьюдента t0,025-49=2,01
87,509< a <89,055
По таблице распределения ч2
71,4 32,4
5,075 <у2< 11,184
Для Y:
Уровень значимости б=1-г=1-0,95=0,05; б/2=0,025
Число степеней свободы n-1=50-1=49
Выборочное среднее Y=192,56
Среднее квадратичное Sy=7,332232447
По таблице распределения Стьюдента t0,025-49=2,01
190,476< a <194,644
По таблице распределения ч2
71,4 32,4
36,895<у2<81,306
6. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между Х и Y (о незначимости отклонения rв от нуля)
Проверяется гипотеза Н0 при альтернативе Н1:
Н0-X и Y независимы
Н1- X и Y зависимы
Корреляционная таблица
|
Y |
173,3 |
178,5 |
183,7 |
188,9 |
194,1 |
199,3 |
204,5 |
|
Элр Yна X |
||
X |
|
178,5 |
183,7 |
188,9 |
194,1 |
199,3 |
204,5 |
209,7 |
Ni |
x сред |
Yx |
|
69,5 |
74,7 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
72,05 |
0,00 |
|
74,7 |
79,9 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
77,25 |
0,00 |
|
79,9 |
85,1 |
1 |
2 |
1 |
1 |
1 |
0 |
0 |
6 |
82,45 |
185,43 |
|
85,1 |
90,3 |
0 |
1 |
9 |
14 |
7 |
1 |
1 |
33 |
87,65 |
191,66 |
|
90,3 |
95,5 |
0 |
0 |
1 |
0 |
1 |
6 |
3 |
11 |
92,85 |
201,43 |
|
95,5 |
100,7 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
98,05 |
0,00 |
|
100,7 |
105,9 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
103,25 |
0,00 |
|
|
Nj |
1 |
3 |
11 |
15 |
9 |
7 |
4 |
50 |
|
|
|
Элр XнаY |
y сред |
175,9 |
181,1 |
186,3 |
191,5 |
196,7 |
201,9 |
207,1 |
|
|
|
|
Xy |
82,45 |
84,18 |
87,65 |
87,30 |
87,65 |
92,11 |
91,55 |
|
|
|
1) Проверяемая гипотеза H0: X иY независимы
2) Конкурирующая гипотеза H1: X иY зависимы
[ |
) |
[ |
] |
||||
X \ Y |
176 |
191,5 |
191,5 |
207 |
|||
81,8 |
87,65 |
17 |
11 |
5 |
11 |
22 |
|
87,65 |
93,5 |
8 |
14 |
20 |
14 |
28 |
|
25 |
25 |
50 |
|||||
c 2 (выч) |
11,68831 |
ч2 выч =11,68831
Уровень значимости б=0,05
Число степеней свободы k=1
ч2 крит =3,8
ч2 выч > ч2 крит
Осуществилось маловероятное событие. Гипотеза H0 отвергается.
X и Y зависимы.
Проверка гипотезы о незначимости отклонения коэффициента корреляции от нуля:
Проверяемая гипотеза H0: генеральный коэффициент корреляции r = 0
Конкурирующая гипотеза H1: r 0
Xср |
Yср |
Sx |
Sy |
rв |
Критерий Стьюдента t |
|
88,282 |
192,56 |
2,7194 |
7,332232 |
0,638387 |
5,746119729 |
Критерий Стьюдента t = = 5,746
Уровень значимости б = 0,05
Число степеней свободы k = n-2 = 48
По таблице распределения Стьюдента: tкр=2,01
Т.к. мы попали в критическую область, то гипотезу H0 отвергаем (по принципу практической невозможности осуществления маловероятного события, т.к. P(t > 2,01) = 0,05).
7. Найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi, yi), i = 1, ..., n и эмпирическими линиями регрессии
Теоретические линии регрессии Y на X:
=1,721263*x + 40,60345
Теоретические линии регрессии X на Y:
=0,236767*y + 40,60345
Т.л.р. |
y на х |
х на y |
|
a= |
1,721263 |
0,236767 |
|
b= |
40,60345 |
42,69015 |
|
Точки: |
|
|
|
x1 |
51,25 |
55,50307 |
|
x2 |
79,25 |
74,04846 |
|
y1 |
158,8931 |
155 |
|
y2 |
178,1957 |
183 |
Размещено на Allbest.ru
Подобные документы
Построение ряда распределения предприятий по стоимости основных производственных фондов методом статистической группировки. Нахождение средних величин и индексов. Понятие и вычисление относительных величин. Показатели вариации. Выборочное наблюдение.
контрольная работа [120,9 K], добавлен 01.03.2012Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.
практическая работа [495,9 K], добавлен 26.11.2012Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Вычисление выборочных характеристик по заданной выборке. Результаты ранжирования выборочных данных и вычисление моды и медианы. Оценка функции плотности распределения.
курсовая работа [215,7 K], добавлен 07.02.2016Законы распределения случайных величин. Закон распределения Пуассона. Свойства плотности вероятности. Критериальные случайные величины. Свойство коэффициента корреляции. Закон больших чисел и его следствия. Предельные теоремы теории вероятностей.
курс лекций [774,3 K], добавлен 11.03.2011Распределение вероятностей случайных величин. Числовые характеристики случайных величин. Смешанные начальный и центральный моменты совместного распределения совокупности случайных величин. Физический смысл понятия корреляции. Модель потока редких событий.
лекция [429,8 K], добавлен 02.08.2009Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.
контрольная работа [59,3 K], добавлен 26.06.2009Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Выборочное наблюдение как метод статистического исследования, его особенности. Случайный, механический, типический и серийный виды отбора при образовании выборочных совокупностей. Понятие и причины возникновения ошибки выборки, методы ее определения.
реферат [21,1 K], добавлен 04.06.2010Средние величины в экономическом анализе. Общее понятие о степенных и структурных средних. Свойства средней арифметической величины. Расчеты, необходимые для нахождения параметров регрессии. Линейный коэффициент корреляции. Определение медианы и моды.
курсовая работа [165,9 K], добавлен 12.03.2013