Типовой расчет по математической статистике
Обработка статистических данных веса и роста опрошенных людей. Составление группированных рядов, построение полигона, гистограммы относительных частот и графика эмпирических функций. Вычисление точечной оценки и составление корреляционной таблицы.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 21.04.2012 |
Размер файла | 515,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство образования и науки Российской Федерации
Алтайский государственный технический университет
им. И.И. Ползунова
Кафедра «Высшей математики»
Типовой расчет по математической статистике
Вариант задания-7
Барнаул 2009
1. Содержание задания
гистограмма эмпирический корреляционный статистика
В качестве исходных данных предлагаются результаты опроса людей об их весе. X (в килограммах) и росте Y (в сантиметрах). Данные приводятся в приложении: таблица П4 содержит результаты опроса 100 человек, проживающих в Европе.
Для обработки этих данных в типовом расчёте требуется выполнить следующую работу:
1. Из предложенной генеральной совокупности объёма N = 100 сформировать выборку объёма п = 50 с помощью таблицы П6 случайных чисел.
2. Для величин X и F составить группированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для X и Y.
3. Вычислить точечные оценки: выборочные средние хср и уср; несмещённые выборочные средние квадратичные отклонения sx и sy
4. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости б = 0,05.
5. Найти доверительные интервалы для М[Х], M[Y], D[X], D[Y] с надёжностью г= 0,95.
6. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между X иY (о незначимости отклонения rв от нуля).
7. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi yi), i= 1,..., п и эмпирическими линиями регрессии.
2. Выполнение типового расчёта
1. Сформируем выборку объёма п= 50 из генеральной совокупности (X, Y) , представленной в таблице П4 приложения.
Для этого воспользуемся таблицей из 50-ти случайных чисел, полученных с помощью датчика случайных чисел. Эти числа указывают номера элементов, которые будут взяты из генеральной совокупности:
Таблица 1(случайные величины), Вариант 7
6 |
27 |
73 |
92 |
78 |
48 |
81 |
80 |
1 |
23 |
|
35 |
55 |
88 |
76 |
14 |
35 |
43 |
13 |
16 |
88 |
|
44 |
94 |
64 |
99 |
10 |
38 |
29 |
3 |
79 |
14 |
|
77 |
7 |
84 |
67 |
11 |
18 |
37 |
91 |
2 |
17 |
|
100 |
49 |
87 |
41 |
45 |
52 |
82 |
28 |
46 |
32 |
Выборочная совокупность приводится в таблице 2:
Таблица 2(выборочная совокупность)
xi |
yi |
xi |
yi |
xi |
yi |
xi |
yi |
xi |
yi |
|
63,6 |
164 |
83,4 |
178 |
77 |
181 |
63 |
162 |
74,8 |
181 |
|
76,5 |
174 |
85 |
175 |
90,3 |
188 |
86,8 |
187 |
70,6 |
178 |
|
62,7 |
152 |
76,7 |
178 |
80,7 |
177 |
75,5 |
177 |
73,3 |
160 |
|
79,1 |
173 |
87,9 |
185 |
62,2 |
165 |
89,9 |
186 |
80,7 |
180 |
|
79,4 |
176 |
76 |
179 |
66,6 |
166 |
81,7 |
185 |
78,1 |
172 |
|
81,9 |
190 |
64,8 |
165 |
88,7 |
190 |
75,3 |
174 |
75,9 |
182 |
|
62,7 |
168 |
78 |
175 |
75,6 |
168 |
69,9 |
168 |
71,6 |
165 |
|
65,9 |
166 |
63,7 |
155 |
92 |
194 |
82 |
175 |
91,4 |
197 |
|
84,5 |
188 |
82,8 |
188 |
89,2 |
184 |
74,9 |
190 |
76,2 |
181 |
|
77,6 |
174 |
76,7 |
178 |
76 |
179 |
72,7 |
174 |
87,4 |
184 |
Величина xi - вес (в килограммах), a yi - рост (в сантиметрах) i-ro человека.
2. Составим группированный ряд для величины X. Для этого определим наибольшее
xmax =92
xmin =62,2
и наименьшее значения величины X, встречающееся в выборке. Вычислим размах:
Rx= хтах - xmin= 92-62,2=29,8
Весь промежуток [62,2; 92] изменения выборочных данных величины X , разобьём на r = 7 интервалов (следуя рекомендации (30.2), модуль 30, при п = 50).
Тогда шаг разбиения
hx = Rx / r =29,8/7=4,26
Для того, чтобы шаг разбиения был удобным, возьмём его равным hx =5. Тогда расширение промежутка разбиения составит (5 -4,257) * 7 = 5,2.
Определения границ интервалов [ai-1, ai) , i -- 1, ... , 7, границы определяются так:
ai=аi-1+hх, i -- 1, ...,7.
Затем для каждого i-ro интервала [ai-1, ai) определяется его середина хi* по формуле:
хi*= (ai-1+ ai)/2
С помощью таблицы 2 находятся частоты ni - количество выборочных значений X, попавших в i-й интервал.
Результаты группировки выборочных значений для X сведём в таблицу 3:
Таблица 3
Номер интервала i |
Интервалы [ai-1;ai) |
Середины интервалов xi* |
Частоты ni |
Относительные частоты ni/n |
Накопленные относительные частоты i?j=1(ni/n) |
ni/nhx |
|
1 |
[60;65) |
62,5 |
7 |
0,14 |
0,14 |
0,03 |
|
2 |
[65;70) |
67,5 |
3 |
0,06 |
0,20 |
0,01 |
|
3 |
[70;75) |
72,5 |
6 |
0,12 |
0,32 |
0,03 |
|
4 |
[75;80) |
77,5 |
16 |
0,32 |
0,64 |
0,08 |
|
5 |
[80;85) |
82,5 |
8 |
0,16 |
0,80 |
0,04 |
|
6 |
[85;90) |
87,5 |
7 |
0,14 |
0,94 |
0,03 |
|
7 |
[90;95] |
92,5 |
3 |
0,06 |
1,00 |
0,01 |
|
|
n= |
50 |
|
Используя полученные результаты для хi* и ni/n (столбец 3-й и 5-й), строим полигон относительных частот (рисунок 1);
используя столбец 2-й и 7-й, строим гистограмму относительных частот (рисунок 2);
используя столбец 3-й и 6-й, строим график эмпирической функции распределения (рисунок 3).
Рисунок 1
Рисунок 2
Рисунок 3
Для величины Y аналогичные результаты укажем в окончательном виде.
ymax=197
ymin=152
Ry=45
hy=6,47=7
Результаты группировки выборочных значений для Y:
Таблица 4
Номер интервала i |
Интервалы [bi-1;bi) |
Середины интервалов yi* |
Частоты mi |
Относительные частоты mi/m |
Накопленные относительные частоты i?j=1(mi/m) |
mi/mhy |
|
1 |
[150;157) |
153,5 |
2 |
0,04 |
0,04 |
0,01 |
|
2 |
[157;164) |
160,5 |
2 |
0,04 |
0,08 |
0,01 |
|
3 |
[164;171) |
167,5 |
9 |
0,18 |
0,26 |
0,03 |
|
4 |
[171;178) |
174,5 |
12 |
0,24 |
0,50 |
0,04 |
|
5 |
[178;185) |
181,5 |
13 |
0,26 |
0,76 |
0,04 |
|
6 |
[185;192) |
188,5 |
9 |
0,18 |
0,94 |
0,03 |
|
7 |
[192;199] |
195,5 |
3 |
0,06 |
1,00 |
0,01 |
|
|
m= |
50 |
|
На рисунках 4 - 6 изображены полигон, гистограмма относительных частот и график эмпирической функции распределения для величины Y:
Рисунок 4
Рисунок 5
Рисунок 6
3. Точечные оценки х , у , sx , sy вычислим по группированным данным (см.таблицы 3 и 4).
Составим таблицу 5:
Таблица 5
Номер интервала i |
xi* |
ni |
xi*ni |
xi*2ni |
yi* |
mi |
yi*mi |
yi*2mi |
|
1 |
62,5 |
7 |
437,5 |
27343,75 |
153,5 |
2 |
307 |
47124,5 |
|
2 |
67,5 |
3 |
202,5 |
13668,75 |
160,5 |
2 |
321 |
51520,5 |
|
3 |
72,5 |
6 |
435 |
31537,5 |
167,5 |
9 |
1507,5 |
252506,3 |
|
4 |
77,5 |
16 |
1240 |
96100 |
174,5 |
12 |
2094 |
365403 |
|
5 |
82,5 |
8 |
660 |
54450 |
181,5 |
13 |
2359,5 |
428249,3 |
|
6 |
87,5 |
7 |
612,5 |
53593,75 |
188,5 |
9 |
1696,5 |
319790,3 |
|
7 |
92,5 |
3 |
277,5 |
25668,75 |
195,5 |
3 |
586,5 |
114660,8 |
|
? |
- |
50 |
3865 |
302362,5 |
- |
50 |
8872 |
1579254,5 |
Искомые оценки:
xср |
77,3 |
yср |
177,44 |
||
s2x |
73,43 |
s2y |
102,18 |
||
sx |
8,57 |
sy |
10,11 |
4. Проверим с помощью критерия ч2 гипотезу Но: распределение генеральной совокупности X имеет нормальный закон N(mx уx).
Здесь k = 2 неизвестных параметра mx и уx (математическое ожидание и среднее квадратичное отклонение) заменяются соответствующими оценками xср =77,3 и sx = 8,57
В качестве интервалов возьмём вначале интервалы [ai-1, ai), i = 1, ... ,7 (см. таблицу 3), приняв a0= - ? , a7=+? .
Результаты расчётов выборочной величины чВ2 приведём в таблице 6:
Таблица 6
[ai-1;ai) |
ni |
zi=(ai- xcp)/sx |
Ф(zi) |
pi=Ф(zi)-Ф(zi-1) |
npi |
(ni-npi)2/npi |
|
(-?;65) |
7 |
-2,02 |
-0,478 |
0,022 |
1,10 |
0,1152 |
|
[65;70) |
3 |
-1,32 |
-0,407 |
0,071 |
3,55 |
||
[70;75) |
6 |
-0,62 |
-0,232 |
0,175 |
8,75 |
0,8643 |
|
[75;80) |
16 |
0,08 |
0,032 |
0,264 |
13,20 |
2,2139 |
|
[80;85) |
8 |
0,78 |
0,282 |
0,250 |
12,50 |
||
[85;90) |
7 |
1,48 |
0,430 |
0,148 |
7,40 |
0,0931 |
|
[90;+?) |
3 |
? |
0,500 |
0,070 |
3,50 |
||
1,000 |
50 |
3,29 |
Пришлось произвести объединение первых двух интервалов, 4 и 5, 6 и 7 из-за малости теоретических частот и для удовлетворения условия npi> 5.
В итоге число интервалов т = 4, поэтому число степеней свободы для ч2 распределения равно
т --k--1=4 --2 -- 1 =1.
По таблице П2 приложения находим
j ч20,95(1) = 3,84.
Вывод: так как ч2В= 3,29< ч20,95(1) = 3,84, то гипотеза Но о нормальном распределении величины X не противоречит выборочным данным.
Аналогично проверяем гипотезу Но: распределение генеральной совокупности Y имеет нормальный закон N(my уy).
Параметры ту и уy заменяем соответственно оценками yср = 177,44 и sy = 10,11.
Используя интервалы [bi-1;bi) и частоты mi = 1,...,7 из таблицы 4, проведём вычисление ч2В, оформив таблицу 7
Таблица 7
i |
[bi-1;bi) |
mi |
zi=(bi- ycp)/sy |
Ф(zi) |
pi=Ф(zi)-Ф(zi-1) |
mpi |
(mi-mpi)2/mpi |
|
1 |
(-?;157) |
2 |
-1,53 |
-0,437 |
0,063 |
3,15 |
0,42 |
|
2 |
[157;164) |
2 |
-0,93 |
-0,324 |
0,113 |
5,65 |
2,778 |
|
3 |
[164;171) |
9 |
-0,34 |
-0,133 |
0,191 |
9,55 |
||
4 |
[171;178) |
12 |
0,25 |
0,099 |
0,232 |
11,60 |
0,814 |
|
5 |
[178;185) |
13 |
0,85 |
0,302 |
0,203 |
10,15 |
||
6 |
[185;192) |
9 |
1,44 |
0,425 |
0,123 |
6,15 |
1,471 |
|
7 |
[192;+?) |
3 |
? |
0,500 |
0,075 |
3,75 |
||
1,000 |
50 |
5,48 |
Здесь объединены 2 и 3, 4 и 5, 6 и 7 интервалы, из-за малости теоретических частот.
В итоге число интервалов т = 4, поэтому число степеней свободы для ч2 распределения равно
т --k--1=4 --2 -- 1 =1.
По таблице П2 приложения находим
j ч20,95(2) = 5,99.
Вывод: так как ч2В= 5,48< ч20,95(2) = 5,99, то гипотеза Но о нормальном распределении величины Y не противоречит выборочным данным.
5. Доверительный интервал для математического ожидания М[Х] и D[Y], согласно (31.8):
xср |
77,3 |
|
sx |
73,43 |
|
s2x |
8,57 |
|
n |
50 |
|
г |
0,95 |
|
б |
0,05 |
|
t1-б(n-1) |
2,01 |
|
ч21-б/2(n-1) |
71,4 |
|
ч2б/2(n-1) |
32,4 |
|
M[X] > |
56,43 |
|
M[X] < |
98,17 |
|
D[X] > |
5,88 |
|
D[X] < |
12,96 |
Аналогично получим доверительный интервал для математического ожидания M[Y] и D[Y]
yср |
177,44 |
|
sy |
102,18 |
|
s2y |
10,11 |
|
m |
50 |
|
г |
0,95 |
|
б |
0,05 |
|
t1-б(n-1) |
2,01 |
|
ч21-б/2(n-1) |
71,4 |
|
ч2б/2(n-1) |
32,4 |
|
M[Y] > |
148,39 |
|
M[Y] < |
206,49 |
|
D[Y] > |
6,94 |
|
D[Y] < |
15,29 |
6. Построим корреляционную таблицу 8 - таблицу с двумя входами.
По вертикали расположим интервалы [ai-1;ai)для величины X, а по горизонтали интервалы [bi-1;bi)для Y.
Каждую пару выборочных значений (xk ,yk ), k = 1, ... , 50 разнесём по полученным клеткам, в результате получим частоты n - количество пар (xk ,yk )таких, что xk { [ai-1;ai) и yk{ [bi-1;bi).
В угловых скобках <...> указаны значения условных вариант ui, и vi (см. формулы 32.16). В последнем столбце и последней строке вычислены условные средние (см. следующий 7-й пункт).
Таблица 8
[150;157) |
[157;164) |
[164;171) |
[171;178) |
[178;185) |
[185;192) |
[192;199) |
mi |
yср (xi*) |
||
у X |
yi*=153,5 |
yi* =160,5 |
yi* =167,5 |
yi* =174,5 |
yi* =181,5 |
yi* =188,5 |
yi* =195,0 |
|||
<-4> |
<-3> |
<-2> |
<0> |
<1> |
<2> |
<3> |
||||
[60;65) |
2 |
1 |
4 |
0 |
0 |
0 |
0 |
7 |
162,5 |
|
xi* =62,5 |
||||||||||
<-3> |
||||||||||
[65;70) |
0 |
0 |
3 |
0 |
0 |
0 |
0 |
3 |
167,5 |
|
xi* =67,5 |
||||||||||
<-2> |
||||||||||
[70;75) |
0 |
1 |
0 |
1 |
2 |
1 |
1 |
6 |
180,3 |
|
xi* =72,5 |
||||||||||
<-1> |
||||||||||
[75;80) |
0 |
0 |
2 |
8 |
6 |
0 |
0 |
16 |
176,3 |
|
xi* =77,5 |
||||||||||
<0> |
||||||||||
[80;85) |
0 |
0 |
0 |
2 |
2 |
4 |
0 |
8 |
183,3 |
|
xi* =82,5 |
||||||||||
<1> |
||||||||||
[85;90) |
0 |
0 |
0 |
1 |
3 |
3 |
0 |
7 |
183,5 |
|
xi* =87,5 |
||||||||||
<2> |
||||||||||
[90;95) |
0 |
0 |
0 |
0 |
0 |
1 |
2 |
3 |
192,8 |
|
xi* =92,5 |
||||||||||
<3> |
||||||||||
ni |
2 |
2 |
9 |
12 |
13 |
9 |
3 |
?=50 |
|
|
xср (yi*) |
62,5 |
67,5 |
67,5 |
78,8 |
79,8 |
84,2 |
85,8 |
|
|
Таблица 5*(в условных вариантах для таблицы 8)
Номер интервала i |
ui* |
ni |
ui*ni |
ui*2ni |
vi* |
mi |
vi*mi |
vi*2mi |
|
1 |
-3 |
7 |
-21 |
63 |
-3 |
2 |
-6 |
18 |
|
2 |
-2 |
3 |
-6 |
12 |
-2 |
2 |
-4 |
8 |
|
3 |
-1 |
6 |
-6 |
6 |
-1 |
9 |
-9 |
9 |
|
4 |
0 |
16 |
0 |
0 |
0 |
12 |
0 |
0 |
|
5 |
1 |
8 |
8 |
8 |
1 |
13 |
13 |
13 |
|
6 |
2 |
7 |
14 |
28 |
2 |
9 |
18 |
36 |
|
7 |
3 |
3 |
9 |
27 |
3 |
3 |
9 |
27 |
|
? |
- |
50 |
-2 |
144 |
- |
50 |
21 |
111 |
Проверим гипотезу Но, между X и Y отсутствует корреляционная связь, то есть коэффициент корреляции генеральной совокупности r= 0, при конкурирующей гипотезе H1: r>0. Гипотезу H1взяли с учётом того, что выборочный коэффициент rв=0,86 > 0.
В качестве статистики возьмём величину (см. таблицу 2 модуля 31)
uср |
-0,04 |
|
vср |
0,42 |
|
su |
1,71 |
|
sv |
1,44 |
|
xyср |
1,96 |
|
rв |
0,81 |
|
Vкр |
(1,68;+?) |
|
tв(48) |
9,4 |
Так как tв(48) = 8,1{ Vкр , то Но отвергаем, то есть следует считать, что наблюдаемые величины X и Y (вес и рост человека) коррелированные, причём большему значению X в среднем соответствует большее значение величины Y.
7. Выборочное уравнение прямой линии регрессии Y на Х имеет вид
y= |
f(x) |
|
152 |
53,03 |
|
197 |
96,03 |
Выборочное уравнение прямой линии регрессии X на Y:
x= |
f(y) |
|
62,2 |
167,03 |
|
92 |
187,49 |
Для построения эмпирических линий регрессии Y на Х и X на Y найдём условные средние у(хi*) и х(уi*) по формулам (32.3), используя корреляционную таблицу 8.
Итак, получены точки Мi (хi*, у(хi*)):
Mi(xi*,yср(xi*)) |
||
62,5 |
162,5 |
|
67,5 |
167,5 |
|
72,5 |
180,25 |
|
77,5 |
176,25 |
|
82,5 |
183,25 |
|
87,5 |
183,5 |
|
92,5 |
192,84 |
и точки Ni(yi*,xср(yi*)):
Ni(yi*,xср(yi*)) |
||
153,5 |
62,5 |
|
160,5 |
67,5 |
|
167,7 |
67,5 |
|
174,5 |
78,75 |
|
181,5 |
69,73 |
|
188,5 |
84,17 |
|
195,5 |
85,84 |
Напомним, что ломаная с вершинами в точках Мi (хi*, у(хi*) )есть эмпирическая линия регрессии Y и Х, а ломаная с вершинами в точках Ni(yi*,xср(yi*)) - эмпирическая линия регрессии X на Y.
На рисунке 7 также изображены прямые линии регрессии Y на X (сплошной линией) и Х на Y (пунктирной линией). На этом же рисунке отмечены выборочные точки (xi,yi), i =1, ... 50 (диаграмма рассеивания).
(xср |
;yср) |
|
77,3 |
177,44 |
Размещено на Allbest.ru
Подобные документы
Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.
контрольная работа [108,5 K], добавлен 03.10.2010Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.
курсовая работа [1,3 M], добавлен 10.06.2013Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.
контрольная работа [379,3 K], добавлен 23.08.2015Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011Вероятность совместного появления двух белых шаров. Расчет числа исходов, благоприятствующих интересующему событию. Функция распределения случайной величины. Построение полигона частот, расчет относительных частот и эмпирической функции распределения.
задача [38,9 K], добавлен 14.11.2010Исследование влияния техногенного воздействия на структуру порового пространства, фильтрационно-емкостные свойства нефтенасыщенных коллекторов. Построение диаграммы рассеивания, гистограммы частот, корреляционной таблицы. Метод доверительных интервалов.
курсовая работа [992,6 K], добавлен 06.04.2014Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.
лабораторная работа [58,7 K], добавлен 14.03.2014Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Нахождение вероятности события, используя формулу Бернулли. Составление закона распределения случайной величины и уравнения регрессии. Расчет математического ожидания и дисперсии, сравнение эмпирических и теоретических частот, используя критерий Пирсона.
контрольная работа [167,7 K], добавлен 29.04.2012