Типовой расчет по математической статистике

Обработка статистических данных веса и роста опрошенных людей. Составление группированных рядов, построение полигона, гистограммы относительных частот и графика эмпирических функций. Вычисление точечной оценки и составление корреляционной таблицы.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 21.04.2012
Размер файла 515,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Алтайский государственный технический университет

им. И.И. Ползунова

Кафедра «Высшей математики»

Типовой расчет по математической статистике

Вариант задания-7

Барнаул 2009

1. Содержание задания

гистограмма эмпирический корреляционный статистика

В качестве исходных данных предлагаются результаты опроса людей об их весе. X (в килограммах) и росте Y (в сантиметрах). Данные приводятся в приложении: таблица П4 содержит результаты опроса 100 человек, проживающих в Европе.

Для обработки этих данных в типовом расчёте требуется выполнить следующую работу:

1. Из предложенной генеральной совокупности объёма N = 100 сформировать выборку объёма п = 50 с помощью таблицы П6 случайных чисел.

2. Для величин X и F составить группированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для X и Y.

3. Вычислить точечные оценки: выборочные средние хср и уср; несмещённые выборочные средние квадратичные отклонения sx и sy

4. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости б = 0,05.

5. Найти доверительные интервалы для М[Х], M[Y], D[X], D[Y] с надёжностью г= 0,95.

6. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между X иY (о незначимости отклонения rв от нуля).

7. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi yi), i= 1,..., п и эмпирическими линиями регрессии.

2. Выполнение типового расчёта

1. Сформируем выборку объёма п= 50 из генеральной совокупности (X, Y) , представленной в таблице П4 приложения.

Для этого воспользуемся таблицей из 50-ти случайных чисел, полученных с помощью датчика случайных чисел. Эти числа указывают номера элементов, которые будут взяты из генеральной совокупности:

Таблица 1(случайные величины), Вариант 7

6

27

73

92

78

48

81

80

1

23

35

55

88

76

14

35

43

13

16

88

44

94

64

99

10

38

29

3

79

14

77

7

84

67

11

18

37

91

2

17

100

49

87

41

45

52

82

28

46

32

Выборочная совокупность приводится в таблице 2:

Таблица 2(выборочная совокупность)

xi

yi

xi

yi

xi

yi

xi

yi

xi

yi

63,6

164

83,4

178

77

181

63

162

74,8

181

76,5

174

85

175

90,3

188

86,8

187

70,6

178

62,7

152

76,7

178

80,7

177

75,5

177

73,3

160

79,1

173

87,9

185

62,2

165

89,9

186

80,7

180

79,4

176

76

179

66,6

166

81,7

185

78,1

172

81,9

190

64,8

165

88,7

190

75,3

174

75,9

182

62,7

168

78

175

75,6

168

69,9

168

71,6

165

65,9

166

63,7

155

92

194

82

175

91,4

197

84,5

188

82,8

188

89,2

184

74,9

190

76,2

181

77,6

174

76,7

178

76

179

72,7

174

87,4

184

Величина xi - вес (в килограммах), a yi - рост (в сантиметрах) i-ro человека.

2. Составим группированный ряд для величины X. Для этого определим наибольшее

xmax =92

xmin =62,2

и наименьшее значения величины X, встречающееся в выборке. Вычислим размах:

Rx= хтах - xmin= 92-62,2=29,8

Весь промежуток [62,2; 92] изменения выборочных данных величины X , разобьём на r = 7 интервалов (следуя рекомендации (30.2), модуль 30, при п = 50).

Тогда шаг разбиения

hx = Rx / r =29,8/7=4,26

Для того, чтобы шаг разбиения был удобным, возьмём его равным hx =5. Тогда расширение промежутка разбиения составит (5 -4,257) * 7 = 5,2.

Определения границ интервалов [ai-1, ai) , i -- 1, ... , 7, границы определяются так:

aii-1+hх, i -- 1, ...,7.

Затем для каждого i-ro интервала [ai-1, ai) определяется его середина хi* по формуле:

хi*= (ai-1+ ai)/2

С помощью таблицы 2 находятся частоты ni - количество выборочных значений X, попавших в i-й интервал.

Результаты группировки выборочных значений для X сведём в таблицу 3:

Таблица 3

Номер интервала i

Интервалы [ai-1;ai)

Середины интервалов xi*

Частоты ni

Относительные частоты ni/n

Накопленные относительные частоты i?j=1(ni/n)

ni/nhx

1

[60;65)

62,5

7

0,14

0,14

0,03

2

[65;70)

67,5

3

0,06

0,20

0,01

3

[70;75)

72,5

6

0,12

0,32

0,03

4

[75;80)

77,5

16

0,32

0,64

0,08

5

[80;85)

82,5

8

0,16

0,80

0,04

6

[85;90)

87,5

7

0,14

0,94

0,03

7

[90;95]

92,5

3

0,06

1,00

0,01

 

n=

50

 

Используя полученные результаты для хi* и ni/n (столбец 3-й и 5-й), строим полигон относительных частот (рисунок 1);

используя столбец 2-й и 7-й, строим гистограмму относительных частот (рисунок 2);

используя столбец 3-й и 6-й, строим график эмпирической функции распределения (рисунок 3).

Рисунок 1

Рисунок 2

Рисунок 3

Для величины Y аналогичные результаты укажем в окончательном виде.

ymax=197

ymin=152

Ry=45

hy=6,47=7

Результаты группировки выборочных значений для Y:

Таблица 4

Номер интервала i

Интервалы [bi-1;bi)

Середины интервалов yi*

Частоты mi

Относительные частоты mi/m

Накопленные относительные частоты i?j=1(mi/m)

mi/mhy

1

[150;157)

153,5

2

0,04

0,04

0,01

2

[157;164)

160,5

2

0,04

0,08

0,01

3

[164;171)

167,5

9

0,18

0,26

0,03

4

[171;178)

174,5

12

0,24

0,50

0,04

5

[178;185)

181,5

13

0,26

0,76

0,04

6

[185;192)

188,5

9

0,18

0,94

0,03

7

[192;199]

195,5

3

0,06

1,00

0,01

 

m=

50

 

На рисунках 4 - 6 изображены полигон, гистограмма относительных частот и график эмпирической функции распределения для величины Y:

Рисунок 4

Рисунок 5

Рисунок 6

3. Точечные оценки х , у , sx , sy вычислим по группированным данным (см.таблицы 3 и 4).

Составим таблицу 5:

Таблица 5

Номер интервала i

xi*

ni

xi*ni

xi*2ni

yi*

mi

yi*mi

yi*2mi

1

62,5

7

437,5

27343,75

153,5

2

307

47124,5

2

67,5

3

202,5

13668,75

160,5

2

321

51520,5

3

72,5

6

435

31537,5

167,5

9

1507,5

252506,3

4

77,5

16

1240

96100

174,5

12

2094

365403

5

82,5

8

660

54450

181,5

13

2359,5

428249,3

6

87,5

7

612,5

53593,75

188,5

9

1696,5

319790,3

7

92,5

3

277,5

25668,75

195,5

3

586,5

114660,8

?

-

50

3865

302362,5

-

50

8872

1579254,5

Искомые оценки:

xср

77,3

yср

177,44

s2x

73,43

s2y

102,18

sx

8,57

sy

10,11

4. Проверим с помощью критерия ч2 гипотезу Но: распределение генеральной совокупности X имеет нормальный закон N(mx уx).

Здесь k = 2 неизвестных параметра mx и уx (математическое ожидание и среднее квадратичное отклонение) заменяются соответствующими оценками xср =77,3 и sx = 8,57

В качестве интервалов возьмём вначале интервалы [ai-1, ai), i = 1, ... ,7 (см. таблицу 3), приняв a0= - ? , a7=+? .

Результаты расчётов выборочной величины чВ2 приведём в таблице 6:

Таблица 6

[ai-1;ai)

ni

zi=(ai- xcp)/sx

Ф(zi)

pi=Ф(zi)-Ф(zi-1)

npi

 (ni-npi)2/npi

(-?;65)

7

-2,02

-0,478

0,022

1,10

0,1152

[65;70)

3

-1,32

-0,407

0,071

3,55

[70;75)

6

-0,62

-0,232

0,175

8,75

0,8643

[75;80)

16

0,08

0,032

0,264

13,20

2,2139

[80;85)

8

0,78

0,282

0,250

12,50

[85;90)

7

1,48

0,430

0,148

7,40

0,0931

[90;+?)

3

?

0,500

0,070

3,50

1,000

50

3,29

Пришлось произвести объединение первых двух интервалов, 4 и 5, 6 и 7 из-за малости теоретических частот и для удовлетворения условия npi> 5.

В итоге число интервалов т = 4, поэтому число степеней свободы для ч2 распределения равно

т --k--1=4 --2 -- 1 =1.

По таблице П2 приложения находим

j ч20,95(1) = 3,84.

Вывод: так как ч2В= 3,29< ч20,95(1) = 3,84, то гипотеза Но о нормальном распределении величины X не противоречит выборочным данным.

Аналогично проверяем гипотезу Но: распределение генеральной совокупности Y имеет нормальный закон N(my уy).

Параметры ту и уy заменяем соответственно оценками yср = 177,44 и sy = 10,11.

Используя интервалы [bi-1;bi) и частоты mi = 1,...,7 из таблицы 4, проведём вычисление ч2В, оформив таблицу 7

Таблица 7

i

[bi-1;bi)

mi

zi=(bi- ycp)/sy

Ф(zi)

pi=Ф(zi)-Ф(zi-1)

mpi

(mi-mpi)2/mpi

1

(-?;157)

2

-1,53

-0,437

0,063

3,15

0,42

2

[157;164)

2

-0,93

-0,324

0,113

5,65

2,778

3

[164;171)

9

-0,34

-0,133

0,191

9,55

4

[171;178)

12

0,25

0,099

0,232

11,60

0,814

5

[178;185)

13

0,85

0,302

0,203

10,15

6

[185;192)

9

1,44

0,425

0,123

6,15

1,471

7

[192;+?)

3

?

0,500

0,075

3,75

1,000

50

5,48

Здесь объединены 2 и 3, 4 и 5, 6 и 7 интервалы, из-за малости теоретических частот.

В итоге число интервалов т = 4, поэтому число степеней свободы для ч2 распределения равно

т --k--1=4 --2 -- 1 =1.

По таблице П2 приложения находим

j ч20,95(2) = 5,99.

Вывод: так как ч2В= 5,48< ч20,95(2) = 5,99, то гипотеза Но о нормальном распределении величины Y не противоречит выборочным данным.

5. Доверительный интервал для математического ожидания М[Х] и D[Y], согласно (31.8):

xср

77,3

sx

73,43

s2x

8,57

n

50

г

0,95

б

0,05

t1-б(n-1)

2,01

ч21-б/2(n-1)

71,4

ч2б/2(n-1)

32,4

M[X] >

56,43

M[X] <

98,17

D[X] >

5,88

D[X] <

12,96

Аналогично получим доверительный интервал для математического ожидания M[Y] и D[Y]

yср

177,44

sy

102,18

s2y

10,11

m

50

г

0,95

б

0,05

t1-б(n-1)

2,01

ч21-б/2(n-1)

71,4

ч2б/2(n-1)

32,4

M[Y] >

148,39

M[Y] <

206,49

D[Y] >

6,94

D[Y] <

15,29

6. Построим корреляционную таблицу 8 - таблицу с двумя входами.

По вертикали расположим интервалы [ai-1;ai)для величины X, а по горизонтали интервалы [bi-1;bi)для Y.

Каждую пару выборочных значений (xk ,yk ), k = 1, ... , 50 разнесём по полученным клеткам, в результате получим частоты n - количество пар (xk ,yk )таких, что xk { [ai-1;ai) и yk{ [bi-1;bi).

В угловых скобках <...> указаны значения условных вариант ui, и vi (см. формулы 32.16). В последнем столбце и последней строке вычислены условные средние (см. следующий 7-й пункт).

Таблица 8

[150;157)

[157;164)

[164;171)

[171;178)

[178;185)

[185;192)

[192;199)

mi

yср (xi*)

у

X

yi*=153,5

yi* =160,5

yi* =167,5

yi* =174,5

yi* =181,5

yi* =188,5

yi* =195,0

<-4>

<-3>

<-2>

<0>

<1>

<2>

<3>

[60;65)

2

1

4

0

0

0

0

7

162,5

xi* =62,5

<-3>

[65;70)

0

0

3

0

0

0

0

3

167,5

xi* =67,5

<-2>

[70;75)

0

1

0

1

2

1

1

6

180,3

xi* =72,5

<-1>

[75;80)

0

0

2

8

6

0

0

16

176,3

xi* =77,5

<0>

[80;85)

0

0

0

2

2

4

0

8

183,3

xi* =82,5

<1>

[85;90)

0

0

0

1

3

3

0

7

183,5

xi* =87,5

<2>

[90;95)

0

0

0

0

0

1

2

3

192,8

xi* =92,5

<3>

ni

2

2

9

12

13

9

3

?=50

 

xср (yi*)

62,5

67,5

67,5

78,8

79,8

84,2

85,8

 

 

Таблица 5*(в условных вариантах для таблицы 8)

Номер интервала i

ui*

ni

ui*ni

ui*2ni

vi*

mi

vi*mi

vi*2mi

1

-3

7

-21

63

-3

2

-6

18

2

-2

3

-6

12

-2

2

-4

8

3

-1

6

-6

6

-1

9

-9

9

4

0

16

0

0

0

12

0

0

5

1

8

8

8

1

13

13

13

6

2

7

14

28

2

9

18

36

7

3

3

9

27

3

3

9

27

?

-

50

-2

144

-

50

21

111

Проверим гипотезу Но, между X и Y отсутствует корреляционная связь, то есть коэффициент корреляции генеральной совокупности r= 0, при конкурирующей гипотезе H1: r>0. Гипотезу H1взяли с учётом того, что выборочный коэффициент rв=0,86 > 0.

В качестве статистики возьмём величину (см. таблицу 2 модуля 31)

uср

-0,04

vср

0,42

su

1,71

sv

1,44

xyср

1,96

rв

0,81

Vкр

(1,68;+?)

tв(48)

9,4

Так как tв(48) = 8,1{ Vкр , то Но отвергаем, то есть следует считать, что наблюдаемые величины X и Y (вес и рост человека) коррелированные, причём большему значению X в среднем соответствует большее значение величины Y.

7. Выборочное уравнение прямой линии регрессии Y на Х имеет вид

y=

f(x)

152

53,03

197

96,03

Выборочное уравнение прямой линии регрессии X на Y:

x=

f(y)

62,2

167,03

92

187,49

Для построения эмпирических линий регрессии Y на Х и X на Y найдём условные средние у(хi*) и х(уi*) по формулам (32.3), используя корреляционную таблицу 8.

Итак, получены точки Мii*, у(хi*)):

Mi(xi*,yср(xi*))

62,5

162,5

67,5

167,5

72,5

180,25

77,5

176,25

82,5

183,25

87,5

183,5

92,5

192,84

и точки Ni(yi*,xср(yi*)):

Ni(yi*,xср(yi*))

153,5

62,5

160,5

67,5

167,7

67,5

174,5

78,75

181,5

69,73

188,5

84,17

195,5

85,84

Напомним, что ломаная с вершинами в точках Мii*, у(хi*) )есть эмпирическая линия регрессии Y и Х, а ломаная с вершинами в точках Ni(yi*,xср(yi*)) - эмпирическая линия регрессии X на Y.

На рисунке 7 также изображены прямые линии регрессии Y на X (сплошной линией) и Х на Y (пунктирной линией). На этом же рисунке отмечены выборочные точки (xi,yi), i =1, ... 50 (диаграмма рассеивания).

(xср

;yср)

77,3

177,44

Размещено на Allbest.ru


Подобные документы

  • Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.

    контрольная работа [108,5 K], добавлен 03.10.2010

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.

    курсовая работа [1,3 M], добавлен 10.06.2013

  • Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.

    контрольная работа [379,3 K], добавлен 23.08.2015

  • Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.

    курсовая работа [241,3 K], добавлен 10.04.2011

  • Вероятность совместного появления двух белых шаров. Расчет числа исходов, благоприятствующих интересующему событию. Функция распределения случайной величины. Построение полигона частот, расчет относительных частот и эмпирической функции распределения.

    задача [38,9 K], добавлен 14.11.2010

  • Исследование влияния техногенного воздействия на структуру порового пространства, фильтрационно-емкостные свойства нефтенасыщенных коллекторов. Построение диаграммы рассеивания, гистограммы частот, корреляционной таблицы. Метод доверительных интервалов.

    курсовая работа [992,6 K], добавлен 06.04.2014

  • Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.

    лабораторная работа [58,7 K], добавлен 14.03.2014

  • Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.

    курсовая работа [511,8 K], добавлен 08.12.2013

  • Нахождение вероятности события, используя формулу Бернулли. Составление закона распределения случайной величины и уравнения регрессии. Расчет математического ожидания и дисперсии, сравнение эмпирических и теоретических частот, используя критерий Пирсона.

    контрольная работа [167,7 K], добавлен 29.04.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.