Оценка погрешности уравнения регрессии

Определение математического ожидания, дисперсии, функции распределения, вероятности событий, ошибок измерений. Построение эмпирической функции распределения. Статистическая проверка гипотезы о нормальном распределении. Оценка коэффициента корреляции.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 13.05.2014
Размер файла 168,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Нефтяная компания, изучив данные геологоразведки, оценивает вероятность обнаружения нефти в некотором районе как 0,3. Из предыдущего опыта подобных работ известно, что если нефть действительно должна быть обнаружена, первые пробные бурения дают положительные образцы с вероятностью 0,4. Если оказалось, что первые бурения дали отрицательный результат, какова вероятность того, что нефть, тем не менее, будет обнаружена в данном районе?

Решение

Пусть А: «Нефть не обнаружили в некотором районе».

Зададим гипотезы:

Н1 = {Нефть есть},

H2 = {Нефти нет},

По условию P( H1 ) = 0,3, P( H2 ) = 0,7. Сумма их вероятностей равна 1.

Далее Р(А/Н1) = 0,6, Р(А/Н2) = 1.

Значение Р(А), вычислим по формуле полной вероятности

Р(А) = Р( Н1 )Р( А/H1 ) + P( H2 )P( A/H2 ) =0,3*0,6+0,7*1=0,88.

Событие А={Нефть не обнаружили в некотором районе} осуществилось, т.е. данная задача на формулу Байеса. Событие {нефть есть, но ее не обнаружили в некотором районе}? это гипотеза H1 . По формуле Байеса

Ответ:

2. Число дефектов в изделии может быть любым - 0,1, 2, 3, 4 и т.д. По оценке компании вероятность отсутствия дефекта составляет 0,9, а вероятность наличия одного дефекта - 0,05. Какова вероятность, что в изделии не больше, чем один дефект?

Решение

Пусть А: «в изделии не больше, чем один дефект»

А1: «в изделии один дефект»

А2: «в изделии нет дефектов»

События А1 и А2 несовместны. По теореме сложения для несовместных событий: Р(А)=P (A1+A2) = P (A1) + P (A2)=0,9+0,05=0,95

Ответ:0,95.

3. В программе экзамена 45 вопросов, из которых студент знает 30. В билете 3 вопроса. Случайная величина Х - число вопросов билета, которые знает студент.

1) Составить таблицу распределения Х.

2) Найти математическое ожидание M(X) и дисперсию D(Х).

3) Построить график функции распределения y = F(x)

4) Найти вероятность P(0,5<X<3).

Решение

1) Пусть Х - число вопросов билета, которые знает студент.

Случайная величина Х может принять значения х1=0, х2=1, х3=2.

По формуле классической вероятности Р=, где m-благоприятствующее число исходов, n- общее число исходов.

Найдем Р(х1=0)=

Р(х2=1)=

Р(х3=2)=

Р(х4=3)=

Пользовались формулой

Получили закон гипергеометрического распределения:

Таблица 1

Х

0

1

2

3

P

0,03

0,22

0,46

0,29

Проверка: .

2)Найдем математическое ожидание

M(X) =0*0,03+1*0,22+2*0,46+3*0,29=2,01

Найдем дисперсию

D(Х)= 0*0,03+1*0,22+2*0,46+3*0,29-2,012=0,6299

3)Найдем функцию распределения .

Пусть , тогда

Пусть , тогда

Пусть , тогда

Пусть , тогда

Пусть , тогда

Имеем

-функция распределения.

Построим ее график

Рис. 1

4) Найти вероятность P(0,5<X<3)=.

Ответ: 1)

Таблица 2

Х

0

1

2

3

P

0,03

0,22

0,46

0,29

2) M(X) =2,01 , D(Х)= 0,6299

3)

4)р= 0,68

4. Ошибка измерения высоты полета гидрометеорологического спутника относительно наземной станции подчинена нормальному закону с математическим ожиданием, равным нулю и средним квадратическим отклонением, равным 1 км. Ошибка принимает отрицательное значение, если измеряемая высота слишком мала и положительное значение, если измеряемая высота слишком велика. Найти вероятность того, что а) ошибка будет больше чем +0.75 км; б) значение ошибки будет заключено в пределах между + 0.10 км и + 0.60 км; в) ошибка будет меньше чем - 1.25 км.

Решение

А) По условию

Воспользуемся формулой

Б) Далее

В)

5. Отдел маркетинга крупной швейной фабрики провёл анкетирование 500 человек (женщин) по вопросу роста (Х) см и веса (Y) кг. В результате была выявлена следующая зависимость (таблица 2.2.1).

Требуется:

1 часть.

произвести выборку из 200 значений;

построить эмпирическую функцию распределения, полигон, гистограмму для случайной величины Х;

построить точечные и интервальные оценки для мат. ожидания и дисперсии генеральной совокупности Х;

сделать статистическую проверку гипотезы о законе распределения случайной величины Х;

часть 2.

1) нанести на координатную плоскость данные выборки (x;y) и по виду корреляционного облака подобрать вид функции регрессии;

2) составить корреляционную таблицу по сгруппированным данным;

вычислить коэффициент корреляции;

получить уравнение регрессии;

Решение

1) Произведём из генеральной совокупности N=500 выборку n=200 значений. Cлучайное число - 6316. Нужно выбрать столбцы 2,6,11,16.

Получилась выборка:

Таблица 3

156

387

50

80

371

323

332

296

105

149

176

171

166

182

165

168

170

181

161

169

65

70

57

76

59

62

76

68

66

67

Таблица 4

316

491

54

385

360

354

238

380

145

399

1

307

175

161

161

165

176

165

161

166

167

167

165

168

161

163

55

66

63

78

56

51

62

65

63

63

73

59

65

Таблица 5

458

5

163

277

189

240

265

98

73

16

255

112

410

168

175

161

171

184

173

166

170

172

176

162

157

188

66

66

52

63

72

63

67

61

74

81

60

60

75

Таблица 6

466

96

113

328

47

77

220

274

39

307

372

22

43

164

167

174

161

172

171

173

176

156

167

165

174

183

53

64

69

62

63

69

68

70

54

59

63

66

73

Таблица 7

221

412

255

364

249

418

374

120

154

473

70

438

64

173

165

164

171

172

171

166

164

164

169

169

163

173

71

67

61

60

72

65

62

56

63

65

75

54

75

Таблица 8

435

34

342

336

493

285

182

152

160

168

135

19

275

176

168

169

168

166

178

165

164

161

170

164

171

171

67

55

66

67

64

80

62

62

51

66

53

62

67

Таблица 9

353

204

273

5

341

219

76

345

456

337

417

114

351

163

167

165

159

171

174

164

166

161

169

163

168

166

63

64

63

60

66

67

59

78

55

64

64

58

63

Таблица 10

45

110

460

4

150

301

359

224

292

458

112

143

489

172

165

166

171

161

163

165

172

167

176

174

169

167

69

76

71

75

56

58

72

66

57

70

69

71

61

Таблица 11

22

55

259

303

351

68

113

143

315

280

187

184

416

176

175

167

480

176

176

168

175

177

167

170

158

171

75

80

64

75

65

71

58

67

78

65

69

61

62

Таблица 12

24

146

420

478

453

473

162

145

42

470

45

380

83

176

172

165

178

157

167

169

172

177

159

172

169

164

60

64

60

71

60

63

62

64

67

61

60

61

70

Таблица 13

262

23

465

190

292

367

5

295

323

172

422

153

438

174

176

159

169

164

165

159

165

173

172

173

167

167

74

75

48

67

60

61

60

60

63

67

66

68

57

Таблица 14

351

462

337

42

139

187

242

359

90

482

45

358

251

176

168

175

183

170

165

176

165

182

173

172

166

163

65

67

59

73

61

69

62

56

66

65

60

61

65

Таблица 15

62

130

286

361

183

79

371

378

419

307

56

374

168

173

161

159

166

163

163

165

168

172

167

171

168

164

66

66

55

55

64

58

63

71

67

59

67

70

60

Таблица 16

43

298

239

145

325

65

153

373

9

340

142

192

260

163

173

167

172

162

156

164

160

170

171

174

167

170

63

66

60

64

65

53

63

61

68

64

70

65

58

Таблица 17

116

26

253

59

202

439

21

199

221

332

273

286

106

170

172

166

164

172

167

155

159

165

173

176

171

162

65

67

62

60

73

57

61

55

68

65

70

65

66

Таблица 18

468

103

240

106

424

414

296

283

165

173

169

190

169

169

170

162

61

64

74

80

58

59

75

53

Составим ранжированный (по увеличению) ряд для случайной величины Х.

Таблица 19

X

155

156

156

157

157

157

158

159

159

159

159

159

159

Y

61

53

54

60

60

53

61

55

60

48

61

55

60

Таблица 20

160

161

161

161

161

161

161

161

161

161

161

161

61

66

56

55

51

66

55

66

52

62

51

59

Таблица 21

162

162

162

162

163

66

53

65

60

65

Таблица 22

163

163

163

163

163

163

164

164

164

164

164

164

164

58

63

65

63

64

54

62

53

59

63

53

56

61

Таблица 23

164

164

164

164

164

165

165

165

165

165

165

165

165

165

165

70

60

60

63

60

76

63

63

62

67

56

69

60

72

60

Таблица 24

165

165

165

165

165

165

165

166

166

166

166

166

166

166

61

59

56

63

68

63

63

62

71

78

60

55

64

57

Таблица 25

166

166

166

166

167

167

167

167

167

167

167

167

167

167

62

63

62

67

64

65

64

59

60

65

57

63

59

64

Таблица 26

167

167

167

167

167

167

168

168

168

168

168

168

168

168

168

168

57

61

65

68

57

63

66

58

67

73

62

70

67

58

67

55

Таблица 27

169

169

169

169

169

169

169

169

169

169

169

170

170

65

75

71

64

64

67

61

62

74

58

66

61

66

Таблица 28

170

170

170

170

170

170

170

170

171

171

171

171

171

171

171

75

76

65

68

69

58

61

73

75

62

65

67

62

64

67

Таблица 29

171

171

171

171

171

171

171

172

172

172

172

172

172

172

65

70

60

63

69

64

66

73

67

64

67

64

72

64

Таблица 30

172

172

172

172

172

172

172

173

173

173

173

173

173

60

67

60

66

69

63

74

75

64

66

65

66

63

Таблица 31

173

173

173

173

173

174

174

174

174

174

174

175

175

175

66

71

63

63

68

70

74

69

67

66

69

66

59

67

Таблица 32

175

176

176

176

176

176

176

176

176

176

176

176

176

176

176

177

177

80

70

70

62

78

65

65

81

67

70

75

60

71

65

75

67

78

Таблица 33

178

178

180

181

182

182

183

183

184

188

190

71

80

75

68

66

76

73

73

72

75

80

Cоставим новую таблицу, в которой отразим частоты появления случайных величин и относительные частоты .

Таблица 34

i

1

2

3

4

5

6

7

8

9

10

11

12

155

156

157

158

159

160

161

162

163

164

165

166

1

2

3

1

6

1

11

4

7

12

17

11

Таблица 35

i

13

14

15

16

17

18

19

20

21

22

23

24

167

168

169

170

171

172

173

174

175

176

177

178

16

11

11

10

14

14

11

6

4

14

2

2

Таблица 36

i

25

26

27

28

29

30

31

180

181

182

183

184

188

190

1

1

2

2

1

1

1

Минимальное и максимальное значения случайной величины: Тогда интервал варьирования R («размах») будет равен R= . Длину интервала рассчитывают по формуле:

=4,18

округлим до 4, т.е. размер интервала h=4, а число интервалов будет равно 9.

Соответствующий интервальный вариационный ряд приведён в таблице

Таблица 37

Индекс интервала i

Число покупателей (интервалы)

Частота

Относительная частота

1

155-159

13

13/200

2

159-163

23

23/200

3

163-167

56

56/200

4

167-171

46

46/200

5

171-175

35

35/200

6

175-179

18

18/200

7

179-183

6

6/200

8

183-187

1

1/200

9

187-191

2

2/200

=1

2) После составления вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию

F*(x)=,

то есть функцию, найденную опытным путём. Здесь - относительная частота события Х< х, n - общее число значений. Эмпирическое распределение можно изобразить в виде полигона, гистограммы или ступенчатой кривой. Построим выборочную функцию распределения. Очевидно, что для функция так как . На концах интервалов значения функции рассчитаем в виде «нарастающей относительной частоты»

Таблица 38 «Расчёт эмпирической функции распределения»

Индекс интервала i

1

13/200

2

13/200+23/200=36/200

3

36/200+56/200=92/200

4

92/200+46/200=138/200

5

138/200+35/200=173/200

6

173/200+18/200=191/200

7

191/200+6/200=197/200

8

197/200+1/200=198/200

9

198/200+2/200=1

Табличные значения не полностью определяют выборочную функцию распределения непрерывной случайной величины, поэтому при графическом изображении её доопределяют, соединив точки графика, соответствующие концам интервала, отрезками прямой .

Полученные данные, представленные в виде вариационного ряда, изобразим графически в виде ломаной линии (полигона), связывающей на плоскости точки с координатами , где - среднее значение интервала , а - относительная частота. На этом же рисунке отобразим пунктирной линией выравнивающие (теоретические) частоты.

Рис. 2

Таблица 39 Дискретный вариационный ряд

Номер интервала i

Среднее значение интервала

Относительная частота

Выборочная оценка плотности вероятности

1

157

13/200

0,01625

2

161

23/200

0,02875

3

165

56/200

0,07

4

169

46/200

0,0575

5

173

35/200

0,04375

6

177

18/200

0,0225

7

181

6/200

0,0075

8

185

1/200

0,00125

9

189

2/200

0,0025

Рис. 3

На основании полученных выборочных данных необходимо сделать предположение, что изучаемая величина распределена по некоторому определённому закону. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты полученных в наблюдениях значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдавшихся значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле:

где n - число испытаний,

- вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое распределение.

Эмпирические (полученные из таблицы) и выравнивающие частоты сравнивают, и при небольшом расхождении данных делают заключение о выбранном законе распределения.

Предположим, что случайная величина Х распределена нормально. В этом случае выравнивающие частоты находят по формуле:

где n - число испытаний,

h - длина частичного интервала,

- выборочное среднее квадратичное отклонение,

( - середина i - го частичного интервала)

- функция Лапласа

Результаты вычислений отобразим в таблице

Таблица 40

Номер Интервала k

Центр Интервала xk*

Границы Интервала [xk-1 , xk ]

nk*/n

Hk

1

156.94444

155.00000...158.88889

0.03500

0.00900

2

160.83333

158.88889...162.77778

0.11000

0.02829

3

164.72222

162.77778...166.66667

0.23500

0.06043

4

168.61111

166.66667...170.55556

0.24000

0.06171

5

172.50000

170.55556...174.44444

0.22500

0.05786

6

176.38889

174.44444...178.33333

0.11000

0.02829

7

180.27778

178.33333...182.22222

0.02000

0.00514

8

184.16667

182.22222...186.11111

0.01500

0.00386

9

188.05556

186.11111...190.00000

0.01000

0.00257

Рис. 4

1) Найдём числовые характеристики вариационного ряда.

Выборочная средняя ():

или ,

где - частоты,

а -объём выборки. Выборочная средняя является оценкой математического ожидания (среднего значения теоретического закона распределения).

168.62.

Выборочная дисперсия ():

= 36.6689

Среднеквадратическое отклонение:

=

==6,05548

Найдем несмещённую оценку дисперсии и среднеквадратического отклонения («исправленную» выборочную дисперсию и среднеквадратическое отклонение) по формулам:

и

==36,853165 и S=6,055=6,070118625

Доверительный интервал для оценки математического ожидания с надёжностью 0,95 определяют по формуле:

P(-tФ(t)=

Из соотношения Ф(z)=/2 вычисляют значение функции Лапласа: Ф(z)=0,475. По таблице значений функции Лапласа находят z=1,96. Таким образом,

168.62-1,96,

167,78<a<169,459.

Доверительный интервал для оценки среднего квадратичного отклонения случайной величины находят по формуле:

,

где S - несмещённое значение выборочного среднего квадратичного отклонения;

q - параметр, который находится по таблице на основе известного объёма выборки n и заданной надёжности оценки .

На основании данных значений =0,95 и n=200 по таблице (Приложение В) можно найти значение q=0,099. Таким образом,

,

5,509<

4)Проведём статистическую проверку гипотезы о нормальном распределении. Нормальный закон распределения имеет два параметра (r=2): математическое ожидание и среднее квадратическое отклонение.

Таблица 41

i

Ф()

0

0

-0,5

0,0268

5,36

157

-0,4732

1

157

13

-0,4732

0,077

15,4

161

-0,3962

2

161

23

-0,3962

0,1705

34,1

165

-0,2257

3

165

56

-0,2257

0,2496

49,92

169

0,0239

4

169

46

0,0239

0,2403

48,06

173

0,2642

5

173

35

0,2642

0,1535

30,7

177

0,4177

6

177

18

0,4177

0,0626

12,52

181

0,4803

7

181

6

0,4803

0,0162

3,24

185

0,4965

8

185

1

0,4965

0,0029

0,58

189

0,4994

9

189

2

0,4994

0,0006

0,12

+

0,5

Вычислим сумму Пирсона =

=16,15

По таблице можно найти число по схеме: для уровня значимости б=0,05 и числа степеней свободы l=k-r-1=9-2-1=6=12,6. Следовательно, критическая область - (12,6;). Величина =16,15 входит в критическую область, поэтому гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается.

При б=0,1 =10,6. Критическая область - (10,6;). Величина =16,15 также входит в критическую область и гипотеза о нормальном законе распределения величины Х не принимается.

При б=0,01 =16,8 (16,8;). В этом случае гипотеза о нормальном законе распределения величины Х принимается.

2 часть

1) Данные сгруппируем в корреляционную таблицу.

2) Строим в системе координат множество, состоящее из 200 экспериментальных точек.

По расположению точек делаем заключение о том, что экономико-математическую модель можно искать в виде .

3) Найдём выборочные уравнения линейной регрессии.

Для упрощения расчётов разобьём случайные величины на интервалы и выберем средние значения. Для величины Х указанные действия были выполнены в 1 части задания.

1. Вычисляем коэффициент ковариации.

Коэффициент ковариации характеризует степень линейной зависимости двух случайных величин Х и Y и вычисляется по формуле:

cov(X,Y) = 1/n У n k = 1 (xk-Mx)(yk-My) (1.1),

где Mx = 1 / n Уn k = 1xk, My = 1 / n Уn k = 1yk ( 1.2 ),

- оценки математического ожидания случайных величин X и Y соответственно.

То есть, ковариация, это математическое ожидание произведения центрированных случайных величин 1.1. Вычислим оценку математического ожидания случайной величины Х. При больших объемах выборки числитель и знаменатель дроби (1.2) могут принимать большие значения, что, в свою очередь, может привести к потере точности. Поэтому при практических вычислениях лучше избегать суммирования большого числа слагаемых. В нашем случае объем выборки n = 200, и поэтому лучше суммировать по 10 элементов:

S1 = x1 +…+ x10, S2 = x11 +…+ x20, - - - - - - - - - - - S20 = x191 +…+ x200,

Затем делим S1, S2,..., S20 на 10.

В дробях

s1 = S1 /10 , s2 = S2 /10 , s20 = S20 /10

числитель и знаменатель не столь велики, как в формуле ( 1.2 ) затем вычисляем

Mx = (s1 + s2 + ... + s20 )/20

1.1.1. Складывая последовательно по 10 элементов выборки X получим следующие значения для Sk :

1573 1603 1616 1634 1642 1650 1655 1664 1670 1678 1687 1696 1706 1712 1720 1728 1738 1757 1764 1831

1.1.2. Каждое из чисел S1, S2,…, S20 делим на 10. Получаем 20 чисел

sk = Sk/10:

157.3 160.3 161.6 163.4 164.2 165 165.5 166.4 167 167.8 168.7 169.6 170.6 171.2 172 172.8 173.8 175.7 176.4 183.1

1.1.3. Искомая оценка математического ожидания X есть

Mx = (s1 + s2 + ... + s20 )/ 20 = 3372.4 / 20 =168,6

1.2. Аналогичным образом вычислим оценку математического ожидания случайной величины Y.

1.2.1. Складывая последовательно по 10 элементов выборки Y получим следующие значения для Sk :

565 586 599 594 632 622 647 623 616 651 658 662 661 663 659 662 675 708 717 718

1.2.2. Каждое из чисел S1, S2,…, S20 делим на 10. Получаем 20 чисел

sk = Sk/10 :

56.5 58.6 59.9 59.4 63.2 62.2 64.7 62.3 61.6 65.1 65.8 66.2 66.1 66.3 65.9 66.2 67.5 70.8 71.7 71.8

1.2.3. Искомая оценка математического ожидания Y есть

Mx = (s1 + s2 + ... + s20 )/ 20 = 1291,8 / 20 =64,59

1.3. Вычислим значения центрированных величин (xk-Mx) и (yk-My) для всех элементов выборки. Результаты занесем в таблицу 1. 1.4. Вычислим произведение центрированных величин (xk-Mx)*(yk-My). Результаты занесем в таблицу 1.

Таблица 1

k

xk

yk

( хk-Mx )

( yk-My )

( хk-Mx )*( yk-My )

1

155

61

-13.62000

-3.59000

48.89580

2

156

53

-12.62000

-11.59000

146.26580

3

156

54

-12.62000

-10.59000

133.64580

4

157

60

-11.62000

-4.59000

53.33580

5

157

60

-11.62000

-4.59000

53.33580

6

157

53

-11.62000

-11.59000

134.67580

7

158

61

-10.62000

-3.59000

38.12580

8

159

55

-9.62000

-9.59000

92.25580

9

159

60

-9.62000

-4.59000

44.15580

10

159

48

-9.62000

-16.59000

159.59580

11

159

61

-9.62000

-3.59000

34.53580

12

159

55

-9.62000

-9.59000

92.25580

13

159

60

-9.62000

-4.59000

44.15580

14

160

61

-8.62000

-3.59000

30.94580

15

161

66

-7.62000

1.41000

-10.74420

16

161

56

-7.62000

-8.59000

65.45580

17

161

55

-7.62000

-9.59000

73.07580

18

161

51

-7.62000

-13.59000

103.55580

19

161

66

-7.62000

1.41000

-10.74420

20

161

55

-7.62000

-9.59000

73.07580

21

161

66

-7.62000

1.41000

-10.74420

22

161

52

-7.62000

-12.59000

95.93580

23

161

62

-7.62000

-2.59000

19.73580

24

161

51

-7.62000

-13.59000

103.55580

25

161

59

-7.62000

-5.59000

42.59580

26

162

66

-6.62000

1.41000

-9.33420

27

162

53

-6.62000

-11.59000

76.72580

28

162

65

-6.62000

0.41000

-2.71420

29

162

60

-6.62000

-4.59000

30.38580

30

163

65

-5.62000

0.41000

-2.30420

31

163

58

-5.62000

-6.59000

37.03580

32

163

63

-5.62000

-1.59000

8.93580

33

163

65

-5.62000

0.41000

-2.30420

34

163

64

-5.62000

-0.59000

3.31580

35

163

54

-5.62000

-10.59000

59.51580

36

163

62

-5.62000

-2.59000

14.55580

37

164

53

-4.62000

-11.59000

53.54580

38

164

59

-4.62000

-5.59000

25.82580

39

164

63

-4.62000

-1.59000

7.34580

40

164

53

-4.62000

-11.59000

53.54580

41

164

56

-4.62000

-8.59000

39.68580

42

164

61

-4.62000

-3.59000

16.58580

43

164

70

-4.62000

5.41000

-24.99420

44

164

60

-4.62000

-4.59000

21.20580

45

164

60

-4.62000

-4.59000

21.20580

46

164

63

-4.62000

-1.59000

7.34580

47

164

60

-4.62000

-4.59000

21.20580

48

164

76

-4.62000

11.41000

-52.71420

49

165

63

-3.62000

-1.59000

5.75580

50

165

63

-3.62000

-1.59000

5.75580

51

165

62

-3.62000

-2.59000

9.37580

52

165

67

-3.62000

2.41000

-8.72420

53

165

56

-3.62000

-8.59000

31.09580

54

165

69

-3.62000

4.41000

-15.96420

55

165

60

-3.62000

-4.59000

16.61580

56

165

72

-3.62000

7.41000

-26.82420

57

165

60

-3.62000

-4.59000

16.61580

58

165

61

-3.62000

-3.59000

12.99580

59

165

59

-3.62000

-5.59000

20.23580

60

165

56

-3.62000

-8.59000

31.09580

61

165

63

-3.62000

-1.59000

5.75580

62

165

68

-3.62000

3.41000

-12.34420

63

165

63

-3.62000

-1.59000

5.75580

64

165

63

-3.62000

-1.59000

5.75580

65

165

62

-3.62000

-2.59000

9.37580

66

166

71

-2.62000

6.41000

-16.79420

67

166

78

-2.62000

13.41000

-35.13420

68

166

60

-2.62000

-4.59000

12.02580

69

166

55

-2.62000

-9.59000

25.12580

70

166

64

-2.62000

-0.59000

1.54580

71

166

57

-2.62000

-7.59000

19.88580

72

166

62

-2.62000

-2.59000

6.78580

73

166

63

-2.62000

-1.59000

4.16580

74

166

62

-2.62000

-2.59000

6.78580

75

166

67

-2.62000

2.41000

-6.31420

76

166

64

-2.62000

-0.59000

1.54580

77

167

65

-1.62000

0.41000

-0.66420

78

167

64

-1.62000

-0.59000

0.95580

79

167

59

-1.62000

-5.59000

9.05580

80

167

60

-1.62000

-4.59000

7.43580

81

167

65

-1.62000

0.41000

-0.66420

82

167

57

-1.62000

-7.59000

12.29580

83

167

63

-1.62000

-1.59000

2.57580

84

167

59

-1.62000

-5.59000

9.05580

85

167

64

-1.62000

-0.59000

0.95580

86

167

57

-1.62000

-7.59000

12.29580

87

167

61

-1.62000

-3.59000

5.81580

88

167

65

-1.62000

0.41000

-0.66420

89

167

68

-1.62000

3.41000

-5.52420

90

167

57

-1.62000

-7.59000

12.29580

91

167

63

-1.62000

-1.59000

2.57580

92

167

66

-1.62000

1.41000

-2.28420

93

168

58

-0.62000

-6.59000

4.08580

94

168

67

-0.62000

2.41000

-1.49420

95

168

73

-0.62000

8.41000

-5.21420

96

168

62

-0.62000

-2.59000

1.60580

97

168

70

-0.62000

5.41000

-3.35420

98

168

67

-0.62000

2.41000

-1.49420

99

168

58

-0.62000

-6.59000

4.08580

100

168

67

-0.62000

2.41000

-1.49420

101

168

55

-0.62000

-9.59000

5.94580

102

168

65

-0.62000

0.41000

-0.25420

103

168

75

-0.62000

10.41000

-6.45420

104

169

71

0.38000

6.41000

2.43580

105

169

64

0.38000

-0.59000

-0.22420

106

169

64

0.38000

-0.59000

-0.22420

107

169

67

0.38000

2.41000

0.91580

108

169

61

0.38000

-3.59000

-1.36420

109

169

62

0.38000

-2.59000

-0.98420

110

169

74

0.38000

9.41000

3.57580

111

169

58

0.38000

-6.59000

-2.50420

112

169

66

0.38000

1.41000

0.53580

113

169

61

0.38000

-3.59000

-1.36420

114

169

66

0.38000

1.41000

0.53580

115

170

75

1.38000

10.41000

14.36580

116

170

76

1.38000

11.41000

15.74580

117

170

65

1.38000

0.41000

0.56580

118

170

68

1.38000

3.41000

4.70580

119

170

69

1.38000

4.41000

6.08580

120

170

58

1.38000

-6.59000

-9.09420

121

170

61

1.38000

-3.59000

-4.95420

122

170

73

1.38000

8.41000

11.60580

123

170

75

1.38000

10.41000

14.36580

124

170

62

1.38000

-2.59000

-3.57420

125

171

65

2.38000

0.41000

0.97580

126

171

67

2.38000

2.41000

5.73580

127

171

62

2.38000

-2.59000

-6.16420

128

171

64

2.38000

-0.59000

-1.40420

129

171

67

2.38000

2.41000

5.73580

130

171

65

2.38000

0.41000

0.97580

131

171

70

2.38000

5.41000

12.87580

132

171

60

2.38000

-4.59000

-10.92420

133

171

63

2.38000

-1.59000

-3.78420

134

171

69

2.38000

4.41000

10.49580

135

171

64

2.38000

-0.59000

-1.40420

136

171

66

2.38000

1.41000

3.35580

137

171

73

2.38000

8.41000

20.01580

138

171

67

2.38000

2.41000

5.73580

139

172

64

3.38000

-0.59000

-1.99420

140

172

67

3.38000

2.41000

8.14580

141

172

64

3.38000

-0.59000

-1.99420

142

172

72

3.38000

7.41000

25.04580

143

172

64

3.38000

-0.59000

-1.99420

144

172

60

3.38000

-4.59000

-15.51420

145

172

67

3.38000

2.41000

8.14580

146

172

60

3.38000

-4.59000

-15.51420

147

172

66

3.38000

1.41000

4.76580

148

172

69

3.38000

4.41000

14.90580

149

172

63

3.38000

-1.59000

-5.37420

150

172

74

3.38000

9.41000

31.80580

151

172

75

3.38000

10.41000

35.18580

152

172

64

3.38000

-0.59000

-1.99420

153

173

66

4.38000

1.41000

6.17580

154

173

65

4.38000

0.41000

1.79580

155

173

66

4.38000

1.41000

6.17580

156

173

63

4.38000

-1.59000

-6.96420

157

173

66

4.38000

1.41000

6.17580

158

173

71

4.38000

6.41000

28.07580

159

173

63

4.38000

-1.59000

-6.96420

160

173

63

4.38000

-1.59000

-6.96420

161

173

68

4.38000

3.41000

14.93580

162

173

70

4.38000

5.41000

23.69580

163

173

74

4.38000

9.41000

41.21580

164

174

69

5.38000

4.41000

23.72580

165

174

67

5.38000

2.41000

12.96580

166

174

66

5.38000

1.41000

7.58580

167

174

69

5.38000

4.41000

23.72580

168

174

66

5.38000

1.41000

7.58580

169

174

59

5.38000

-5.59000

-30.07420

170

175

67

6.38000

2.41000

15.37580

171

175

80

6.38000

15.41000

98.31580

172

175

70

6.38000

5.41000

34.51580

173

175

70

6.38000

5.41000

34.51580

174

176

62

7.38000

-2.59000

-19.11420

175

176

78

7.38000

13.41000

98.96580

176

176

65

7.38000

0.41000

3.02580

177

176

65

7.38000

0.41000

3.02580

178

176

81

7.38000

16.41000

121.10580

179

176

67

7.38000

2.41000

17.78580

180

176

70

7.38000

5.41000

39.92580

181

176

75

7.38000

10.41000

76.82580

182

176

60

7.38000

-4.59000

-33.87420

183

176

71

7.38000

6.41000

47.30580

184

176

65

7.38000

0.41000

3.02580

185

176

75

7.38000

10.41000

76.82580

186

176

67

7.38000

2.41000

17.78580

187

176

78

7.38000

13.41000

98.96580

188

177

71

8.38000

6.41000

53.71580

189

177

80

8.38000

15.41000

129.13580

190

178

75

9.38000

10.41000

97.64580

191

178

68

9.38000

3.41000

31.98580

192

180

66

11.38000

1.41000

16.04580

193

181

76

12.38000

11.41000

141.25580

194

182

73

13.38000

8.41000

112.52580

195

182

73

13.38000

8.41000

112.52580

196

183

72

14.38000

7.41000

106.55580

197

183

75

14.38000

10.41000

149.69580

198

184

80

15.38000

15.41000

237.00580

199

188

66

19.38000

1.41000

27.32580

200

190

69

21.38000

4.41000

94.28580

1.5. Вычислим ковариацию cov(X,Y) как среднее значение элементов 6-го столбца таблицы 1.

1.5.1. Складывая последовательно по 10 элементов выборки Y получим следующие значения для Sk :

904.288 495.568 343.838 261.318 61.038 86.518 1.068 49.638 48.438 -2.982 3.368 29.578 23.298 42.518 44.278 60.698 140.738 432.068 567.358 1029.208

1.5.2. Каждое из чисел S1, S2,…, S20 делим на 10. Получаем 20 чисел

sk = Sk/10:

90.4288 49.5568 34.3838 26.1318 6.1038 8.6518 0.1068 4.9638 4.8438 -0.2982 0.3368 2.9578 2.3298 4.2518 4.4278 6.0698 14.0738 43.2068 56.7358 102.9208

1.5.3. Искомая оценка коэффициента ковариации cov(X,Y) есть

Mx = (s1 + s2 + ... + s20 )/ 20 = 462.184 / 20 = 23,1092

ОТВЕТ: cov(X,Y) = 23.1092

2. Вычисляем коэффициент корреляции.

Коэффициент корреляции -- это показатель взаимного вероятностного влияния двух случайных величин. Коэффициент корреляции R может принимать значения от -1 до +1. Если абсолютное значение находится ближе к 1, то это свидетельство сильной связи между величинами, а если ближе к 0 -- то, это говорит о слабой связи или ее отсутствии. Если абсолютное значение R равно единице, то можно говорить о функциональной связи между величинами, то есть одну величину можно выразить через другую посредством математической функции.

Вычислить коэффициент корреляции можно по следующим формулам:

Rx,y = cov( X,Y ) /уxуy ( 2.1 ),

где cov( X,Y ) - ковариация случайных величин Х и Y

уx2 = 1 /n У n k = 1 (xk-Mx)2 , уy2 = 1 / n У n k = 1 (yk-My)2 (2.2),

- оценки дисперсий случайных величин X и Y соответственно.

Mx = 1 /n У n k = 1 xk , My = 1 / n У n k = 1 yk ( 2.3 ),

- оценки математического ожидания случайных величин X и Y соответственно.

или по формуле

Rx,y = (Mxy - MxMy) / SxSy (2.4), где:

Mx = 1 /n У n k = 1 xk , My = 1 / n У n k = 1 yk ,

Mxy = 1 /n У n k = 1 xkyk ( 2.5 )

Sx2 = 1 / n У n k = 1 (xk2 - Mx2) , Sy2 = 1 / n У n k = 1 yk2 - My2 ( 2.6 )

На практике, для вычисления коэффициента корреляции чаще используется формула (2.4) т.к. она требует меньше вычислений. Однако если предварительно была вычислена ковариация cov(X,Y), то выгоднее использовать формулу (2.1), т.к. кроме собственно значения ковариации можно воспользоваться и результатами промежуточных вычислений.

2.1 Вычислим коэффициент корреляции по формуле (2.1) для этого воспользуемся результатами, представленными в таблице 1, дополнив последнюю двумя новыми столбцами в которые запишем (предварительно вычислив) значения квадратов центрированных случайных величин (xk-Mx)2 и (yk-My)2. Получим таблицу 2.

Таблица 2

k

xk

yk

( хk-Mx )

( хk-Mx )2

( yk-My )

( yk-My )2

1

155

61

-13.62000

185.50440

-3.59000

12.88810

2

156

53

-12.62000

159.26440

-11.59000

134.32810

3

156

54

-12.62000

159.26440

-10.59000

112.14810

4

157

60

-11.62000

135.02440

-4.59000

21.06810

5

157

60

-11.62000

135.02440

-4.59000

21.06810

6

157

53

-11.62000

135.02440

-11.59000

134.32810

7

158

61

-10.62000

112.78440

-3.59000

12.88810

8

159

55

-9.62000

92.54440

-9.59000

91.96810

9

159

60

-9.62000

92.54440

-4.59000

21.06810

10

159

48

-9.62000

92.54440

-16.59000

275.22810

11

159

61

-9.62000

92.54440

-3.59000

12.88810

12

159

55

-9.62000

92.54440

-9.59000

91.96810

13

159

60

-9.62000

92.54440

-4.59000

21.06810

14

160

61

-8.62000

74.30440

-3.59000

12.88810

15

161

66

-7.62000

58.06440

1.41000

1.98810

16

161

56

-7.62000

58.06440

-8.59000

73.78810

17

161

55

-7.62000

58.06440

-9.59000

91.96810

18

161

51

-7.62000

58.06440

-13.59000

184.68810

19

161

66

-7.62000

58.06440

1.41000

1.98810

20

161

55

-7.62000

58.06440

-9.59000

91.96810

21

161

66

-7.62000

58.06440

1.41000

1.98810

22

161

52

-7.62000

58.06440

-12.59000

158.50810

23

161

62

-7.62000

58.06440

-2.59000

6.70810

24

161

51

-7.62000

58.06440

-13.59000

184.68810

25

161

59

-7.62000

58.06440

-5.59000

31.24810

26

162

66

-6.62000

43.82440

1.41000

1.98810

27

162

53

-6.62000

43.82440

-11.59000

134.32810

28

162

65

-6.62000

43.82440

0.41000

0.16810

29

162

60

-6.62000

43.82440

-4.59000

21.06810

30

163

65

-5.62000

31.58440

0.41000

0.16810

31

163

58

-5.62000

31.58440

-6.59000

43.42810

32

163

63

-5.62000

31.58440

-1.59000

2.52810

33

163

65

-5.62000

31.58440

0.41000

0.16810

34

163

64

-5.62000

31.58440

-0.59000

0.34810

35

163

54

-5.62000

31.58440

-10.59000

112.14810

36

163

62

-5.62000

31.58440

-2.59000

6.70810

37

164

53

-4.62000

21.34440

-11.59000

134.32810

38

164

59

-4.62000

21.34440

-5.59000

31.24810

39

164

63

-4.62000

21.34440

-1.59000

2.52810

40

164

53

-4.62000

21.34440

-11.59000

134.32810

41

164

56

-4.62000

21.34440

-8.59000

73.78810

42

164

61

-4.62000

21.34440

-3.59000

12.88810

43

164

70

-4.62000

21.34440

5.41000

29.26810

44

164

60

-4.62000

21.34440

-4.59000

21.06810

45

164

60

-4.62000

21.34440

-4.59000

21.06810

46

164

63

-4.62000

21.34440

-1.59000

2.52810

47

164

60

-4.62000

21.34440

-4.59000

21.06810

48

164

76

-4.62000

21.34440

11.41000

130.18810

49

165

63

-3.62000

13.10440

-1.59000

2.52810

50

165

63

-3.62000

13.10440

-1.59000

2.52810

51

165

62

-3.62000

13.10440

-2.59000

6.70810

52

165

67

-3.62000

13.10440

2.41000

5.80810

53

165

56

-3.62000

13.10440

-8.59000

73.78810

54

165

69

-3.62000

13.10440

4.41000

19.44810

55

165

60

-3.62000

13.10440

-4.59000

21.06810

56

165

72

-3.62000

13.10440

7.41000

54.90810

57

165

60

-3.62000

13.10440

-4.59000

21.06810

58

165

61

-3.62000

13.10440

-3.59000

12.88810

59

165

59

-3.62000

13.10440

-5.59000

31.24810

60

165

56

-3.62000

13.10440

-8.59000

73.78810

61

165

63

-3.62000

13.10440

-1.59000

2.52810

62

165

68

-3.62000

13.10440

3.41000

11.62810

63

165

63

-3.62000

13.10440

-1.59000

2.52810

64

165

63

-3.62000

13.10440

-1.59000

2.52810

65

165

62

-3.62000

13.10440

-2.59000

6.70810

66

166

71

-2.62000

6.86440

6.41000

41.08810

67

166

78

-2.62000

6.86440

13.41000

179.82810

68

166

60

-2.62000

6.86440

-4.59000

21.06810

69

166

55

-2.62000

6.86440

-9.59000

91.96810

70

166

64

-2.62000

6.86440

-0.59000

0.34810

71

166

57

-2.62000

6.86440

-7.59000

57.60810

72

166

62

-2.62000

6.86440

-2.59000

6.70810

73

166

63

-2.62000

6.86440

-1.59000

2.52810

74

166

62

-2.62000

6.86440

-2.59000

6.70810

75

166

67

-2.62000

6.86440

2.41000

5.80810

76

166

64

-2.62000

6.86440

-0.59000

0.34810

77

167

65

-1.62000

2.62440

0.41000

0.16810

78

167

64

-1.62000

2.62440

-0.59000

0.34810

79

167

59

-1.62000

2.62440

-5.59000

31.24810

80

167

60

-1.62000

2.62440

-4.59000

21.06810

81

167

65

-1.62000

2.62440

0.41000

0.16810

82

167

57

-1.62000

2.62440

-7.59000

57.60810

83

167

63

-1.62000

2.62440

-1.59000

2.52810

84

167

59

-1.62000

2.62440

-5.59000

31.24810

85

167

64

-1.62000

2.62440

-0.59000

0.34810

86

167

57

-1.62000

2.62440

-7.59000

57.60810

87

167

61

-1.62000

2.62440

-3.59000

12.88810

88

167

65

-1.62000

2.62440

0.41000

0.16810

89

167

68

-1.62000

2.62440

3.41000

11.62810

90

167

57

-1.62000

2.62440

-7.59000

57.60810

91

167

63

-1.62000

2.62440

-1.59000

2.52810

92

167

66

-1.62000

2.62440

1.41000

1.98810

93

168

58

-0.62000

0.38440

-6.59000

43.42810

94

168

67

-0.62000

0.38440

2.41000

5.80810

95

168

73

-0.62000

0.38440

8.41000

70.72810

96

168

62

-0.62000

0.38440

-2.59000

6.70810

97

168

70

-0.62000

0.38440

5.41000

29.26810

98

168

67

-0.62000

0.38440

2.41000

5.80810

99

168

58

-0.62000

0.38440

-6.59000

43.42810

100

168

67

-0.62000

0.38440

2.41000

5.80810

101

168

55

-0.62000

0.38440

-9.59000

91.96810

102

168

65

-0.62000

0.38440

0.41000

0.16810

103

168

75

-0.62000

0.38440

10.41000

108.36810

104

169

71

0.38000

0.14440

6.41000

41.08810

105

169

64

0.38000

0.14440

-0.59000

0.34810

106

169

64

0.38000

0.14440

-0.59000

0.34810

107

169

67

0.38000

0.14440

2.41000

5.80810

108

169

61

0.38000

0.14440

-3.59000

12.88810

109

169

62

0.38000

0.14440

-2.59000

6.70810

110

169

74

0.38000

0.14440

9.41000

88.54810

111

169

58

0.38000

0.14440

-6.59000

43.42810

112

169

66

0.38000

0.14440

1.41000

1.98810

113

169

61

0.38000

0.14440

-3.59000

12.88810

114

169

66

0.38000

0.14440

1.41000

1.98810

115

170

75

1.38000

1.90440

10.41000

108.36810

116

170

76

1.38000

1.90440

11.41000

130.18810

117

170

65

1.38000

1.90440

0.41000

0.16810

118

170

68

1.38000

1.90440

3.41000

11.62810

119

170

69

1.38000

1.90440

4.41000

19.44810

120

170

58

1.38000

1.90440

-6.59000

43.42810

121

170

61

1.38000

1.90440

-3.59000

12.88810

122

170

73

1.38000

1.90440

8.41000

70.72810

123

170

75

1.38000

1.90440

10.41000

108.36810

124

170

62

1.38000

1.90440

-2.59000

6.70810

125

171

65

2.38000

5.66440

0.41000

0.16810

126

171

67

2.38000

5.66440

2.41000

5.80810

127

171

62

2.38000

5.66440

-2.59000

6.70810

128

171

64

2.38000

5.66440

-0.59000

0.34810

129

171

67

2.38000

5.66440

2.41000

5.80810

130

171

65

2.38000

5.66440

0.41000

0.16810

131

171

70

2.38000

5.66440

5.41000

29.26810

132

171

60

2.38000

5.66440

-4.59000

21.06810

133

171

63

2.38000

5.66440

-1.59000

2.52810

134

171

69

2.38000

5.66440

4.41000

19.44810

135

171

64

2.38000

5.66440

-0.59000

0.34810

136

171

66

2.38000

5.66440

1.41000

1.98810

137

171

73

2.38000

5.66440

8.41000

70.72810

138

171

67

2.38000

5.66440

2.41000

5.80810

139

172

64

3.38000

11.42440

-0.59000

0.34810

140

172

67

3.38000

11.42440

2.41000

5.80810

141

172

64

3.38000

11.42440

-0.59000

0.34810

142

172

72

3.38000

11.42440

7.41000

54.90810

143

172

64

3.38000

11.42440

-0.59000

0.34810

144

172

60

3.38000

11.42440

-4.59000

21.06810

145

172

67

3.38000

11.42440

2.41000

5.80810

146

172

60

3.38000

11.42440

-4.59000

21.06810

147

172

66

3.38000

11.42440

1.41000

1.98810

148

172

69

3.38000

11.42440

4.41000

19.44810

149

172

63

3.38000

11.42440

-1.59000

2.52810

150

172

74

3.38000

11.42440

9.41000

88.54810

151

172

75

3.38000

11.42440

10.41000

108.36810

152

172

64

3.38000

11.42440

-0.59000

0.34810

153

173

66

4.38000

19.18440

1.41000

1.98810

154

173

65

4.38000

19.18440

0.41000

0.16810

155

173

66

4.38000

19.18440

1.41000

1.98810

156

173

63

4.38000

19.18440

-1.59000

2.52810

157

173

66

4.38000

19.18440

1.41000

1.98810

158

173

71

4.38000

19.18440

6.41000

41.08810

159

173

63

4.38000

19.18440

-1.59000

2.52810

160

173

63

4.38000

19.18440

-1.59000

2.52810

161

173

68

4.38000

19.18440

3.41000

11.62810

162

173

70

4.38000

19.18440

5.41000

29.26810

163

173

74

4.38000

19.18440

9.41000

88.54810

164

174

69

5.38000

28.94440

4.41000

19.44810

165

174

67

5.38000

28.94440

2.41000

5.80810

166

174

66

5.38000

28.94440

1.41000

1.98810

167

174

69

5.38000

28.94440

4.41000

19.44810

168

174

66

5.38000

28.94440

1.41000

1.98810

169

174

59

5.38000

28.94440

-5.59000

31.24810

170

175

67

6.38000

40.70440

2.41000

5.80810

171

175

80

6.38000

40.70440

15.41000

237.46810

172

175

70

6.38000

40.70440

5.41000

29.26810

173

175

70

6.38000

40.70440

5.41000

29.26810

174

176

62

7.38000

54.46440

-2.59000

6.70810

175

176

78

7.38000

54.46440

13.41000

179.82810

176

176

65

7.38000

54.46440

0.41000

0.16810

177

176

65

7.38000

54.46440

0.41000

0.16810

178

176

81

7.38000

54.46440

16.41000

269.28810

179

176

67

7.38000

54.46440

2.41000

5.80810

180

176

70

7.38000

54.46440

5.41000

29.26810

181

176

75

7.38000

54.46440

10.41000

108.36810

182

176

60

7.38000

54.46440

-4.59000

21.06810

183

176

71

7.38000

54.46440

6.41000

41.08810

184

176

65

7.38000

54.46440

0.41000

0.16810

185

176

75

7.38000

54.46440

10.41000

108.36810

186

176

67

7.38000

54.46440

2.41000

5.80810

187

176

78

7.38000

54.46440

13.41000

179.82810

188

177

71

8.38000

70.22440

6.41000

41.08810

189

177

80

8.38000

70.22440

15.41000

237.46810

190

178

75

9.38000

87.98440

10.41000

108.36810

191

178

68

9.38000

87.98440

3.41000

11.62810

192

180

66

11.38000

129.50440

1.41000

1.98810

193

181

76

12.38000

153.26440

11.41000

130.18810

194

182

73

13.38000

179.02440

8.41000

70.72810

195

182

73

13.38000

179.02440

8.41000

70.72810

196

183

72

14.38000

206.78440

7.41000

54.90810

197

183

75

14.38000

206.78440

10.41000

108.36810

198

184

80

15.38000

236.54440

15.41000

237.46810

199

188

66

19.38000

375.58440

1.41000

1.98810

200

190

69

21.38000

457.10440

4.41000

19.44810

2.2. Вычислим уx2 как среднее значение элементов 5-го столбца таблицы 2.

2.2.1. Складывая последовательно по 10 элементов 5-го столбца получим следующие значения для Sk :

1299.524 700.324 497.204 274.884 196.964 131.044 99.844 51.684 26.244 8.324 2.164 12.004 41.604 68.164 114.244 176.324 271.924 503.364 609.684 2211.604

2.2.2. Каждое из чисел S1, S2,…, S20 делим на 10. Получаем 20 чисел

sk = Sk/10:

129.9524 70.0324 49.7204 27.4884 19.6964 13.1044 9.9844 5.1684 2.6244 0.8324 0.2164 1.2004 4.1604 6.8164 11.4244 17.6324 27.1924 50.3364 60.9684 221.1604

2.2.3. Искомая уx2 есть

уx2 = (s1 + s2 + ... + s20 ) / 20 = 729.712 /20 = 36.4856.

2.3. Вычислим уy2 как среднее значение элементов 7-го столбца таблицы 2.

2.3.1. Складывая последовательно по 10 элементов 7-го столбца получим следующие значения для Sk :

836.981 585.201 540.861 467.761 316.921 320.721 360.221 132.541 231.801 215.501 356.241 373.521 217.701 157.341 216.061 163.521 215.181 787.241 851.621 707.441

2.3.2. Каждое из чисел S1, S2,…, S20 делим на 10. Получаем 20 чисел

sk = Sk/10:

83.6981 58.5201 54.0861 46.7761 31.6921 32.0721 36.0221 13.2541 23.1801 21.5501 35.6241 37.3521 21.7701 15.7341 21.6061 16.3521 21.5181 78.7241 85.1621 70.7441

2.3.3. Искомая уy2 есть

уx2 = (s1 + s2 + ... + s20 ) / 20 = 805,438/20=40,2719

2.4. Вычислим произведение уx2уy2x2уy2 = 36.4856*40.2719 = 1469.344435

2.5. Извлечем из последнего числа квадратный корень, получим значение уxуy. уxуy = 38.332029 2.5.Вычислим коэффициент корреляции по формуле ( 2.1 ).

Rx,y = cov( X,Y ) /уxуy = 23.109200 / 38.332029 = 0.602869

ОТВЕТ: Rx,y = 0.602869

3. Проверяем значимость коэффициента корреляции (проверяем гипотезу зависимости).

Поскольку оценка коэффициента корреляции вычислена на конечной выборке, и поэтому может отклоняться от своего генерального значения, необходимо проверить значимость коэффициента корреляции. Проверка производится с помощью t-критерия:

t = (Rx,y v (n - 2)) / v (1 - R2x,y ) ( 3.1 )

Случайная величина t следует t-распределению Стьюдента и по таблице t-распределения необходимо найти критическое значение критерия (tкр.б) при заданном уровне значимости б. Если вычисленное по формуле ( 3.1 ) t по модулю окажется меньше чем tкр.б, то зависимости между случайными величинами X и Y нет. В противном случае, экспериментальные данные не противоречат гипотезе о зависимости случайных величин.

3.1. Вычислим значение t-критерия по формуле ( 3.1 ) получим:

t = (0.60287 v (200 - 2)) / v (1 - 0.602872 ) = 10.63261

3.2. Определим по таблице t-распределения критическое значение параметра tкр.б Искомое значение tкр.б располагается на пересечении строки соответствующей числу степеней свободы и столбца соответствующего заданному уровню значимости б. В нашем случае число степеней свободы есть n - 2 = 200 - 2 = 198 и б = 0.1 , что соответствует критическому значению критерия tкр.б = 1.658 (см. табл. 3)

Таблица 3 t-распределение

Число степеней свободы ( n - 2 )

б = 0.1

б = 0.05

б = 0.02

б = 0.01

б = 0.002

б = 0.001

1

6.314

12.706

31.821

63.657

318.31

636.62

2

2.920

4.303

6.965

9.925

22.327

31.598

3

2.353

3.182

4.541

5.841

10.214

12.924

4

2.132

2.776

3.747

4.604

7.173

8.610

5

2.015

2.571

3.365

4.032

5.893

6.869

6

1.943

2.447

3.143

3.707

5.208

5.959

7

1.895

2.365

2.998

3.499

4.785

5.408

8

1.860

2.306

2.896

3.355

4.501

5.041

9

1.833

2.262

2.821

3.250

4.297

4.781

10

1.812

2.228

2.764

3.169

4.144

4.587

11

1.796

2.201

2.718

3.106

4.025

4.437

12

1.782

2.179

2.681

3.055

3.930

4.318

13

1.771

2.160

2.650

3.012

3.852

4.221

14

1.761

2.145

2.624

2.977

3.787

4.140

15

1.753

2.131

2.602

2.947

3.733

4.073

16

1.746

2.120

2.583

2.921

3.686

4.015

17

1.740

2.110

2.567

2.898

3.646

3.965

18

1.734

2.101

2.552

2.878

3.610

3.922

19

1.729

2.093

2.539

2.861

3.579

3.883

20

1.725

2.086

2.528

2.845

3.552

3.850

21

1.721

2.080

2.518

2.831

3.527

3.819

22

1.717

2.074

2.508

2.819

3.505

3.792

23

1.714

2.069

2.500

2.807

3.485

3.767

24

1.711

2.064

2.492

2.797

3.467

3.745

25

1.708

2.060

2.485

2.787

3.450

3.725

26

1.706

2.056

2.479

2.779

3.435

3.707

27

1.703

2.052

2.473

2.771

3.421

3.690

28

1.701

2.048

2.467

2.763

3.408

3.674

29

1.699

2.045

2.462

2.756

3.396

3.659

30

1.697

2.042

2.457

2.750

3.385

3.646

40

1.684

2.021

2.423

2.704

3.307

3.551

60

1.671

2.000

2.390

2.660

3.232

3.460

120

1.658

1.980

2.358

2.617

3.160

3.373

?

1.645

1.960

2.326

2.576

3.090

3.291

3.2. Сравним абсолютное значение t-критерия и tкр.б Абсолютное значение t-критерия не меньше критического t = 10.63261, tкр.б = 1.658, следовательно экспериментальные данные, с вероятностью 0.9 ( 1 - б ), не противоречат гипотезе о зависимости случайных величин X и Y.

4. Вычисляем коэффициенты уравнения линейной регрессии.

Уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость между случайными величинами X и Y. Если считать, что величина X свободная, а Y зависимая от Х, то уравнение регрессии запишется следующим образом

Y = a + b*X ( 4.1 ), где:

b = Rx,yy / уx) Rx,y = Sy / Sx (4.2),

a = My - b*Mx ( 4.3 )

Рассчитанный по формуле (4.2) коэффициент b называют коэффициентом линейной регрессии. В некоторых источниках a называют постоянным коэффициентом регрессии и b соответственно переменным. Погрешности предсказания Y по заданному значению X вычисляются по формулам:

уy/x = уy v (1-R2x,y ) = Syv (1-R2x,y ) (4.4)

- абсолютная погрешность,

дy/x = (уy/x / My )* 100% ( 4.5 ) - относительная погрешность

Величину уy/x (формула 4.4) еще называют остаточным средним квадратическим отклонением, оно характеризует уход величины Y от линии регрессии, описываемой уравнением (4.1), при фиксированном (заданном) значении X.

4.1. Вычислим отношение уy2 / уx2.

уy2 / уx2 = 40.27190 / 36.48560 = 1.10378

4.2. Вычислим отношение уy / уx

Извлечем из последнего числа квадратный корень - получим: уy / уx = 1.05061

4.3 Вычислим коэффициент b по формуле ( 4.2 ) b = 0.60287 * 1.05061 = 0.63338

4.4 Вычислим коэффициент a по формуле ( 4.3 ) a = 64.59000 - 0.63338 * 168.62000 = -42.21031

4.5 Оценим погрешности уравнения регрессии.

4.5.1 Извлечем из уy2 квадратный корень получим:

уy = v40.2719 = 6.34601;

4.5.2 Возведем в квадрат Rx,y получим: R2x,y = 0.602872 = 0.36345 4.5.3 Вычислим абсолютную погрешность (остаточное среднее квадратическое отклонение) по формуле ( 4.4 )

уy/x = (6.34601v (1 - 0.36345 ))= 5.06310

4.5.4 Вычислим относительную погрешность по формуле ( 4.5 ) дy/x = ( 5.06310 / 64.59000)100% = 7.83884%

Ответ: Уравнение линейной регрессии имеет вид: Y = 0.63338 X -42.21031 ( 4.6 )

Погрешности уравнения: уy/x = 5.06310 ; дy/x = 7.83884%

5. Строим диаграмму рассеяния (корреляционное поле) и график линии регрессии.

Диаграмма рассеяния -- это графическое изображение соответствующих пар (xk, yk) в виде точек плоскости, в прямоугольных координатах с осями X и Y. Корреляционное поле является одним из графических представлений связанной (парной) выборки. В той же системе координат строится и график линии регрессии. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы диаграмма была максимально наглядной.

5.1. Находим минимальный и максимальный элемент выборки X это 1-й и 200-й элементы соответственно, xmin = 1550 и xmax = 1900.

5.2. Находим минимальный и максимальный элемент выборки Y это 10-й и 178-й элементы соответственно, ymin = 480 и ymax = 810.

5.3. На оси абсцисс выбираем начальную точку чуть левее точки x1 = 1550, и такой масштаб, чтобы на оси поместилась точка x200 = 1900 и отчетливо различались остальные точки.

5.4. На оси ординат выбираем начальную точку чуть левее точки y10 = 480, и такой масштаб, чтобы на оси поместилась точка y178 = 810 и отчетливо различались остальные точки.

5.5. На оси абсцисс размещаем значения xk, а на оси ординат значения yk.

5.6. Наносим точки (x1, y1 ), (x2, y2 ),…,(x200, y200 ) на координатную плоскость. Получаем диаграмму рассеяния (корреляционное поле), изображенное на рисунке ниже.

5.7. Начертим линию регрессии. Для этого найдем две различные точки с координатами (xr1, yr1) и (xr2, yr2) удовлетворяющие уравнению (4.6), нанесем их на координатную плоскость и проведем через них прямую. В качестве абсциссы первой точки возьмем значение xmin=1550. Подставим значение xmin в уравнение (4.6), получим ординату первой точки. Таким образом имеем точку с координатами (1550, 55.96338). Аналогичным образом получим координаты второй точки, положив в качестве абсциссы значение xmax = 1900. Вторая точка будет: ( 1900, 78.13164 ).

Линия регрессии показана на рисунке ниже красным цветом

вероятность дисперсия статистический корреляция

Рис. 5

Обратите внимание, что линия регрессии всегда проходит через точку средних значений величин Х и Y, т.е. с координатами (Mx , My).

Размещено на Allbest.ru


Подобные документы

  • Исследование сходимости рядов. Степенной ряд интеграла дифференциального уравнения. Определение вероятности событий, закона распределения случайной величины, математического ожидания, эмпирической функции распределения, выборочного уравнения регрессии.

    контрольная работа [420,3 K], добавлен 04.10.2010

  • Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.

    контрольная работа [547,6 K], добавлен 02.02.2012

  • Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.

    контрольная работа [148,8 K], добавлен 12.02.2012

  • Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.

    задача [140,0 K], добавлен 17.11.2011

  • Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.

    контрольная работа [97,1 K], добавлен 26.02.2012

  • Решение задач по определению вероятности событий, ряда и функции распределения с помощью формулы умножения вероятностей. Нахождение константы, математического описания и дисперсии непрерывной случайной величины из функции распределения случайной величины.

    контрольная работа [57,3 K], добавлен 07.09.2010

  • Определение вероятности случайного события; вероятности выиграшных лотерейных билетов; пересечения двух независимых событий; непоражения цели при одном выстреле. Расчет математического ожидания, дисперсии, функции распределения случайной величины.

    контрольная работа [480,0 K], добавлен 29.06.2010

  • Определение вероятности появления события в каждом из независимых испытаний. Случайные величины, заданные функцией распределения (интегральной функцией), нахождение дифференциальной функции (плотности вероятности), математического ожидания и дисперсии.

    контрольная работа [59,7 K], добавлен 26.07.2010

  • Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.

    курсовая работа [511,8 K], добавлен 08.12.2013

  • Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.

    контрольная работа [38,5 K], добавлен 25.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.