Типовой расчёт по математической статистике

Вычисление точечных оценок: выборочные средние и несмещённые выборочные средние квадратичного отклонения. Нахождение выборочных уравнений прямых линий регрессии. Закон распределения случайных величин. Вычисление выборочного коэффициента корреляции.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 17.06.2012
Размер файла 245,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Задание (вариант 25)

В качестве исходных данных предлагаются результаты опроса людей об их весе Х (в килограммах) и росте Y (в сантиметрах). Данные выборочной совокупности содержат результаты опроса 50 человек, проживающих в Европе.

Для обработки этих данных в типовом расчёте требуется выполнить следующую работу:

1. Для величин Х и Y составить сгруппированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для Х и Y.

2. Вычислить точечные оценки: выборочные средние и ; несмещённые выборочные средние квадратичные отклонения sx и sy.

3. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости = 0,05.

4. Найти доверительные интервалы для M[X], M[Y], D[X], D[Y] с надёжностью = 0,95.

5. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между Х и Y (о незначимости отклонения rв от нуля).

6. Найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi, yi), i = 1, ..., n и эмпирическими линиями регрессии.

Таблица 1 - Статистические данные для 25-го варианта

Вариант 14

X

Y

1) 87.7 190

2) 87.6 192

3) 89.2 191

4) 88.2 195

5) 87.6 193

6) 84.8 185

7) 86.1 185

8) 85.7 186

9) 90.4 197

10) 90.7 202

11) 93.5 207

12) 90.0 195

13) 91.8 200

14) 86.0 185

15) 87.6 192

16) 88.0 191

17) 87.3 188

18) 93.4 206

19) 86.6 191

20) 86.5 187

21) 87.7 188

22) 85.7 190

23) 86.4 188

24) 87.6 191

25) 84.5 179

26) 89.7 195

27) 81.8 176

28) 92.4 205

29) 87.0 190

30) 89.4 195

31) 89.7 197

32) 89.6 195

33) 90.0 202

34) 91.2 200

35) 89.4 197

36) 87.2 188

37) 92.1 201

38) 91.9 205

39) 90.8 200

40) 88.4 192

41) 93.4 203

42) 89.7 197

43) 87.0 188

44) 82.6 176

45) 84.3 183

46) 87.4 191

47) 83.8 183

48) 88.4 193

49) 88.2 191

50) 88.1 191

1. Из предложенной генеральной совокупности объёма N = 100 сформировать выборку объёма n = 50 с помощью таблицы случайных чисел. Вариационные и статистические ряды для X и Y

Таблица 2 - Выборки x, y

Выборка Х

Выборка Y

87,7

190

87,6

192

89,2

191

88,2

195

87,6

193

84,8

185

86,1

185

85,7

186

90,4

197

90,7

202

93,5

207

90

195

91,8

200

86

185

87,6

192

88

191

87,3

188

93,4

206

86,6

191

86,5

187

87,7

188

85,7

190

86,4

188

87,6

191

84,5

179

89,7

195

81,8

176

92,4

205

87

190

89,4

195

89,7

197

89,6

195

90

202

91,2

200

89,4

197

87,2

188

92,1

201

91,9

205

90,8

200

88,4

192

93,4

203

89,7

197

87

188

82,6

176

84,3

183

87,4

191

83,8

183

88,4

193

88,2

191

88,1

191

Таблица 3 - Вариационные ряды x, y

Вариационный ряд для Х

Вариационный ряд для Y

81,8

176

82,6

176

83,8

179

84,3

183

84,5

183

84,8

185

85,7

185

85,7

185

86

186

86

187

86,1

188

86,4

188

86,5

188

86,6

188

87

188

87

190

87,2

190

87,3

190

87,4

191

87,6

191

87,6

191

87,6

191

87,6

191

87,7

191

87,7

191

88,1

192

88,2

192

88,2

192

88,4

193

88,4

193

89,2

195

89,4

195

89,4

195

89,6

195

89,7

195

89,7

197

89,7

197

90

197

90

197

90,4

200

90,7

200

90,8

200

91,2

201

91,8

202

91,9

202

92,1

203

92,4

205

93,4

205

93,4

206

93,5

207

Таблица 4 - Статистические ряды x, y

Статистический ряд для Х

81,8

1

82,6

1

83,8

1

84,3

1

84,8

1

84,5

1

85,7

2

86,0

2

86,1

1

86,4

1

86,5

1

86,6

1

87,0

2

87,2

1

87,3

1

87,4

1

87,6

4

87,7

2

88,1

1

88,2

2

88,4

2

89,2

1

89,4

2

89,6

1

89,7

3

90,0

2

90,4

1

90,7

1

90,8

1

91,2

1

91,8

1

91,9

1

92,1

1

92,4

1

93,4

2

93,5

1

 

50

Статистический ряд для Y

176,0

2

179,0

1

183,0

2

185,0

3

186,0

1

187,0

1

188,0

5

190,0

3

191,0

7

192,0

3

193,0

2

195,0

5

197,0

4

200,0

3

201,0

1

202,0

2

203,0

1

205,0

2

206,0

1

207,0

1

 

50

2. Для величин Х и Y составить сгруппированные ряды. На основании этих рядов построить полигоны, гистограммы относительных частот и графики эмпирических функций распределения для Х и Y

Для Х:

Число интервалов

k=1+3,322*ln(n)=1+3,322*ln(50)=6,64?7

Длина интервала hx:

hx==1,67

Число интервалов k=

7

Xmin=

81,8

Xmax=

93,5

Размах выборки Rx=

11,7

Длина интервала hx=

1,671429

=

5,2

Превышение

24,7

 

12,35

N

Границы интервалов

Частота ni

ni/n

ni/(n*hx)

nx/n

Xi сред

1

69,5

74,7

0

0,00

0,000

0,00

72,05

2

74,7

79,9

1

0,02

0,004

0,00

77,25

3

79,9

85,1

5

0,10

0,019

0,02

82,45

4

85,1

90,3

32

0,64

0,123

0,12

87,65

5

90,3

95,5

11

0,22

0,042

0,76

92,85

6

95,5

100,7

1

0,02

0,004

0,98

98,05

7

100,7

105,9

0

0,00

0,000

1,00

103,25

50

1,00

0,192

1,00

Для Y:

Число интервалов

k=1+3,322*ln(n)=1+3,322*ln(50)=6,64?7

Длина интервала hy:

hy==4,428

Число интервалов k=

7

Ymin=

176

Ymax=

207

Размах выборки Ry=

31

Длина интервала hy=

4,428571

=

5,2

Превышение

5,4

 

2,7

N

Границы интервалов

Частота ni

ni/n

ni/(n*hy)

ny/n

Yi сред

1

173,3

178,5

2

0,04

0,00769

0,00

175,9

2

178,5

183,7

3

0,06

0,01154

0,04

181,1

3

183,7

188,9

10

0,20

0,03846

0,10

186,3

4

188,9

194,1

15

0,30

0,05769

0,30

191,5

5

194,1

199,3

9

0,18

0,03462

0,60

196,7

6

199,3

204,5

6

0,12

0,02308

0,78

201,9

7

204,5

209,7

5

0,10

0,01923

0,90

207,1

50

1,00

0,19231

1,00

3. Вычислить точечные оценки: выборочные средние и ; несмещённые выборочные средние квадратичные отклонения sx и sy. Точечные оценки

Выборочное среднее по всему массиву

X

Y

88,282

192,56

Выборочное среднее по сгруппированному ряду

X

Y

88,274

192,956

Относительная ошибка

X

Y

0,01%

0,21%

Среднее кв. откл. по всему массиву

X

Y

Дисперсия: 7,395138776

Дисперсия: 53,76163265

СКО: 2,719400444

СКО: 7,332232447

Среднее кв. откл. для сгруп.-го ряда

X

Y

12,84675918

62,95353469

3,584237601

7,934326354

Для сгруппированного ряда с поправкой Шеппарда

X

Y

Дисперсия: 10,59342585

Дисперсия: 60,70020136

СКО: 3,254754346

СКО: 7,791033395

Относительная ошибка

X

Y

19,69%

6,26%

Выборочное среднее:

1. по всему массиву X=88,282, Y=192,56

2. по сгруппированному ряду X=88,274, Y=192,956

3. относительные погрешности Ex=0,01% Ey=0,21%

Среднеквадратичные отклонения

1. по всему массиву Sx= 2,719400444, Sy=7,332232447

2. по сгруппированному ряду Sx=3,584237601, Sy=7,934326354

3. относительные погрешности Esx=19,69%, Esy=6,26%

4. Проверить гипотезы о нормальном законе распределения случайных величин Х и Y при уровне значимости = 0,05

Проверяется гипотеза Н0 при альтернативе Н1:

Н0-случайная величина, подчиняется нормальному закону

Н1-случайная величина, подчиняется нормальному закону

,

Ф(zi)- функция Лапласа

p(

Для X:

N

Границы интервалов

Частота ni

Zi

Ф(Zi)

Pi

n*Pi

Критерий

1

69,5

76,8

1

-5,77

-0,4979

0,1767

8,835

6,948186

2

76,8

84,1

5

-3,53

-0,3212

0,2148

10,74

3,067747

3

84,1

91,3

24

-1,29

-0,1064

0,2544

12,72

10,00302

4

91,3

98,6

12

0,94

0,148

0,2005

10,025

0,38909

5

98,6

105,9

7

3,18

0,3485

0,1515

7,575

0,043647

 

 

 

49

+

0,5

 

 

20,45169

При заданном уровне значимости 0,95 и количестве степеней свободы 2 табличное значение(2;0,95) = 5.991, суммарная мера расхождения 20,45169 превышает данную меру расхождения, значит, данное распределение нельзя считать нормальным с уровнем доверительной вероятности 0,95.

Для Y:

N

Границы интервалов

Частота ni

Zi

Ф(Zi)

Pi

n*Pi

Критерий

1

173,3

179,54

5

-

-0,5

0,25780

12,89

4,829488

2

179,54

185,78

12

-1,72

-0,2422

0,22226

11,113

0,070797

3

185,78

192,02

16

-0,92

-0,0199

0,22874

11,437

1,820492

4

192,02

198,26

10

-0,12

0,2088

0,29120

14,56

1,428132

5

198,26

204,5

8

0,68

0,3749

0,12510

6,255

0,486815

 

 

 

51

+

0,5

 

 

8,635724

При заданной доверительной вероятности 0,95 и количестве степеней свободы 2 табличное значение(2;0,95) = 5.991, суммарная мера расхождения 8,635724 превышает данную меру расхождения, значит, данное распределение нельзя считать нормальным с уровнем доверительной вероятности 0,95. распределение квадратичный регрессия корреляция

5. Найти доверительные интервалы для M[X], M[Y], D[X], D[Y] с надёжностью = 0,95

Надежность

0,95

Уровень значимости

0,05

0,025

t крит

2,01

X->

Доверительный интервал

 

Y->

Доверительный интервал

 

87,509

< a <

89,055

190,476

< a <

194,644

c 1

71,4

c 2

32,4

X->

Доверительный интервал

 

Y->

Доверительный интервал

 

5,075

< s в квадрате <

11,184

36,895

< s в квадрате <

81,306

Для Х:

Уровень значимости б=1-г=1-0,95=0,05; б/2=0,025

Число степеней свободы n-1=50-1=49

Выборочное среднее X=88,282

Среднее квадратичное Sx=2,719400444

По таблице распределения Стьюдента t0,025-49=2,01

87,509< a <89,055

По таблице распределения ч2

71,4 32,4

5,075 <у2< 11,184

Для Y:

Уровень значимости б=1-г=1-0,95=0,05; б/2=0,025

Число степеней свободы n-1=50-1=49

Выборочное среднее Y=192,56

Среднее квадратичное Sy=7,332232447

По таблице распределения Стьюдента t0,025-49=2,01

190,476< a <194,644

По таблице распределения ч2

71,4 32,4

36,895<у2<81,306

6. Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв и проверить гипотезу об отсутствии корреляционной связи между Х и Y (о незначимости отклонения rв от нуля)

Проверяется гипотеза Н0 при альтернативе Н1:

Н0-X и Y независимы

Н1- X и Y зависимы

Корреляционная таблица

 

Y

173,3

178,5

183,7

188,9

194,1

199,3

204,5

 

Элр Yна X

X

 

178,5

183,7

188,9

194,1

199,3

204,5

209,7

Ni

x сред

Yx

69,5

74,7

0

0

0

0

0

0

0

0

72,05

0,00

74,7

79,9

0

0

0

0

0

0

0

0

77,25

0,00

79,9

85,1

1

2

1

1

1

0

0

6

82,45

185,43

85,1

90,3

0

1

9

14

7

1

1

33

87,65

191,66

90,3

95,5

0

0

1

0

1

6

3

11

92,85

201,43

95,5

100,7

0

0

0

0

0

0

0

0

98,05

0,00

100,7

105,9

0

0

0

0

0

0

0

0

103,25

0,00

 

Nj

1

3

11

15

9

7

4

50

 

 

Элр XнаY

y сред

175,9

181,1

186,3

191,5

196,7

201,9

207,1

 

 

 

Xy

82,45

84,18

87,65

87,30

87,65

92,11

91,55

 

 

 

1) Проверяемая гипотеза H0: X иY независимы

2) Конкурирующая гипотеза H1: X иY зависимы

[

)

[

]

X \ Y

176

191,5

191,5

207

81,8

87,65

17

11

5

11

22

87,65

93,5

8

14

20

14

28

25

25

50

c 2 (выч)

11,68831

ч2 выч =11,68831

Уровень значимости б=0,05

Число степеней свободы k=1

ч2 крит =3,8

ч2 выч > ч2 крит

Осуществилось маловероятное событие. Гипотеза H0 отвергается.

X и Y зависимы.

Проверка гипотезы о незначимости отклонения коэффициента корреляции от нуля:

Проверяемая гипотеза H0: генеральный коэффициент корреляции r = 0

Конкурирующая гипотеза H1: r 0

Xср

Yср

Sx

Sy

Критерий Стьюдента t

88,282

192,56

2,7194

7,332232

0,638387

5,746119729

Критерий Стьюдента t = = 5,746

Уровень значимости б = 0,05

Число степеней свободы k = n-2 = 48

По таблице распределения Стьюдента: tкр=2,01

Т.к. мы попали в критическую область, то гипотезу H0 отвергаем (по принципу практической невозможности осуществления маловероятного события, т.к. P(t > 2,01) = 0,05).

7. Найти выборочные уравнения прямых линий регрессии Y на Х и Х на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками (xi, yi), i = 1, ..., n и эмпирическими линиями регрессии

Теоретические линии регрессии Y на X:

=1,721263*x + 40,60345

Теоретические линии регрессии X на Y:

=0,236767*y + 40,60345

Т.л.р.

y на х

х на y

a=

1,721263

0,236767

b=

40,60345

42,69015

Точки:

 

 

x1

51,25

55,50307

x2

79,25

74,04846

y1

158,8931

155

y2

178,1957

183

Размещено на Allbest.ru


Подобные документы

  • Построение ряда распределения предприятий по стоимости основных производственных фондов методом статистической группировки. Нахождение средних величин и индексов. Понятие и вычисление относительных величин. Показатели вариации. Выборочное наблюдение.

    контрольная работа [120,9 K], добавлен 01.03.2012

  • Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.

    практическая работа [495,9 K], добавлен 26.11.2012

  • Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Вычисление выборочных характеристик по заданной выборке. Результаты ранжирования выборочных данных и вычисление моды и медианы. Оценка функции плотности распределения.

    курсовая работа [215,7 K], добавлен 07.02.2016

  • Законы распределения случайных величин. Закон распределения Пуассона. Свойства плотности вероятности. Критериальные случайные величины. Свойство коэффициента корреляции. Закон больших чисел и его следствия. Предельные теоремы теории вероятностей.

    курс лекций [774,3 K], добавлен 11.03.2011

  • Распределение вероятностей случайных величин. Числовые характеристики случайных величин. Смешанные начальный и центральный моменты совместного распределения совокупности случайных величин. Физический смысл понятия корреляции. Модель потока редких событий.

    лекция [429,8 K], добавлен 02.08.2009

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

    контрольная работа [59,3 K], добавлен 26.06.2009

  • Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

    реферат [162,6 K], добавлен 04.06.2010

  • Выборочное наблюдение как метод статистического исследования, его особенности. Случайный, механический, типический и серийный виды отбора при образовании выборочных совокупностей. Понятие и причины возникновения ошибки выборки, методы ее определения.

    реферат [21,1 K], добавлен 04.06.2010

  • Средние величины в экономическом анализе. Общее понятие о степенных и структурных средних. Свойства средней арифметической величины. Расчеты, необходимые для нахождения параметров регрессии. Линейный коэффициент корреляции. Определение медианы и моды.

    курсовая работа [165,9 K], добавлен 12.03.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.