Бизнес-аналитика и статистика

Построение уравнения тренда методами регрессионного анализа. Определение величины остаточной дисперсии и коэффициентов корреляции. Построение уравнения регрессии разными способами, сравнительная характеристика полученных оценок и построенных графиков.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 10.03.2016
Размер файла 459,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

УФИМСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра автоматизированных систем управления

Курсовое проектирование

по дисциплине «Бизнес-аналитика и статистика»

Выполнил: Нафикова Л.И.

Уфа-2014 г.

ИСХОДНЫЕ ДАННЫЕ

Таблица 1. Исходные данные

N

X

Y

Z

G

1

44

-8

-75

60

2

48

-9

-127

54

3

16

0

4

53

4

46

-11

-10

48

5

38

-6

-75

49

6

0

6

48

49

7

47

-9

-130

55

8

23

-1

-57

61

9

6

2

-102

72

10

5

3

-101

77

11

26

-4

-115

65

12

18

1

-60

69

13

21

-2

-110

73

14

5

3

14

67

15

43

-9

-159

65

16

21

-2

-25

56

17

27

-3

-22

60

18

6

2

-75

72

19

36

-6

-106

67

20

44

-8

-135

77

21

37

-7

68

82

22

42

-9

117

88

23

25

-2

-100

92

24

49

-10

-64

92

25

7

3

-36

81

26

24

-2

27

81

27

15

0

-3

78

28

41

-8

-10

74

29

28

-4

-74

69

30

32

-5

-11

74

31

5

3

-104

80

32

26

-4

-58

82

Итого

26,6129

-3,29032

-50,1333

69,4375

Задача 1.

Вычислите показатели вариации по каждой из выборок X, Y, Z:

- среднее арифметическое;

- моду;

- медиану;

- размах вариации;

- дисперсию;

- стандартное отклонение;

- среднее линейное отклонение;

- коэффициенты осцилляции и вариации.

Решение

Таблица 2. Расчет среднего значения

N

X

Y

Z

1

44

-8

-75

2

48

-9

-127

3

16

0

4

4

46

-11

-10

5

38

-6

-75

6

0

6

48

7

47

-9

-130

8

23

-1

-57

9

6

2

-102

10

5

3

-101

11

26

-4

-115

12

18

1

-60

13

21

-2

-110

14

5

3

14

15

43

-9

-159

16

21

-2

-25

17

27

-3

-22

18

6

2

-75

19

36

-6

-106

20

44

-8

-135

21

37

-7

68

22

42

-9

117

23

25

-2

-100

24

49

-10

-64

25

7

3

-36

26

24

-2

27

27

15

0

-3

28

41

-8

-10

29

28

-4

-74

30

32

-5

-11

31

5

3

-104

32

26

-4

-58

Итого

26,6129

-3,29032

-50,1333

1) Среднее арифметическое:

;

(X) ==0,83

(Y) ==-0,10

(Z) ==1,56

Таблица 3

Исходные данные в порядке возрастания

Мода

Mo = .

Mo (X) = 16

Mo (Y) = - (нет данных)

Mo (Z) = -16

Медиана:

Ме=

, если n - нечетное

, если n - четное

Так как объем выборки равен 32, то берем среднее арифметическое двух центральных значений: № 16 и № 17

Mе (X) = =22

Mе (Y) = = -184,5

Mе (Z) = =13,5

Размах вариации.

R= xmax -xmin.

X

Y

Z

xmax

45

-58

57

xmin

6

-421

-16

R(X) = 45-6=39

R(Y) =-58-(-421)=363

R(Z) = 57-(-16)=73

Дисперсия

Таблица 4. Расчет исходных данных дисперсии

N

X

Y

Z

(Xi-Xср)

(Xi-Xср)^2

(Yi-Yср)

(Yi-Yср)^2

(Zi-Zср)

(Zi-Zср)^2

1

44

-8

-75

17,41

302,98

-4,69

21,97

-22,94

526,13

2

48

-9

-127

21,41

458,23

-5,69

32,35

-74,94

5615,63

3

16

0

4

-10,59

112,23

3,31

10,97

56,06

3143,00

4

46

-11

-10

19,41

376,60

-7,69

59,10

42,06

1769,25

5

38

-6

-75

11,41

130,10

-2,69

7,22

-22,94

526,13

6

0

6

48

-26,59

707,23

9,31

86,72

100,06

10012,50

7

47

-9

-130

20,41

416,42

-5,69

32,35

-77,94

6074,25

8

23

-1

-57

-3,59

12,92

2,31

5,35

-4,94

24,38

9

6

2

-102

-20,59

424,10

5,31

28,22

-49,94

2493,75

10

5

3

-101

-21,59

466,29

6,31

39,85

-48,94

2394,88

11

26

-4

-115

-0,59

0,35

-0,69

0,47

-62,94

3961,13

12

18

1

-60

-8,59

73,85

4,31

18,60

-7,94

63,00

13

21

-2

-110

-5,59

31,29

1,31

1,72

-57,94

3356,75

14

5

3

14

-21,59

466,29

6,31

39,85

66,06

4364,25

15

43

-9

-159

16,41

269,17

-5,69

32,35

#####

11435,63

16

21

-2

-25

-5,59

31,29

1,31

1,72

27,06

732,38

17

27

-3

-22

0,41

0,17

0,31

0,10

30,06

903,75

18

6

2

-75

-20,59

424,10

5,31

28,22

-22,94

526,13

19

36

-6

-106

9,41

88,48

-2,69

7,22

-53,94

2909,25

20

44

-8

-135

17,41

302,98

-4,69

21,97

-82,94

6878,63

21

37

-7

68

10,41

108,29

-3,69

13,60

120,06

14415,00

22

42

-9

117

15,41

237,35

-5,69

32,35

169,06

28582,13

23

25

-2

-100

-1,59

2,54

1,31

1,72

-47,94

2298,00

24

49

-10

-64

22,41

502,04

-6,69

44,72

-11,94

142,50

25

7

3

-36

-19,59

383,92

6,31

39,85

16,06

258,00

26

24

-2

27

-2,59

6,73

1,31

1,72

79,06

6250,88

27

15

0

-3

-11,59

134,42

3,31

10,97

49,06

2407,13

28

41

-8

-10

14,41

207,54

-4,69

21,97

42,06

1769,25

29

28

-4

-74

1,41

1,98

-0,69

0,47

-21,94

481,25

30

32

-5

-11

5,41

29,23

-1,69

2,85

41,06

1686,13

31

5

3

-104

-21,59

466,29

6,31

39,85

-51,94

2697,50

32

26

-4

-58

-0,59

0,35

-0,69

0,47

-5,94

35,25

Итого

851

-106

-1666

7175,72

686,88

128733,88

Среднее значение

26,59

-3,31

-52,06

D(X)==231,47

D(Y)= =22,15

D(Z)==4152,70

Стандартное отклонение

=

==15,21

==4,70.

==64,44.

Среднее линейное отклонение

Таблица 5. Расчет среднего линейного отклонения

N

X

Y

Z

Xi-Xср

|Xi-Xср|

Yi-Yср

|Yi-Yср|

Zi-Zср

|Zi-Zср|

1

44

-8

-75

17,41

17,41

-4,69

4,69

-22,94

22,94

2

48

-9

-127

21,41

21,41

-5,69

5,69

-74,94

74,94

3

16

0

4

-10,59

10,59

3,31

3,31

56,06

56,06

4

46

-11

-10

19,41

19,41

-7,69

7,69

42,06

42,06

5

38

-6

-75

11,41

11,41

-2,69

2,69

-22,94

22,94

6

0

6

48

-26,59

26,59

9,31

9,31

100,06

100,06

7

47

-9

-130

20,41

20,41

-5,69

5,69

-77,94

77,94

8

23

-1

-57

-3,59

3,59

2,31

2,31

-4,94

4,94

9

6

2

-102

-20,59

20,59

5,31

5,31

-49,94

49,94

10

5

3

-101

-21,59

21,59

6,31

6,31

-48,94

48,94

11

26

-4

-115

-0,59

0,59

-0,69

0,69

-62,94

62,94

12

18

1

-60

-8,59

8,59

4,31

4,31

-7,94

7,94

13

21

-2

-110

-5,59

5,59

1,31

1,31

-57,94

57,94

14

5

3

14

-21,59

21,59

6,31

6,31

66,06

66,06

15

43

-9

-159

16,41

16,41

-5,69

5,69

-106,94

106,94

16

21

-2

-25

-5,59

5,59

1,31

1,31

27,06

27,06

17

27

-3

-22

0,41

0,41

0,31

0,31

30,06

30,06

18

6

2

-75

-20,59

20,59

5,31

5,31

-22,94

22,94

19

36

-6

-106

9,41

9,41

-2,69

2,69

-53,94

53,94

20

44

-8

-135

17,41

17,41

-4,69

4,69

-82,94

82,94

21

37

-7

68

10,41

10,41

-3,69

3,69

120,06

120,06

22

42

-9

117

15,41

15,41

-5,69

5,69

169,06

169,06

23

25

-2

-100

-1,59

1,59

1,31

1,31

-47,94

47,94

24

49

-10

-64

22,41

22,41

-6,69

6,69

-11,94

11,94

25

7

3

-36

-19,59

19,59

6,31

6,31

16,06

16,06

26

24

-2

27

-2,59

2,59

1,31

1,31

79,06

79,06

27

15

0

-3

-11,59

11,59

3,31

3,31

49,06

49,06

28

41

-8

-10

14,41

14,41

-4,69

4,69

42,06

42,06

29

28

-4

-74

1,41

1,41

-0,69

0,69

-21,94

21,94

30

32

-5

-11

5,41

5,41

-1,69

1,69

41,06

41,06

31

5

3

-104

-21,59

21,59

6,31

6,31

-51,94

51,94

32

26

-4

-58

-0,59

0,59

-0,69

0,69

-5,94

5,94

Итого

851

-106

-1666

406,19

128,00

1675,63

Среднее значение

26,59

-3,31

-52,06

12,69

4,00

52,36

(X)= 12,69

(Y)== 4

(Z)== 52,36

Относительные показатели вариации вычисляют как отношение абсолютного показателя к среднему значению, выраженное в процентах.

Коэффициент осцилляции:

VR(X) ==146,65%

VR(Y) == -10958,49%

VR(Z) == -140,22%

Линейный коэффициент вариации:

Vd(X) ==47,73%

Vd (Y) == -120,75%

Vd (Z) == 114,71%

Коэффициент вариации:

Vd(X) ==47,75%

Vd (Y) == -53,49%

Vd (Z) == 139,84%

Выборка считается однородной, если V < 30 %.

Выборка в данном случае ни для одного из показателей X, Y, Z не является однородной.

Задача 2.

По каждой из выборок X, Y, Z:

- проведите группировку данных по интервалам равной длины;

- составьте вариационный ряд;

- вычислите относительные частоты и накопленные частости;

- постройте полигон, гистограмму и кумуляту;

- нанесите на график кумуляты график накопленных частот без группировки.

Решение

Сгруппируем данные. Расположив их в порядке возрастания, и подсчитав, сколько раз встречалось каждое значение признака, получим следующее статистическое распределение в табличном виде.

Таблица 6. Статистическое распределение данных

Xi

ni

Yi

ni

Zi

ni

6

1

-421

1

-16

2

9

2

-420

1

-15

1

12

2

-376

1

-14

1

14

2

-373

1

-8

2

15

1

-359

1

-6

1

16

3

-347

1

-5

1

17

2

-317

1

2

2

21

1

-308

1

4

1

22

3

-305

1

5

1

24

2

-264

1

8

1

26

1

-251

1

10

1

29

1

-248

1

11

1

30

1

-225

1

13

1

32

2

-223

1

14

1

33

1

-217

1

17

2

37

1

-195

1

24

2

40

1

-174

1

25

2

41

2

-171

1

27

1

43

1

-166

1

28

2

45

2

-151

1

31

1

-137

1

34

1

-134

1

39

1

-124

1

43

1

-121

1

49

1

-115

1

57

1

-103

1

-94

1

-84

1

-80

1

-69

1

-59

1

-58

1

Признак X принимает любые значения от 6 до 45, признак Y принимает значения от -421 до -58, признак Z принимает значения от -16 до 57.

Ориентировочное число интервалов группирования определим по формуле Стерджесса:

k = 1 + 3,32?lg n,

где k - число групп;

n - объем выборки (число единиц совокупности).

k = 1 + 3,32?lg 32=1 +4,997=5,997.

Разобьем весь интервал на 6 интервалов одинаковой длиной:

для признака X интервал равен:

h = (45-6)/6 = 6,5

для признака Y интервал равен:

h = (-58-(-421))/6 = 60,5

для признака Z интервал равен:

h = (57-(-16))/6 = 12,7

и подсчитаем, сколько значений признака попадает в каждый частичный интервал (значения, совпадающие с граничными, будем относить к левому интервалу). Статистическое распределение частот оказывается следующим в табличном виде.

Частости - относительные частоты, выраженные в процентах:

ni (%) =*100%.

Накопленные (кумулятивные) частости:

Ki=.

Для значений X интервалы выглядят следующим образом: [6 .. 12,5], (12,5 .. 19], (19 .. 25,5], (25,5 .. 32], (32 .. 38,5] и (38,5 .. 45] (табл. 7, 8).

Таблица 7. Группировка данных

Группы X

Xi

ni

Группы Y

Yi

ni

Группы Z

Zi

ni

[6 .. 12,5]

6

1

[-421 .. -360,5]

-421

1

[-16 .. -3,83]

-16

2

9

2

-420

1

-15

1

12

2

-376

1

-14

1

(12,5 .. 19]

14

2

-373

1

-8

2

15

1

(-360,5 .. -300]

-359

1

-6

1

16

3

-347

1

-5

1

17

2

-317

1

(-3,83 .. 8,33]

2

2

(19 .. 25,5]

21

1

-308

1

4

1

22

3

-305

1

5

1

24

2

(-300 .. -239,5]

-264

1

8

1

(25,5 .. 32]

26

1

-251

1

(8,33 .. 20,50]

10

1

29

1

-248

1

11

1

30

1

(-239,5 .. -179]

-225

1

13

1

32

2

-223

1

14

1

(32 .. 38,5]

33

1

-217

1

17

2

37

1

-195

1

(20,50 .. 32,67]

24

2

(38,5 .. 45]

40

1

(-179 .. -118,5]

-174

1

25

2

41

2

-171

1

27

1

43

1

-166

1

28

2

45

2

-151

1

31

1

-137

1

(32,67 .. 44,83]

34

1

-134

1

39

1

-124

1

43

1

-121

1

(44,83 .. 57]

49

1

(-118,5 .. -58]

-115

1

57

1

-103

1

-94

1

-84

1

-80

1

-69

1

-59

1

-58

1

Таблица 8. Группировка данных X

xi

ni

ni, %

Ki, %

6;

12,5

5

15,625

15,63

12,5;

19

8

25

40,63

19;

25,5

6

18,75

59,38

25,5;

32

5

15,625

75,00

32;

38,5

2

6,25

81,25

38,5;

45

6

18,75

100

У

32

100

-

Рисунок 1 - График кумуляты X

Для значений Y интервалы выглядят следующим образом:

[-421 .. -360,5], (-360,5 .. -300], (-300 .. -239,5], (-239,5 .. -179], (-179 .. -118,5] и (-118,5 .. -58] (табл. 9).

Таблица 9. Группировка данных Y

Yi

ni

ni, %

Ki, %

-421;

-360,5

4

12,5

12,50

-360,5;

-300,0

5

15,625

28,13

-300,0;

-239,5

3

9,375

37,50

-239,5;

-179,0

4

12,5

50,00

-179,0;

-118,5

8

25

75,00

-118,5;

-58,0

8

25

100

У

32

100

-

Рисунок 2 - График кумуляты Y

Для значений Z интервалы выглядят следующим образом: [-16 .. -3,83], (-3,83 .. 8,33], (8,33 .. 20,50], (20,50 .. 32,67], (32,67 .. 44,83] и (44,83 .. 57] (табл.).

Таблица 10. Группировка данных Z

Zi

ni

ni, %

Ki, %

-16;

-3,83

8

25,00

25,00

-3,83;

8,33

5

15,63

40,63

8,33;

20,50

6

18,75

59,38

20,50;

32,67

8

25,00

84,38

32,67;

44,83

3

9,38

93,75

44,83;

57,00

2

6,25

100

У

32

100

-

Рисунок 3 - График кумуляты Z

Гистограмма - столбиковая диаграмма частот. Основание каждого прямоугольника соответствует интервалу группировки. Высота столбика - частость.

Рисунок 4 - Гистограмма группировки X

Рисунок 5 - Гистограмма группировки Y

Рисунок 6 - Гистограмма группировки Z

Полигон частот - изображение вариационного ряда с помощью ломаной линии. Для построения полигона достаточно соединить отрезками прямых линий верхние стороны прямоугольников (рис. 1, 2, 3).

Рисунок 9 - Полигон распределения группировки X

Рисунок 10 - Полигон распределения группировки Y

Рисунок 11 - Полигон распределения группировки Z

Таблица 11. Накопленные частоты

Группы X

Xi

ni

ni, %

Ki, %

Группы Y

Yi

ni

ni, %

Ki, %

Группы Z

Zi

ni

ni, %

Ki, %

[6 .. 12,5)

6

1

3,13

3,13

[-421 .. -360,5)

-421

1

3,13

3,13

[-16 .. -3,83)

-16

2

6,25

6,25

9

2

6,25

9,38

-420

1

3,13

6,25

-15

1

3,13

9,38

12

2

6,25

15,63

-376

1

3,13

9,38

-14

1

3,13

12,50

(12,5 .. 19]

14

2

6,25

21,88

-373

1

3,13

12,50

-8

2

6,25

18,75

15

1

3,13

25,00

(-360,5 .. -300]

-359

1

3,13

15,63

-6

1

3,13

21,88

16

3

9,38

34,38

-347

1

3,13

18,75

-5

1

3,13

25,00

17

2

6,25

40,63

-317

1

3,13

21,88

(-3,83 .. 8,33]

2

2

6,25

31,25

(19 .. 25,5]

21

1

3,13

43,75

-308

1

3,13

25,00

4

1

3,13

34,38

22

3

9,38

53,13

-305

1

3,13

28,13

5

1

3,13

37,50

24

2

6,25

59,38

(-300 .. -239,5]

-264

1

3,13

31,25

8

1

3,13

40,63

(25,5 .. 32]

26

1

3,13

62,50

-251

1

3,13

34,38

(8,33 .. 20,50]

10

1

3,13

43,75

29

1

3,13

65,63

-248

1

3,13

37,50

11

1

3,13

46,88

30

1

3,13

68,75

(-239,5 .. -179]

-225

1

3,13

40,63

13

1

3,13

50,00

32

2

6,25

75,00

-223

1

3,13

43,75

14

1

3,13

53,13

(32 .. 38,5]

33

1

3,13

78,13

-217

1

3,13

46,88

17

2

6,25

59,38

37

1

3,13

81,25

-195

1

3,13

50,00

(20,50 .. 32,67]

24

2

6,25

65,63

(38,5 .. 45]

40

1

3,13

84,38

(-179 .. -118,5]

-174

1

3,13

53,13

25

2

6,25

71,88

41

2

6,25

90,63

-171

1

3,13

56,25

27

1

3,13

75,00

43

1

3,13

93,75

-166

1

3,13

59,38

28

2

6,25

81,25

45

2

6,25

100,00

-151

1

3,13

62,50

31

1

3,13

84,38

32

100

-137

1

3,13

65,63

(32,67 .. 44,83]

34

1

3,13

87,50

-134

1

3,13

68,75

39

1

3,13

90,63

-124

1

3,13

71,88

43

1

3,13

93,75

-121

1

3,13

75,00

(44,83 .. 57]

49

1

3,13

96,88

(-118,5 .. -58]

-115

1

3,13

78,13

57

1

3,13

100,00

-103

1

3,13

81,25

32

100,00

-94

1

3,13

84,38

-84

1

3,13

87,50

-80

1

3,13

90,63

-69

1

3,13

93,75

-59

1

3,13

96,88

-58

1

3,13

100,00

Кумулята - изображение накопленных частостей, обычно в виде ломаной линии. По существу, кумулята - это интеграл от гистограммы (рис.4, 5, 6).

Рисунок 12. Кумулята X

Рисунок 13. Кумулята Y

Рисунок 14. Кумулята Z

Задача 3.

По сгруппированным данным и графикам определите:

- среднее арифметическое;

- моду;

- медиану.

Сравните результаты с решением Задачи 1.

Решение

При расчетах по группированным данным учитывается относительная частота появления каждого варианта (табл.12). Среднее значение - средняя арифметическая взвешенная:

Таблица 12. Расчет среднего значения по группированным данным выборки X

xi

ni

?ni

[6 .. 12,5)

9,25

5

46,25

(12,5 .. 19]

15,75

8

126

(19 .. 25,5]

22,25

6

133,5

(25,5 .. 32]

28,75

5

143,75

(32 .. 38,5]

35,25

2

70,5

(38,5 .. 45]

41,75

6

250,5

У

-

32

770,5

=770,5/32=24,08

Таблица 13. Расчет среднего значения по группированным данным выборки Y

yi

ni

?ni

[-421 .. -360,5)

-390,75

4

-1563

(-360,5 .. -300]

-330,25

5

-1651,3

(-300 .. -239,5]

-269,75

3

-809,25

(-239,5 .. -179]

-209,25

4

-837

(-179 .. -118,5]

-148,75

8

-1190

(-118,5 .. -58]

-88,25

8

-706

У

-

32

-6756,5

=-6756,5/32= -211,14

Таблица 14. Расчет среднего значения по группированным данным выборки Z

zi

ni

?ni

[-16 .. -3,83)

-9,92

8

-79,333

(-3,83 .. 8,33]

2,25

5

11,25

(8,33 .. 20,50]

14,42

6

86,5

(20,50 .. 32,67]

26,58

8

212,667

(32,67 .. 44,83]

38,75

3

116,25

(44,83 .. 57]

50,92

2

101,833

У

-

32

449,167

=449,167/32=14,04

В качестве среднего значения по интервалам ,, приближенно принят центр интервала группирования.

Мода - это координата основания самого высокого столбика гистограммы, т.е. модального интервала. Распределение может иметь несколько мод. В качестве оценки моды используют не середину модального интервала, а скорректированное значение.

Медиана определяется как 50 %-й квантиль (рис. 7, 8, 9). Это аргумент функции распределения, при котором вероятность равна 0,5 = 50 %:

Me: F(Me) = 0,5 = 50%;

Me = F-1(0,5).

Медиана делит упорядоченную совокупность пополам.

Рисунок 15. Графическое определение медианы (x)

Рисунок 16. Графическое определение медианы (y)

Рисунок 17. Графическое определение медианы (z)

Из графиков найдем для группировки X:

=16,5, =22 (в задаче 1 получено Mo (X) = 16 Mе (X) =22), т.е. практически сходится с решением, полученным без группировки исходных данных.

для группировки Y:

=-(нет данных), =-247,2

(в задаче 1 получено Mo (X) = - (нет данных), Mе (Y) = -184,5). В данном случае имеется расхождение с данными (медиана), полученными при решении без группировки исходных данных по формулам. В данном случае группировка данных помогла выявить влияние отдельных единиц на средние итоговые показатели.

для группировки Z:

=-16, =24,5, = 14,4 (в задаче 1 получено Mo (Z) = -16, Mе (Z) = 13,5), т.е. практически сходится с решением, полученным без группировки исходных данных с учетом погрешности.

Задача 4.

Постройте корреляционное поле. Проведите группировку Y и Z , используя X как группировочный признак. Вычислите условные средние x, x. Нанесите линию эмпирической регрессии на корреляционное поле.

Решение

Корреляционное поле (поле корреляции, диаграмма рассеяния) - это графическое изображение исходных данных.

Рисунок 18 Корреляционное поле {xi , yi}

Рисунок 19 Корреляционное поле {xi , zi}

Условное среднее значение - это среднее значение одного признака при условии, что другой признак принимает заранее заданное фиксированное значение:

При вычислении условных средних значений подсчитывают средние x и x для каждой группы единиц в зависимости от значения группировочного признака х (табл.15).

Таблица 15. Условные средние

xi

i

ni

? y j

x

? z j

x

[6 .. 12,5)

9,25

5

-1590

-397,5

-64

-8,0

(12,5 .. 19]

15,75

8

-1636

-327,2

19

3,8

(19 .. 25,5]

22,25

6

-763

-254,3

65

10,8

(25,5 .. 32]

28,75

5

-860

-215,0

135

16,9

(32 .. 38,5]

35,25

2

-1178

-147,3

116

38,7

(38,5 .. 45]

41,75

6

-662

-82,8

106

53,0

У

-

32

-6689

-1424,0

115,2

На поле корреляции наносят линию условного среднего (эмпирической регрессии). Для этого наносят точки с координатами {i, xi} и соединяют их отрезками прямых линий (рис.12).

Рисунок 20 Поле корреляции и эмпирическая регрессия

Рисунок 21 Поле корреляции и эмпирическая регрессия

По внешнему виду графика можно выявить возможный характер взаимосвязи между признаками и оценить погрешность построения уравнения регрессии.

Задача 5.

Найдите предельную ошибку выборки X, Y, Z; постройте доверительные интервалы для среднего, дисперсии и стандартного отклонения генеральной совокупности при доверительной вероятности р = 68 %; 95 %; 99,7 %.

Решение.

Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения µx , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и математическим ожиданием (генеральным средним) называется ошибкой выборки:

=|-|.

Ошибка выборочного наблюдения пропорциональна стандартному отклонению и обратно пропорциональна квадратному корню из объема выборки:

=t•=t•.

Стандартное отклонение выборочного среднего составляет:

= .

=

=

=

Коэффициент доверия t находят по распределению Стьюдента (табл. 16) с учетом объема выборки и заданного значения доверительной вероятности:

t=t.

Таблица 16 Процентные точки распределения Стьюдента t(n, p) и нормального распределения

p

n

0,5

0,6

0,7

0,8

0,9

0,95

0,99

0,999

5

0

0,2672

0,5594

0,9195

1,4759

2,015

3,3649

5,8934

10

0

0,2602

0,5415

0,8791

1,3722

1,8125

2,7638

4,1437

20

0

0,2567

0,5329

0,86

1,3253

1,7247

2,528

3,5518

30

0

0,2556

0,53

0,8538

1,3104

1,6973

2,4573

3,3852

40

0

0,255

0,5286

0,8507

1,3031

1,6839

2,4233

3,3069

50

0

0,2547

0,5278

0,8489

1,2987

1,6759

2,4033

3,2614

100

0

0,254

0,5261

0,8452

1,2901

1,6602

2,3642

3,1737

1000

0

0,2534

0,5246

0,842

1,2824

1,6464

2,3301

3,0984

z

0

0,2533

0,5244

0,8416

1,2816

1,6449

2,3263

3,0902

Для симметричного распределения достаточно определить одно значение квантиля, например, для верхней границы доверительного интервала. Противоположная граница симметрична относительно точки {0; 0,5}:

t=-t.

t= t1+ (t2-t1) / (p2-p1) * (p-p1)

Найдем предельные ошибки выборки используя таблицу распределения Стьюдента.

Коэффициенты доверия по распределению Стьюдента:

При р=68%

При р=95%

При р=0,997

Предельные ошибки выборки:

Доверительный интервал для генерального среднего:

-t•+ t•.

Значение t определяет, «сколько сигм» нужно взять для построения доверительного интервала.

При р=68%

x

y

z

При р=95%

x

y

z

При р=99,7%

x

y

z

При использовании табулированного распределения приходится проводить интерполяцию, т.е. находить приближенное значение функции между известными точками.

Исходные данные для интерполяции:

t1( p1) и t2( p2).

Требуется найти значение t между точками p1 и p2 :

t(p): p1 < p< p2.

Искомое значение t для заданного p находим по формуле:

t= t1+•(p-p1).

Интерполяция может проводиться дважды - по p, затем по n.

Доверительный интервал для генеральной дисперсии:

где - выборочная дисперсия;

- квантиль распределения Пирсона (табл. 17).

Квантили распределения Пирсона:

Доверительный интервал для генеральной дисперсии:

При р=68%

При р=95%

При р=99,7%

Доверительный интервал для среднеквадратичного отклонения:

При р=68%

При р=95%

При р=99,7%

Задача 6.

Постройте доверительные интервалы для генерального среднего µx , µy и µz при доверительной вероятности р = 68 %; 95 %; 99,7 % упрощенным способом: «одна/две/три сигмы».

Решение

=

=

=

Величину коэффициента t выбираем для «стандартных» значений вероятности (табл. 17).

Таблица 17. Процентные точки распределения 2n

p

n

5

10

20

30

40

50

100

0,001

0,2102

1,478

5,921

11,58

17,91

24,67

61,92

0,010

0,5543

2,558

8,260

14,95

22,16

29,70

70,07

0,050

1,145

3,940

10,85

18,49

26,50

34,76

77,93

0,100

1,610

4,865

12,44

20,59

29,05

37,68

82,36

0,200

2,342

6,179

14,57

23,36

32,34

41,44

87,95

0,300

2,999

7,267

16,26

25,50

34,87

44,31

92,13

0,400

3,655

8,295

17,80

27,44

37,13

46,86

95,81

0,500

4,351

9,341

19,33

29,33

39,33

49,33

99,33

0,600

5,131

10,47

20,95

31,31

41,62

51,89

102,9

0,700

6,064

11,78

22,77

33,53

44,16

54,72

106,9

0,800

7,289

13,44

25,03

36,25

47,26

58,16

111,7

0,900

9,236

15,98

28,41

40,25

51,80

63,16

118,5

0,950

11,07

18,30

31,41

43,77

55,75

67,50

124,3

0,990

15,08

23,20

37,56

50,89

63,69

76,15

135,8

0,999

20,51

29,58

45,31

59,70

73,40

86,66

149,4

Подставляем в доверительный интервал, получаем приближенные границы доверительных интервалов:

р=68%

р=95%

р=99,7%

Форма распределения Стьюдента приближается к нормальному распределению при большом объеме выборки, начиная с нескольких десятков единиц. При этом погрешность от замены распределения Стьюдента нормальным не превышает единиц процентов.

Таблица 18. Стандартные квантили нормального распределения

Вероятность (округленно)

Вероятность

Коэффициент доверия

Ошибка выборки

Доверительный интервал

68 %

0,682689

1,000

одна сигма

µ = ±у

95 %

0,954500

2,000

две сигмы

µ = ±2у

99,7 %

0,997300

3,000

три сигмы

µ = ±3у

Таким образом, получаем приближенные границы доверительных интервалов:

p = 68%: µ = ±у; -у?µ?+у

p = 95%: µ = ±2у; -2у?µ ? +2у

p = 99,7%: µ = ±3у; -3у?µ?+3у

Таблица 19. Доверительные интервалы для генерального среднего мY

P

t

мX

мY

мZ

68%

22,39

26,49

-228,80

-189,26

10,56

17,50

95%

20,34

28,54

-248,57

-169,50

7,09

20,97

99,70%

18,29

30,59

-268,33

-149,73

3,63

24,44

Задача 7

При уровне значимости б = 32%; 5%; 0,3% проверьте гипотезы:

у2x = у2y;

µx = +5;

µx = µy.

Решение

Сравнение дисперсий

При заданном уровне значимости б должно выполняться следующее неравенство:

В табл. 20 приводится верхняя половина распределения.

Таблица 20. Процентные точки распределения Фишера для выборок равного объема: n1=n2

p

n

0,5

0,6

0,7

0,8

0,9

0,95

0,99

0,999

5

1,0

1,2692

1,641

2,2275

3,453

5,0503

10,967

29,752

10

1,0

1,1787

1,4061

1,7316

2,3226

2,9782

4,8491

8,7539

20

1,0

1,1216

1,2684

1,4656

1,7938

2,1242

2,9377

4,29

30

1,0

1,0978

1,2132

1,3641

1,6065

1,8409

2,386

3,2171

40

1,0

1,084

1,1817

1,3076

1,5056

1,6928

2,1142

2,7268

50

1,0

1,0747

1,1608

1,2706

1,4409

1,5995

1,949

2,4413

=0,721

=0,511

=0,371

Распределение Фишера для уровней значимости б=32%; 5%; 0,3%:

Уровни значимости б

32%

0,721

1,387

0,0108

5%

0,511

1,956

0,0108

0,30%

0,371

2,693

0,0108

- гипотеза не верна при 32%;

- гипотеза не верна при 5%;

- гипотеза не верна при 0,3%.

Проверка гипотезы о среднем значении :

Н0: µ 1 = A.

Рассмотрим случайную величину

.

Для проверки вычислим фактическую t - статистику:

tфакт.=

tкр=;

- гипотезу отвергаем при 32%.

- гипотезу отвергаем при 5%.

- гипотезу отвергаем при 0,3%.

Проверка гипотезы о среднем значении

б

tкр.

Сравнение

tфакт.

0,32

2,1146

<

7,0888

0,05

4,3988

<

7,0888

0,003

6,6777

<

7,0888

Из расчетов видно, что для всех уровней значимости б=32%; 5%; 0,3% tфакт> tкр, следовательно гипотезу отвергаем.

Гипотеза о равенстве средних мx = мy.

H0: µ12 или µ12 =0.

Гипотеза о равенстве средних отвергается, если фактическая статистика больше табличной:

|tфакт|>tтабл.

При изучении выборочных оценок используется распределение Стьюдента с числом степеней свободы df=n1+n2-2:

При 32%

> - значит, гипотезу отвергаем.

При 5%:

> - значит, гипотезу отвергаем.

При 0,3%:

> - значит, гипотезу отвергаем.

Сравнение средних

б

tкр.

Сравнение

tфакт.

0,32

1,444

<

28,25

0,05

2,320

<

28,25

0,003

3,334

<

28,25

Из расчетов видно, что для всех уровней значимости б=32%; 5%; 0.3% tфакт> tкр , следовательно гипотезу отвергаем.

Задача 8.

Вычислите линейные коэффициенты корреляции rух и rzх. Сделайте вывод о тесноте линейной связи между признаками.

Решение

Линейный коэффициент корреляции вычисляется следующим образом:

=

Таблица 21. Расчет показателей для коэффициента корреляции rух

N

Xi

Yi

X2

XY

Y2

1

16

-134

256

-2144

17956

2

22

-174

484

-3828

30276

3

17

-124

289

-2108

15376

4

22

-171

484

-3762

29241

5

12

-94

144

-1128

8836

6

22

-195

484

-4290

38025

7

9

-69

81

-621

4761

8

45

-421

2025

-18945

177241

9

29

-251

841

-7279

63001

10

40

-373

1600

-14920

139129

11

41

-308

1681

-12628

94864

12

16

-151

256

-2416

22801

13

32

-264

1024

-8448

69696

14

33

-305

1089

-10065

93025

15

6

-59

36

-354

3481

16

26

-217

676

-5642

47089

17

24

-225

576

-5400

50625

18

15

-84

225

-1260

7056

19

37

-347

1369

-12839

120409

20

17

-121

289

-2057

14641

21

12

-103

144

-1236

10609

22

21

-166

441

-3486

27556

23

14

-115

196

-1610

13225

24

14

-80

196

-1120

6400

25

9

-58

81

-522

3364

26

32

-317

1024

-10144

100489

27

24

-223

576

-5352

49729

28

43

-420

1849

-18060

176400

29

41

-359

1681

-14719

128881

30

45

-376

2025

-16920

141376

31

30

-248

900

-7440

61504

32

16

-137

256

-2192

18769

итого

782

-6689

23278

-202935

1785831

среднее значение

24,44

-209,03

727,44

-6341,72

55807,22

=-0,95136

Отрицательная (обратная) зависимость.

|rxy|>0,7 - существенная линейная зависимость

Таблица 22. Расчет показателей для коэффициента корреляции и rzх

N

Xi

Zi

X2

XZ

Z2

1

16

11

256

176

121

2

22

28

484

616

784

3

17

10

289

170

100

4

22

17

484

374

289

5

12

-16

144

-192

256

6

22

-15

484

-330

225

7

9

2

81

18

4

8

45

57

2025

2565

3249

9

29

31

841

899

961

10

40

43

1600

1720

1849

11

41

28

1681

1148

784

12

16

-16

256

-256

256

13

32

2

1024

64

4

14

33

49

1089

1617

2401

15

6

8

36

48

64

16

26

13

676

338

169

17

24

17

576

408

289

18

15

-8

225

-120

64

19

37

-14

1369

-518

196

20

17

4

289

68

16

21

12

24

144

288

576

22

21

27

441

567

729

23

14

39

196

546

1521

24

14

-5

196

-70

25

25

9

5

81

45

25

26

32

14

1024

448

196

27

24

25

576

600

625

28

43

24

1849

1032

576

29

41

34

1681

1394

1156

30

45

25

2025

1125

625

31

30

-6

900

-180

36

32

16

-8

256

-128

64

итого

782

449

23278

14480

18235

среднее значение

24,44

14,03

727,44

452,50

569,84

= 0,48178

Положительная (прямая) зависимость.

0<|ryx|<1 - линейная зависимость на фоне случайных отклонений.

Задача 9.

Вычислите коэффициенты корреляции рангов Спирмена и Кендалла Y(X) и Z(X). Сделайте вывод о тесноте связи.

Решение

Для вычисления коэффициентов корреляции рангов Спирмена исходные данные ранжируют, т.е. расставляют по порядку возрастания/убывания. Рангом является порядковый номер.

Коэффициент корреляции рангов Спирмена.

, -1? ? +1.

где di = R(Xl) -R(yt) - разность рангов X и Y;

n - число наблюдений (число пар, число разностей рангов);

6 - число шесть (не путать с сигмой!).

Для вычисления ранговых коэффициентов исходные данные ранжируют, т.е. расставляют по порядку возрастания или убывания, а затем нумеруют (табл. 23). Ранг - это порядковый номер. Если встречаются два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.

Таблица 23. Ранжирование данных

Rx

x

Ry

y

Rz

z

1

6

1

-421

1,5

-16

2,5

9

2

-420

1,5

-16

2,5

9

3

-376

3

-15

4,5

12

4

-373

4

-14

4,5

12

5

-359

5,5

-8

6,5

14

6

-347

5,5

-8

6,5

14

7

-317

7

-6

8

15

8

-308

8

-5

10

16

9

-305

9,5

2

10

16

10

-264

9,5

2

10

16

11

-251

11

4

12,5

17

12

-248

12

5

12,5

17

13

-225

13

8

14

21

14

-223

14

10

16

22

15

-217

15

11

16

22

16

-195

16

13

16

22

17

-174

17

14

18,5

24

18

-171

18,5

17

18,5

24

19

-166

18,5

17

20

26

20

-151

20,5

24

21

29

21

-137

20,5

24

22

30

22

-134

22,5

25

23,5

32

23

-124

22,5

25

23,5

32

24

-121

24

27

25

33

25

-115

25,5

28

26

37

26

-103

25,5

28

27

40

27

-94

27

31

28,5

41

28

-84

28

34

28,5

41

29

-80

29

39

30

43

30

-69

30

43

31,5

45

31

-59

31

49

31,5

45

32

-58

32

57

Затем рассматриваются пары значений {xi , yi } исходных данных, каждое значение со своим рангом. В табл. 24 столбцы x и y соответствуют исходным, неупорядоченным данным.

Таблица 24. Коэффициент корреляции рангов Спирмена для У (Х)

N п\п

x

y

Rx

Ry

d

d2

1

16

-134

10

22

-12

144

2

22

-174

16

17

-1

1

3

17

-124

12,5

23

-10,5

110,25

4

22

-171

16

18

-2

4

5

12

-94

4,5

27

-22,5

506,25

6

22

-195

16

16

0

0

7

9

-69

2,5

30

-27,5

756,25

8

45

-421

31,5

1

30,5

930,25

9

29

-251

21

11

10

100

10

40

-373

27

4

23

529

11

41

-308

28,5

8

20,5

420,25

12

16

-151

10

20

-10

100

13

32

-264

23,5

10

13,5

182,25

14

33

-305

25

9

16

256

15

6

-59

1

31

-30

900

16

26

-217

20

15

5

25

17

24

-225

18,5

13

5,5

30,25

18

15

-84

8

28

-20

400

19

37

-347

26

6

20

400

20

17

-121

12,5

24

-11,5

132,25

21

12

-103

4,5

26

-21,5

462,25

22

21

-166

14

19

-5

25

23

14

-115

6,5

25

-18,5

342,25

24

14

-80

6,5

29

-22,5

506,25

25

9

-58

2,5

32

-29,5

870,25

26

32

-317

23,5

7

16,5

272,25

27

24

-223

18,5

14

4,5

20,25

28

43

-420

30

2

28

784

29

41

-359

28,5

5

23,5

552,25

30

45

-376

31,5

3

28,5

812,25

31

30

-248

22

12

10

100

32

16

-137

10

21

-11

121

итого

782

-6689

528

528

0

10795

=1,97856 - связь статистически значима.

Таблица 25. Коэффициент корреляции рангов Спирмена для Z(X)

N п\п

x

z

Rx

Rz

d

d2

1

16

11

10

15

-5

25

2

22

28

16

25,5

-9,5

90,25

3

17

10

12,5

14

-1,5

2,25

4

22

17

16

18,5

-2,5

6,25

5

12

-16

4,5

1,5

3

9

6

22

-15

16

3

13

169

7

9

2

2,5

9,5

-7

49

8

45

57

31,5

32

-0,5

0,25

9

29

31

21

27

-6

36

10

40

43

27

30

-3

9

11

41

28

28,5

25,5

3

9

12

16

-16

10

1,5

8,5

72,25

13

32

2

23,5

9,5

14

196

14

33

49

25

31

-6

36

15

6

8

1

13

-12

144

16

26

13

20

16

4

16

17

24

17

18,5

18,5

0

0

18

15

-8

8

5,5

2,5

6,25

19

37

-14

26

4

22

484

20

17

4

12,5

11

1,5

2,25

21

12

24

4,5

20,5

-16

256

22

21

27

14

24

-10

100

23

14

39

6,5

29

-22,5

506,25

24

14

-5

6,5

8

-1,5

2,25

25

9

5

2,5

12

-9,5

90,25

26

32

14

23,5

17

6,5

42,25

27

24

25

18,5

22,5

-4

16

28

43

24

30

20,5

9,5

90,25

29

41

34

28,5

28

0,5

0,25

30

45

25

31,5

22,5

9

81

31

30

-6

22

7

15

225

32

16

-8

10

5,5

4,5

20,25

итого

782

449

528

528

0

2791,5

=0,51164 - связь статистически незначима.

Ранговый коэффициент корреляции Кендалла:

,

где n - число наблюдений;

S = P - Q - разность сумм числа последовательностей и инверсий результативного признака.

В процессе вычислений факторный признак X упорядочивается по возрастанию с присвоением порядкового номера (ранжируется). Затем результативный признак Y упорядочивается по возрастанию факторного признака X.

Число последовательностей P для каждого ранга Y - это число следующих рангов, превышающих эту величину.

Число инверсий Q для каждого ранга Y - это число следующих рангов, меньших выбранного.

Таблица 26. Вычисление рангового коэффициента корреляции Кендалла

N п\п

X

Y соот. зн Х

Ранги Y

P

Q

1

6

-59

31

1

30

2

9

-69

30

1

29

3

9

-58

32

0

29

4

12

-94

27

2

26

5

12

-103

26

2

25

6

14

-115

25

2

24

7

14

-80

29

0

25

8

15

-84

28

0

24

9

16

-134

22

2

21

10

16

-151

20

3

19

11

16

-137

21

2

19

12

17

-124

23

1

19

13

17

-121

24

0

19

14

21

-166

19

0

18

15

22

-174

17

1

16

16

22

-171

18

0

16

17

22

-195

16

0

15

18

24

-225

13

2

12

19

24

-223

14

1

12

20

26

-217

15

0

12

21

29

-251

11

1

10

22

30

-248

12

0

10

23

32

-264

10

0

9

24

32

-317

7

2

6

25

33

-305

9

0

7

26

37

-347

6

1

5

27

40

-373

4

2

3

28

41

-308

8

0

4

29

41

-359

5

0

3

30

43

-420

2

1

1

31

45

-421

1

1

0

32

45

-376

3

0

0

Итого

782

-6689

528

28

468

S = 28 - 468= - 440

=-0,8871 - связь статистически значима.

Таблица 27. Вычисление рангового коэффициента корреляции Кендалла

N п\п

X

Z соот. зн Х

Ранги Z

P

Q

1

6

8

13

12

19

2

9

2

9,5

8

21

3

9

5

12

10

19

4

12

-16

1,5

0

27

5

12

24

20,5

15

11

6

14

39

29

23

3

7

14

-5

8

6

19

8

15

-8

5,5

3

20

9

16

11

15

8

15

10

16

-16

1,5

0

22

11

16

-8

5,5

2

19

12

17

10

14

5

15

13

17

4

11

4

15

14

21

27

24

11

7

15

22

28

25,5

11

5

16

22

17

18,5

6

9

17

22

-15

3

0

15

18

24

17

18,5

5

9

19

24

25

22,5

6

6

20

26

13

16

3

3

21

29

31

27

7

4

22

30

-6

7

1

9

23

32

2

9,5

1

8

24

32

14

17

1

7

25

33

49

31

6

1

26

37

-14

4

0

6

27

40

43

30

4

1

28

41

28

25,5

2

2

29

41

34

28

2

1

30

43

24

20,5

0

2

31

45

57

32

1

0

32

45

25

22,5

0

0

Итого

782

449

528

163

320

S = 163 - 320= - 157

= -0,31653 - связь статистически незначима.

Коэффициент Кендалла ф дает более осторожную оценку корреляции, чем коэффициент Спирмена с (числовое значение ф всегда меньше, чем с). Хотя вычисление коэффициента с менее трудоемко, чем вычисление коэффициента ф, последний легче пересчитать, если к ряду добавляется новый член.

регрессионный тренд дисперсия корреляция

Задача 10.

Постройте уравнения регрессии Y(X), Z(X) графическим способом.

Решение

Проведем линии регрессии «на глаз» - по местам «сгущения» точек. На линиях регрессии и выберем по две точки, ближе к краям диапазона значений. Составим систему уравнений - два уравнения с двумя неизвестными:

Из построенной линии регрессии по Y (X) получим:

(x1; y1) = (12; - 94);

(x2; y2) = (45; - 400).

Y(X)= -92,7059-0,10784*x.

Из построенной линии регрессии по Z(X) получим:

(x1; z1) = (12; 4);

(x2; z2) = (45; 31).

Z(X) = -5,81818-0,818182*x.

Задача 11.

C помощью метода наименьших квадратов (МНК) постройте уравнения регрессии Y(X), X(Y), Z (X), X(Z). Нанесите линии регрессии на корреляционное поле.

Решение

Построение парной линейной регрессии по МНК сводится к решению системы нормальных уравнений.

Для уравнения

y= a + b? x

нужно решить следующую систему:

Решая систему, получаем оценки неизвестных коэффициентов a€ и b€. Затем записываем уравнение регрессии, подставляя найденные коэффициенты:

y= a€ + b€? x.

Таблица 28. Расчет значений

n

x

x^2

y

y^2

z

z^2

x*y

x*z

1

16

256

-134

17956

11

121

-2144

176

2

22

484

-174

30276

28

784

-3828

616

3

17

289

-124

15376

10

100

-2108

170

4

22

484

-171

29241

17

289

-3762

374

5

12

144

-94

8836

-16

256

-1128

-192

6

22

484

-195

38025

-15

225

-4290

-330

7

9

81

-69

4761

2

4

-621

18

8

45

2025

-421

177241

57

3249

-18945

2565

9

29

841

-251

63001

31

961

-7279

899

10

40

1600

-373

139129

43

1849

-14920

1720

11

41

1681

-308

94864

28

784

-12628

1148

12

16

256

-151

22801

-16

256

-2416

-256

13

32

1024

-264

69696

2

4

-8448

64

14

33

1089

-305

93025

49

2401

-10065

1617

15

6

36

-59

3481

8

64

-354

48

16

26

676

-217

47089

13

169

-5642

338

17

24

576

-225

50625

17

289

-5400

408

18

15

225

-84

7056

-8

64

-1260

-120

19

37

1369

-347

120409

-14

196

-12839

-518

20

17

289

-121

14641

4

16

-2057

68

21

12

144

-103

10609

24

576

-1236

288

22

21

441

-166

27556

27

729

-3486

567

23

14

196

-115

13225

39

1521

-1610

546

24

14

196

-80

6400

-5

25

-1120

-70

25

9

81

-58

3364

5

25

-522

45

26

32

1024

-317

100489

14

196

-10144

448

27

24

576

-223

49729

25

625

-5352

600

28

43

1849

-420

176400

24

576

-18060

1032

29

41

1681

-359

128881

34

1156

-14719

1394

30

45

2025

-376

141376

25

625

-16920

1125

31

30

900

-248

61504

-6

36

-7440

-180

32

16

256

-137

18769

-8

64

-2192

-128

Сумма

782

23278

-6689

1785831

449

18235

-202935

14480

Для Y (X)

Итак, Y(X)=22,41 -9,4707x

Для построения графика возьмем две точки с координатами (9; - 63) и

(48; - 432)

Для X (Y)

Для уравнения

x = a + b? y

нужно решить следующую систему:

Итак, X (Y)=3,15-0,10183y

Для построения графика возьмем две точки с координатами (-23; 5) и

(-414; 45)

Для Z (X)

Для уравнения

z= a + b? x

нужно решить следующую систему:

Итак, Z (X)=-6,53464+0,841571x

Для построения графика возьмем две точки с координатами (3; -4) и

(45; 31)

Для X(Z)

Для уравнения

x= a + b? z

нужно решить следующую систему:

Итак, X(Z)=20,31386+0,29389z

Для построения графика возьмем две точки с координатами (4; 21) и

(52; 36)

Таблица 29. Расчет значений из уравнений парной линейной регрессии по МНК

n

y(x)

x(y)

z(x)

x(z)

1

-129,122

16,79685

6,930495

23,54665

2

-185,95

20,87

11,98

28,54

3

-138,59

15,78

7,77

23,25

4

-185,95

20,56

11,98

25,31

5

-91,24

12,72

3,56

15,61

6

-185,95

23,01

11,98

15,91

7

-62,83

10,18

1,04

20,90

8

-403,77

46,02

31,34

37,07

9

-252,24

28,71

17,87

29,42

10

-356,42

41,13

27,13

32,95

11

-365,89

34,52

27,97

28,54

12

-129,12

18,53

6,93

15,61

13

-280,65

30,04

20,40

20,90

14

-290,12

34,21

21,24

34,71

15

-34,42

9,16

-1,49

22,66

16

-223,83

25,25

15,35

24,13

17

-204,89

26,06

13,66

25,31

18

-119,65

11,71

6,09

17,96

19

-328,01

38,49

24,60

16,20

20

-138,59

15,47

7,77

21,49

21

-91,24

13,64

3,56

27,37

22

-176,48

20,06

11,14

28,25

23

-110,18

14,86

5,25

31,78

24

-110,18

11,30

5,25

18,84

25

-62,83

9,06

1,04

21,78

26

-280,65

35,43

20,40

24,43

27

-204,89

25,86

13,66

27,66

28

-384,83

45,92

29,65

27,37

29

-365,89

39,71

27,97

30,31

30

-403,77

41,44

31,34

27,66

31

-261,71

28,41

18,71

18,55

32

-129,12

17,10

6,93

17,96

n

-

-

-

-

Задача 12.

После определения коэффициентов корреляции и построения уравнения регрессии разными способами провести сравнение полученных оценок и построенных графиков.

Решение

Сравним построенные уравнения регрессии

Y(X)

Графическим способом: Y(X)= -92,7059-0,10784*x.

С помощью МНК: Y(X)=22,41 -9,4707

Z(X)

Графическим способом: Z(X) = -5,81818-0,818182*x.

С помощью МНК: Z (X)=-6,53464+0,841571x

Построенные графики совпадают, с небольшими различиями, связанными с погрешностями построения линий «на глаз». Погрешность вполне допустимая.

Задача 13.

Проведите сглаживание ряда динамики Gt с помощью простой и взвешенной скользящей средней, а также скользящей медианы по трем, пяти и двенадцати точкам. В качестве номера месяца t используется столбец N. Постройте графики исходного ряда динамики (ИРД) и сглаженных рядов следующим образом. Для нечетных вариантов:

1) ИРД, ССП(3), ССП(5), ССП(12);

2) ИРД, ССВ(3), ССВ(5), ССВ(12);

3) ИРД, СМ(3), СМ(5), СМ(12).

Для четных вариантов:

1) ИРД, ССП(3), ССВ(3), СМ(3);

2) ИРД, ССП(5), ССВ(5), СМ(5);

3) ИРД, ССП(12), ССВ(12), СМ(12).

Сравните результаты сглаживания.

Решение

Для вычисления значений таблицы используем формулу для расчета простой скользящей средней:

И формулу для расчета скользящей средней взвешенной:

В качестве весов wk используем биноминальные коэффициенты.

Простая скользящая средняя

- по 3 точкам.

Скользящая средняя взвешенная

- по 3 точкам.

Скользящая медиана - по 3 точкам.

Таблица 30. Сглаживание ряда динамики Gt по трем точкам

t

G

ссп (3)

ccв (3)

см (3)

1

46

-

-

-

2

40

41,3

41,0

40

3

38

40,3

39,8

40

4

43

41,3

41,8

43

5

43

45,0

44,5

43

6

49

48,0

48,3

49

7

52

56,3

55,3

52

8

68

64,0

65,0

68

9

72

70,3

70,8

71

10

71

74,0

73,3

72

11

79

72,0

73,8

71

12

66

68,3

67,8

66

13

60

61,3

61,0

60

14

58

60,3

59,8

60

15

63

60,0

60,8

59

16

59

64,3

63,0

63

17

71

67,0

68,0

71

18

71

73,7

73,0

71

19

79

77,3

77,8

79

20

82

85,7

84,8

82

21

96

89,3

91,0

90

22

90

95,3

94,0

96

23

100

94,0

95,5

92

24

92

90,7

91,0

92

25

80

82,7

82,0

80

26

76

76,3

76,3

76

27

73

77,7

76,5

76

28

84

79,3

80,5

81

29

81

82,7

82,3

83

30

83

86,7

85,8

83

31

96

95,0

95,3

96

32

106

-

-

-

Рисунок 22 - Сглаживание ряда динамики Gt по трем точкам

Простая скользящая средняя

- по 5 точкам.

Скользящая средняя взвешенная

- по 5 точкам.

Скользящая медиана - по 5 точкам.

Таблица 31. Сглаживание ряда динамики Gt по пяти точкам

t

G

ссп (5)

ссв (5)

см (5)

1

46

-

-

-

2

40

-

-

-

3

38

42,0

41,3

43

4

43

42,6

42,7

43

5

43

45,0

44,7

43

6

49

51,0

50,7

49

7

52

56,8

56,0

52

8

68

62,4

63,3

68

9

72

68,4

69,0

71

10

71

71,2

71,2

71

11

79

69,6

71,2

71

12

66

66,8

66,7

66

13

60

65,2

64,3

63

14

58

61,2

60,7

60

15

63

62,2

62,3

60

16

59

64,4

63,5

63

17

71

68,6

69,0

71

18

71

72,4

72,2

71

19

79

79,8

79,7

79

20

82

83,6

83,3

82

21

96

89,4

90,5

90

22

90

92,0

91,7

92

23

100

91,6

93,0

92

24

92

87,6

88,3

90

25

80

84,2

83,5

80

26

76

81,0

80,2

80

27

73

78,8

77,8

80

28

84

79,4

80,2

81

29

81

83,4

83,0

83

30

83

90,0

88,8

84

31

96

-

-

-

32

106

-

-

-

Рисунок 23 - Сглаживание ряда динамики Gt по пяти точкам

Простая скользящая средняя

- по 12 точкам.

Скользящая средняя взвешенная

- по 12 точкам.

Скользящая медиана - по 12 точкам.

Таблица 32. Сглаживание ряда динамики Gt по двенадцати точкам

t

G

ссп (12)

ссв (12)

см (12)

1

46

-

-

-

2

40

-

-

-

3

38

-

-

-

4

43

-

-

-

5

43

-

-

-

6

49

55,6

55,1

50,5

7

52

56,8

56,4

56

8

68

58,3

59,0

59

9

72

60,3

61,2

61,5

10

71

61,7

62,4

61,5

11

79

64,0

65,2

64,5

12

66

65,8

65,8

67

13

60

68,1

67,5

69,5

14

58

69,3

68,4

71

15

63

71,3

70,6

71

16

59

72,8

71,8

71

17

71

74,6

74,3

71

18

71

76,8

76,3

75

19

79

78,4

78,5

79,5

20

82

79,9

80,1

79,5

21

96

80,8

81,9

79,5

22

90

82,8

83,4

81

23

100

83,7

84,9

81,5

24

92

84,7

85,2

82,5

25

80

86,1

85,6

83,5

26

76

88,1

87,2

87

27

73

-

-

-

28

84

-

-

-

29

81

-

-

-

30

83

-

-

-

31

96

-

-

-

32

106

-

-

-

Рисунок 24 - Сглаживание ряда динамики Gt по двенадцати точкам

Наиболее сглаженным получился ряд при первом способе, т.е. по трем точкам.

Задача 14.

Вычислите показатели динамики для ряда G:

* средний уровень ряда динамики;

* абсолютный прирост;

* темп (коэффициент) роста;

* темп прироста;

* средний абсолютный прирост;

* средний темп (коэффициент) роста;

* средний темп прироста.

Решение

Средний уровень ряда динамики:

,

Абсолютный прирост:

- цепной

- базисный

Коэффициент роста:

- цепной

- базисный

Темп роста:

- цепной

- базисный

Темп прироста:

Таблица 33. Расчеты абсолютного прироста, коэффициента роста и темпа роста:

t

G

Абсол. прирост

Темп роста

Темп прироста, %

цепной

базисный

цепной

базисный

1

46

2

40

-6

-6

0,870

0,870

-13,04

3

38

-2

-8

0,950

0,826

-5,00

4

43

5

-3

1,132

0,935

13,16

5

43

0

-3

1,000

0,935

0,00

6

49

6

3

1,140

1,065

13,95

7

52

3

6

1,061

1,130

6,12

8

68

16

22

1,308

1,478

30,77

9

72

4

26

1,059

1,565

5,88

10

71

-1

25

0,986

1,543

-1,39

11

79

8

33

1,113

1,717

11,27

12

66

-13

20

0,835

1,435

-16,46

13

60

-6

14

0,909

1,304

-9,09

14

58

-2

12

0,967

1,261

-3,33

15

63

5

17

1,086

1,370

8,62

16

59

-4

13

0,937

1,283

-6,35

17

71

12

25

1,203

1,543

20,34

18

71

0

25

1,000

1,543

0,00

19

79

8

33

1,113

1,717

11,27

20

82

3

36

1,038

1,783

3,80

21

96

14

50

1,171

2,087

17,07

22

90

-6

44

0,938

1,957

-6,25

23

100

10

54

1,111

2,174

11,11

24

92

-8

46

0,920

2,000

-8,00

25

80

-12

34

0,870

1,739

-13,04

26

76

-4

30

0,950

1,652

-5,00

27

73

-3

27

0,961

1,587

-3,95

28

84

11

38

1,151

1,826

15,07

29

81

-3

35

0,964

1,761

-3,57

30

83

2

37

1,025

1,804

2,47

31

96

13

50

1,157

2,087

15,66

32

106

10

60

1,104

2,304

10,42

?

2267

60

Средние показатели вычисляют по цепным показателям динамики.

Средний абсолютный прирост:

=

Средний коэффициент роста:

1,027295

Средний темп роста:

%

Средний темп прироста:

Задача 15.

Постройте уравнение тренда с помощью МНК двумя способами и нанесите линию тренда на график исходного ряда динамики. Определите величину остаточной дисперсии.

Методика решения

Уравнение тренда строят методами регрессионного анализа. Линейный тренд описывается с помощью линейного уравнения относительно времени:

g(t) = a + b?t.

Первый способ. Составляется система нормальных уравнений по МНК:

Таблица 34. Первый способ

t

g

t^2

g*t

1

46

1

46

2

40

4

80

3

38

9

114

4

43

16

172

5

43

25

215

6

49

36

294

7

52

49

364

8

68

64

544

9

72

81

648

10

71

100

710

11

79

121

869

12

66

144

792

13

60

169

780

14

58

196

812

15

63

225

945

16

59

256

944

17

71

289

1207

18

71

324

1278

19

79

361

1501

20

82

400

1640

21

96

441

2016

22

90

484

1980

23

100

529

2300

24

92

576

2208

25

80

625

2000

26

76

676

1976

27

73

729

1971

28

84

784

2352

29

81

841

2349

30

83

900

2490

31

96

961

2976

32

106

1024

3392

Сумма

528

2267

11440

41965

Составим систему нормальных уравнений:

g(t) = 43,26613 + 1,671371?t.

Нанесем линию тренда на график используя две точки: (4; 50) и (30; 93).

Второй способ. Вычисления упрощаются, если сместить начало координат в середину ряда:

t? = t-t: {...;-3; -2; -1; 0; 1; 2; 3;...}.

В результате сумма значений нового аргумента t? равна нулю, а система нормальных уравнений принимает вид:

где

Таблица 35. Второй способ

t*

g

t*^2

g*t*

-15,5

46

240,25

-713

-14,5

40

210,25

-580

-13,5

38

182,25

-513

-12,5

43

156,25

-537,5

-11,5

43

132,25

-494,5

-10,5

49

110,25

-514,5

-9,5

52

90,25

-494

-8,5

68

72,25

-578

-7,5

72

56,25

-540

-6,5

71

42,25

-461,5

-5,5

79

30,25

-434,5

-4,5

66

20,25

-297

-3,5

60

12,25

-210

-2,5

58

6,25

-145

-1,5

63

2,25

-94,5

-0,5

59

0,25

-29,5

0,5

71

0,25

35,5

1,5

71

2,25

106,5

2,5

79

6,25

197,5

3,5

82

12,25

287

4,5

96

20,25

432

5,5

90

30,25

495

6,5

100

42,25

650

7,5

92

56,25

690

8,5

80

72,25

680

9,5

76

90,25

722

10,5

73

110,25

766,5

11,5

84

132,25

966

12,5

81

156,25

1012,5

13,5

83

182,25

1120,5

14,5

96

210,25

1392

15,5

106

240,25

1643

Сумма

0

2267

2728

4559,5

Расчет значений:

1,671

g(t) =70,843+1,671t

Нанесем линию тренда на график используя две точки:

(4; 78,5) и (30; 121).

Таблица 36. Расчеты для вычисления остаточной дисперсии

t

g

g(t)

(g(t)-gt)^2

1

46

44,9375

1,128906

2

40

46,60887

43,67718

3

38

48,28024

105,6834

4

43

49,95161

48,32492

5

43

51,62298

74,35585

6

49

53,29435

18,44148

7

52

54,96573

8,79553

8

68

56,6371

129,1156

9

72

58,30847

187,4581

10

71

59,97984

121,444

11

79

61,65121

300,9805

12

66

63,32258

7,168574

13

60

64,99395

24,93955

14

58

66,66532

75,08782

15

63

68,33669

28,4803

16

59

70,00806

121,1775

17

71

71,67944

0,461633

18

71

73,35081

5,526291

19

79

75,02218

15,82307

20

82

76,69355

28,15843

21

96

78,36492

310,9961

22

90

80,03629

99,27551

23

100

81,70766

334,6097

24

92

83,37903

74,32108

25

80

85,0504

25,50657

26

76

86,72177

114,9564

27

73

88,39315

236,9489

28

84

90,06452

36,77836

29

81

91,73589

115,2593

30

83

93,40726

108,311

31

96

95,07863

0,848924

32

106

96,75

85,5625

Сумма

2889,603

СПИСОК ЛИТЕРАТУРЫ

1. Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях.- М.: Юнити-Дана, 2011.- 270 с.

2. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика.- М.: Юнити-Дана, 2011.- 656 с.

3. Гмурман В.Е. Теория вероятностей и математическая статистика.- М.: Высш. школа, 2010.-479 с.

4. ГОСТ 2.304-81. Шрифты чертежные.

5. Кремер Н.Ш. Теория вероятностей и математическая статистика.- М.: ЮНИТИ-ДАНА, 2010.-573 с.

6. Шмойлова Р.А. Практикум по теории статистики.- М.: Финансы и статистика, 2009.- 416 с.

7. Шмойлова Р.А. Теория статистики.- М.: Финансы и статистика, 2010.- 656 с.

Размещено на Allbest.ru


Подобные документы

  • Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.

    реферат [57,4 K], добавлен 25.01.2009

  • Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.

    контрольная работа [216,6 K], добавлен 12.05.2010

  • Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.

    контрольная работа [222,5 K], добавлен 08.05.2014

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.

    контрольная работа [75,1 K], добавлен 29.01.2010

  • Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

    лабораторная работа [1,8 M], добавлен 25.05.2009

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Исследование зависимости сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии. Построение поля корреляции. Определение интервальных оценок заданных коэффициентов. Средняя ошибка аппроксимации.

    контрольная работа [2,1 M], добавлен 09.08.2013

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.

    курсовая работа [1,1 M], добавлен 22.05.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.