Общая теория статистики

Характеристика средних величин и показателей вариации. Расчет значения модальной величины признака и медианы. Особенность определения среднего квадратичного отклонения и дисперсии. Проведение исследования корреляционного и регрессионного анализа.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 863,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пензенский государственный университет

Факультет «Экономика и управление»

Кафедра «Экономика и финансы»

Курсовая работа

по дисциплине: «Общая теория статистики»

Автор работы

Кожевникова Е.А.

Пенза 2017

Содержание

Введение

1. Средние величины и показатели вариации

2. Корреляционный анализ

3. Регрессионный анализ

Заключение

Список использованных источников

Введение

Понятие «статистика» многозначно. В настоящее время насчитывается около тысячи определений статистики. Первое из них относится к 1749 году и подразумевается как совокупность сведений о государстве, о его достопримечательностях. Это понятие ввёл немецкий учёный Готфрид Ахенваль - представителем описательной школы государствоведения.

На протяжении этого времени оно уточнялось и дополнялось. Дать определение статистики как науки пытались философы, математики, экономисты.

Статистика как единое целое включает:

1) особую область общественно значимой профессиональной деятельности, которая направлена на сбор, обработку и анализ социально-экономической информации на базе применения статистических методов;

2) отрасль общественной науки, которая занимается разработкой теоретических основ и методологии статистики. Эти основы лежат в основе прикладных статистических исследований, всей деятельности в области практической статистики;

3) массивы статистической информации. Они представляются в виде статистических отчётов, статистических сборников официальных данных о разных сферах общественной жизни.

Предметом исследования в статистике является закономерности массовых социально-экономических явлений, которые состоят из множества отдельных элементов или фактов.

Однако недостаточно только провести массовое наблюдение, чтобы выявить те или иные закономерности.

Результаты наблюдения подвергают обработке, сводке, что позволяет выделить во всей совокупности различные типы, группы единиц и затем для всей совокупности и отдельных ее частей рассчитать обобщающие показатели (характеристики).

Массовое наблюдение, группировка и сводка его результатов, вычисление и анализ обобщающих показателей - все это вместе составляет специфический метод статистики.

К какой бы области ни относился предмет статистики (население, промышленность, торговля и т.д.), метод ее везде одинаков, т.е. везде используется массовое наблюдение, группировка и обобщающие показатели, в которых, благодаря действию закона больших чисел, взаимопогошается влияние случайных причин и выявляется типичное и закономерное. Иначе говоря, метод статистики обусловлен спецификой ее предмета.

Целью курсовой работы является закрепление и углубление знаний, приобретённых в процессе изучения дисциплины «общая теория статистики».

Для этого поставлены следующие задачи:

- изучить средние величины и показатели вариации;

- рассмотреть корреляционный анализ;

- рассмотреть регрессионный анализ.

Номер классного журнала - 9.

1. Средние величины и показатели вариации

В статистике средними величинами называют обобщающие показатели, которые выражают типичные, характерные для определенного места и времени размеры и количественные соотношения явлений общественной жизни.

В статистике применяются следующие виды средних величин: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, а также структурные средние - мода и медиана.

Наиболее самый распространённый вид средних величин - это средняя арифметическая, представляющая собой сумму всех чисел, делённую на их количество. Она может иметь форму простой и взвешенной.

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

,

где xi - величины, для которых исчисляется средняя,

n - число единиц совокупности.

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

,

где fi - частота.

Мода представляет собой наиболее часто встречающееся значение признака в данной совокупности.

Модой для дискретного ряда является вариант, обладающий наибольшей частотой.

При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем -- значение модальной величины признака по формуле:

,

где М0 - значение моды,

х0 - нижняя граница модального интервала,

h - величина интервала,

fm - частота модального интервала,

fm-1 - частота интервала, предшествующего модальному,

fm+1 - частота интервала, следующего за модальным.

Медианой называют величину варьирующего признака, которая находится в середине ряда, расположенного в порядке возрастания или убывания.

Медиана -- значение варьирующего признака, приходящееся на середину ранжированной совокупности. Для ранжированного ряда с нечетным числом индивидуальных величин медианой будет величина, которая расположена в центре ряда. Для ранжированного ряда с четным числом индивидуальных величин медианой будет средняя арифметическая величина, которая рассчитывается из двух срединых величин.

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем -- значение медианы по формуле:

,

где XMe - нижняя граница медианного интервала,

hMe - величина медианного интервала,

fMe - частота медианного интервала,

SMe-1 - накопленная частота предшествующего медианного интервала.

Для характеристики размеров колеблемости признаков в статистике применяется следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации и др.

Дисперсия - это средняя из квадратов отклонений значений признака от его средней арифметической величины. Она определяется по формуле арифметической простой:

Или средней арифметической взвешенной:

Выделяют 3 вида дисперсий: общая, средняя внутригрупповая и межгрупповая. Они связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.

Среднее квадратичное отклонение - это корень квадратный из дисперсии - определяется по формулам средней арифметической простой:

Или средней арифметической взвешенной:

Мерой сравнения степеней колеблемости для двух, трех и более вариационных рядов служит показатель, который носит название коэффициента вариации и определятся по формуле:

Коэффициент детерминации представляет собой отношение межгрупповой дисперсии к общей. Он определяет долю (в процентах) изменений, обусловленных влиянием факторных признаков, в общей изменчивости результативного признака. Рассчитывается по следующей формуле:

?2 = у2межгр / у2об

Задача 1.1 По статистическим данным 12;14;11;13;16;12;17;12;19 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации.

Решение.

1) Находим среднее значение по формуле (1.1)

= = =14

2) Определяем моду (М0 ) и медиану (Me ). Так как в условии задачи представлен дискретный ряд, то М0 = 12.

Для определения медианы расположим ряд в порядке возрастания: 12;13;13;13;14;15;17;18;20. Так как этот ряд нечётный, то Me = 13.

Находим дисперсию по формуле (1.5)

у2= = = 6,7

Далее определяем среднеквадратическое отклонение по формуле (1.7)

Так как этот показатель представляет собой корень квадратный из дисперсии, то у = 2,59

Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)

V= 100% = 17,3%

Ответ: среднее значение равно 14, мода равна 12, медиана равна 13, дисперсия равна 6,7, среднеквадратическое отклонение равно 2,59 и коэффициент вариации равен 17,3%.

Задача 1.2 По данным статистики в отчётном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 30%, стоимость основных фондов увеличилась на 19%. Определить значение фондоотдачи.

Прежде чем начать решение этой задачи, нужно сказать, что фондоотдача представляет собой отношение стоимости произведенной продукции за период к средней величине стоимости основных фондов за этот же период.

Фондоотдача является самым важным показателем использования основных фондов, так как с её увеличением повышается эффективность использования основных средств.

Решение.

Кфо = 100%

Кфо = 100% = 1,09

Вывод: коэффициент фондоотдачи увеличился на 9%.

Задача 1.3 Объём оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.

Таблица 1.1 - Исходные данные

У

m

80-100

6

100-120

17

120-140

25

140-160

28

160-180

14

180-200

10

Решение.

Находим среднее значение по формуле (1.1)

= 6+17+25+28+14+10/6 = 100/6 = 16,7

Определяем моду по формуле (1.3)

M0 = 140+20 = 143,4

Находим медиану.

Для того, чтобы найти медианный интервал, нужно найти накопленные частоты (суммы частот данного и всех предшествующих интервалов) и суммировать.

Таблица 1.2 - промежуточные расчёты

У

m

Накопленная

Частота(SMe-1)

80-100

6

6

100-120

17

23(6+17)

120-140

25

48(23+25)

140-160

28

76(28+28)

160-180

14

90(76+14)

180-200

10

100(90+10)

Как только накопленное значение частоты превысит , то это и будет медианным интервалом. В данном случае n = 50. Значит, медианный интервал - 140-160. Теперь находим медиану по формуле (1.4)

Me =

Ответ: среднее значение равно 16,7 ; мода равна 143,4; медиана равна 141,4.

Задача 1.4 По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 1.3).

Таблица 1.3 - Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

1,0-1,2

12

12

1,2-1,4

13

13

1,4-1,6

26

26

1,6-1,8

20

24

45

1,8-2,0

22

15

38

2,0-2,2

27

14

42

2,2-2,4

15

15

2,4-2,6

11

11

95

104

202

Решение.

Рассчитаем общую дисперсию

Исходные данные и промежуточные расчёты представлены в таблице 1.4.

Таблица 1.4 - исходные данные

Объем оборота предприятий (Хi)

Число предприятий по форме собственности

Расчет общей дисперсии

mгi

mчi

moi

сред i

xсред.imoi

(xсред.i -)2

(xсред.i -)2moi

1,0-1,2

12

12

1,1

13,2

0,52

6.76

1,2-1,4

13

13

1,3

16,9

0,27

3,78

1,4-1,6

26

26

1,5

39

0,1

0,27

1,6-1,8

20

24

45

1,7

76,5

0,01

0,46

1,8-2,0

22

15

38

1,9

72,2

0,006

0,23

2,0-2,2

27

14

42

2,1

88,2

0,08

3,44

2,2-2,4

15

15

2,3

34,5

0,23

3,68

2,4-2,6

11

11

2,5

27,5

0,46

5,52

Итого

95

104

202

368

24,14

Находим выработку в среднем на одно предприятие по формуле (1.2)

=

Определяем общую дисперсию по формуле (1.6)

у2 об.= = 115 000 руб.

Рассчитаем среднюю из внутригрупповых дисперсий.

Нужно рассмотреть , как складываются показатели выручки и ее вариации по группам в зависимости от форм собственности. Для этого рассчитываем дисперсию по государственным и частным предприятиям.

Расчет дисперсии по государственным предприятиям представлены в таблице 1.5

Хi

mгi

Хср.i

Хср.i*mгi

(Хср.i- x?г)2

14,6-14,8

11

14,7

161,7

0,09

14,8-15,0

13

14,9

193,7

0,01

15,0-15,2

18

15,1

271,8

0,01

15,2-15,4

6

15,3

91,8

0,09

15,4-15,6

2

15,5

31

0,25

50

75,5

750

0,45

x? гос. = = 15

гос.= 46 800 руб.

Хi

mчi

Хср.i

Хср.i*mчi

(Хср.i- x?ч)2

(Хср.i - x?ч)2*mчi

14,0-14,2

3

14,1

42,3

0,278784

0,836352

14,2-14,4

4

14,3

57,2

0,107584

0,430336

14,4-14,6

17

14,5

246,5

0,016384

0,278528

14,6-14,8

15

14,7

220,5

0,005184

0,07776

14,8-15,0

6

14,9

89,4

0,073984

0,443904

15,0-15,2

5

15,1

75,5

0,222784

1,11392

50

87,6

731,4

0,704704

3,1808

x? част. = = 14,628

част. фирм = 63 600 руб.

средняя внутригрупповая = = = 55 200

2межгрупповая = 2общая - 2внутригрупповая = 34 600

з2 = * 100% = 38,5%

Следовательно, 38,5% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,5% - влиянием других факторов.

Ответ: средняя внутригрупповая дисперсия = 55 200; межгрупповая дисперсия = 34 600; общая дисперсия = 89 800. Коэффициент детерминации = 38,5%

Задача 1.5 Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.7).

Таблица 1.7 - исходные данные.

Хi

1

2

8

mi

30

15

5

Хi

1

6

mi

10

15

Хi

3

8

mi

20

5

Решение.

Определяем дисперсию 1,2 и 3 групп по формуле (1.8), предварительно определив их среднее значение по формуле (1.2)

Среднее значение и дисперсия 1 группы:

= = 2

у2=

Среднее значение и дисперсия 2 группы:

= = 4

у2=

Среднее значение и дисперсия 3 группы:

= = 4

у2=

Находим среднюю внутригрупповую дисперсию: складываем дисперсии 3 групп и делим на 3.

у2 сред.внут. =

Тогда среднее значение 3 групп будет равно:

=

Находим общую дисперсию

у2 об. = = = 5,6

Зная общую и среднюю внутригрупповую дисперсии, находим межгрупповую дисперсию.

у2межгр. = 5,6 - 4,73 = 0,87

Ответ: средняя внутригрупповая дисперсия равна 4,73, общая дисперсия равна 5,6, межгрупповая дисперсия равна 0,87

2. Корреляционный анализ

Корреляция представляет собой взаимозависимость двух случайных величин. Суть ее заключается в том, что при изменении значения одной случайной величины происходит изменение значения другой.

Корреляционный анализ  посвящён изучению взаимосвязей между случайными величинами. Задача корреляционного анализа сводится к установлению направления связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Он может варьировать в пределах от -1 до +1. Если коэффициент корреляции равен 0 то, это говорит об отсутствии корреляционных связей между переменными. Причем если коэффициент корреляции ближе к 1 (или -1) то говориться о сильной корреляции, а если ближе к 0, то о слабой.

При положительной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значе-ниям одного признака - низкие значения другого. При отрицательной корреляции образуется обратная связь.

Коэффициент корреляции рассчитывается по следующей формуле:

Rxy

где - среднее значение произведения х и у

ух - среднеквадратическое отклонение х

уу - среднеквадратическое отклонение у

Значение коэффициента корреляции и характеристика связи:

От 0 до 0,2 - очень слабая

От 0,2 до 0,4 - слабая

От 0,4 до 0,6 - средняя

От 0,6 до 0,8 - сильная

От 0,8 до 1,0 - очень сильная

Значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента (расчётное значение):

t =

Далее находят табличное значение коэффициентов корреляции для различного числа степеней свободы f = n-2 и различных уровней значимости  a = 0,1; 0,05; 0,01 и 0,001. Считается, что корреляция значима, если рассчитанный коэффициент корреляции табличное значение коэффициента корреляции.

Коэффициент корреляции рангов - показатель, который был введён английским учёным-психологом Ч. Спирменом в конце ХХ века. Он основан не на изучении зависимости самих переменных, а только их рангов.

Ранг представляет собой порядковый номер, который присваивается каждому индивидуальному значению х и у отдельно после их упорядочения по возрастанию (или убыванию).

Коэффициент корреляции рангов определяется по формуле Спирмена:

R = 1 ,

где d - разность рангов х и у (d = dx -dy)

n - число наблюдаемых пар значений х и у.

Коэффициент ранговой корреляции может принимать значение от -1 до 1. Задача 2.1. Определить коэффициент корреляции между У и Х. Оценить значимость коэффициента корреляции при уровне 0,05.

Таблица 2.0 - Исходные данные

Х

ХУ

3,5

28.35

4,6

43,24

5,8

65,54

4,2

28,98

5,2

50,44

Решение.

Сначала находим значение У: каждое произведение значений Х и У делим на каждое значение Х.

Таблица 2.1 - промежуточные расчёты

Х

У

ХУ

3,5

8,1

28.35

4,6

9,4

43,24

5,8

11,3

65,54

4,2

6,4

28,98

5,2

9,7

50,44

Увеличиваем значения Х и У на 9, затем находим ХУ и дисперсии Х и У. Сумму всех значений поделим на их количество и получим их среднее значение.

Таблица 2.2 - промежуточные расчёты

Х

У

ХУ

(x -)2

(у -)2

1

12,5

17,1

213,75

1,3456

0,7744

2

13,6

18,4

250,24

0,0036

0,1764

3

14,8

20,3

300,44

1,2996

5,3824

4

13,2

15,4

203,28

0,2116

6,6564

5

14,2

18.7

265,54

0,2916

0,5184

,

68,3

89,9

6140,17

3,152

13,508

,

13,66

17,98

245,61

15,76

2,7

Зная дисперсии х и у, можем найти их среднеквадратические отклонения:

ух = = 3,97

уу = = 1,64

Зная все значения, находим коэффициент корреляции по формуле (2.1)

rxy = 0,16

Находим расчётное значение коэффициента по критерию Стьюдента. Вычислим по формуле (2.2)

t = = = 0,28

Далее определяем табличное значение коэффициента корреляции t (0,05;3) = 3,18

Отсюда следует, что t t (0,05;3) , т.е. 0,28 3,18

Ответ: коэффициент корреляции равен 0,16. Расчётное значение коэффициента меньше табличного. Это свидетельствует о том, что полученный коэффициент незначим, образует очень слабую связь между двумя переменными.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 28 32 23 30 25 24

у 27 30 21 28 24 20

Решение.

Строим таблицу аналогично таблице 2.2 и находим ХУ и дисперсии Х и У и их средние значения.

Таблица 2.3 - промежуточные расчёты

Х

У

ХУ

(x -)2

(у -)2

1

27

26

702

1

4

2

31

29

899

25

25

3

22

20

440

16

16

4

29

27

783

9

9

5

24

23

552

4

1

6

23

19

437

9

25

,

156

144

3813

64

80

,

26

24

635,5

10,6

13,3

Определяем среднеквадратические отклонения х и у

ух = = 3,26

уу = =

Находим коэффициент корреляции

rxy = 0,97

Находим расчётное значение коэффициента по формуле (2.2)

t = = = 8,08

Далее определяем табличное значение коэффициента корреляции

t (0,05;6) = 2,447

Отсюда следует, что t t (0,05;6) .

Ответ: коэффициент корреляции равен 0,97. Расчётное значение коэффициента превышает табличное значение. Это значит, что полученный коэффициент значим, образует очень сильную связь между двумя переменными.

Задача 2.3. В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей (Х): 74 99 51 56 93 67 59

Статистика (У): 60 94 45 72 81 89 49.

Определить коэффициент ранговой корреляции Спирмена, расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Решение.

Проранжируем каждый из элементов X и Y, затем вычислим разность рангов по каждому случаю и возведём полученную разность в квадрат.

Полученные данные представлены в таблице 2.4

Таблица 2.4 - промежуточные расчёты

№ студента

dx

dy

dx - dy

d2

1

2

4

-2

4

2

0

0

0

0

3

6

6

0

0

4

5

3

2

4

5

1

2

-1

1

6

3

1

2

4

7

4

5

-1

1

Находим сумму квадратов разностей:

d2 = 4+0+0+4+1+4+1 = 14

Рассчитываем коэффициент ранговой корреляции по формуле (2.3)

R = 1 =1 - = 1- 0, 25 = 0,75

Находим расчётное значение критерия Стьюдента по формуле (2.2)

t = = = 2,55

Далее определяем табличное значение коэффициента

t (0,05;7) = 2,37

Отсюда следует, что t t (0,05;7) .

Ответ: коэффициент ранговой корреляции равен 0,75. Расчётное значение коэффициента больше табличного. Из этого можно сделать вывод, что полученный коэффициент значим, образует сильную связь между двумя переменными.

3. Регрессионный анализ

Регрессионный анализ позволяет установить аналитическую зависимость, в которой изменение среднего значения результативного признака обусловлено влиянием одной или нескольких независимых величин. Регрессионный анализ даёт изучить двухстороннюю зависимость между переменными, т.е. когда величина одного признака х изменяется в зависимости от другого у, и наоборот, у от х.

Уравнение регрессии представляет собой математическую модель, в которой усреднённое значение результативного признака х рассматривается как функция одного или нескольких факторных признаков.

С помощью регрессионного анализа можно осуществлять:

- построение эмпирических графиков (линий) регрессии (регрессия х по у и регрессия у по х);

- поиск уравнений, позволяющих по эмпирическим данным построить теоретическую, т.е. выровненную линию регрессии;

- вычисление коэффициентов, позволяющих судить, насколько в среднем результирующая величина изменяется при соответствующих изменениях факторного признака.

Аналитические зависимости между социально-экономическими показателями могут быть представлены простыми уравнениями в форме линейной и нелинейной связи:

х = a0 + a1x - прямолинейная зависимость;

х = a0 ха1 - степенная зависимость;

х = a0 + a1 - гиперболическая зависимость;

х = a0 + a1x + а2х2 - парабола второго порядка;

х = a0 + a1 - логарифмическая функция;

где х - теоретические значения результативного признака, рассчитанные по уравнению регрессии;

a0 , a1 , а2 - коэффициенты уравнения регрессии.

Для простоты расчётов нелинейные формы связи (путём логарифмирования или замены переменных) чаще всего преобразуют в линейную форму.

Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.

Первая система уравнения имеет вид:

{

Вторая система имеет вид:

Из 2.8 находим:

Подставляем в (2.8), имеем:

.

Из 2.7 находим а0:

.

Подставляем а0 в (2.8), имеем:

.

После определения коэффициентов регрессии проверяется их значимость по критерии Стьюдента.

Расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:

Выдвигается аналогичная гипотеза как и при проверке “r”: параметр а1 равен нулю. Если расчетное значение при заданном уровне значимости больше табличного, то нулевая гипотеза отвергается и параметр считается значимым.

Расчетное значение критерия Стьюдента для параметра а0 определяется по формуле:

.

Значимость модели проверяется по критерию Фишера:

где - табличное значение критерия;

- степень свободы факторной дисперсии

- степень свободы остаточной дисперсии

Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле, и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной.

Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.

После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка.

Ошибка аппроксимации рассчитывается по формуле:

где - исходное значение показателя;

- расчетное (прогнозное) значение показателя.

Ошибка аппроксимации не должна превышать 12-15%. Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения. Стандартная ошибка определяется по формуле:

.

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Исходные данные:

у: 30; 25; 24; 23; 22; 21,5; 20; 20,5; 19; 17

х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение

1) Уравнение обратной функции: y = +

Произведем замену X = . В результате получим линейное уравнение

= +X

Рассчитаем его параметры, используя расчетную таблицу 3.1

Таблица 3.1 - исходные данные

№ п/п

1

30

1

1

30

1

30,8232

2

25

2

0,5

12,5

0,25

24,7256

3

24

3

0,333333

7,999992

0,111111

22,69313

4

23

4

0,25

5,75

0,0625

21,67687

5

22

5

0,2

4,4

0,04

21,06712

6

21,5

6

0,166667

3,58

0,027778

20,66066

7

20

7

0,142857

2,85714

0,020408

20,370255

8

20,5

8

0,125

2,5625

0,015625

20,152488

9

19

9

0,111111

2,111109

0,012346

19,983110

10

17

10

0,1

1,7

0,01

19,84761

итого

222

55

2,928968

73,460741

1,549768

202,016933

Ср. знач.

22,2

5,5

0,292897

7,3460741

0,154977

= = =12,1951;

= = 22,2-12,19510,292897=18,6281

Получим следующее уравнение гиперболической модели:

y = 18,6281 +.

2) Определим индекс детерминации

Расчеты приведены в таблице 3.2

Таблица 3.2 - Расчет коэффициента детерминации

№ п/п

1

30

1

30,8232

60,84

0,677659

2

25

2

24,7256

7,84

0,075295

3

24

3

22,69313

3,24

1,70791

4

23

4

21,67687

0,64

1,750672

5

22

5

21,06712

0,04

0,870265

6

21,5

6

20,66066

0,49

0,704491

7

20

7

20,370255

4,84

0,13709

8

20,5

8

20,152488

2,89

0,120764

9

19

9

19,983110

10,24

0,96665

10

17

10

19,84761

27,04

8,108882

итого

222

55

202,016933

118,1

15,119642

Ср. знач.

22,2

5,5

11,81

R2 = 1- 0,87.

Вариация результата у (себестоимость единицы продукции) на 87% объясняется вариацией фактора х (стоимостью основных фондов).

3) Определим стандартную ошибку модели по формуле (3.3)

== 1,3747

4) Определим F - критерий Фишера

F = 8 = 53,32;

для =0,05, , .

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

5) По вычисленному коэффициенту детерминации рассчитаем коэффициент корреляции.

rxy =

rxy = = 0,93

Определяем расчетное значение критерия Стьюдента для параметра а1 по формуле (2.9) вариация медиана дисперсия регрессионный

ta1 = 0,93 = 0,93 = 7,15

Табличное значение критерия Стьюдента: tкрит = 2,306

Вывод: расчётное значение параметра а1 больше табличного ( ta1> tкрит). Следовательно, параметр а1 является значимым.

Определяем расчетное значение критерия Стьюдента для параметра а0 по формуле (3.0)

уy = = 3,44

ta0 = = 43,83.

Табличное значение критерия Стьюдента: tкрит = 2,306.

Вывод: расчётное значение параметра а0 больше табличного ( ta0> tкрит). Следовательно, параметр а0 является значимым.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

у 10; 13,4; 15,4; 16,5; 18,6; 19,1

х 1; 2; 3; 4; 5; 6.

Определить характеристики модели:

1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение.

Исходные данные и промежуточные расчеты приведены в таблице 3.3

Таблица 3.3 - исходные данные и промежуточные расчёты

y

x

19

22,4

24,4

25,5

27,6

28,1

1

2

3

4

5

6

0

0,69

1,10

1,39

1,61

1,79

0

0,48

1,21

1,93

2,59

3,20

0

16,15

27,94

36,84

46,05

52,09

147

21

6,58

9,41

179,07

1) Система уравнений имеет вид:

Подставляем значения и решаем систему

,

= 25,5 - 1,097a1

,

,

2,19= 179,07 - 167,79

2,19= 11,28

= 5,15

a0 = 25,5 - 1,097 11,28 = 19,85

Составляем модель:

у = 19,85 + 5,15

2) Находим индекс детерминации по формуле (3.5)

Таблица 3.4 - Расчет коэффициента детерминации

19,85

23,42

25.51

26,99

28,14

29,07

Сумма

0,15

-0,02

0,11

-0,49

0,46

0,03

0,24

0,0225

0,0004

0,0121

0,2401

0,2116

0,0009

0,4876

30,25

4,41

0,01

1

9,61

12,96

58,24

R2 = 1 - = 0,99

Вариация результата у на 99 % объясняется вариацией фактора х.

3) Находим стандартную ошибку по формуле (3.3)

== 0,3576

4) Определим F - критерий Фишера

F = 4 = 396;

для =0,05, , .

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

Задача 3.3 Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5

Таблица 3.5 - Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. Решение

1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК

Промежуточные расчеты представим в таблице 3.6

Таблица 3.6 - Промежуточные расчеты

Год

t

у

t-tср

ур

еt

1

1

7,5

-8

64

-1,95

15,6

7,698

-0,198

0,0392

2,65

2

2

7,5

-7

49

-1,95

13,65

7,917

-0,417

0,1739

5,56

3

3

8,0

-6

36

-1,45

8,7

8,136

-0,136

0,0185

1,7

4

4

8,4

-5

25

-1,05

5,25

8,355

0,045

0,00203

0,53571

5

5

8,6

-4

16

-0,85

3,4

8,574

0,026

0,00068

0,30233

6

6

8,4

-3

9

-1,05

3,15

8,793

-0,393

0,15445

4,67857

7

7

8,6

-2

4

-0,85

1,7

9,012

-0,412

0,16974

4,7907

8

8

9,7

-1

1

0,25

-0,25

9,231

0,469

0,21996

4,83505

9

9

10,2

0

0

0,75

0

9,45

0,75

0,5625

7,35294

10

10

10,3

1

1

0,85

0,85

9,669

0,631

0,39816

6,12621

11

11

10,2

2

4

0,75

1,5

9,888

0,312

0,09734

3,05882

12

12

10,1

3

9

0,65

1,95

10,107

-0,007

0,00005

0,06931

13

13

10,8

4

16

1,35

5,4

10,326

0,474

0,22468

4,38889

14

14

10,6

5

25

1,15

5,75

10,545

0,055

0,00303

0,51886

15

15

10,8

6

36

1,35

8,1

10,764

0,036

0,0013

0,33333

16

16

10,7

7

49

1,25

8,75

10,983

-0,283

0,08009

2,64486

17

17

10,2

8

64

0,75

6

11,202

-1,002

1,004

9,82352

Итого

153

160,6

0

408

-0,05

89,5

160,65

-0,05

3,14961

59,3691

Ср. знач.

9

9,45

a1 = = 0,219 a0 = 9,45 - 0,219 9 = 7,479

Линейная модель имеет вид yt = 7,479 + 0,219t.

2) Определим коэффициент детерминации.

Таблица 3.7 - Расчеты для коэффициента детерминации

t

у

ур

еt

еt2

1

7,5

7,698

-0,198

0,0392

-1,95

3,8025

2

7,5

7,917

-0,417

0,1739

-1,95

3,8025

3

8,0

8,136

-0,136

0,0185

-1,45

2,1025

4

8,4

8,355

0,045

0,00203

-1,05

1,1025

5

8,6

8,574

0,026

0,00068

-0,85

0,7225

6

8,4

8,793

-0,393

0,15445

-1,05

1,1025

7

8,6

9,012

-0,412

0,16974

-0,85

0,7225

8

9,7

9,231

0,469

0,21996

0,25

0,0625

9

10,2

9,45

0,75

0,5625

0,75

0,5625

10

10,3

9,669

0,631

0,39816

0,85

0,7225

11

10,2

9,888

0,312

0,09734

0,75

0,5625

12

10,1

10,107

-0,007

0,00005

0,65

0,4225

13

10,8

10,326

0,474

0,22468

1,35

1,8225

14

10,6

10,545

0,055

0,00303

1,15

1,3225

15

10,8

10,764

0,036

0,0013

1,35

1,8225

16

10,7

10,983

-0,283

0,08009

1,25

1,5625

17

10,2

11,202

-1,002

1,004

0,75

0,5625

Итого

160,6

160,65

-0,05

3,14961

-0,05

22,7825

Ср. знач.

9,45

R2 = 1 - = 0,86

3) Определим стандартную ошибку по формуле (3.3)

== 0,4582

4) Определим F - критерий Фишера

для =0,05, ,

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

5) Определим ошибку аппроксимации по формуле (3.2)

59,3691 = 3,5%

6) Осуществим прогноз на 2017

2017 г.: у18 = 7,479 + 0,219 18 = 11,4

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 2.6. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.8 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение.

Построим линейную модель уt = а0 + аit, параметры которой оценим через систему

Все расчёты представим в таблице 3.9

Таблица 3.9 - промежуточные расчёты

Месяц

t

y

t2

1

1

59,6

1

59,6

58,075

2

2

58,5

4

117

58,15

3

3

58

9

174

58,225

4

4

56,4

16

225,6

58,3

5

5

57,0

25

285

58,375

6

6

57,9

36

347,4

58,45

7

7

59,7

49

417,9

58,525

8

8

59,6

64

476,8

58,6

Итого

36

466,7

204

2103,3

466,7

Ср.знач.

4,5

58,3375

25,5

262,9125

Значение х меняем на значение t и находим параметры а0 и а1.

,

,

,

,

,

,

,

,

Линейная модель будет выглядеть следующим образом:

уt = 58 + 0,075t

1) Определим коэффициент детерминации по формуле (3.5)

Таблица 3.10 - Расчет коэффициента детерминации

y

59,6

58,075

1,525

2,325625

1,59

2,559

58,5

58,15

0,35

0,1225

0,03

0,59829

58

58,225

-0,225

0,050625

0,11

0,38793

56,4

58,3

-1,9

3,61

3,75

3.36879

57,0

58,375

-1,375

1,890625

1,79

2,41228

57,9

58,45

-0,55

0,3025

0,19

0,94991

59,7

58,525

1,175

1,380625

1,86

1,96817

59,6

58,6

1

1

1,59

1,67785

466,7

466,7

0

10,6825

10,91

13,92222

58,3375

R2 = 1 - = 0,02

2) Определим стандартную ошибку по формуле (3.3)

== 1,3343

3) Определим значимость модели с помощью F - критерия Фишера

для =0,05

Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.

4) Определим ошибку аппроксимации по формуле (3.2)

13,92222 = 1,7%

5) Осуществим прогноз цены одного доллара на декабрь 2017 года.

Декабрь: у12 = 58 + 0,075 12 = 58,9

Построим полулогарифмическую модель lnу = ао + а1t. Произведем замену У = . В результате получим линейное уравнение: У = ао + а1t.

Все расчёты представим в таблице 3.11

Таблица 3.11 - промежуточные расчёты

Месяц

t

y

t2

У

1

1

59,6

1

4,09

4,09

58,07

2

2

58,5

4

4,07

8,14

58,15

3

3

58

9

4,06

12,18

58,22

4

4

56,4

16

4,03

16,12

58,3

5

5

57,0

25

4,04

20,2

58,38

6

6

57,9

36

4,06

24,36

58,45

7

7

59,7

49

4,09

28,63

58,53

8

8

59,6

64

4,09

32,72

58,6

Итого

36

466,7

204

32,53

146,44

466,7

Ср.знач.

4,5

58,3375

25,5

4,00625

18,305

,

,

,

,

,

,

,

,

Полулогарифмическая модель будет выглядеть следующим образом:

lnу = 4,0604 + 0,013t

1) Определим коэффициент детерминации по формуле (3.5)

Таблица 3.12 - Расчет коэффициента детерминации

y

59,6

58,07

1,53

2,3409

1,59

2,5671

58,5

58,15

0,35

0,1225

0,03

0,5983

58

58,22

-0,22

0,0484

0,11

0,3793

56,4

58,3

-1,9

3,61

3,75

3,3688

57,0

58,38

-1,38

1,9044

1,79

2,42

57,9

58,45

-0,55

0,3025

0,19

0,9499

59,7

58,53

1,17

1,3689

1,86

1,9598

59,6

58,6

1

1

1,59

1,6778

466,7

466,7

0

10,6976

10,91

13,921

58,3375

R2 = 1 - = 0,02

2) Определим стандартную ошибку по формуле (3.3)

== 1,3353

3) Определим значимость модели с помощью F - критерия Фишера

для =0,05

Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.

4) Определим ошибку аппроксимации по формуле (3.2)

13,921 = 1,74%

5) Осуществим прогноз цены одного доллара на декабрь 2017 года.

Декабрь: у12 = = 58,9

Построим гиперболическую модель у = 1/(ао + а1t). Произведем замену У = . В результате получим линейное уравнение: У = ао + а1t.

Все расчёты представим в таблице 3.13

Таблица 3.13 - промежуточные расчёты

Месяц

t

y

t2

У

1

1

59,6

1

0,0168

0,0168

58,04

2

2

58,5

4

0,0171

0,0342

58,13

3

3

58

9

0,0172

0,0516

58,21

4

4

56,4

16

0,0177

0,0708

58,3

5

5

57,0

25

0,0175

0,0875

58,38

6

6

57,9

36

0,0173

0,1038

58,47

7

7

59,7

49

0,0167

0,1169

58,55

8

8

59,6

64

0,0168

0,1344

58,64

Итого

36

466,7

204

0,1371

0,616

466,72

Ср.знач.

4,5

58,3375

25,5

0,01714

0,077

,

,

,

,

,

,

,

,

Гиперболическая модель будет выглядеть следующим образом:

у=

1) Определим коэффициент детерминации по формуле (3.5)

Таблица 3.14 - Расчет коэффициента детерминации

y

59,6

58,04

1,56

2,4336

1,59

2,6175

58,5

58,13

0,37

0,1369

0,03

0,63248

58

58,21

-0,21

0,0441

0,11

0,36207

56,4

58,3

-1,9

3,61

3,75

3,3688

57,0

58,38

-1,38

1,9044

1,79

2,42105

57,9

58,47

-0,57

0,3249

0,19

0,9845

59,7

58,55

1,15

1,3225

1,86

1,9263

59,6

58,64

0,96

0,9216

1,59

1,6107

466,7

466,72

-0,02

10,698

10,91

13,354168

58,3375

R2 = 1 - = 0,02

2) Определим стандартную ошибку по формуле (3.3)

== 1,3353

3) Определим значимость модели с помощью F - критерия Фишера

для =0,05

Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.

4) Определим ошибку аппроксимации по формуле (3.2)

13,354168 = 1,7%

5) Осуществим прогноз цены одного доллара на декабрь 2017 года.

Декабрь: у12 = = 59

Из 3 построенных моделей, судя по стандартной ошибке (наименьшей) лучшей из них является линейная модель: уt = 58 + 0,075t.

Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество.

Таблица 3.15 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ (на конец года; рублей за единицу иностранной валюты)

Страна

Наименование валюты

2010

2011

2012

2013

2014

2015

Испания

евро

40,33

41,67

40,23

44,97

68,34

79,70

Решение.

1) Находим среднее значение иностранной валюты (у) и определяем по формуле (1.1). Исходные данные представлены в таблице 3.16

Таблица 3.16 - исходные данные

t

1

2

3

4

5

6

у

40,33

41,67

40,23

44,97

68,34

79,70

= = 52,24.

2) Определяем структурные средние (моду и медиану).

Так как мода - это наиболее часто встречающееся значение признака в данной совокупности, то М0 = 79,7.

Чтобы определить медиану, нужно значения у проранжировать в порядке возрастания:

у 40,23;40,33;41,67;44,97;68,34;79,7.

Ранжированный ряд является чётным. Для нахождения медианы берём и складываем 2 значения, располагающиеся посередине и делим на 2, т.е. находим среднее значение.

Ме = =43,32

3) Находим показатели вариации: дисперсию, среднее квадратическое отклонение, коэффициент вариации. Дисперсию рассчитываем по формуле (1.5)

у2= = = 244.

Зная дисперсию, находим среднее квадратическое отклонение

у = = 15,62

Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)

V= 100% = 29,9%

4) Построим линейную модель yt = а0 + аit, параметры которой оценим МНК

Промежуточные расчеты представим в таблице 3.17

Таблица 3.17 - Промежуточные расчеты

Год

t

у

t-tср

ур

еt

1

1

40,33

-2,5

6,25

-12,21

30,525

31,955

8,375

70,141

20,766

2

2

41,67

-1,5

2,25

-10,87

16,305

40,069

1,601

2,563

3,842

3

3

40,23

-0,5

0,25

-12,01

6,005

48,183

-7,953

63,25

19,768

4

4

44,97

0,5

0,25

-7,27

-3,635

56,297

-11,327

128,3

25,188

5

5

68,34

1,5

2,25

16,1

24,15

64,411

3,929

15,347

5,749

6

6

79,70

2,5

6,25

27,46

68,65

72,525

7,175

51,48

9,002

Итого

21

315,24

0

17,5

1,2

142

313,44

1,8

331,71

84,315

Ср. знач.

3,5

52,24

a1 = = 8,114 a0 = 52,24 - 8,114 3,5 = 23,841

Линейная модель имеет вид yt = 23,841 + 8,114t.

Для оценки качества модели используем такие показатели, как коэффициент детерминации, стандартная ошибка, значимость модели с помощью расчётного и табличного значения критерия Фишера и ошибка аппроксимации.

5) Определим коэффициент детерминации по формуле (3.6)

Таблица 3.18 - Расчеты для коэффициента детерминации

t

у

ур

еt

еt2

1

40,33

31,955

8,375

70,141

-12,21

149,0841

2

41,67

40,069

1,601

2,563

-10,87

118,1569

3

40,23

48,183

-7,953

63,25

-12,01

144,2401

4

44,97

56,297

-11,327

128,3

-7,27

52,8529

5

68,34

64,411

3,929

15,347

16,1

259,21

6

79,70

72,525

7,175

51,48

27,46

754,0516

Итого

315,24

313,44

1,8

331,71

1,2

1477,5956

Ср. знач.

52,24

R2 = 1 - = 0,78

6) Определим стандартную ошибку по формуле (3.3)

== 9,099

7) Определим значимость модели с помощью F - критерия Фишера

для =0,05

Вывод: расчётное значение критерия Фишера превышает табличное значение (F>Fтабл). Это свидетельствует о том, что модель имеет значимость.

8) Определим ошибку аппроксимации по формуле (3.2)

84,315 = 14%

Вывод: полученное значение не превышает 15%, что свидетельствует о хорошем качестве построенной модели.

Задача 3.6. По статистическим данным Росстата (таблица 3.7) выполнить комплексный статистический анализ инвестиций в основной капитал.

Таблица 3.19 - Инвестиции в основной капитал, млн. руб.

Номер студента

Регионы

2012

2013

2014

Приволжский федеральный округ

2012877

2301298

2355973

1; 15

Республика Башкорто--стан

233683

266396

285520

2; 16

Республика Маpий Эл

31656

46178

48354

3; 17

Республика Моpдовия

49825

53714

55292

4; 18

Республика Татарстан

470751

525730

542781

5; 19

Удмуртская Республика

64221

82678

89836

6; 20

Чувашская Республика

65255

60122

56446

7; 21

Пермский край

162241

219494

185649

8; 22

Киpовская область

50545

58655

56294

9; 23

Нижегородская область

257454

280884

286619

10; 24

Оренбургская область

151250

152877

150208

11; 25

Пензенская область

72343

82164

83690

12;26

Самарская область

213022

269737

300311

13; 27

Саратовская область

117646

125834

132804

14; 28

Ульяновская область

72985

76835

82168

Таблица 3.20 - Инвестиции в основной капитал, млн. руб.

Регионы

2012

2013

2014

Оренбургская область

151250

152877

150208

Этапы:

- графическое представление информации и ее анализ;

- определение средних величин и показателей вариации;

- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;

- определение показателей динамики инвестиций и их анализ;

- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.

Решение

1) Рост благосостояния общества, а также развитие экономики основаны на высоком масштабе воспроизводства товаров и услуг. Не последнюю роль в этом процессе выполняют инвестиции. На данный момент капитальные вложения являются одним из основных направлений вложения инвестиций в нашей стране.

Построим графически динамику объёма инвестиций в основной капитал в Оренбургской области за 2012- 2014 гг.

Рисунок 1 - Динамика объёма инвестиций в основной капитал в Оренбургской области.

Из рисунка 1 видно, что с 2012 года наблюдается увеличение инвестиций, с 2013 года - снижение.

2) Находим среднее значение инвестиций в основной капитал (у) и определяем по формуле (1.1). Исходные данные представлены в таблице 3.21

Таблица 3.21 - исходные данные

t

1

2

3

у

151250

152877

150208

= = 151 445 млн.руб.

Находим показатели вариации: дисперсию, среднее квадратическое отклонение, коэффициент вариации. Дисперсию рассчитываем по формуле (1.5)

у2= = = 1 206 272,7.

Зная дисперсию, находим среднее квадратическое отклонение

у = = 1098,3 млн.руб.

Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)

V= 100% = 0,73%

3) Определим коэффициента корреляции между инвестициями (у) и числом предприятий (тыс.) (х). Расчёты коэффициента корреляции представлены в таблице 3.22

Таблица 3.22 - расчёты коэффициента корреляции

у

х

ху

(x -)2

(у -)2

1

151 250

41,1

6 616 375

83 601 187 837,7

38 025

2

152 877

40,6

6 206 806

14 503 457 158,1

2 050 624

3

150 208

41

6 158 528

28 462 490 488,9

1 530 169

454 335

122,7

18 981 709

126 567 135 485

3 618 818

151 445

40,9

6 327 236,3

42 189 045 161,7

1 206 272,7

Определяем среднеквадратические отклонения х и у

ух = = 205 400

уу = = 1098,3

Находим коэффициент корреляции по формуле (2.1)

rxy = 0,0005

Находим расчётное значение коэффициента по формуле (2.2)

t = = = 0,0005

Далее определяем табличное значение коэффициента корреляции

t (0,05;3) = 3,18

Отсюда следует, что t t (0,05;6) .

Расчётное значение коэффициента не превышает табличное значение. Это значит, что полученный коэффициент не значим, образует очень слабую связь между двумя показателями.

4) Проанализируем данные показатели, и приведем в таблице 3.23 -- 3.24

Таблица 3.23 -- Анализ показателей Приволжского федерального округа

Год

Приволжский федеральный округ (инвестиции млн.руб.)

Абсолютный прирост, млн. руб.

Темп роста %

Темп прироста %

Цепной

Базисный

Цепной

Базисный

Цепной

Базисный

2012

2012877

-

-

-

-

-

-

2013

2301298

288421

288421

114,33%

114,33%

14,33%

14,33%

2014

2355973

54675

343096

102,38%

117,05%

2,38%

17,05%

В 2013 году по сравнению с 2012 наблюдается прирост в 14,33% . Общий прирост за 2012 -2014 гг. составил 17,05%. За базисный год брался 2012. Из данной таблицы можно сделать вывод, что прирост снизился.

Далее проанализируем инвестиции в Оренбургской области.

Таблица 3.24 - Анализ инвестиций в Оренбургской области

Год

Оренбургская область (инвестиции млн.руб.)

Абсолютный прирост, млн. руб.

Темп роста %

Темп прироста %

Цепной

Базисный

Цепной

Базисный

Цепной

Базисный

2012

151 250

-

-

-

-

-

-

2013

152 877

+ 1627

+ 1627

101,07

101,07

+ 1,07

+ 1,07

2014

150 208

- 2669

- 1042

98,25

99,31

- 1,75

- 0,69

Исходя из таблицы 3.11 можно сделать вывод, что темп прироста инвестиций в данном регионе в 2013 году по сравнению с 2012 увеличился и составил 1,07%, a в 2014 году по сравнению с 2013 уменьшился на 1,75%.

Таблица 3.25 - дополнительные расчеты для построения модели.

t

y

t-t?

y-y?

(y-y?)І

(y-y?)*(t-t?)

(t-t?)І

1

151 250

-1

-195

38 025

195

1

2

152 877

0

1432

2 050 624

0

0

3

150 208

1

-1237

1 530 169

-1237

1

? 6

454 335

0

0

3 618 818

-1042

2


2

151 445

5) Построим регрессионную модель связи инвестиций со временем (годами) и проведем ее статистический анализ.

Рассчитаем коэффициенты уравнения регрессии:

a1 = = -521 a0 = 151 445- 2 (- 521) = 152 847

Тогда линейная модель имеет вид

уt = 152 847 - 521t

Определим коэффициент детерминации по формуле (3.5)

Таблица 3.26 - Расчет коэффициента детерминации

у

151 250

152 326

- 1076

1 157 776

38 025

0,7114

152 877

151 805

1072

1 149 184

2 050 624

0,7012

150 208

151 284

- 1076

1 157 776

1 530 169

0,7163

? 454 335

455 415

- 1080

3 462 736

3 618 818

2,1289

R2 = 1 - = 0,04

Определим стандартную ошибку по формуле (3.3)

Sy == 1 860,84

Определим значимость модели с помощью F - критерия Фишера

для =0,05

Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не имеет значимости.

Определим ошибку аппроксимации по формуле (3.2)

2,1289 = 0,71%

Вывод: полученное значение не превышает 15%, что свидетельствует о хорошем качестве построенной модели.

Заключение

В заключении, можно сказать, что в ходе курсовой работы были закреплены знания, приобретённые в процессе изучения дисциплины «общая теория статистики» а именно:

- рассмотрены средние величины и показатели вариации;

- рассмотрены корреляционный анализ и регрессионный анализ.

Также на основе этих знаний были решены задачи и для каждой задачи сделаны выводы. Благодаря знаниям мы научились устанавливать связи в корреляционном анализе между двумя взаимосвязанными показателями, в регрессионном анализе - оценивать качество модели.

Статистка отражает количественные характеристики общественных явлений, событий. Числовые характеристики выступают в виде первичных (например, конкретные данные об организации или физическом лице) и сводных статистических показателей (информация об экономическом, демографическом, социальном положении в РФ), которые отражают реальные процессы в жизни общества.

Список использованных источников

1. Васильева Э.К, Лялин В.С. Статистика: учебник для вузов. - М.: ЮНИТИ-ДИНА, 2014 - 309 с.

2. Конденкова М. А. Инновационная экономика. -- Казань: Бук, 2017 - 98 с.

3. Статистика: учебник для вузов / под редакцией В.С. Мхитаряна - М.: Издательский центр «Академия», 2014 - 304 с.

Размещено на Allbest.ru


Подобные документы

  • Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

    контрольная работа [59,3 K], добавлен 26.06.2009

  • Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.

    контрольная работа [438,8 K], добавлен 06.11.2010

  • Понятие и сущность типологической группировки. Расчет динамики и структуры изменения объема продукции в квартальном разрезе и в целом за год. Вычисление показателей вариации, дисперсии, среднего квадратичного отклонения. Определение моды и медианы.

    контрольная работа [135,8 K], добавлен 24.09.2012

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Расчет средних уровней производительности труда и показателей вариации. Понятие моды и медианы признака, построение полигона и оценка характера асимметрии. Методика выравнивания ряда динамики по прямой линии. Индивидуальные и агрегатные индексы объема.

    контрольная работа [682,4 K], добавлен 24.09.2012

  • Вычисление средней арифметической заработных плат, моды и медианы, размаха вариации, дисперсии и среднего квадратичного отклонения. Статистический анализ товарооборота, его динамики и показателей. Оценка стоимости продукции, средней цены, удельного веса.

    контрольная работа [152,5 K], добавлен 08.01.2013

  • Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа [218,5 K], добавлен 27.02.2011

  • Распределение клиентов, воспользовавшихся услугами данной туристской фирмы в течение летнего сезона, по возрастному составу. Определение однородности представленного признака путем расчета коэффициента вариации. Расчет моды, медианы, линейного отклонения.

    контрольная работа [164,9 K], добавлен 31.03.2016

  • Группировка указанных данных с равными интервалами. Вычисление среднего арифметического, дисперсии и среднего квадратичного отклонения. Расчет коэффициентов вариации. Определение базисных показателей динамики. Построение столбиковых и круговых диаграмм.

    контрольная работа [281,7 K], добавлен 24.09.2012

  • Возрастание объемов продаж. Определение среднего, медианы и моды. Распределение цен на акции фармацевтической компании. Определение межквартильного размаха, среднего квадратичного отклонения, коэффициента вариации, дисперсии, показателя асимметрии.

    курсовая работа [28,3 K], добавлен 03.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.