Общая теория статистики

Статистика как самостоятельная общественная наука. Изучение методов статистических исследований, применяемых в области экономики, менеджмента. Способы проведения корреляционного и регрессионного анализа. Определение средних величин и показателей вариации.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»

КУРСОВАЯ РАБОТА

по дисциплине: «Общая теория статистики»

Автор работы

Федорова Л.Н.

Специальность: 38.03.01 Экономика.

Группа: 16ЭЭ3

Руководитель работы

В.Н. Деркаченко

Пенза 2017

Введение

Статистика - самостоятельная общественная наука, которая, как и любая другая наука, имеет свои методы исследования.

Для принятия наиболее оптимальных решений в области своей деятельности таким специалистам, как экономисты и менеджеры, необходимо овладеть методами статистических исследований, ведь в дальнейшем знания и умения пользоваться методами статистических исследований помогут более эффективно изучать тенденции рыночной конъюнктуры товаров и услуг.

Статистика играет огромную роль в области экономики, а статистическая информация является важнейшей составной частью глобальной информационной системы государства.

Можно сказать, что статистика обеспечивает анализ количественной стороны, а также служит основой для принятия соответствующих управленческих решений.

Развитие экономики характеризуется еще и тем, насколько эффективно используются ресурсы, имеющиеся в государстве, и прежде всего рабочая сила. Поддержание занятости - одно из важнейших цель экономической политики. статистика экономика менеджмент корреляционный

Основными задачами данной курсовой работы являются: - проведение корреляционного анализа;

- определение средних величин и показателей вариации;

- проведение регрессионного анализа.

Целью данной курсовой работы является решение задач по каждому из разделов.

Мой номер классного журнала - 21.

1. Средние величины и показатели вариации

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину[2].

В статистике используют различные виды средних величин, которые делятся на два больших класса:

1) степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая, средняя кубическая);

2) структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения. Поэтому их именуют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней - средняя арифметическая. Средней арифметической называется такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. [2].

(1.1)

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную.

= (1.2)

Также известны другие средние, их можно определить по общей формуле:

(1.3), где k - степень, определяющая различные средние.

Средняя гармоническая взвешенная находится по формуле:

гм= (1.4)

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр. [1].

Ме = Xн + i ) (1.5),

где Хн - нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений);

- накопленная частота интервала, предшествующего медианному;

mме - частота медианного интервала;

Также существует такой показатель как мода, который находится как:

М0 = хн + i (1.6),

где Хн - нижняя граница интервала, содержащего моду;

i - ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:

R = Xmax - Xmin (1,7)

Простое среднее линейное отклонение:

= (1.8)

Взвешенное среднее линейное отклонение:

вз = (1.9)

Среднеквадратическое отклонение:

у = (1.10).

Средняя дисперсия :

уІ = (1.11).

Взвешенная дисперсия:

уІвз = (1.12).

Среднее квадратическое отклонение:

) = (1.13)

Взвешенное среднее квадратическое отклонение:

= (1.14)

Коэффициент вариации - наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.

V = 100% (1.15)

Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Решение:

Увеличим значения на 21 и получим следующие данные:

24; 26; 23; 25; 28; 24; 29; 24; 31.

Определим среднее значение по формуле 1.1

= = 26

Мода = 24, так как это часто встречающее значение.

Чтобы определить медиану, необходимо расставить ряд в порядке возрастания.

Получим: 23; 24; 24; 24; 25; 26; 28; 29;31.

Количество значений нечетное, поэтому медианой будет являться число 25, т. к. оно занимает центральное положение в ряду.

Далее, определим среднюю дисперсию:

уІ(sІ) = =

Теперь вычислим среднеквадратическое отклонение:

у = = 2,24

Наконец, найдем коэффициент вариации:

V = = 8,6 %

Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 42%, стоимость основных фондов увеличилась на 31%. Определить изменение фондоотдачи.

Решение:

Фондоотдача = * 100% = *100% = 108%

Фондоотдача = 108%-100% = 8%

Таким образом, при увеличении дохода от реализации продукции в отчетном периоде по сравнению с базисным 42% на и увеличении стоимости основных средств на 31%, то фондоотдача изменится на 8%.

Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.

Таблица 1.1 - Исходные данные

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Решение:

Таблица 1.2

У

m

Середина интервала

Накопленная частота

80-100

6

90

6

100-120

17

110

23

120-140

25

130

48

140-160

28

150

76

160-180

14

170

90

180-200

10

190

100

Итого

100

Найдем среднюю простую:

x?= 141,4

Для определения моды и медианы, необходимо найти медийный интервал.

Медианным интервалом будет интервал 140-160, так как накопленная частота на этом промежутке превысит значение

50. (76 >50).

Найдем медиану:

140+20 =141,43

Вычисляем моду:

М0 = хн + i = 140 + 20[] =143,53

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 1.3). Каждое значение Хi увеличить на свой номер классного журнала.

Таблица 1.3. Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

22,0-22,2

3

3

22,2-22,4

4

4

22,4-22,6

17

17

22,6-22,8

11

15

26

22,8-23,0

13

6

19

23,0-23,2

18

5

23

23,2-23,4

6

6

23,4-23,6

2

2

50

50

100

Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.

Решение:

Чтобы определить общую дисперсию, необходимо знать значение общей средней:

При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:

= = 0,09 или 90 000 руб.

Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:

= = 23

Внутригрупповая дисперсия определяется по формуле:

или 556 000 руб.

Межгрупповая дисперсия вычисляется следующим образом:

или 344 000 руб.

Теперь необходимо рассчитать коэффициент детерминации:

- связь умеренная, т.к. находится в интервале 30% - 50%.

Таким образом,

Задача 1. 5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.4).

Таблица 1.4 - Исходные данные

1 группа

Хi

1

2

8

mi

30

15

5

2 группа

Хi

1

6

mi

10

15

3 группа

Хi

3

8

mi

20

5

Решение:

В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.

Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:

Теперь необходимо рассчитать общее среднее значение и общую дисперсию:

Ответ:

2. Корреляционный анализ

Корреляционный анализ -- это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять[3].

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи, с чем задачи корреляционного анализа можно дополнить следующими:

1) выявление факторов, оказывающих наибольшее влияние на результативный признак;

2) выявление неизученных ранее причин связей;

3) построение корреляционной модели с ее параметрическим анализом;

4) исследование значимости параметров связи и их интервальная оценка.

На величину показателей влияет несколько факторов, поэтому для оценки тесноты связи между показателем и факторами используются множественный корреляционный анализ. [3].

Корреляционный момент определяется:

(2.1),

где n - объем выборки, число наблюдений;

Xi , Yi - i-тое значение фактора и показателя;

X?, - средние значения фактора и показателя.

Корреляционный момент имеет размерность, то переходят к безразмерному коэффициенту корреляции:

rxy = (2.2),

где - среднеквадратические отклонения фактора и показателя.

Для расчета коэффициента корреляции также используется следующая зависимость:

rxy = (2.3),

где - среднее значения произведения фактора на показатель.

Коэффициент корреляции изменяется в пределах: -1 r +1

Значимость коэффициента корреляции базируется на проверке статистических гипотез, выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H0: r=0; H1: r 0.

После этого определяется расчетное значение критерия Стьюдента по формуле:

t = (2.4).

Далее находится табличное значение критерия Стьюдента. Входом в табличное значение является уровень значимости и степень свободы . На практике, чаще всего, принимают за 0; 0,5; = n2. Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если же, табличное значение критерия Стьюдента больше расчетного значения критерия, то нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим. [3].

Также для расчетов в этом разделе используется коэффициент ранговой корреляции Спирмена:

(2.5)

Корреляционный момент:

Кху = (2.6)

Задача 2. 1. Определить коэффициент корреляции между У и Х. Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Таблица 2.1

У

29,1

30,4

32,3

27,9

30,7

150,4

Х

24,5

25,6

26,8

25,2

26,2

128,3

ХУ

712,95

778,24

865,64

703,08

804,34

3864,25

(Хi-Х?)І

1,3456

0,0036

1,2996

0,2116

0,2916

3,152

(Уi-У?)І

0,9604

0,1024

4,9284

4,7524

0,3844

11,128

Вычислим средние значения:

X?=

У?=

Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y:

= 0,6304

Коэффициент корреляции определяется по формуле:\

В соответствии с данными задачи, расчет выглядит следующим образом:

Вывод: связь между показателем и фактором сильная, т.к. её значение находится в интервале 0,6-0,8. Значимость коэффициента корреляции проверяется по критерию Стьюдента. Вначале вычисляется расчетное значение критерия по формуле:

Табличное значение критерия Стьюдента:

Вывод: расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

Ответ: = ; ; коэффициент не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Таблица 2.2 Исходные данные

х

у

39

38

43

41

34

32

41

39

36

35

35

31

Решение:

Таблица 2.3

x

y

x2

y2

x * y

39

38

1521

1444

1482

43

41

1849

1681

1763

34

32

1156

1024

1088

41

39

1681

1521

1599

36

35

1296

1225

1260

35

31

1225

961

1085

228

216

8728

7856

8277

Для наших данных система уравнений имеет вид

6a + 228*b = 216

228*a + 8728*b = 8277

Домножим уравнение (1) на -38, получим систему, которую можно решить методом алгебраического сложения.

-228а - 8664*b = -8208

228*а + 8728*b = 8277

64*b = 69

b =1.0781

Теперь найдем коэффициент «а» из уравнения 1:

6*а + 228*1,0781 = 216

6*а = - 29813

а = -4,9688

Получаем эмпирические коэффициенты регрессии: b = 1.0781, a = -4.9688

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.0781 x -4.9688

Параметры уравнения регрессии

Выборочные дисперсии:

Среднеквадратическое отклонение:

Коэффициент корреляции:

Значимость коэффициента корреляции:

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:

tкрит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Задача 2.3.

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе.

Решение:

Таблица 2.4

Теория вероятности

Статистика

86

72

111

106

63

57

68

84

105

93

79

101

71

61

Матрица рангов.

Таблица 2.5

ранг (Rтв), dx

ранг (Rс), dy

(dx - dy)2

5

3

4

7

7

0

1

1

0

2

4

4

6

5

1

4

6

4

3

2

1

28

28

14

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Связь между признаком Y и фактором X сильная и прямая

3. Регрессионный анализ

Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi.

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.

- оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы[6].

В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.

Формулы и модели регрессионного анализа:

1) линейная модель

y= a0+a1x (3.1)

2) нахождение коэффициента а1 модели:

а1 = (3.2)

3) нахождение коэффициента a0 модели:

a0 = а1 (3.3)

4) стандартная ошибка :

Sy= (3.4)

5) коэффициент детерминации:

R 2 = 1- (3.5)

6) критерий Стьюдента для коэффициентов:

(3.6)

7) случайные отклонения a1 и a0

; (3.7)

8) критерий Фишера :

(3.8)

9) стандартное отклонение

(3.9)

10) стандартная ошибка:

(3.10)

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение: Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)

Таблица 3.1

y

y2

1/х

у/х

1/x2

х

42

1764

1

42

1

1

37

1369

0,5

18,5

0,25

2

36

1296

0,333

12

0,11

3

35

1225

0,25

8,75

0,625

4

34

1156

0,2

6,8

0,04

5

33,5

1122,25

0,167

5,583

0,028

6

32

1024

0,143

4,571

0,0204

7

32,5

1056,25

0,125

4,0625

0,016

8

31

961

0,111

3,44

0,0123

9

29

841

0,1

2,9

0,01

10

342

11814,5

2,929

108,4965

2,1117

55

Среднее значение

34,2

1181,45

0,293

10,84965

0,21117

5,5

Можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:

а1 = = = 6,6154

а0 = а1 = 34,2 - 6,6154 0,293 = 32,2617

Формально а0 показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.

Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

= 32,2617 +

Определим каждое значение .

Таблица 3.2 - Расчет показателей индекса детерминации, стандартной ошибки

y

Х

y?

(y-yЇ)І

(y-y^)І

42

1

38,8771

60,84

9,75250441

20,25

37

2

35,5694

7,84

2,04661636

12,25

36

3

34,4668

3,24

2,35070224

6,25

35

4

33,91555

0,64

1,1760318

2,25

34

5

33,58478

0,04

0,1724076

0,25

33,5

6

33,36427

0,49

0,0184226

0,25

32

7

33,2068

4,84

1,456366

2,25

32,5

8

33,088625

2,89

0,346479

6,25

31

9

32,99674

10,24

3,9869706

12,25

29

10

32,92324

27,04

15,391812

20,25

342

55

341,9933

118,1

36,69831

82,5

Ср.

знач.

34,2

5,5

34,19933

11,81

8,25

По данной таблице определим коэффициент детерминации:

R2 = 1- = 1- = 0,69

Можно вычислить индекс детерминации (R), он равен:

R = = 0,83. В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

Стандартная ошибка :

Sy= = = 12,9748

Критерий Фишера (F):

= = 17,81

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f = 8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается нулевая гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля, для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели:

0,125

Далее определим случайные отклонения a0 и а1:

4,7698

32,848

Далее определим критерий Стьюдента для коэффициентов:

0,20139

6,76374

Фактические значения t - статистики для параметров , превышают табличные:

6,76 ?= 2,306; =0,201 < 2,306

Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:

= 2,306·4,7698 = 10,9991

= 2,306·32,848 = 75,7475

Доверительные интервалы:

Таким образом, доверительный интервал для а0:

32,2614-10,9991? a0?32,2614+10,9991

21,2623? a0?43,2305

6,6154 - 75,7475? a1?6,6154 + 75,7475

-69,1321 а182,3629

Таким образом, на основе анализа верхних и нижних границ доверительных интервалов можно сделать вывод, что параметры и с вероятностью 95% будут находиться в указанных границах интервалов.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным: Определить характеристики модели.

Характеристики модели:

1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Таблица 3.3

х

у

1

31

0

0

0

2

34,4

0,69

0,48

23,736

3

36,4

1,10

1,21

40,04

4

37,5

1,39

1,93

52,125

5

39,6

1,61

2,59

63,756

6

40,1

1,79

3,20

71,779

21

219

6,58

9,41

251,436

Определим а0 и а1 для построения модели:

а1 = = = 5,14

а0 = = = 30,8631

Далее, найдя коэффициенты, можем построить модель: = 30,8631 + 5,14lnx

Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.

Таблица 3.4 - Расчет индекса детерминации

Y

X

y?

(y-yЇ)І

(y-y^)І

31

1

30,8631

30,25

0,0187

34,4

2

34,4097

4,41

0,0001

36,4

3

36,5171

0,01

0,0137

37,5

4

38,0077

1

0,2578

39,6

5

39,1385

9,61

0,212

40,1

6

40,0631

12,96

0,0013

219

21

219,0685

58,24

0,5036

Ср.знач.

36,5

3,5

По найденным значениям определим индекс детерминации:

0,99

Получается, что связь между признаком Y и фактором X высокая и прямая.

Определим стандартную ошибку:

0,1259 (3.1.9)

Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости б=0,05 и числе степеней свободы k1 = 1, k2 = n - 2 = 6 - 2 = 4. Fкр=7,71.

Так как наблюдаемое значение критерия больше табличного F = 396 ? Fкр = 7,71 следовательно, с вероятностью 0,95 уравнение регрессии считается статистически значимым.

Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5.

Таблица 3.5. Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой:

;

Таблица 3.6 - Промежуточные расчеты.

Год (t)

У

t - t?

(t-tЇ)І

y-y?

(t-t?)(y-y?)

ур

y-y?

(y-y^)І

(y-yЇ)І

1

7,5

-8

64

-1,947

15,576

7,692

-0,192

0,03694

2,56

3,791

2

7,5

-7

49

-1,947

13,629

7,912

-0,412

0,16933

5,49

3,791

3

8

-6

36

-1,447

8,6824

8,131

-0,131

0,01713

1,64

2,094

4

8,4

-5

25

-1,047

5,2353

8,350

0,050

0,00248

0,59

1,096

5

8,6

-4

16

-0,847

3,3882

8,570

0,030

0,00092

0,35

0,718

6

8,4

-3

9

-1,047

3,1412

8,789

-0,389

0,15132

4,63

1,096

7

8,6

-2

4

-0,847

1,6941

9,008

-0,408

0,16671

4,75

0,718

8

9,7

-1

1

0,2529

-0,253

9,228

0,472

0,22307

4,87

0,064

9

10,2

0

0

0,7529

0

9,447

0,753

0,56686

7,38

0,567

10

10,3

1

1

0,8529

0,8529

9,666

0,634

0,40145

6,15

0,728

11

10,2

2

4

0,7529

1,5059

9,886

0,314

0,09872

3,08

0,567

12

10,1

3

9

0,6529

1,9588

10,105

-0,005

0,00003

0,05

0,426

13

10,8

4

16

1,3529

5,4118

10,325

0,476

0,22610

4,40

1,83

14

10,6

5

25

1,1529

5,7647

10,544

0,056

0,00315

0,53

1,329

15

10,8

6

36

1,3529

8,1176

10,763

0,037

0,00135

0,34

1,83

16

10,7

7

49

1,2529

8,7706

10,983

-0,283

0,07986

2,64

1,57

17

10,2

8

64

0,7529

6,0235

11,202

-1,002

1,00400

9,82

0,567

153

160,6

0

408

0

89,5

160,6

0

3,14943

59,281

22,78

9

9,4471

0,219 , соответственно =9,4471-0,219·9 = 7,476

Отсюда уравнение линейного тренда принимает окончательный вид: y?t=0,219t +7,476

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц. Определим коэффициент детерминации:

0,8617

- т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Определим стандартную ошибку:

0,4582 (3.1.9)

Оценим значимость модели с помощью критерия Фишера:

93,46.

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4,54. Поскольку F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Определим ошибку аппроксимации:

100% = 3,492%.

В среднем, расчетные значения отклоняются от фактических на 3,49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Спрогнозируем коэффициент рождаемости в 2017:

y?2017=0,219·18+7,476 = 11,4.

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.7. Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :

Таблица 3.8 - промежуточные расчеты

T

Цена (y)

t-t?

y-y?

(t-t?)( y-y?)

(t-tЇ)І

y?

y-y?

(y-y^)І

(y-y?)І

1

59,6

-3,5

1,2625

-4,41875

12,25

58,075

1,525

2,325625

2,5587

1,5939

2

58,5

-2,5

0,1625

-0,40625

6,25

58,15

0,35

0,1225

0,59829

0,0264

3

58

-1,5

-0,3375

0,50625

2,25

58,225

-0,225

0,050625

0,38793

0,1139

4

56,4

-0,5

-1,9375

0,96875

0,25

58,3

-1,9

3,61

3,36879

3,7539

5

57

0,5

-1,3375

-0,66875

0,25

58,375

-1,375

1,890625

2,41228

1,7889

6

57,9

1,5

-0,4375

-0,65625

2,25

58,45

-0,55

0,3025

0,94991

0,1914

7

59,7

2,5

1,3625

3,40625

6,25

58,525

1,175

1,380625

1,96817

1,8564

8

59,6

3,5

1,2625

4,41875

12,25

58,6

1

1

1,67785

1,5939

36

466,7

0

0

3,15

42

466,7

0

10,6825

13,92196

10,91875

Сред. знач 4,5

58,3375

58,3375

0,075. тогда : a0= 58,3375 - 4,5?0,075 = 58

Таким образом, линейная модель будет выглядеть как:

Определим коэффициент детерминации:

0,0216.

Определим стандартную ошибку: 1,3343.

Определим значимость модели используя критерий Фишера:

0,1325.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5,99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

1,74

- в среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь 2017 года:=12·0,075+58=58,9

Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.2.2. Для удобства расчета проведем замену: lny=У

Таблица 3.9 - Промежуточные расчеты для модели lnу = ао + а1t

t

Цена (y)

У

1

59,6

4,0877

1

4,0877

4,061592

0,02611

0,02165

0,0006817

0,000468723

0,6387455

2

58,5

4,069

4

8,138

4,062865

0,00613

0,00295

0,00003758

0,0000087025

0,15065127

3

58

4,0604

9

12,1812

4,064139

-0,00374

-0,00565

0,00001399

0,0000319225

0,09210915

4

56,4

4,0325

16

16,13

4,065413

-0,03291

-0,03355

0,00108307

0,001125603

0,81611903

5

57

4,0431

25

20,2155

4,066687

-0,02359

-0,02295

0,000556488

0,000526703

0,58346318

6

57,9

4,0587

36

24,3522

4,067961

-0,00926

-0,00735

0,0000857

0,00005402

0,22815187

7

59,7

4,0893

49

28,6251

4,069235

0,02007

0,02325

0,000402805

0,000540563

0,49079305

8

59,6

4,0877

64

32,7016

4,070508

0,01719

0,02165

0,000295496

0,000468723

0,42052988

?36

466,7

32,5284

204

146,4313

32,5284

0

0

0,003156901

0,00322496

3,42056294

Ср.

знач

4,5

58,3375

4,06605

25,5

18,3039

4,06605

0,00127;

a0 = 4,06605 - 4,5?0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny = 0,00127t + 4,0603

Определим коэффициент детерминации:

0,0211.

Определим стандартную ошибку:

0,0299.

Определим значимость модели, используя критерий Фишера:

0,1293.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

0,4276

Осуществим прогноз на декабрь: 58,9

Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.2.3. Для удобства расчета проведем замену : 1/у = У

Таблица 3.10 - Промежуточные расчеты для модели у = 1/(ао + а1t)

t

Цена (y)

У

y-y?

(y-y^)І

1

59,6

0,0168

1

0,0168

58,11138

1,48862

2,21599

1,59391

2,49768

2

58,5

0,0171

4

0,0342

58,16772

0,33228

0,11041

0,02641

0,56801

3

58

0,0172

9

0,0516

58,22416

-0,22416

0,05025

0,11391

0,38649

4

56,4

0,0177

16

0,0708

58,28072

-1,88072

3,53710

3,75391

3,33461

5

57

0,0175

25

0,0875

58,33738

-1,33738

1,78860

1,78891

2,34629

6

57,9

0,0173

36

0,1038

58,39416

-0,49416

0,24419

0,19141

0,85347

7

59,7

0,0168

49

0,1176

58,45105

1,24895

1,55988

1,85641

2,09205

8

59,6

0,0168

64

0,1344

58,50804

1,09196

1,19237

1,59391

1,83214

36

466,7

0,1372

204

0,6167

466,4746

0,22538

10,69879

10,91875

13,9107

Ср.

знач. 4,5

58,3375

0,01715

25,5

0,0770875

58,30933

0,0000167;

a0 = 0,01715 + 4,5?0,0000167 = 0,017225.

Таким образом, модель будет иметь вид:

Определим коэффициент детерминации:

0,02014.

Определим стандартную ошибку:

1,335.

Определим значимость модели, используя критерий Фишера:

0,1233.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

1,7388

Осуществим прогноз на декабрь: 58,7

Лучшая модель, судя по величине стандартной ошибки (наименьшая) является: lny = 0,00127t + 4,0603

Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество.

Таблица 3.11. Исходные данные

Страна

Наименование валюты

2010

2011

2012

2013

2014

2015

21. Турция

Турецкая лира

19,60

16,83

16,97

15,30

24,27

25,08

Определим средний курс: 19,67 руб.

Мода - это часто повторяющееся значение в совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.

Ранжируем ряд данных: 15,30; 16,83; 16,97; 19,60; 24,27; 25,08

18,285

Найдем дисперсию

34,84

Определим среднее квадратическое отклонение:

руб.

Рассчитаем коэффициент вариации:

30,04%.

Построим линейную модель связи показателя со временем, которое будет выглядеть следующим образом: , где t - год.

Таблица 3.12 - Расчеты данных уравнения тренда

Год

t

У

t-t?

y-y?

(y-y?)(t-t?)

(t-tЇ)І

(y-yЇ)І

2010

1

19,60

-2,5

-0,07

0,175

6,25

0,0049

2011

2

16,83

-1,5

-2,84

4,26

2,25

8,0656

2012

3

16,97

-0,5

-2,7

1,35

0,25

7,29

2013

4

15,30

0,5

-4,37

-2,185

0,25

19,0969

2014

5

24,27

1,5

4,6

6,9

2,25

21,16

2015

6

25,08

2,5

5,41

13,525

6,25

29,2681

?

21

118,02

24,025

17,5

84,8855

Среднее значение

3,5

19,67

Определим и a0:

= 1,3729

a0 = 19,67 - 3,5?1,3729 = 14,8625

Таким образом, линейная модель имеет вид: 14,8625 + 1,3729t

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса AMD, причем величина прироста ежегодно составляет в среднем 1,3729 руб.

Для анализа полученной модели постоим таблицу.

Таблица 3.13 - Анализ модели, дополнительные вычисления

у?

y-y?

(y-y^)І

16,2354

3,3646

11,320533

19,59902235

17,6083

-0,7783

0,60575089

2,876341321

18,9812

-2,0112

4,0449254

20,59941053

20,3541

-5,0541

25,543927

25,77909082

21,727

2,543

6,466849

5,460094486

23,0999

1,981

3,924361

8,840293959

? 117,972

51,906346

83,15425347

Определим коэффициент детерминации:

0,389.

Определим стандартную ошибку:

3,602299

Определим значимость модели, используя критерий Фишера:

2,546645

При уровне значимости 0,05 и степенях свободы табличное значение критерия составляет 7,71. Так как , то уравнение регрессии признается статистически не значимым.

Задача 3.6. По статистическим данным Росстата выполнить комплексный статистический анализ инвестиций в основной капитал.

Таблица 3.14 Инвестиции в основной капитал, млн. руб.

Номер студента

Регионы

2012

2013

2014

21

Пермский край

162 241

219494

185 649

Этапы:

- графическое представление информации и ее анализ;

- определение средних величин и показателей вариации;

- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;

- определение показателей динамики инвестиций и их анализ;

- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.

Решение:

По данному графику мы видим, что инвестиции в основной капитал Пермского края до 2013 года увеличивались, а после снизились.

2) Определим коэффициент корреляции между инвестициями и выбранным фактором

Таблица 3.15

Приволж фед. Округ (Х)

Пермский край (у)

у-у?

х-х?

(х-х?)(у-у?)

(у-у?)І

(х-х?)І

2 012 877

162 241

-210 505,6667

-26 887

5 659 865 861

44 312 635 699

722 910 769

2 301 298

219 494

77 915,33333

30 366

2 365 977 012

6 070 799 168

922 093 956

2 355 973

185 649

132 590,3333

-3 479

-461 281 769

17 580 196 493

12 103 441

6 670 148

567 384

0

0

7 564 561 104

67 963 631 361

1 657 108 166

2 223 382,67

189 128

Определим средние величины и показатели вариации

189 128 млн.руб.

Рассчитаем дисперсию по формуле:

552 369 388,7

Среднее квадратическое отклонение:

23 502,54

Коэффициент вариации рассчитаем по формуле:

Таким образом, каждое значение ряда отличается от среднего на 23 502,54 млн. руб.

0,713

Таблица 3.16 - дополнительные расчеты для построения модели.

T

y

t-t?

y-y?

(y-yЇ)І

(y-y?)*(t-t?)

(t-tЇ)І

1

162 241

-1

-26 887

722 910 769

26887

1

2

219 494

0

30 366

922 093 956

0

0

3

185 649

1

-3 479

12 103 441

-3479

1

6

567 384

0

0

1 657 108 166

23408

2

2

189128

Рассчитаем коэффициенты уравнения регрессии:

11 704

a0= 189128 - 2?11704= 165 720

Таким образом, линейная модель:

Определим коэффициент детерминации:

37 190,6

Определим значимость модели используя критерий Фишера:

Табличное значение критерия со степенями свободы k1=1 и k2=1, Fтабл = 161,45. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим.

Вычислим ошибку аппроксимации:

10,76

Определим динамику темпа роста в Приволжском округе

Таблица 3.17

Год

Приволжский округ

Абсолютный прирост, млн. руб.

Темп роста %

Темп прироста %

Цепной

Базисный

Цепной

Базисный

Цепной

Базисный

2012

2012877

-

-

-

-

-

-

2013

2301298

288421

288421

114,33%

114,33%

14,33%

14,33%

2014

2355973

54675

343096

102,38%

117,05%

2,38%

17,05%

Наблюдается положительная динамика темпа роста инвестиций и отрицательная динамика темпа прироста.

Определим динамику роста в Пермском крае

Таблица 3.18

Год

Пермский край

Абсолютный прирост, млн. руб.

Темп роста %

Темп прироста %

Доля от общих инвестиций

Цепной

Базисный

Цепной

Базисный

Цепной

Базисный

2012

162241

-

-

-

-

-

-

8,06%

2013

219494

57253

57253

135,29%

135,29%

35,29%

35,29%

9,54%

2014

185649

-33845

23408

84,58%

114,43%

-15,42%

14,43%

7,88%

Таким образом, была изучена зависимость инвестиций от времени (года). На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера.

Заключение

Статистическая закономерность составляет предмет статистической науки. Она представляет одну из форм проявления всеобщей причинной связи между явлениями в природе и обществе.

Статистическое наблюдение обеспечивает получение необходимых данных о количественных значениях тех или иных показателей и, естественно, должны изменяться в соответствии с требованиями системы статистических наблюдений.

В ходе выполнения работы были рассмотрена теория по основным средним величинам, показателям вариации, корреляционному анализу, регрессионному анализу и решены задачи по ним. Для решения задач использовалась программа MS Excel.

Таким образом, статистика выполняет важную роль в механизме управления экономикой. Наличие систематической, полной и своевременной информации о происходящих процессах и явлениях - необходимое условие эффективных управленческих решений на государственном и региональном уровнях. Состав статистической информации в условиях рыночных отношений во многом определяется практическими потребностями общества, Качество и достоверность статистических данных - основа эффективных решений, способствующих успешному реформированию экономики.

Список использованных источников

1. Васильева Е.К. Статистика: Учебник / Е. К. Васильева, В.С. Ляпин. - Юнити, 2013, 399 с.

2. Елисеева И.И. Избашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2014, 656 с.

3. Ефимова, М.Р. Общая теория статистики: Учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. - М.: ИНФРА-М, 2013. 416 c.

4. Кошевой О.С., Некрылова Н.В. Общая теория статистики: учебное пособие. - Пенза: Издательство ПГУ, 2017. 138 с.

Размещено на Allbest.ru


Подобные документы

  • Предмет статистики. Метод статистики. Расчёт показателей вариации. Ряды динамики. Выборочное наблюдение. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа.

    курсовая работа [134,4 K], добавлен 21.10.2004

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.

    методичка [2,2 M], добавлен 16.02.2011

  • Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.

    курсовая работа [180,5 K], добавлен 10.08.2009

  • Статистика как общественная наука, изучающая количественную сторону массовых общественных явлений с целью выявления их особенностей и закономерностей развития. Понятия, предмет, задачи, система статистических показателей. Организация статистики в России.

    реферат [16,8 K], добавлен 04.06.2010

  • Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

    реферат [162,6 K], добавлен 04.06.2010

  • Определение термина "статистика" и история ее возникновения. Взаимосвязь статистики с другими науками. Виды статистических исследований. Предназначение корреляционно-регрессионного анализа и выборочного метода. Методика анализа сезонных колебаний.

    реферат [33,1 K], добавлен 10.01.2015

  • Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.

    курсовая работа [895,1 K], добавлен 20.03.2015

  • Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.

    эссе [18,7 K], добавлен 17.10.2014

  • Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

    контрольная работа [564,1 K], добавлен 13.09.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.