Общая теория статистики

Рассмотрение теоретического обоснования сущности, общих понятий и методов расчета средних величин. Характеристика системы показателей и информационной базы корреляционно-регрессионного анализа. Определение средних величин и показателей вариации.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 535,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра «Экономика и финансы»

Курсовая работа

по дисциплине «Общая теория статистики»

Направление подготовки -38.03.01 Экономика

Профиль подготовки - Мировая экономика

Выполнила студентка: Зябирова Д.И.

Группа:16ээ2

Руководитель: Деркаченко В.Н.

к.т.н., доцент

2017

Содержание

Введение

1. Средние величины и показатели вариации

2. Корреляционный анализ

3. Регрессионный анализ

Заключение

Список использованных источников

Введение

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления.

Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития. Данные, упитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов- от численности взрослого мужского населения, доходов казны- от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.

С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.

Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика.

Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.

Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.

Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:

1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;

2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;

3. Выполнение расчетов.

корреляционный регрессионный вариация информационный

1. Средние величины и показатели вариации

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Существует 2 класса средних величин: степенные и структурные.

К структурным средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.

Степенные средние могут быть простыми и взвешенными.

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

где X - значения отдельных статистических величин или середин группировочных интервалов;

m - показатель степени, от значения которого зависят следующие виды степенных средних величин:

Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.

Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.

Если X задан равными интервалами, то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:

где Мо - мода;

ХНМо - нижняя граница модального интервала;

hМо - размах модального интервала (разность между его верхней и нижней границей);

fМо - частота модального интервала;

fМо-1 - частота интервала, предшествующего модальному;

fМо+1 - частота интервала, следующего за модальным.

Статистическая медиана - это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.

Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).

Если X задан в виде равных интервалов, то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:

где Ме - медиана;

ХНМе - нижняя граница медианного интервала;

hМе - размах медианного интервала (разность между его верхней и нижней границей);

fМе - частота медианного интервала;

fМе-1 - сумма частот интервалов, предшествующих медианному.

Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации.

Линейный коэффициент вариации - это отношение среднего линейного отклонение к средней арифметической:

С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.

Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую:

Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперсию взвешенную:

Если значения X - это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:

.

Выше уже было рассказано о формуле средней квадратической, которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:

Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:

Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:

Задание 1.1

По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение было увеличено на номер классного журнала (7). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Дано (х): 10; 12; 9; 11; 14; 10; 15; 10; 17;

Определим среднее значение:

Моду: - наиболее часто встречающееся значение ряда.

Медиана. Для ее расчета расположим ряд в порядке возрастания:

9, 10, 10, 10, 11, 12, 14, 15, 17.

Количество элементов 9, нечетное количество, медианой будет являться число 11, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.

Вычислим дисперсию:

=6,7

Вычислим среднеквадратическое отклонение:

И коэффициент вариации составит:

Задание 1.2

По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 28%, стоимость основных фондов увеличилась на 17%. Определить изменение фондоотдачи.

Фондоотдача - это финансовый коэффициент, характеризующий эффективность использования основных средств организации. Фондоотдача показывает, сколько выручки приходится на единицу стоимости основных средств.

, соответственно изменение фондоотдачи:

= 9,4%

Таким образом, фондоотдача увеличилась на 9,4%

Задание 1.3

Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Определим среднее значение моду и медиану. Промежуточные вычисления приведены в таблице 2

Таблица 2 - Промежуточные вычисления

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

У?

90

110

130

150

170

190

m*У?

540

1870

3250

4200

2380

1900

У?/2

45

55

65

75

85

95

Накопл. частота

6

23

48

76

90

100

Общее число работников составляет человек

Среднее значение x?=

Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение . (76>50). Вычислим моду:

Вычислим медиану:

Задание 1.4

По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 3). Каждое значение Хi было увеличено на номер классного журнала (7).

Таблица 3 - Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

8,0-8,2

3

3

8,2-8,4

4

4

8,4-8,6

17

17

8,6-8,8

11

15

26

8,8-9,0

13

6

19

9,0-9,2

18

5

23

9,2-9,4

6

6

9,4-9,6

2

2

50

50

100

Для удобства расчета составим таблицу 4, в которой будут отражены промежуточные вычисления по нахождению общей дисперсии.

Таблица 4 - Расчет общей дисперсии

Число предприятий

Расчет дисперсии

Хi (млн. руб)

mгi

mчi

moi

Хср.i

Хср.i*moi

(Хср.i-X?o)^2

(Хср.i-X?o)І*moi

8,0-8,2

3

3

8,1

24,3

0,509796

1,529388

8,2-8,4

4

4

8,3

33,2

0,264196

1,056784

8,4-8,6

17

17

8,5

144,5

0,098596

1,676132

8,6-8,8

11

15

26

8,7

226,2

0,012996

0,337896

8,8-9,0

13

6

19

8,9

169,1

0,007396

0,140524

9,0-9,2

18

5

23

9,1

209,3

0,081796

1,881308

9,2-9,4

6

6

9,3

55,8

0,236196

1,417176

9,4-9,6

2

2

9,5

19

0,470596

0,941192

У

50

50

100

881,4

8,9804

Общее среднее: млн. руб.

Общая дисперсия: у2о= млн.руб. (89804 руб.)

Далее рассчитаем дисперсию по группам: для государственных и частных предприятий.

Таблица 5 - Расчет дисперсии (гос. предприятия)

Хi (млн. руб)

mгi

Хср.i

Хср.i*mгi

(Хср.i-X?г)І

(Хср.i-X?г)І*mгi

8,6-8,8

11

8,7

95,7

0,09

0,99

8,8-9,0

13

8,9

115,7

0,01

0,13

9,0-9,2

18

9,1

163,8

0,01

0,18

9,2-9,4

6

9,3

55,8

0,09

0,54

9,4-9,6

2

9,5

19

0,25

0,5

У

50

450

2,34

Среднее значение : млн. руб.

Дисперсия: у2г= млн.руб. (46800 руб.)

Таблица 6 - Расчет дисперсии (частные предприятия)

Хi (млн. руб)

mчi

Хср.i

Хср.i*mчi

(Хср.i-X?ч)І

(Хср.i-X?ч)І*mчi

8,0-8,2

3

8,1

24,3

0,278784

0,836352

8,2-8,4

4

8,3

33,2

0,107584

0,430336

8,4-8,6

17

8,5

144,5

0,016384

0,278528

8,6-8,8

15

8,7

130,5

0,005184

0,07776

8,8-9,0

6

8,9

53,4

0,073984

0,443904

9,0-9,2

5

9,1

45,5

0,222784

1,11392

У

50

431,4

3,1808

Среднее значение : млн. руб.

Дисперсия: у2ч= млн.руб. (63616 руб.)

Средняя внутригрупповая дисперсия:

у?в=

Общая дисперсия равна сумме межгрупповой и среднегрупповой дисперсий, следовательно межгрупповая дисперсия будет равна:

уІмг= уІо - у?в= 89804 - 55208 = 34596 руб.

Вычислим коэффициент детерминации:

Таким образом, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.

Задание 1.5

Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 7 - Исходные данные

1 - группа

Хi

1

2

8

mi

30

15

5

2 - группа

Хi

1

6

mi

10

15

3 - группа

Хi

3

8

mi

20

5

Для удобства расчета общей дисперсии составим таблицу 8, в которой будут представлены вычисления.

Таблица 8 - Вычисление общей дисперсии.

Xi

mi

Расчет дисперсии

1

2

3

moi

Х*moi

(Х-Х?o)І

(Х-Х?o)І*moi

1

30

10

40

40

4

160

2

15

15

30

1

15

3

20

20

60

0

0

6

15

15

90

9

135

8

5

5

10

80

25

250

Сумма

100

300

560

Среднее общее значение : х?о=

Общая дисперсия:

Далее определим дисперсию для каждой группы в отдельности :

Таблица 9 - Вычисление дисперсии для 1 группы

Xi

m1i

X*m1i

(Х-Х?1)І

(Х-Х?1)І*m1i

1

30

30

1

30

2

15

30

0

0

8

5

40

36

180

Среднее значение : X?1=

Дисперсия: уІ1=

Таблица 10 - Вычисление дисперсии для 2 группы

Xi

m2i

X*m2i

(Х-Х?2)І

(Х-Х?2)І*m2i

1

10

10

9

90

6

15

90

4

60

Среднее значение : X?2=

Дисперсия: уІ2=

Таблица 11 - Вычисление дисперсии для 3 группы

Xi

m3i

X*m3i

(Х-Х?3)І

(Х-Х?3)І*m3i

3

20

60

1

20

8

5

40

16

80

Среднее значение : X?3=

Дисперсия: уІ3=

Вычислим среднюю внутригрупповую дисперсию: у?Ів=

И межгрупповую: уІмг=уІо-у?Ів= 5,6 - 4,73 = 0,87

2. Корреляционный анализ

Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y.

Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:

1. Вычисление выборочных коэффициентов корреляции.

2.Составление корреляционной таблицы.

3. Проверка статистической гипотезы значимости связи.

Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и ц(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.

Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.

Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой:

где уX и уY выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:

Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r: r=rB (9)

Принимая во внимание формулы:

видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:

где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:

Основные свойства выборочного коэффициента линейной корреляции:

1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.

2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.

3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству 0<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.

4. Чем ближе |r| к 1, тем теснее прямолинейная корреляция между величинами Y, X.

По своему характеру корреляционная связь может быть прямой и обратной, а по силе - сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.

Таблица 12 - Сила и характер связи между параметрами

Сила связи

Характер связи

Прямая (+)

Обратная (-)

Полная

1

-1

Сильная

От 0,7 до 1

От -0,7 до -1

Средняя

От 0,3 до 0,7

От -0,3 до -0,7

Слабая

От 0,3 до 0

От -0,3 до 0

Связь отсутсвует

0

0

Задание 2.1

Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ:28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Определим У, увеличим Х и У на номер журнала.

Таблица 13 - Результаты вычислений

У

15,1

16,4

18,3

13,9

16,7

Х

10,5

11,6

12,8

11,2

12,2

ХУ

158,55

190,24

234,24

155,68

203,74

(Хi-Х?)І

1,3456

0,0036

1,2996

0,2116

0,2916

(Уi-У?)І

0,9604

0,1024

4,9284

4,7524

0,3844

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Вычислим коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче: f= 5-2 =3.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента:

Таким образом, табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а следовательно коэффициент корреляции не значим.

Задание 2.2

Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Это нулевой вариант. Каждое значение х и у было увеличено на свой номер классного журнала (4).

Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 14

Таблица 14 - Результаты промежуточных вычислений.

Сумма

Х

25

29

20

27

22

21

144

У

24

27

18

25

21

17

132

ХУ

600

783

360

675

462

357

3237

(Хi-Х?)І

1

25

16

9

4

9

64

(Уi-У?)І

4

25

16

9

1

25

80

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. В данной задаче значение степени свободы: f= 6-2 =4.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента: :

Таким образом, табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а следовательно коэффициент корреляции значим

Задание 2.3

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.

Результаты:

1.Коэффициент ранговой корреляции.

2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Решение:

Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. Все эти вычисления представлены в таблице 15 (все значения баллов были увеличены на номер классного журнала - 7).

Таблица 15 - Расчет коэффициента ранговой корреляции Спирмена.

№ студента

1

2

3

4

5

6

7

Теория вероятностей

72

97

49

54

91

65

57

Статистика

58

92

43

70

79

87

47

Ранг (Rтв)

5

7

1

2

6

4

3

Ранг (Rст)

3

7

1

4

5

6

2

4

0

0

4

1

4

1

Значение степени свободы составляет f = 7 - 2 =5

Количество ранжируемых элементов: n = 7

Коэффициент корреляции Спирмена:

Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости б=0,05, оно равно . Таким образом, расчетное значение критерия корреляции Спирмена меньше критического значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент корреляции не значим.

Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 16

Таблица 16 - Расчет коэффициента корреляции Стьюдента.

№ студента

1

2

3

4

5

6

7

Сумма

Теория вероятностей (x)

72

97

49

54

91

65

57

485

Статистика (y)

58

92

43

70

79

87

47

476

хi-x?

2,71

27,72

-20,28

-15,28

21,72

-4,28

-12,28

yi-y?

-10,00

24,00

-25,00

2,00

11,00

19,00

-21,00

(хi-x?)(yi-y?)

-27,1

665,28

507

-30,56

238,92

-81,32

257,88

1530,1

(хi-x?)І

7,36735

768,082

411,51

233,653

471,51

18,3673

150,939

2061,43

(yi-yЇ)І

100

576

625

4

121

361

441

2228

Среднее значение баллов по теории вероятности: х? =

Определим корреляционный момент: Кху =

Вычислим дисперсии:

уІх =

уІy =

Коэффициент корреляции:

Определим расчетное значение критерия Стьюдента: , соответственно табличное значение критерия

Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.

3. Регрессионный анализ

Регрессионный анализ - метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной.

Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для изучения по выборочным данным статистической зависимости ряда величин; некоторые из которых являются случайными. При статистической зависимости величины не связаны функционально, но как случайные величины заданы совместным распределением вероятностей.

Исследование зависимости случайных величин приводит к моделям регрессии и регрессионному анализу на базе выборочных данных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.

Числовые данные обычно имеют между собой явные (известные) или неявные (скрытые) связи.

Явно связаны показатели, которые получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, проценты выполнения плана, уровни, удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпы прироста, индексы и т. д.

Связи же второго типа (неявные) заранее неизвестны. Однако необходимо уметь объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.

Математические модели строятся и используются для трех обобщенных целей:

* для объяснения;

* для предсказания;

* для управления.

Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели.

Постановка задачи регрессионного анализа формулируется следующим образом.

Имеется совокупность результатов наблюдений. В этой совокупности один столбец соответствует показателю, для которого необходимо установить функциональную зависимость с параметрами объекта и среды, представленными остальными столбцами. Требуется: установить количественную взаимосвязь между показателем и факторами. В таком случае задача регрессионного анализа понимается как задача выявления такой функциональной зависимости y = f (x2, x3, …, xт), которая наилучшим образом описывает имеющиеся экспериментальные данные.

Допущения:

- количество наблюдений достаточно для проявления статистических закономерностей относительно факторов и их взаимосвязей;

- обрабатываемые данные содержат некоторые ошибки (помехи), обусловленные погрешностями измерений, воздействием неучтенных случайных факторов;

- матрица результатов наблюдений является единственной информацией об изучаемом объекте, имеющейся в распоряжении перед началом исследования.

Функция f (x2, x3, …, xт), описывающая зависимость показателя от параметров, называется уравнением (функцией) регрессии. Термин «регрессия» (regression (лат.) - отступление, возврат к чему-либо) связан со спецификой одной из конкретных задач, решенных на стадии становления метода.

Решение задачи регрессионного анализа целесообразно разбить на несколько этапов:

- предварительная обработка данных;

- выбор вида уравнений регрессии;

- вычисление коэффициентов уравнения регрессии;

- проверка адекватности построенной функции результатам наблюдений.

Задание 3.1

Требуется построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Исходные данные:

у: 28; 23; 22; 21; 20; 19,5; 18; 18,5; 17; 15

х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение:

1) Уравнение обратной функции: .

Произведем замену . В результате получим линейное уравнение .

Для определения обратной модели связи составим таблицу, предварительно увеличив значения у на номер своего классного журнала (5)

Таблица - 17

y

x

X

y*X

X^2

y^2

x^2

x*y

1

28

1

1

28

1

784

1

28

2

23

2

0,5

11,5

0,25

529

4

46

3

22

3

0,333

7,326

0,11

484

9

66

4

21

4

0,25

5,25

0,0625

441

16

64

5

20

5

0,2

4

0,04

400

25

100

6

19,5

6

0,167

3,25

0,027889

380,25

36

117

7

18

7

0,143

2,574

0,020449

324

49

126

8

18,5

8

0,125

2,313

0,015625

342,25

64

148

9

17

9

0,111

1,887

0,012321

289

81

153

10

15

10

0,1

1,5

0,01

225

100

150

Итого

202

55

2,929

67,6

1,908784

4198,5

385

1018

Ср.знач.

20,2

5,5

0,293

6,76

0,1908784

Далее строим систему:

10a + 55*b = 202

55*a + 385*b = 1018

Получаем эмпирические коэффициенты регрессии: b = -1.1273, a = 26.4

Уравнение регрессии (эмпирическое уравнение регрессии):

y = -1.1273 x + 26.4

2) Определим индекс детерминации - это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными.

Расчеты приведены в таблице 18

Таблица 18 - Расчет коэффициента детерминации

№ п/п

1

28

1

25,87543

60,84

7,438

2

23

2

21,86228

7,84

1,312

3

22

3

20,52456

3,24

1,037

4

21

4

19,85570

0,64

0,794

5

20

5

19,45438

0,04

0,583

6

19,5

6

19,18684

0,49

0,0186

7

18

7

18,99573

4,84

0, 259

8

18,5

8

18,85241

2,89

1,25

9

17

9

18,74093

10,24

0,556

10

15

10

18,65175

27,04

0,0162

итого

202

55

202

118,1

13,264

Ср. знач.

20,2

5,5

.

Т.е. в 88.77% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 11.23% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3) Определим стандартную ошибку модели

.

4) Определим F - критерий Фишера

;

для =0,05, , .

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

5). Далее определяем доверительные интервалы.

b - tкрит* Sb <b<b + tкрит *Sb

(-1.13 - 2.306*0.142; -1.13 + 2.306*0.142)

(-1.454;-0.8)

a - tкрит *Sa<a< a + tкрит *Sa

(26.4 - 2.306*0.88; 26.4 + 2.306*0.88)

(24.372;28.428)

Где Sa - стандартное отклонение случайной величины a.

Sb - стандартное отклонение случайной величины b.

tкрит (n-m-1;б/2) = (8;0.025) = 2.306

В результате получаем:

24.372<a< 28.428

-1.454<b<-0.8

Задание 3.2

Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

у 10; 13,4; 15,4; 16,5; 18,6; 19,1

х 1; 2; 3; 4; 5; 6.

Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Характеристики модели: 1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Таблица 19 - Исходные данные

y, %

x,

тыс.дол.

17

20,4

22,4

23,5

25,6

26,1

1

2

3

4

5

6

0

0,69

1,10

1,39

1,61

1,79

0

0,48

1,21

1,93

2,59

3,20

0

14,076

24,46

32,665

41,216

46,719

135

21

6,58

9,41

159,136

а) составляем систему уравнений

6a0+6,58a1=135

6,58a0+9,41a1=159,136

б) решаем систему и составляем модель

a0=16,95

a1=5,05

y=16,95+5,05lnx

Определим индекс детерминации

Расчеты приведены в таблице 20.

Таблица 20 - Расчет коэффициента детерминации

№ п/п

1

17

1

16,8635

30,25

0,0186

2

20,4

2

20,4099

4,41

0,0001

3

22,4

3

22,5171

0,01

0,0137

4

23.5

4

24,0076

1

0,2577

5

25.6

5

25,1383

9,61

0,2131

6

26,1

6

26,0635

12,96

0,0013

итого

135

21

135

58,24

0,5046

Ср. знач.

22,5

3,5

.

Вариация результата у (себестоимость единицы продукции) на 99% объясняется вариацией фактора х (стоимостью основных фондов).

3) Определим стандартную ошибку модели

.

4) Определим F - критерий Фишера

;

для =0,05, , .

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

Задание 3.3

Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 21.

Таблица 21 - Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК

Промежуточные расчеты представлены в таблице 22

Таблица 22

.

; .

Линейная модель имеет вид .

2) Определим коэффициент детерминации

Расчеты для коэффициента детерминации представлены в таблице 22.

3) Определим стандартную ошибку модели по формуле

.

4) Определим F - критерий Фишера

для =0,05, ,

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

5)Определим .

6) Осуществим прогноз на 2017 г.

2017 г.: ;

Задание 3.4

Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 23 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +

Таблица 24 - Оценка параметров линейной модели

t

y

y t

t2

|(yi- )/yi|

1

59,6

59,6

1

58,075

0,02559

2,32563

0,06891

2

58,5

117

4

58,15

0,00598

0,1225

0,03516

3

58

174

9

58,225

0,00388

0,05063

0,01266

4

56,4

225,6

16

58,3

0,03369

3,61

0,00141

5

57

285

25

58,375

0,02412

1,89063

0,00141

6

57,9

347,4

36

58,45

0,0095

0,3025

0,01266

7

59,7

417,9

49

58,525

0,01968

1,38063

0,03516

8

59,6

476,8

64

58,6

0,01678

1

0,06891

36

466,7

2103,3

204

466,7

0,1392

10,6825

0,2363

=58, =0,075.

Уравнение тренда (регрессии) будет иметь вид:

0,075t+58

коэффициент детерминации вычисляется по формуле

0,2363/(0,2363+10,6825)= 0,0216

Построенное уравнение на 2,16% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:

F= (0,2363/1)/( 10,6825/6)= 0,13

к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=10,6825/6=1,7804-

остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.

|(yi- yi)/yi|

0,1392/8=1,74% -находится в допустимых пределах.

Построим нелинейную регрессионную модель вида: lnу = ао + а1t. Это показательная модель.

Найдем оценки коэффициентов показательной модели

,

Тогда линеаризованная модель имеет вид:

.

0,0013

4,0603

Таблица 25 - Оценка коэффициентов показательной модели

t

y

t2

t

|(yi- )/yi|

1

59,6

1

4,0877

4,0877

58,068

0,0257

2

58,5

4

4,069

8,1381

58,144

0,0061

3

58

9

4,0604

12,181

58,219

0,0038

4

56,4

16

4,0325

16,13

58,295

0,0336

5

57

25

4,0431

20,215

58,371

0,0241

6

57,9

36

4,0587

24,352

58,447

0,0094

7

59,7

49

4,0893

28,625

58,523

0,0197

8

59,6

64

4,0877

32,701

58,599

0,0168

36

466,7

204

32,5284

146,431

466,7

0,1392

0,1392/8=1,74%

Проверка статистической значимости показательной модели также проводится по линеаризованной модели.

Таблица 26 - Проверка статистической значимости показательной модели

t

1

1

4,0877

4,061588

1,99E-05

0,00068

2

2

4,069

4,062861

1,02E-05

3,8E-05

3

3

4,0604

4,064134

3,67E-06

1,4E-05

4

4

4,0325

4,065407

4,13E-07

0,00108

5

5

4,0431

4,06668

3,97E-07

0,00056

6

6

4,0587

4,067953

3,62E-06

8,6E-05

7

7

4,0893

4,069226

1,01E-05

0,0004

8

8

4,0877

4,070499

1,98E-05

0,0003

Сумма

36

32,5284

32,5284

0,000068

0,0032

коэффициент детерминации :

0,000068/(0,000068+0,0032)= 0,0211

Построенное уравнение на 2,11% объясняет вариацию результативного признака.

(0,000068/1)/( 0,0032/6) =0,13

к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=0,0032/6=0,00053-

остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Найдем оценки коэффициентов обратной (гиперболической) модели

.

Введем новую переменную . Тогда гиперболическая модель приводится к линейной:

.

1,2563

57,9107

Гиперболическое уравнение регрессии имеет вид:

y = 1,2563/ t + 57,9107.

Таблица 27 - Оценка коэффициентов гиперболической модели

t

y

yi

|(yi- )/yi|

1

59,6

1

1

59,6

59,167

0,0073

0,1875

0,6881

2

58,5

0,5

0,25

29,25

58,5389

0,0007

0,0015

0,0405

3

58

0,33333

0,1111

19,33333

58,3295

0,0057

0,1085

6E-05

4

56,4

0,25

0,0625

14,1

58,2248

0,0324

3,3298

0,0127

5

57

0,2

0,04

11,4

58,162

0,0204

1,3502

0,0308

6

57,9

0,16667

0,0278

9,65

58,1201

0,0038

0,0484

0,0473

7

59,7

0,14286

0,0204

8,528571

58,0902

0,027

2,5915

0,0612

8

59,6

0,125

0,0156

7,45

58,0677

0,0257

2,3478

0,0728

36

466,7

2,71786

1,5274

159,3119

466,7

0,1228

9,9653

0,9534

индекс детерминации вычисляется по формуле

0,9534/(0,9534+9,9653) =0,087

Построенное уравнение на 8,7% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:

F= (0,9534/1)/( 9,9653/6) = 0,57

к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=9,9653/6=1,6609-

остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии.

У показательной модели наименьшая стандартная ошибка. Значит, показательная модель наилучшая.

Спрогнозируем цену одного доллара в декабре 2017 года. Если в августе 2017 г. t=8, то в декабре t=12.

Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.

Таблица 28 - Курсы иностранных валют по отношению к российскому рублю) (на конец года; рублей за единицу иностранной валюты)

Страна

Наименование

валюты

2010

2011

2012

2013

2014

2015

Австралия

австралийский доллар

31,01

32,72

31,55

28,96

45,91

53,12

2.Австрия

евро

40,33

41,67

40,23

44,97

68,34

79,70

3.Азербайджан

азербайджанский манат

38,11

40,98

38,74

41,78

71,84

46,74

4.Армения

армянский драм

84,132)

83,742)

75,372)

80,712)

12,103)

15,053)

5.Беларусь

белорусский рубль

10,162)

38,564)

35,344)

34,314)

38,804)

38,954)

6.Бельгия

евро

40,33

41,67

40,23

44,97

68,34

79,70

7.Германия

евро

40,33

41,67

40,23

44,97

68,34

79,70

8.Дания

датская крона

54,105)

56,065)

53,955)

60,315)

92,025)

10,68

9.Испания

евро

40,33

41,67

40,23

44,97

68,34

79,70

10.Италия

евро

40,33

41,67

40,23

44,97

68,34

79,70

11.Казахстан3)

тенге

20,68

21,69

20,21

21,31

30,83

21,52

12.Канада

канадский доллар

30,49

31,57

30,54

30,55

48,40

52,57

13.Киргизия3)

сом

64,84

69,56

64,08

66,34

95,52

94,84

14. Нидерланды

евро

40,33

41,67

40,23

44,97

68,34

79,70

15.Норвегия5)

норвежская крона

51,61

53,64

54,53

53,21

75,79

83,38

16.Республика Молдова5)

молдавский лей

25,07

27,52

25,10

25,08

36,03

37,06

17. Соединенное

Королевство (Великобритания)

фунт стерлингов

47,26

49,63

48,96

53,96

87,42

107,98

18.США

доллар США

30,48

32,20

30,37

32,73

56,26

72,88

19. Таджикистан

сомони

69,225)

67,665)

63,735)

69,095)

10,76

10,99

20.Туркмения

новый туркменский манат

10,70

11,29

10,65

11,48

19,74

21,44

21.Турция

турецкая лира

19,60

16,83

16,97

15,30

24,27

25,08

22.Узбекистан2)

узбекский сум

18,58

17,94

15,30

14,63

23,22

26,45

23.Украина5)

гривна

38,28

40,05

37,59

39,72

35,56

30,46

24.Финляндия

евро

40,33

41,67

40,23

44,97

68,34

79,70

25.Франция

евро

40,33

41,67

40,23

44,97

68,34

79,70

26.Швеция5)

шведская крона

44,81

46,61

46,69

50,15

72,02

87,26

27.Япония3)

иена

37,38

41,50

35,15

31,06

47,06

60,51

1) По данным Банка России.

2) За 1000 единиц национальной валюты.

3) За 100 единиц национальной валюты.

4) За 10 000 единиц национальной валюты.

5) За 10 единиц национальной валюты.

Таблица 29 - Решение

Страна

Наименование валюты

2010

2011

2012

2013

2014

2015

7. Германия

евро

40,33

41,67

40,23

44,97

68,34

79,70

Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:

=(40,33+41,67+40,23+44,97+68,34+79,70)/6=52,54

Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном распределении нет моды, так как все значения встречаются по одному разу.

Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. Поскольку у нас четное число уровней, то мода равна полусумме чисел, стоящих посередине.

40,23 40,33 41,67 44,97 68,34 79,70

Ме=(41,67+ 44,97)/2=43,32

Для несгруппированных данных дисперсия рассчитывается по формуле:

=((40,33-52,54)2+(41,67-52,54)2+(40,23-52,54)2+

+(44,27-52,54)2+(68,34 -52,54)2+(49,70-52,54)2)/6=115,2

среднеквадратическое отклонение

Индивидуальные значения отклоняются от среднего значения в среднем на ± 10,7.

Коэффициент вариации

Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.

Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +

Таблица 30 - Оценка параметров линейной модели

t

y

yt

t2

1

40,33

40,33

1

32,426

62,477

404,573

2

41,67

83,34

4

40,471

1,437

145,66

3

40,23

120,69

9

48,517

68,678

16,185

4

44,97

179,88

16

56,563

134,394

16,185

5

68,34

341,7

25

64,608

13,923

145,636

6

79,70

478,2

36

72,654

49,642

404,573

21

315,24

207,35667

91

315,24

330,551

1132,812

=231,7 = -51,199

Уравнение тренда (регрессии) будет иметь вид:

= -51,99t+231,7

Определим коэффициент детерминации

Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:

;

к1 =1, к2 = 6-1-1=4, на уровне значимости 0,05 табличное значение Fт = 7,71. Для зависимости y от t выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.

Задача 3.6. По статистическим данным Росстата (таблица 31) выполнить комплексный статистический анализ инвестиций в основной капитал.

Таблица 31 - Инвестиции в основной капитал, млн. руб.

Номер студента

Регионы

2012

2013

2014

Приволжский федеральный округ

2012877

2301298

2355973

1; 15

Республика Башкортостан

233683

266396

285520

2; 16

Республика Маpий Эл

31656

46178

48354

3; 17

Республика Моpдовия

49825

53714

55292

4; 18

Республика Татарстан

470751

525730

542781

5; 19

Удмуртская Республика

64221

82678

89836

6; 20

Чувашская Республика

65255

60122

56446

7; 21

Пермский край

162241

219494

185649

8; 22

Киpовская область

50545

58655

56294

9; 23

Нижегородская область

257454

280884

286619

10; 24

Оренбургская область

151250

152877

150208

11; 25

Пензенская область

72343

82164

83690

12;26

Самарская область

213022

269737

300311

13; 27

Саратовская область

117646

125834

132804

14; 28

Ульяновская область

72985

76835

82168

Этапы:

- графическое представление информации и ее анализ;

- определение средних величин и показателей вариации;

- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;

- определение показателей динамики инвестиций и их анализ;

- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.

Таблица 32 - Решение

Регионы

2012

2013

2014

Пермский край

162241

219494

185649

Представим графически динамику показателя.

Рис. 8. Динамика инвестиций в основной капитал по Пермскому краю за 2012-2014 гг.

По графику видно, что тенденция показателя положительная.

Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:

= (162241+219494+185649)/3=189128 млн. руб.

Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном ряду нет моды, так как все значения встречаются по одному разу.

Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. 162241 185649 219494

Ме=185649 млн. руб.

Для несгруппированных данных дисперсия рассчитывается по формуле:

=((162241-189128)2+(219494-189128)2+

+(185649-189128)2)/3=544300428

среднеквадратическое отклонение 23330,2

Индивидуальные значения отклоняются от среднего значения в среднем на ± 23330,2.

Коэффициент вариации

Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.

Определим коэффициент корреляции между инвестициями и выбранным фактором по данным Росстата - индексами промышленного производства по республике Башкортостан.

Таблица 33 - Инвестиции в основной капитал и индексы промышленного производства по республике Башкортостан

Год

Инвестиции в основной капитал, млн. руб.

Индексы промышленного производства (в процентах к предыдущему году)

2012

162241

102,3

2013

219494

103,9

2014

185649

104,3

Таблица 34 - Расчетные значения для определения коэффициента корреляции

Год

х

y

х2

xy

y2

2012

162241

102,3

26322142081

1659754,3

104652,9

2013

219494

103,9

48177616036

22805426,6

10795,21

2014

185649

104,3

34465551201

19363190,7

10878,49

Сумма

567384

310,5

77965309318

438283716

126326,6

Коэффициент корреляции:

=3,38

Имеется средняя отрицательная линейная связь между y и x: с ростом х снижается у.

Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:

если ,

то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.

- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.

уровень значимости 0,05%

В нашей задаче 3-2=1, tтабл= 12,71.

Для получаем расчетное значение:

.

Коэффициент корреляции несущественно отличается от нуля, его можно считать незначимым.

Определим цепные и базисные показатели ряда динамики инвестиций в основной капитал.

Абсолютный прирост цепной:

Абсолютный прирост базисный:

где - уровень i-го периода; - уровень предшествующего периода; - уровень базисного периода.

Темп роста цепной:

Темп роста базисный:

Темп прироста цепной:

, или

Темп прироста базисный:

, или

Абсолютное содержание 1% прироста:

, или

Результаты расчетов представим в таблице.

Таблица 35 - Вычисление показателей динамики

Год

Инвестиции в основной капитал, млн. руб.

, (млн. руб.)

, (млн. руб.)

,%

,%

,%

,%

А, млн. руб./%

2012

162241

-

-

-

-

-

-

-

2013

219494

57253

57253

135,2

135,2

35,2

35,2

1662,41

2014

185649

-33845

23408

84,5

114,4

-15,5

14,4

2194,94

Все показатели динамики положительные. С каждым годом идет прирост инвестиций.

Средний абсолютный прирост

23408/2=11704млн. руб.

Инвестиции в основной капитал ежегодно растет на 25918,5 млн. руб. в среднем.

Средний темп роста

Средний темп прироста

106,9%-100%=6,9%

Инвестиции в основной капитал ежегодно в среднем за год растет на 10,5%.

Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +

Таблица 36 - Оценка параметров линейной модели

t

y

y t

t2

1

162241

162241

1

2

219494

438988

4

3

185649

556947

9

6

567384

1158176

14

=165720, =11704.

Уравнение тренда (регрессии) будет иметь вид:

11704t+165720

Заключение

Статистика наука, которая изучает приемы систематического наблюдения массовых явлений социальной жизни человека, составление численных их описаний и научную обработку этих описаний. Статистическая закономерность составляет предмет статистической науки. Для изучения предмета статистики разработаны и применяются специфические приемы.

В данной работе были выполнены все задачи. В первой части были выведены основные термины, такие, как средние величины, вариация, мода, медиана, дисперсия, среднеквадратическое отклонение, дано определение и выведены формулы, по которым решены задачи на данную тему и сделаны выводы, все основные расчеты производились в «Excel».Во второй части был теоретически рассмотрен корреляционный анализ, выведены основные понятия и формулы, представлена таблица связи параметров, затем проведены расчёты по представленным задачам, был найден коэффициент корреляции, расчетное и табличное значение критерия Стьюдента, основные расчеты были произведены в «Excel». В третьей части был рассмотрен регрессионный анализ, более подробнее рассмотрены этапы решения задачи, проведены расчеты по заданным вопросам, таким, как, индекс детерминации, стандартная ошибка, расчетное значение критерия Фишера, доверительные коэффициенты интервалов, ошибка аппроксимации, коэффициент детерминации, были построены трендовая линейная регрессионная модель, полулогарифмическая модель, нелинейная обратная модель, сделаны выводы. Также был проведен комплексный статистический анализ инвестиций. Расчеты проводились в программе «Excel».

Список использованных источников

1. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебное пособие для бакалавров / В.Е. Гмурман. - М.: Юрайт, 2013. - 479 c.

2. Горлач, Б.А. Теория вероятностей и математическая статистика: Учебное пособие / Б.А. Горлач. - СПб.: Лань, 2013. - 320 c.

3. Калинина, В.Н. Теория вероятностей и математическая статистика: Учебник для бакалавров / В.Н. Калинина. - М.: Юрайт, 2013. - 472 c.

4. Кобзарь, А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь. - М.: ФИЗМАТЛИТ, 2012. - 816 c.

5. Колемаев, В.А. Теория вероятностей и математическая статистика: Учебник / В.А. Колемаев, В.Н. Калинина. - М.: КноРус, 2013. - 376 c.

6. Кочетков, Е.С. Теория вероятностей и математическая статистика: Учебник / Е.С. Кочетков, С.О. Смерчинская, В.В. Соколов. - М.: Форум, НИЦ ИНФРА-М, 2013. - 240 c.

7. Краснов, М.Л. Вся высшая математика. Т. 5. Теория вероятностей. Математическая статистика. Теория игр: Учебник / М.Л. Краснов, А.И. Киселев, Г.И. Макаренко [и др.]. - М.: ЛКИ, 2013. - 296 c.

8. Кошевой, О.С. Некрылова, Н.В. Общая теория статистики. Практикум.-Издательство ПГУ, 2017 г. - 136 с.

9. Сайт Росстата http://www.gks.ru, сайт Пензастата http://pnz.gks.ru

Размещено на Allbest.ru


Подобные документы

  • Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.

    курсовая работа [177,4 K], добавлен 29.10.2015

  • Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.

    курсовая работа [91,7 K], добавлен 14.12.2008

  • Понятие средних величин и их значение в экономике. Классификация видов средних величин и их краткая характеристика. Средняя гармоническая и арифметическая, способы их расчета. Примеры применения средних величин в практической работе экономистов.

    курсовая работа [205,4 K], добавлен 17.09.2014

  • Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

    курсовая работа [230,6 K], добавлен 24.09.2012

  • Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа [351,2 K], добавлен 20.05.2010

  • Понятие и свойства средних величин. Характеристика и расчет их видов (средних арифметической, гармонической, геометрической, квадратической, кубической и структурных). Сфера их применения в экономическом анализе хозяйственной деятельности отраслей.

    курсовая работа [56,8 K], добавлен 21.05.2014

  • Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

    учебное пособие [276,4 K], добавлен 23.11.2010

  • Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

    реферат [162,6 K], добавлен 04.06.2010

  • Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.

    курсовая работа [895,1 K], добавлен 20.03.2015

  • Определение показателей, описывающих динамику изменения грузооборота. Формулы расчета дисперсии и средних отклонений от начальных показателей. Нахождение индивидуальных и сводных индексов себестоимости единицы продукции и общих затрат по предприятиям.

    контрольная работа [510,4 K], добавлен 15.03.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.