Общая теория статистики
Характеристика средних величин и показателей вариации. Сущность корреляционного анализа. Алгоритм регрессионного анализа. Методика оценки средних величин, динамики показателей, изменения их под влиянием тех или иных факторов. Измерение величины влияния.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 483,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Общая теория статистики
Введение
Современная экономическая система является динамично развивающейся, подверженной изменениям в результате влияния различных факторов. Оценить влияние тех или иных элементов на динамику отельных экономических показателей позволяет статистика с ее обширным инструментарием.
В данной работе поставлены следующие задачи: изучить методику оценки средних величин, динамики показателей, изменения их под влиянием тех или иных факторов, измерения величины этого влияния.
Для достижения поставленных задач в данной работе используются показатели вариации, а также методы корреляционного и регрессионного анализа.
Работа включает в себя три раздела:
1. Средние величины и показатели вариации
2. Корреляционный анализ
3. Регрессионный анализ
1. Средние величины и показатели вариации
Средняя величина - это обобщающая характеристика варьирующего признака единиц качественно однородной совокупности.
Средние величины используются в планировании, анализе выполнения планов, расчетах экономической эффективности общественного производства и т.д. Сравнивая изменение средних уровней во времени, статистика тем самым характеризует важнейшие закономерности развития явлений.
Существуют разные виды средних величин. Среднее хронологическое :
.
Она используется для моментных статистических рядов. Это когда на конкретную дату с различными интервалами показаны значения случайной величины.
Из средних велечин чаще всего используется среднее арифмитическое. Оно бывает двух видов. Среднее арифметическое простое: где xi - i-тое значение случайной велечины, n -число, вариант. Среднее арифметическое взвешенное:
= ,
где mi - частота.
Бывают другие средние, их можно определить по общей формуле:
где k - степень, определяющая различные средние.
Средняя гармоническая используется тогда, когда неизвестна частота (mi), а известен, к примеру, объем реализации. Она высчитывается по формуле:
гм= ,
где Vi - i-тый объем реализации.
Модой называют то значение признака, которое наиболее часто встречается в данной совокупности.
Для интервальных вариационных рядов мода определяется по формуле:
М0 = хн + i ,
где
Хн - нижняя граница интервала, содержащего моду;
i - ширина интервала;
m2 - частота модального интервала;
m1- частота интервала, предшествующего модальному;
m3 - частота интервала, следующего за модальным.
Медианой называют значение признака, приходящееся на середину ранжированной совокупности. Она определяется по формуле:
Ме = Xн + i ) ,
где
Хн - нижняя граница интервала;
i - ширина интервала;
n - объем выборки (число наблюдений)
- накопленная частота интервала, предшествующего медианному;
mме - частота медианного интервала;
Изменение значений признака в пределах изучаемой совокупности называется вариацией.
Для характеристики величины колебания признака в статистике вычисляют следующие показатели вариации:
· размах вариации;
· среднее линейное отклонение;
· средний квадрат отклонения (дисперсия);
· среднее квадратическое отклонение;
· коэффициент вариации.
Абсолютные и относительные показатели вариации, характеризующие изменчивость значений признака, позволяют оценить степень однородности совокупности, типичности и устойчивости средней.
Размах вариации (R) - наиболее простой измеритель вариации и представляет собой разность между наибольшим и наименьшим значениями признака
R = xmax - xmin, ,
где
xmax - наибольшее значение признака;
xmin - наименьшее значение признака.
Простое среднее линейное отклонение:
= ,
где - среднее значение показателя.
Взвешенное среднее линейное отклонение:
вз =
Среднеквадратическое отклонение:
у = (1.2),
где - дисперсия.
Средний квадрат отклонения, или дисперсия - представляет собой среднюю арифметическую из квадратов отклонений вариант от общей средней.
Бывает нескольких видов: простой, взвешенной и выборочной.
Средняя дисперсия :
уІ(sІ) = .
Она так же может быть рассчитана как:
уІ(sІ) =
Взвешенная дисперсия:
уІвз =
Она используется, когда данные представлены в виде интервального ряда и вместо xi берется среднее значение интервала и соответственно частота i- ого интервала (mi).
Также, можно выделить среднее квадратическое отклонение:
) =
Взвешенное среднеквадратическое отклонение:
=
Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квардратического отклонения к средней величине признака:
V = 100%
Он показывает, какую долю среднего значения этой величины составляет её средний разброс. Исчисляется в процентах. Вычисляется только для количественных данных. В отличие от среднего квадратического или стандартного отклонения измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности. По мнению автора рассматриваемого коэффициента К. Пирсона -- коэффициент вариации эффективнее абсолютного показателя вариации [1]. Чем больше коэффициент вариации, тем менее однородна совокупность и тем менее типична средняя величина, тем менее она характеризует изучаемое явление.
Задача 1
По статистическим данным: 18; 20; 17; 19; 22; 18; 23; 18; 25 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличили на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение
Среднее значение определим по формуле средней арифметической простой:
=(18+ 20+ 17+ 19+ 22+ 18+ 23+ 18+ 25)/9=20
Мода - это наиболее часто встречающийся признак в данной совокупности. Число 18 встречается 3 раза. Остальные значения встречаются 1 раз. Мо=18.
Медиана находится посередине ранжированного ряда. Запишем числа в порядке возрастания и определим число, которое находится посередине.
17; 18; 18; 18; 19; 20; 22; 23; 25
Ме=19.
Для несгруппированных данных дисперсия рассчитывается по формуле:
=((18-20)2+ (20-20)2+ (17-20)2+ (19-20)2+ (22-20)2+ +(18-20)2+ (23-20)2+ (18-20)2+ (25-20)2)/9=60/9=6,7
среднеквадратическое отклонение
Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются индивидуальные значения признака от среднего значения. Значит, индивидуальные значения отклоняются от среднего значения в среднем на ± 2,59.
Коэффициент вариации
Коэффициент вариации показывает относительное отклонение индивидуальных значений от среднего значения.
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Задача 2
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 36%, стоимость основных фондов увеличилась на 25%. Определить изменение фондоотдачи. Значения дохода и стоимости основных фондов увеличили на свой номер классного журнала.
Решение
Фондоотдача = доход от реализации продукции предприятия / стоимость основных фондов
Индекс изменения дохода от реализации продукции предприятия равен 1,36. Индекс изменения стоимости основных фондов равен 1,25.
Индекс изменения фондоотдачи=1,36/1,25=1,088
Фондоотдача увеличилась на 8,8%.
Задача 3
Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Решение
Составим вспомогательную таблицу.
Таблица 1.1- Расчетные значения
У |
m |
уц |
уц m |
Кумулята (сумма накопленных частот) S |
|
80-100 |
6 |
90 |
540 |
6 |
|
100-120 |
17 |
110 |
1870 |
23 |
|
120-140 |
25 |
130 |
3250 |
48 |
|
140-160 |
28 |
150 |
4200 |
76 |
|
160-180 |
14 |
170 |
2380 |
90 |
|
180-200 |
10 |
190 |
1900 |
100 |
|
Сумма |
100 |
14140 |
Центр интервалов рассчитывается по формуле:
уц=,
где
унг - нижняя граница интервала,
увг - верхняя граница интервала.
Определим среднее значение.
14140/100=141,40
Мода - это варианта, наиболее часто встречающаяся в ряду.
В интервальном ряду моду вычисляют по формуле:
Модальный интервал равен 140-160, так как он имеет наибольшую частоту.
Определим медиану. Медиана - это значение варианты признака, находящейся в середине упорядоченного ряда.
Значит, медианный интервал равен 140-160.
Задача 4
По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi увеличили на свой номер классного журнала.
Таблица 2 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
16,0-16,2 |
3 |
3 |
||
16,2-16,4 |
4 |
4 |
||
16,4-16,6 |
17 |
17 |
||
16,6-16,8 |
11 |
15 |
26 |
|
16,8-17,0 |
13 |
6 |
19 |
|
17,0-17,2 |
18 |
5 |
23 |
|
17,2-17,4 |
6 |
6 |
||
17,4-17,6 |
2 |
2 |
||
50 |
50 |
100 |
Решение
Составим таблицу.
Таблица 2.2 - Расчетные значения
Хi |
Хi |
mгi |
Хimгi |
mчi |
Хimчi |
moi |
Хi moi |
||||
16,0-16,2 |
16,1 |
3 |
48,3 |
0,836 |
3 |
48,3 |
1,5294 |
||||
16,2-16,4 |
16,3 |
4 |
65,2 |
0,43 |
4 |
65,2 |
1,0568 |
||||
16,4-16,6 |
16,5 |
17 |
280,5 |
0,279 |
17 |
280,5 |
1,6761 |
||||
16,6-16,8 |
16,7 |
11 |
183,7 |
0,99 |
15 |
250,5 |
0,078 |
26 |
434,2 |
0,3379 |
|
16,8-17,0 |
16,9 |
13 |
219,7 |
0,13 |
6 |
101,4 |
0,444 |
19 |
321,1 |
0,1405 |
|
17,0-17,2 |
17,1 |
18 |
307,8 |
0,18 |
5 |
85,5 |
1,114 |
23 |
393,3 |
1,8813 |
|
17,2-17,4 |
17,3 |
6 |
103,8 |
0,54 |
6 |
103,8 |
1,4172 |
||||
17,4-17,6 |
17,5 |
2 |
35 |
0,5 |
2 |
35 |
0,9412 |
||||
Сумма |
50 |
850 |
2,34 |
50 |
831,4 |
3,181 |
100 |
1681,4 |
8,98 |
Определим средние значения по группам по формуле средней арифметической взвешенной.
850/50=17
831,4/50=16,628
Среднее значение в целом:
1681,4/100=16,814
Рассчитаем дисперсии внутри групп:
=
Частная дисперсия в первой группе:
=2,34/50=0,0468
Частная дисперсия во второй группе:
=3,181/50=0,0636
Средняя внутригрупповая дисперсия:
(0,0468*50+0,0636*50)/100=0,0552
Межгрупповая дисперсия
((17-16,814)2*50+(16,628-16,814)2*50)/100=0,0346
Общая дисперсия:
=0,0552+0,0346=0,0898
Тот же результат получаем и по формуле
8,98/100=0,0898
Коэффициент детерминации:
=0,0346/0,0898=0,385 (38,5%)
Задача 5
Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Решение
Определим средние значения по группам по формуле средней арифметической взвешенной.
(1*30+2*15+8*5)/(30+15+5)=100/50=2
(1*10+6*15)/(10+15)=100/25=4
(3*20+8*5)/(20+5)=100/25=4
Среднее значение в целом:
=(2*50+4*25+4*25)/(50+25+25)=300/100=3
Рассчитаем дисперсии внутри групп:
=
Частная дисперсия в первой группе:
=
Частная дисперсия во второй группе:
=
Частная дисперсия в третьей группе:
=
Расчеты приведем в следующих таблицах.
Таблица 3.1 - Расчетная таблица по первой группе
Хi |
mi |
Хimi |
||
1 |
30 |
30 |
30 |
|
2 |
15 |
30 |
0 |
|
8 |
5 |
40 |
180 |
|
Сумма |
50 |
100 |
210 |
Таблица 3.2 - Расчетная таблица по второй группе
Хi |
mi |
Хimi |
||
1 |
10 |
10 |
90 |
|
6 |
15 |
90 |
60 |
|
Сумма |
25 |
100 |
150 |
Таблица 3.3 - Расчетная таблица по третьей группе
Хi |
mi |
Хimi |
||
3 |
20 |
60 |
20 |
|
8 |
5 |
40 |
80 |
|
Сумма |
25 |
100 |
100 |
Рассчитаем общую дисперсию по правилу сложения дисперсий.
Таблица 3.4 - Определение дисперсий по совокупности данных
№ группы |
частота в группе f |
Среднее значение внутри группы, |
*f |
Дисперсия внутри группы |
f |
||
1 |
50 |
2 |
100 |
4,2 |
210 |
50 |
|
2 |
25 |
4 |
100 |
6 |
150 |
25 |
|
3 |
25 |
4 |
100 |
4 |
100 |
25 |
|
Сумма |
100 |
300 |
460 |
100 |
Средняя из частных дисперсий:
460/100=4,6
Межгрупповая дисперсия
100/100=1
Общая дисперсия:
=4,6+1=5,6
2. Корреляционный анализ
В социально- экономических исследованиях используют вероятностные (статистические) связи. Для оценки тесноты связи между показателем и фактором или между двумя факторами, используют корреляционный момент или коэффициент корреляции. [2]
Корреляция может быть положительной и отрицательной (возможна также ситуация отсутствия статистической взаимосвязи -- например, для независимых случайных величин). Отрицательная корреляция -- корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции отрицателен. Положительная корреляция -- корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции положителен.[3]
Задача 1
Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ:28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала.
Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение
Определим У. У=УХ/Х
Составим вспомогательную таблицу.
Таблица 4 - Расчетные значения для определения коэффициента корреляции
№ |
Х |
У |
xi yi |
xi2 |
yi2 |
|
1 |
18,5 |
23,1 |
427,35 |
342,25 |
533,61 |
|
2 |
19,6 |
24,4 |
478,24 |
384,16 |
595,36 |
|
3 |
20,8 |
26,3 |
547,04 |
432,64 |
691,69 |
|
4 |
19,2 |
21,9 |
420,48 |
368,64 |
479,61 |
|
5 |
20,2 |
24,7 |
498,94 |
408,04 |
610,09 |
|
? |
98,3 |
120,4 |
2372,05 |
1935,73 |
2910,36 |
Коэффициент корреляции:
=
=0,842
Имеется сильная линейная связь между y и x. Связь положительная, то есть с ростом х растет у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если
,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 5-2=3, tтабл= 3,18.
Для получаем расчетное значение:
.
Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.
Задача 2
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 18 22 13 20 15 14
у 17 20 11 18 14 10
Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала.
Результаты:
1.Коэффициент корреляции.
2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.
Решение
У и Х увеличим на свой номер классного журнала.
Х |
33 |
37 |
28 |
35 |
30 |
29 |
|
У |
32 |
35 |
26 |
33 |
29 |
25 |
Составим вспомогательную таблицу.
Таблица 5 - Расчетные значения для определения коэффициента корреляции
№ |
Х |
У |
xi yi |
xi2 |
yi2 |
|
1 |
33 |
32 |
1056 |
1089 |
1024 |
|
2 |
37 |
35 |
1295 |
1369 |
1225 |
|
3 |
28 |
26 |
728 |
784 |
676 |
|
4 |
35 |
33 |
1155 |
1225 |
1089 |
|
5 |
30 |
29 |
870 |
900 |
841 |
|
6 |
29 |
25 |
725 |
841 |
625 |
|
? |
192 |
180 |
5829 |
6208 |
5480 |
Коэффициент корреляции:
==0,964
Сильная положительная линейная связь между y и x: с ростом х растет у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если ,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 6-2=4, tтабл= 2,78.
Для получаем расчетное значение:
.
Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.
Задача 3
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистике по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.
Результаты:
1.Коэффициент ранговой корреляции.
2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение
У и Х увеличим на свой номер классного журнала.
Теория вероятностей |
80 |
105 |
57 |
62 |
99 |
73 |
65 |
|
Статистика |
66 |
100 |
51 |
78 |
87 |
95 |
55 |
Составим вспомогательную таблицу.
Таблица 6 - Расчетные значения для определения коэффициента ранговой корреляции Спирмена
№ |
Теория вероятностей х |
Статистика у |
||||
1 |
80 |
66 |
5 |
3 |
4 |
|
2 |
105 |
100 |
7 |
7 |
0 |
|
3 |
57 |
51 |
1 |
1 |
0 |
|
4 |
62 |
78 |
2 |
4 |
4 |
|
5 |
99 |
87 |
6 |
5 |
1 |
|
6 |
73 |
95 |
4 |
6 |
4 |
|
7 |
65 |
55 |
3 |
2 |
1 |
|
? |
28 |
28 |
14 |
Коэффициент Спирмена:
Коэффициент Спирмена:
а по формуле - значение t-статистики:
При = 0,05 и n -2= 7-2=5, tкрит=2,57
Так как t<tкрит, коэффициент несущественно отличается от нуля, является незначимым.
Поэтому на уровне значимости 0,05 можно считать, что связь между х и у незначимая.
3. Регрессионный анализ
Регрессиомнный анализ -- статистический метод исследования влияния одной или нескольких независимых переменных X1, X2,…,Xp на зависимую переменную Y. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные -- критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.[7]
Основными целями регрессионного анализа является:
- Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
- Предсказание значения зависимой переменной с помощью независимой(-ых)
- Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа
Задача 1
Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Исходные данные:
Характеристики модели: 1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение
Имеем данные
Х |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
У |
36 |
31 |
30 |
29 |
28 |
27,5 |
26 |
26,5 |
25 |
23 |
Найдем оценки коэффициентов обратной (гиперболической) модели
.
Введем новую переменную . Тогда гиперболическая модель приводится к линейной:
.
12,2
24,6266
Гиперболическое уравнение регрессии имеет вид:
y = 12,2/ t + 24,6266.
Таблица 7 - Оценка коэффициентов гиперболической модели
х |
y |
yi |
yi |
||||||
1 |
36 |
1 |
1 |
36 |
36,827 |
0,6833 |
74,418 |
0,5 |
|
2 |
31 |
0,5 |
0,25 |
15,5 |
30,727 |
0,0747 |
6,3837 |
0,0429 |
|
3 |
30 |
0,33333 |
0,11111 |
10 |
28,693 |
1,7076 |
0,2433 |
0,0016 |
|
4 |
29 |
0,25 |
0,0625 |
7,25 |
27,677 |
1,7514 |
0,2739 |
0,0018 |
|
5 |
28 |
0,2 |
0,04 |
5,6 |
27,067 |
0,8712 |
1,2846 |
0,0086 |
|
6 |
27,5 |
0,16667 |
0,02778 |
4,5833 |
26,66 |
0,7057 |
2,3718 |
0,0159 |
|
7 |
26 |
0,14286 |
0,02041 |
3,7143 |
26,369 |
0,1365 |
3,3509 |
0,0225 |
|
8 |
26,5 |
0,125 |
0,01563 |
3,3125 |
26,152 |
0,1214 |
4,1959 |
0,0282 |
|
9 |
25 |
0,11111 |
0,01235 |
2,7778 |
25,982 |
0,9646 |
4,9188 |
0,033 |
|
10 |
23 |
0,1 |
0,01 |
2,3 |
25,847 |
8,1031 |
5,5385 |
0,0372 |
|
55 |
282 |
2,929 |
1,5498 |
91,0379 |
282 |
15,1195 |
102,9798 |
0,6919 |
Рис.1. Обратная модель связи себестоимости единицы продукции со стоимостью основных фондов
индекс детерминации вычисляется по формуле
102,9798/(102,9798+15,1195)=0,87
Построенное уравнение на 87% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (102,9798/1)/( 15,1195/8)= 54,49
к1 =1, к2 = 10-1-1=8, на уровне значимости 0,05 табличное значение Fт = 5,32. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=15,1195/8=1,8899- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Стандартные ошибки параметров регрессии рассчитываются по формулам:
=1,6528
=0,6506.
Уровень надежности 95%
2,306
t-статистики рассчитываются по формулам:
ta =a/COa,
ta =12,2/1,6528=7,38
tb=b/COb,
tb=24,6266/0,6506=37,85
С вероятностью 0,95 оценим статистическую значимость параметров уравнения регрессии с помощью t-критерия Стьюдента.
Значение t-статистики для параметра а по модулю больше табличного значения 2,306. Поэтому гипотеза H0 о равенстве нулю коэффициента a отвергается, a значимо, и его нужно включать в модель.
Выборочное значение t-статистики для коэффициента b по модулю также существенно превышает табличное значение 2,306. Поэтому гипотеза H0 о равенстве нулю коэффициента b отвергается, b значимо, и его нужно включать в модель.
Построение доверительных интервалов. Доверительные интервалы - это границы, в которые с большой вероятностью попадают неизвестные параметры. Построим интервалы, в которые неизвестные параметры будут попадать с вероятностью в 95%
-*?a? +*
12,2-2,306*1,6528?a?12,2+2,306*1,6528
8,3886?a?16,0114
С вероятностью 0,95 истинное значение параметра a находится в интервале [8,3886; 16,0114]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
-*?b? +*
24,6266-2,306*0,6506?b? 24,6266+2,306*0,6506
23,1263?b? 26,1269
С вероятностью 0,95 истинное значение параметра b находится в интервале [23,1263; 26,1269]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
Задача 2
Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Характеристики модели: 1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение
Имеем данные
Х |
1 |
2 |
3 |
4 |
5 |
6 |
|
У |
25 |
28,4 |
30,4 |
31,5 |
33,6 |
34,1 |
Найдем оценки коэффициентов полулогарифмической модели
.
Введем новую переменную . Тогда логарифмическая модель приводится к линейной:
.
5,1289
24,876
Логарифмическое уравнение регрессии имеет вид:
y = 24,876+ 5,1289 ln х.
Таблица 8 - Оценка коэффициентов логарифмической модели
х |
y |
yi |
yi |
|||||
1 |
25 |
0 |
0 |
0 |
24,876 |
0,01538 |
31,6294 |
|
2 |
28,4 |
0,69315 |
0,48045 |
19,68538 |
28,431 |
0,00097 |
4,28042 |
|
3 |
30,4 |
1,09861 |
1,20695 |
33,397814 |
30,511 |
0,01225 |
0,00011 |
|
4 |
31,5 |
1,38629 |
1,92181 |
43,668272 |
31,986 |
0,23636 |
2,20869 |
|
5 |
33,6 |
1,60944 |
2,59029 |
54,077114 |
33,131 |
0,22029 |
6,9203 |
|
6 |
34,1 |
1,79176 |
3,2104 |
61,098998 |
34,066 |
0,00117 |
12,7146 |
|
21 |
183 |
6,5793 |
9,4099 |
211,9276 |
183 |
0,4864 |
57,7535 |
индекс детерминации вычисляется по формуле
57,7535/(57,7535+0,4864)=0,99
Построенное уравнение на 99% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (57,7535/1)/( 0,4864/4)= 474,95
к1 =1, к2 = 6-1-1=4, на уровне значимости 0,05 табличное значение Fт = 7,71. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=0,4864/4=0,1216- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Рис.2. Полулогарифмическая модель
Задача 3
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…
Решение
Найдем точечные оценки параметров линейной регрессионной модели
Y = at + b +
Таблица 9 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|(yi- )/yi| |
||||
1 |
7,5 |
7,5 |
1 |
7,692 |
0,0256 |
0,03694 |
3,079529 |
|
2 |
7,5 |
15 |
4 |
7,912 |
0,0549 |
0,16941 |
2,357634 |
|
3 |
8 |
24 |
9 |
8,131 |
0,0164 |
0,01716 |
1,732011 |
|
4 |
8,4 |
33,6 |
16 |
8,35 |
0,0059 |
0,00246 |
1,202661 |
|
5 |
8,6 |
43 |
25 |
8,57 |
0,0035 |
0,00091 |
0,769583 |
|
6 |
8,4 |
50,4 |
36 |
8,789 |
0,0463 |
0,15148 |
0,432778 |
|
7 |
8,6 |
60,2 |
49 |
9,009 |
0,0475 |
0,16695 |
0,192246 |
|
8 |
9,7 |
77,6 |
64 |
9,228 |
0,0487 |
0,22278 |
0,047987 |
|
9 |
10,2 |
91,8 |
81 |
9,447 |
0,0738 |
0,56641 |
1,16E-07 |
|
10 |
10,3 |
103 |
100 |
9,667 |
0,0615 |
0,40094 |
0,048286 |
|
11 |
10,2 |
112,2 |
121 |
9,886 |
0,0308 |
0,09847 |
0,192845 |
|
12 |
10,1 |
121,2 |
144 |
10,11 |
0,0006 |
3,1E-05 |
0,433676 |
|
13 |
10,8 |
140,4 |
169 |
10,33 |
0,044 |
0,22563 |
0,770781 |
|
14 |
10,6 |
148,4 |
196 |
10,54 |
0,0052 |
0,00309 |
1,204158 |
|
15 |
10,8 |
162 |
225 |
10,76 |
0,0034 |
0,00131 |
1,733807 |
|
16 |
10,7 |
171,2 |
256 |
10,98 |
0,0265 |
0,0802 |
2,35973 |
|
17 |
10,2 |
173,4 |
289 |
11,2 |
0,0983 |
1,00521 |
3,081925 |
|
153 |
160,6 |
1534,9 |
1785 |
160,6 |
0,5927 |
3,1494 |
19,6396 |
=7,4728,=0,2194.
Уравнение тренда (регрессии) будет иметь вид:
=0,2194t+7,4728
Рис. 3. Линейная модель
коэффициент детерминации вычисляется по формуле
19,6396/(19,6396+3,1494)=0,86
Построенное уравнение на 86% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (19,6396/1)/( 3,1494/15)= 93,54
к1 =1, к2 = 17-1-1=15, на уровне значимости 0,05 табличное значение Fт = 4,54. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=3,1494/15=0,21- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.
|(yi- yi)/yi|
0,5927/17=3,5% -указывает на качественное уравнение регрессии.
Спрогнозируем коэффициент рождаемости в 2017г. t=18.
y2017=0,2194*18+7,4728=11,4
Задача 4
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.2 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение
Найдем точечные оценки параметров линейной регрессионной модели
Y = at + b +
Таблица 10 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|(yi- )/yi| |
||||
1 |
59,6 |
59,6 |
1 |
58,075 |
0,02559 |
2,32563 |
0,06891 |
|
2 |
58,5 |
117 |
4 |
58,15 |
0,00598 |
0,1225 |
0,03516 |
|
3 |
58 |
174 |
9 |
58,225 |
0,00388 |
0,05063 |
0,01266 |
|
4 |
56,4 |
225,6 |
16 |
58,3 |
0,03369 |
3,61 |
0,00141 |
|
5 |
57 |
285 |
25 |
58,375 |
0,02412 |
1,89063 |
0,00141 |
|
6 |
57,9 |
347,4 |
36 |
58,45 |
0,0095 |
0,3025 |
0,01266 |
|
7 |
59,7 |
417,9 |
49 |
58,525 |
0,01968 |
1,38063 |
0,03516 |
|
8 |
59,6 |
476,8 |
64 |
58,6 |
0,01678 |
1 |
0,06891 |
|
36 |
466,7 |
2103,3 |
204 |
466,7 |
0,1392 |
10,6825 |
0,2363 |
=58,=0,075.
Уравнение тренда (регрессии) будет иметь вид:
0,075t+58
Рис. 4. Линейная модель
коэффициент детерминации вычисляется по формуле
0,2363/(0,2363+10,6825)= 0,0216
Построенное уравнение на 2,16% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (0,2363/1)/( 10,6825/6)= 0,13
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=10,6825/6=1,7804- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.
|(yi- yi)/yi|
0,1392/8=1,74% -находится в допустимых пределах.
Построим нелинейную регрессионную модель вида: lnу = ао + а1t. Это показательная модель.
Найдем оценки коэффициентов показательной модели
,
Тогда линеаризованная модель имеет вид:
.
0,0013
4,0603
Таблица 11 - Оценка коэффициентов показательной модели
t |
y |
t2 |
t |
|(yi- )/yi| |
|||
1 |
59,6 |
1 |
4,0877 |
4,0877 |
58,068 |
0,0257 |
|
2 |
58,5 |
4 |
4,069 |
8,1381 |
58,144 |
0,0061 |
|
3 |
58 |
9 |
4,0604 |
12,181 |
58,219 |
0,0038 |
|
4 |
56,4 |
16 |
4,0325 |
16,13 |
58,295 |
0,0336 |
|
5 |
57 |
25 |
4,0431 |
20,215 |
58,371 |
0,0241 |
|
6 |
57,9 |
36 |
4,0587 |
24,352 |
58,447 |
0,0094 |
|
7 |
59,7 |
49 |
4,0893 |
28,625 |
58,523 |
0,0197 |
|
8 |
59,6 |
64 |
4,0877 |
32,701 |
58,599 |
0,0168 |
|
36 |
466,7 |
204 |
32,5284 |
146,431 |
466,7 |
0,1392 |
Рис. 5. Показательная модель
0,1392/8=1,74%
Проверка статистической значимости показательной модели также проводится по линеаризованной модели.
Таблица 12 - Проверка статистической значимости показательной модели
№ |
t |
|||||
1 |
1 |
4,0877 |
4,061588 |
1,99E-05 |
0,00068 |
|
2 |
2 |
4,069 |
4,062861 |
1,02E-05 |
3,8E-05 |
|
3 |
3 |
4,0604 |
4,064134 |
3,67E-06 |
1,4E-05 |
|
4 |
4 |
4,0325 |
4,065407 |
4,13E-07 |
0,00108 |
|
5 |
5 |
4,0431 |
4,06668 |
3,97E-07 |
0,00056 |
|
6 |
6 |
4,0587 |
4,067953 |
3,62E-06 |
8,6E-05 |
|
7 |
7 |
4,0893 |
4,069226 |
1,01E-05 |
0,0004 |
|
8 |
8 |
4,0877 |
4,070499 |
1,98E-05 |
0,0003 |
|
Сумма |
36 |
32,5284 |
32,5284 |
0,000068 |
0,0032 |
коэффициент детерминации :
0,000068/(0,000068+0,0032)= 0,0211
Построенное уравнение на 2,11% объясняет вариацию результативного признака.
(0,000068/1)/( 0,0032/6) =0,13
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=0,0032/6=0,00053- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Найдем оценки коэффициентов обратной (гиперболической) модели
.
Введем новую переменную . Тогда гиперболическая модель приводится к линейной:
.
1,2563
57,9107
Гиперболическое уравнение регрессии имеет вид:
y = 1,2563/ t + 57,9107.
Таблица 13 - Оценка коэффициентов гиперболической модели
t |
y |
yi |
|(yi- )/yi| |
||||||
1 |
59,6 |
1 |
1 |
59,6 |
59,167 |
0,0073 |
0,1875 |
0,6881 |
|
2 |
58,5 |
0,5 |
0,25 |
29,25 |
58,5389 |
0,0007 |
0,0015 |
0,0405 |
|
3 |
58 |
0,33333 |
0,1111 |
19,33333 |
58,3295 |
0,0057 |
0,1085 |
6E-05 |
|
4 |
56,4 |
0,25 |
0,0625 |
14,1 |
58,2248 |
0,0324 |
3,3298 |
0,0127 |
|
5 |
57 |
0,2 |
0,04 |
11,4 |
58,162 |
0,0204 |
1,3502 |
0,0308 |
|
6 |
57,9 |
0,16667 |
0,0278 |
9,65 |
58,1201 |
0,0038 |
0,0484 |
0,0473 |
|
7 |
59,7 |
0,14286 |
0,0204 |
8,528571 |
58,0902 |
0,027 |
2,5915 |
0,0612 |
|
8 |
59,6 |
0,125 |
0,0156 |
7,45 |
58,0677 |
0,0257 |
2,3478 |
0,0728 |
|
36 |
466,7 |
2,71786 |
1,5274 |
159,3119 |
466,7 |
0,1228 |
9,9653 |
0,9534 |
Рис. 6. Обратная модель
индекс детерминации вычисляется по формуле
0,9534/(0,9534+9,9653) =0,087
Построенное уравнение на 8,7% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (0,9534/1)/( 9,9653/6) = 0,57
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=9,9653/6=1,6609- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии.
У показательной модели наименьшая стандартная ошибка. Значит, показательная модель наилучшая.
Спрогнозируем цену одного доллара в декабре 2017 года. Если в августе 2017 г. t=8, то в декабре t=12.
Задача 5
По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.
Таблица 3.3 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
1. Австралия |
австралийский доллар |
31,01 |
32,72 |
31,55 |
28,96 |
45,91 |
53,12 |
|
2.Австрия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
3.Азербайджан |
азербайджанский манат |
38,11 |
40,98 |
38,74 |
41,78 |
71,84 |
46,74 |
|
4.Армения |
армянский драм |
84,132) |
83,742) |
75,372) |
80,712) |
12,103) |
15,053) |
|
5.Беларусь |
белорусский рубль |
10,162) |
38,564) |
35,344) |
34,314) |
38,804) |
38,954) |
|
6.Бельгия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
7.Германия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
8.Дания |
датская крона |
54,105) |
56,065) |
53,955) |
60,315) |
92,025) |
10,68 |
|
9.Испания |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
10.Италия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
11.Казахстан3) |
тенге |
20,68 |
21,69 |
20,21 |
21,31 |
30,83 |
21,52 |
|
12.Канада |
канадский доллар |
30,49 |
31,57 |
30,54 |
30,55 |
48,40 |
52,57 |
|
13.Киргизия3) |
сом |
64,84 |
69,56 |
64,08 |
66,34 |
95,52 |
94,84 |
|
14. Нидерланды |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
15.Норвегия5) |
норвежская крона |
51,61 |
53,64 |
54,53 |
53,21 |
75,79 |
83,38 |
|
16.Республика Молдова5) |
молдавский лей |
25,07 |
27,52 |
25,10 |
25,08 |
36,03 |
37,06 |
|
17. Соединенное Королевство (Великобритания) |
фунт стерлингов |
47,26 |
49,63 |
48,96 |
53,96 |
87,42 |
107,98 |
|
18.США |
доллар США |
30,48 |
32,20 |
30,37 |
32,73 |
56,26 |
72,88 |
|
19. Таджикистан |
сомони |
69,225) |
67,665) |
63,735) |
69,095) |
10,76 |
10,99 |
|
20.Туркмения |
новый туркменский манат |
10,70 |
11,29 |
10,65 |
11,48 |
19,74 |
21,44 |
|
21.Турция |
турецкая лира |
19,60 |
16,83 |
16,97 |
15,30 |
24,27 |
25,08 |
|
22.Узбекистан2) |
узбекский сум |
18,58 |
17,94 |
15,30 |
14,63 |
23,22 |
26,45 |
|
23.Украина5) |
гривна |
38,28 |
40,05 |
37,59 |
39,72 |
35,56 |
30,46 |
|
24.Финляндия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
25.Франция |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
26.Швеция5) |
шведская крона |
44,81 |
46,61 |
46,69 |
50,15 |
72,02 |
87,26 |
|
27.Япония3) |
иена |
37,38 |
41,50 |
35,15 |
31,06 |
47,06 |
60,51 |
1) По данным Банка России.
2) За 1000 единиц национальной валюты.
3) За 100 единиц национальной валюты.
4) За 10 000 единиц национальной валюты.
5) За 10 единиц национальной валюты.
Решение
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
15.Норвегия |
норвежская крона |
51,61 |
53,64 |
54,53 |
53,21 |
75,79 |
83,38 |
Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:
=(51,61+53,64+54,53+53,21+75,79+83,38)/6=62,03
Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном распределении нет моды, так как все значения встречаются по одному разу.
Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. Поскольку у нас четное число уровней, то мода равна полусумме чисел, стоящих посередине.
51,61 53,21 53,64 54,53 75,79 83,38
Ме=(53,64 + 54,53)/2=54,085.
Для несгруппированных данных дисперсия рассчитывается по формуле:
=((51,61-62,03)2+(53,64-62,03)2+(54,53-62,03)2+
+(53,21-62,03)2+(75,79-62,03)2+(83,38-62,03)2)/6=159,7
среднеквадратическое отклонение
Индивидуальные значения отклоняются от среднего значения в среднем на ± 12,64.
Коэффициент вариации
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Найдем точечные оценки параметров линейной регрессионной модели
Y = at + b +
Таблица 14 - Оценка параметров линейной модели
t |
y |
yt |
t2 |
||||
1 |
51,61 |
51,61 |
1 |
46,028 |
31,154259 |
255,94454 |
|
2 |
53,64 |
107,28 |
4 |
52,428 |
1,4694288 |
92,138241 |
|
3 |
54,53 |
163,59 |
9 |
58,827 |
18,465928 |
10,236587 |
|
4 |
53,21 |
212,84 |
16 |
65,227 |
144,39868 |
10,239573 |
|
5 |
75,79 |
378,95 |
25 |
71,626 |
17,338896 |
92,1472 |
|
6 |
83,38 |
500,28 |
36 |
78,025 |
28,671741 |
255,95947 |
|
21 |
372,16 |
1414,55 |
91 |
372,16 |
241,4989 |
716,6656 |
=39,629,=6,3994.
Уравнение тренда (регрессии) будет иметь вид:
=6,3994t+39,629
Рис. 7. Линейная модель
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (716,6656/1)/( 241,4989/4)= 11,87
к1 =1, к2 = 6-1-1=4, на уровне значимости 0,05 табличное значение Fт = 7,71. Для зависимости y от t выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Задача 6
По статистическим данным Росстата (таблица 3.4) выполнить комплексный статистический анализ инвестиций в основной капитал.
Таблица 3.4 - Инвестиции в основной капитал, млн. руб.
Номер студента |
Регионы |
2012 |
2013 |
2014 |
|
Приволжский федеральный округ |
2012877 |
2301298 |
2355973 |
||
1; 15 |
Республика Башкортостан |
233683 |
266396 |
285520 |
|
2; 16 |
Республика Маpий Эл |
31656 |
46178 |
48354 |
|
3; 17 |
Республика Моpдовия |
49825 |
53714 |
55292 |
|
4; 18 |
Республика Татарстан |
470751 |
525730 |
542781 |
|
5; 19 |
Удмуртская Республика |
64221 |
82678 |
89836 |
|
6; 20 |
Чувашская Республика |
65255 |
60122 |
56446 |
|
7; 21 |
Пермский край |
162241 |
219494 |
185649 |
|
8; 22 |
Киpовская область |
50545 |
58655 |
56294 |
|
9; 23 |
Нижегородская область |
257454 |
280884 |
286619 |
|
10; 24 |
Оренбургская область |
151250 |
152877 |
150208 |
|
11; 25 |
Пензенская область |
72343 |
82164 |
83690 |
|
12;26 |
Самарская область |
213022 |
269737 |
300311 |
|
13; 27 |
Саратовская область |
117646 |
125834 |
132804 |
|
14; 28 |
Ульяновская область |
72985 |
76835 |
82168 |
Этапы:
- графическое представление информации и ее анализ;
- определение средних величин и показателей вариации;
- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;
- определение показателей динамики инвестиций и их анализ;
- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.
Решение
Регионы |
2012 |
2013 |
2014 |
|
Республика Башкортостан |
233683 |
266396 |
285520 |
Представим графически динамику показателя.
Рис. 8. Динамика инвестиций в основной капитал по республике Башкортостан за 2012-2014 гг.
По графику видно, что тенденция показателя положительная.
Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:
= (233683+266396+285520)/3=261866,3 млн. руб.
Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном ряду нет моды, так как все значения встречаются по одному разу.
Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. 233683 266396 285520
Ме=266396 млн. руб.
Для несгруппированных данных дисперсия рассчитывается по формуле:
=((233683-261866,3)2+(266396-261866,3)2+
+(285520-261866,3)2)/3=458104701,6
среднеквадратическое отклонение 21403,5
Индивидуальные значения отклоняются от среднего значения в среднем на ± 21403,5.
Коэффициент вариации
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Определим коэффициент корреляции между инвестициями и выбранным фактором по данным Росстата - индексами промышленного производства по республике Башкортостан.
Таблица 15 - Инвестиции в основной капитал и индексы промышленного производства по республике Башкортостан
Год |
Инвестиции в основной капитал, млн. руб. |
Индексы промышленного производства (в процентах к предыдущему году) |
|
2012 |
233683 |
105,7 |
|
2013 |
266396 |
102,3 |
|
2014 |
285520 |
103,9 |
Таблица 16 - Расчетные значения для определения коэффициента корреляции
Год |
х |
y |
х2 |
xy |
y2 |
|
2012 |
233683 |
105,7 |
54607744489 |
24700293,1 |
11172,49 |
|
2013 |
266396 |
102,3 |
70966828816 |
27252310,8 |
10465,29 |
|
2014 |
285520 |
103,9 |
81521670400 |
29665528 |
10795,21 |
|
Сумма |
785599 |
311,9 |
2,07096E+11 |
81618131,9 |
32432,99 |
Коэффициент корреляции:
=-0,65
Имеется средняя отрицательная линейная связь между y и x: с ростом х снижается у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если
,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 3-2=1, tтабл= 12,71.
Для получаем расчетное значение:
.
Коэффициент корреляции несущественно отличается от нуля, его можно считать незначимым.
Определим цепные и базисные показатели ряда динамики инвестиций в основной капитал.
Абсолютный прирост цепной:
Абсолютный прирост базисный:
где - уровень i-го периода; - уровень предшествующего периода; - уровень базисного периода.
Темп роста цепной:
Темп роста базисный:
Темп прироста цепной:
, или
Темп прироста базисный:
, или
Абсолютное содержание 1% прироста:
, или
Результаты расчетов представим в таблице.
Таблица 17 - Вычисление показателей динамики
Год |
Инвестиции в основной капитал, млн. руб. |
, (млн. руб.) |
, (млн. руб.) |
,% |
,% |
,% |
,% |
А, млн. руб./% |
|
2012 |
233683 |
- |
- |
- |
- |
- |
- |
- |
|
2013 |
266396 |
32713 |
32713 |
114 |
114 |
14 |
14 |
2336,8 |
|
2014 |
285520 |
19124 |
51837 |
107,2 |
122,2 |
7,2 |
22,2 |
2664 |
Все показатели динамики положительные. С каждым годом идет прирост инвестиций.
Средний абсолютный прирост
51837/2=25918,5 млн. руб.
Инвестиции в основной капитал ежегодно растет на 25918,5 млн. руб. в среднем.
Средний темп роста
Средний темп прироста
110,5%-100%=10,5%
Инвестиции в основной капитал ежегодно в среднем за год растет на 10,5%.
Найдем точечные оценки параметров линейной регрессионной модели
Y = at + b +
Таблица 18 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
||
1 |
233683 |
233683 |
1 |
235948 |
|
2 |
266396 |
532792 |
4 |
261867 |
|
3 |
285520 |
856560 |
9 |
287786 |
|
6 |
785599 |
1623035 |
14 |
785601 |
=210029,=25919.
Уравнение тренда (регрессии) будет иметь вид:
25919t+210029
Рис. 9. Линейная модель
Коэффициент детерминации равен 0,9776. Что свидетельствует о хорошем качестве уравнения тренда. Ежегодно показатель увеличивается на 25919 млн. руб.
Заключение
В данной работе были поставлены следующие задачи: изучить методику оценки средних величин, динамики показателей, изменения их под влиянием тех или иных факторов, измерения величины этого влияния.
Для достижения поставленных задач в данной работе были использованы показатели вариации, а также методы корреляционного и регрессионного анализа. Рассчитаны структурные средние, такие как мода и медиана.
Уровень изменчивости признаков измерялся с помощью коэффициента вариации.
Для оценки величины влияния факторов на результат были построены линейные и нелинейные модели зависимостей.
Поставленные задачи в работе выполнены в полном объеме.
Таким образом, можно сделать вывод о том, что в современном обществе статистика стала одним из важнейших инструментов управления национальной экономикой. Развитие рыночных отношений в стране поставило перед статистикой новую задачу - реформирование общеметодологических и организационных основ статистической теории и практики.
Главной задачей статистики является исчисление и анализ статистических показателей, благодаря чему органы управления получают всестороннюю характеристику управляемых объектов: всей национальной экономики, отдельных ее отраслей, предприятий и их подразделений.
Общая теория статистики разрабатывает общие принципы и методы статистического исследования общественных явлений, наиболее общие категории (показатели) статистики. Она является учебной дисциплиной, формирующей необходимые профессиональные знания у экономистов, менеджеров, руководителей предприятий.
Список использованной литературы
регрессионный корреляционный вариация величина
1. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1999.
2. Елисеева И.И. Общая теория статистики: Учебник для вузов / И.И. Елисеева, М.М. Юзбашев; Под ред. И.И. Елисеевой. 4-е изд., перераб. и доп. М.: Финансы и статистика, 2002. 480 с.
3. Практикум по общей теории статистики: учеб. пособие/ И. И. Елисеева, Н. А. Флуд, М. М. Юзбашев; под ред И. И. Елисеевой. - М.: Финансы и статистика, 2008. -512 с.
4. Практикум по теории статистики: Учеб. пособие / Под ред. Р. А. Шмойловой. - М.: Финансы и статистика, 2003. -416 с.
5. Практикум по эконометрике / Под ред. И.И. Елисеевой - М.: Финансы и статистика, 2001.
6. Сборник задач по теории статистики: Учебное пособие/ Под ред. проф. В.В.Глинского и к.э.н., доц. Л.К.Серга. - Изд.3-е.- М.:ИНФРА-М; Новосибирск: Сибирское соглашение, 2002.
7. Статистика: Учебное пособие/Харченко Л-П., Долженкова В.Г., Ионин В.Г. и др., Под ред. В.Г.Ионина. - Изд. 2-е, перераб. и доп. - М.: ИНФРА-М.2003.
8. Эконометрика / Под ред. И.И. Елисеевой - М.: Финансы и статистика, 2001.
9. Сайт Росстата http:// www. gks. ru
Размещено на Allbest.ru
Подобные документы
Понятие о средних величинах как обобщении в экономике. Виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая и кубическая. Показатели вариации. Методика и примеры решения типовых задач на нахождение средних величин.
курсовая работа [27,7 K], добавлен 31.05.2008Абсолютные и относительные величины. Виды средних величин. Формы количественного выражения статистических показателей. Абсолютные размеры явлений и их признаков. Выбор единиц измерения величин. Индивидуальные, групповые и общие абсолютные величины.
презентация [135,5 K], добавлен 16.03.2014Проблема использования индексного анализа динамики средних цен в экономической практике; учет влияния фактора сменяемости изучаемых величин. Методологические принципы исчисления индексов стоимости, средних цен и физического объема внешней торговли.
контрольная работа [1,6 M], добавлен 18.08.2013Изучение показателей качества конструкционного газобетона как случайных величин. Проведение модульного эксперимента и дисперсионного анализа с целью определения достоверности влияния факторов на поведение выбранных показателей качества данной продукции.
курсовая работа [342,3 K], добавлен 08.05.2012Получение функции отклика показателя качества Y2 и формирование выборки объемом 15 и более 60. Зависимость выбранного Y от одного из факторов Х. Дисперсионный анализ и планирование эксперимента. Проведение корреляционного и регрессионного анализа.
курсовая работа [827,2 K], добавлен 19.06.2012Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.
контрольная работа [50,4 K], добавлен 07.06.2011Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.
курсовая работа [413,0 K], добавлен 11.08.2012Линейный регрессионный анализ выработки и потребления меди на мировом рынке. Теория множественной корреляции. Разработка методологии исследования материалов: массовые статистические наблюдения, методы группировок, средних величин, графических изображений.
курсовая работа [1,2 M], добавлен 06.05.2014Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.
курсовая работа [1,2 M], добавлен 04.02.2011Понятие сетевого планирования, его особенности, назначение и сферы применения. Правила и этапы построения сетевых графиков, необходимые расчеты и решение типовых задач. Общая характеристика корреляционного и регрессивного анализа, их применение.
контрольная работа [142,3 K], добавлен 29.04.2009