Общая теория статистики
Характеристика средних величин и показателей вариации. Расчет значения модальной величины признака и медианы. Особенность определения среднего квадратичного отклонения и дисперсии. Проведение исследования корреляционного и регрессионного анализа.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 863,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Пензенский государственный университет
Факультет «Экономика и управление»
Кафедра «Экономика и финансы»
Курсовая работа
по дисциплине: «Общая теория статистики»
Автор работы
Кожевникова Е.А.
Пенза 2017
Содержание
Введение
1. Средние величины и показатели вариации
2. Корреляционный анализ
3. Регрессионный анализ
Заключение
Список использованных источников
Введение
Понятие «статистика» многозначно. В настоящее время насчитывается около тысячи определений статистики. Первое из них относится к 1749 году и подразумевается как совокупность сведений о государстве, о его достопримечательностях. Это понятие ввёл немецкий учёный Готфрид Ахенваль - представителем описательной школы государствоведения.
На протяжении этого времени оно уточнялось и дополнялось. Дать определение статистики как науки пытались философы, математики, экономисты.
Статистика как единое целое включает:
1) особую область общественно значимой профессиональной деятельности, которая направлена на сбор, обработку и анализ социально-экономической информации на базе применения статистических методов;
2) отрасль общественной науки, которая занимается разработкой теоретических основ и методологии статистики. Эти основы лежат в основе прикладных статистических исследований, всей деятельности в области практической статистики;
3) массивы статистической информации. Они представляются в виде статистических отчётов, статистических сборников официальных данных о разных сферах общественной жизни.
Предметом исследования в статистике является закономерности массовых социально-экономических явлений, которые состоят из множества отдельных элементов или фактов.
Однако недостаточно только провести массовое наблюдение, чтобы выявить те или иные закономерности.
Результаты наблюдения подвергают обработке, сводке, что позволяет выделить во всей совокупности различные типы, группы единиц и затем для всей совокупности и отдельных ее частей рассчитать обобщающие показатели (характеристики).
Массовое наблюдение, группировка и сводка его результатов, вычисление и анализ обобщающих показателей - все это вместе составляет специфический метод статистики.
К какой бы области ни относился предмет статистики (население, промышленность, торговля и т.д.), метод ее везде одинаков, т.е. везде используется массовое наблюдение, группировка и обобщающие показатели, в которых, благодаря действию закона больших чисел, взаимопогошается влияние случайных причин и выявляется типичное и закономерное. Иначе говоря, метод статистики обусловлен спецификой ее предмета.
Целью курсовой работы является закрепление и углубление знаний, приобретённых в процессе изучения дисциплины «общая теория статистики».
Для этого поставлены следующие задачи:
- изучить средние величины и показатели вариации;
- рассмотреть корреляционный анализ;
- рассмотреть регрессионный анализ.
Номер классного журнала - 9.
1. Средние величины и показатели вариации
В статистике средними величинами называют обобщающие показатели, которые выражают типичные, характерные для определенного места и времени размеры и количественные соотношения явлений общественной жизни.
В статистике применяются следующие виды средних величин: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, а также структурные средние - мода и медиана.
Наиболее самый распространённый вид средних величин - это средняя арифметическая, представляющая собой сумму всех чисел, делённую на их количество. Она может иметь форму простой и взвешенной.
Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:
,
где xi - величины, для которых исчисляется средняя,
n - число единиц совокупности.
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:
,
где fi - частота.
Мода представляет собой наиболее часто встречающееся значение признака в данной совокупности.
Модой для дискретного ряда является вариант, обладающий наибольшей частотой.
При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем -- значение модальной величины признака по формуле:
,
где М0 - значение моды,
х0 - нижняя граница модального интервала,
h - величина интервала,
fm - частота модального интервала,
fm-1 - частота интервала, предшествующего модальному,
fm+1 - частота интервала, следующего за модальным.
Медианой называют величину варьирующего признака, которая находится в середине ряда, расположенного в порядке возрастания или убывания.
Медиана -- значение варьирующего признака, приходящееся на середину ранжированной совокупности. Для ранжированного ряда с нечетным числом индивидуальных величин медианой будет величина, которая расположена в центре ряда. Для ранжированного ряда с четным числом индивидуальных величин медианой будет средняя арифметическая величина, которая рассчитывается из двух срединых величин.
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем -- значение медианы по формуле:
,
где XMe - нижняя граница медианного интервала,
hMe - величина медианного интервала,
fMe - частота медианного интервала,
SMe-1 - накопленная частота предшествующего медианного интервала.
Для характеристики размеров колеблемости признаков в статистике применяется следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации и др.
Дисперсия - это средняя из квадратов отклонений значений признака от его средней арифметической величины. Она определяется по формуле арифметической простой:
Или средней арифметической взвешенной:
Выделяют 3 вида дисперсий: общая, средняя внутригрупповая и межгрупповая. Они связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.
Среднее квадратичное отклонение - это корень квадратный из дисперсии - определяется по формулам средней арифметической простой:
Или средней арифметической взвешенной:
Мерой сравнения степеней колеблемости для двух, трех и более вариационных рядов служит показатель, который носит название коэффициента вариации и определятся по формуле:
Коэффициент детерминации представляет собой отношение межгрупповой дисперсии к общей. Он определяет долю (в процентах) изменений, обусловленных влиянием факторных признаков, в общей изменчивости результативного признака. Рассчитывается по следующей формуле:
?2 = у2межгр / у2об
Задача 1.1 По статистическим данным 12;14;11;13;16;12;17;12;19 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации.
Решение.
1) Находим среднее значение по формуле (1.1)
= = =14
2) Определяем моду (М0 ) и медиану (Me ). Так как в условии задачи представлен дискретный ряд, то М0 = 12.
Для определения медианы расположим ряд в порядке возрастания: 12;13;13;13;14;15;17;18;20. Так как этот ряд нечётный, то Me = 13.
Находим дисперсию по формуле (1.5)
у2= = = 6,7
Далее определяем среднеквадратическое отклонение по формуле (1.7)
Так как этот показатель представляет собой корень квадратный из дисперсии, то у = 2,59
Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)
V= 100% = 17,3%
Ответ: среднее значение равно 14, мода равна 12, медиана равна 13, дисперсия равна 6,7, среднеквадратическое отклонение равно 2,59 и коэффициент вариации равен 17,3%.
Задача 1.2 По данным статистики в отчётном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 30%, стоимость основных фондов увеличилась на 19%. Определить значение фондоотдачи.
Прежде чем начать решение этой задачи, нужно сказать, что фондоотдача представляет собой отношение стоимости произведенной продукции за период к средней величине стоимости основных фондов за этот же период.
Фондоотдача является самым важным показателем использования основных фондов, так как с её увеличением повышается эффективность использования основных средств.
Решение.
Кфо = 100%
Кфо = 100% = 1,09
Вывод: коэффициент фондоотдачи увеличился на 9%.
Задача 1.3 Объём оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.
Таблица 1.1 - Исходные данные
У |
m |
|
80-100 |
6 |
|
100-120 |
17 |
|
120-140 |
25 |
|
140-160 |
28 |
|
160-180 |
14 |
|
180-200 |
10 |
Решение.
Находим среднее значение по формуле (1.1)
= 6+17+25+28+14+10/6 = 100/6 = 16,7
Определяем моду по формуле (1.3)
M0 = 140+20 = 143,4
Находим медиану.
Для того, чтобы найти медианный интервал, нужно найти накопленные частоты (суммы частот данного и всех предшествующих интервалов) и суммировать.
Таблица 1.2 - промежуточные расчёты
У |
m |
Накопленная Частота(SMe-1) |
|
80-100 |
6 |
6 |
|
100-120 |
17 |
23(6+17) |
|
120-140 |
25 |
48(23+25) |
|
140-160 |
28 |
76(28+28) |
|
160-180 |
14 |
90(76+14) |
|
180-200 |
10 |
100(90+10) |
Как только накопленное значение частоты превысит , то это и будет медианным интервалом. В данном случае n = 50. Значит, медианный интервал - 140-160. Теперь находим медиану по формуле (1.4)
Me =
Ответ: среднее значение равно 16,7 ; мода равна 143,4; медиана равна 141,4.
Задача 1.4 По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 1.3).
Таблица 1.3 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
1,0-1,2 |
12 |
12 |
||
1,2-1,4 |
13 |
13 |
||
1,4-1,6 |
26 |
26 |
||
1,6-1,8 |
20 |
24 |
45 |
|
1,8-2,0 |
22 |
15 |
38 |
|
2,0-2,2 |
27 |
14 |
42 |
|
2,2-2,4 |
15 |
15 |
||
2,4-2,6 |
11 |
11 |
||
95 |
104 |
202 |
Решение.
Рассчитаем общую дисперсию
Исходные данные и промежуточные расчёты представлены в таблице 1.4.
Таблица 1.4 - исходные данные
Объем оборота предприятий (Хi) |
Число предприятий по форме собственности |
Расчет общей дисперсии |
||||||
mгi |
mчi |
moi |
сред i |
xсред.imoi |
(xсред.i -)2 |
(xсред.i -)2moi |
||
1,0-1,2 |
12 |
12 |
1,1 |
13,2 |
0,52 |
6.76 |
||
1,2-1,4 |
13 |
13 |
1,3 |
16,9 |
0,27 |
3,78 |
||
1,4-1,6 |
26 |
26 |
1,5 |
39 |
0,1 |
0,27 |
||
1,6-1,8 |
20 |
24 |
45 |
1,7 |
76,5 |
0,01 |
0,46 |
|
1,8-2,0 |
22 |
15 |
38 |
1,9 |
72,2 |
0,006 |
0,23 |
|
2,0-2,2 |
27 |
14 |
42 |
2,1 |
88,2 |
0,08 |
3,44 |
|
2,2-2,4 |
15 |
15 |
2,3 |
34,5 |
0,23 |
3,68 |
||
2,4-2,6 |
11 |
11 |
2,5 |
27,5 |
0,46 |
5,52 |
||
Итого |
95 |
104 |
202 |
368 |
24,14 |
Находим выработку в среднем на одно предприятие по формуле (1.2)
=
Определяем общую дисперсию по формуле (1.6)
у2 об.= = 115 000 руб.
Рассчитаем среднюю из внутригрупповых дисперсий.
Нужно рассмотреть , как складываются показатели выручки и ее вариации по группам в зависимости от форм собственности. Для этого рассчитываем дисперсию по государственным и частным предприятиям.
Расчет дисперсии по государственным предприятиям представлены в таблице 1.5
Хi |
mгi |
Хср.i |
Хср.i*mгi |
(Хср.i- x?г)2 |
|
14,6-14,8 |
11 |
14,7 |
161,7 |
0,09 |
|
14,8-15,0 |
13 |
14,9 |
193,7 |
0,01 |
|
15,0-15,2 |
18 |
15,1 |
271,8 |
0,01 |
|
15,2-15,4 |
6 |
15,3 |
91,8 |
0,09 |
|
15,4-15,6 |
2 |
15,5 |
31 |
0,25 |
|
50 |
75,5 |
750 |
0,45 |
x? гос. = = 15
гос.= 46 800 руб.
Хi |
mчi |
Хср.i |
Хср.i*mчi |
(Хср.i- x?ч)2 |
(Хср.i - x?ч)2*mчi |
|
14,0-14,2 |
3 |
14,1 |
42,3 |
0,278784 |
0,836352 |
|
14,2-14,4 |
4 |
14,3 |
57,2 |
0,107584 |
0,430336 |
|
14,4-14,6 |
17 |
14,5 |
246,5 |
0,016384 |
0,278528 |
|
14,6-14,8 |
15 |
14,7 |
220,5 |
0,005184 |
0,07776 |
|
14,8-15,0 |
6 |
14,9 |
89,4 |
0,073984 |
0,443904 |
|
15,0-15,2 |
5 |
15,1 |
75,5 |
0,222784 |
1,11392 |
|
50 |
87,6 |
731,4 |
0,704704 |
3,1808 |
x? част. = = 14,628
част. фирм = 63 600 руб.
средняя внутригрупповая = = = 55 200
2межгрупповая = 2общая - 2внутригрупповая = 34 600
з2 = * 100% = 38,5%
Следовательно, 38,5% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,5% - влиянием других факторов.
Ответ: средняя внутригрупповая дисперсия = 55 200; межгрупповая дисперсия = 34 600; общая дисперсия = 89 800. Коэффициент детерминации = 38,5%
Задача 1.5 Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.7).
Таблица 1.7 - исходные данные.
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
Хi |
1 |
6 |
|
mi |
10 |
15 |
|
Хi |
3 |
8 |
|
mi |
20 |
5 |
Решение.
Определяем дисперсию 1,2 и 3 групп по формуле (1.8), предварительно определив их среднее значение по формуле (1.2)
Среднее значение и дисперсия 1 группы:
= = 2
у2=
Среднее значение и дисперсия 2 группы:
= = 4
у2=
Среднее значение и дисперсия 3 группы:
= = 4
у2=
Находим среднюю внутригрупповую дисперсию: складываем дисперсии 3 групп и делим на 3.
у2 сред.внут. =
Тогда среднее значение 3 групп будет равно:
=
Находим общую дисперсию
у2 об. = = = 5,6
Зная общую и среднюю внутригрупповую дисперсии, находим межгрупповую дисперсию.
у2межгр. = 5,6 - 4,73 = 0,87
Ответ: средняя внутригрупповая дисперсия равна 4,73, общая дисперсия равна 5,6, межгрупповая дисперсия равна 0,87
2. Корреляционный анализ
Корреляция представляет собой взаимозависимость двух случайных величин. Суть ее заключается в том, что при изменении значения одной случайной величины происходит изменение значения другой.
Корреляционный анализ посвящён изучению взаимосвязей между случайными величинами. Задача корреляционного анализа сводится к установлению направления связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.
Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Он может варьировать в пределах от -1 до +1. Если коэффициент корреляции равен 0 то, это говорит об отсутствии корреляционных связей между переменными. Причем если коэффициент корреляции ближе к 1 (или -1) то говориться о сильной корреляции, а если ближе к 0, то о слабой.
При положительной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значе-ниям одного признака - низкие значения другого. При отрицательной корреляции образуется обратная связь.
Коэффициент корреляции рассчитывается по следующей формуле:
Rxy
где - среднее значение произведения х и у
ух - среднеквадратическое отклонение х
уу - среднеквадратическое отклонение у
Значение коэффициента корреляции и характеристика связи:
От 0 до 0,2 - очень слабая
От 0,2 до 0,4 - слабая
От 0,4 до 0,6 - средняя
От 0,6 до 0,8 - сильная
От 0,8 до 1,0 - очень сильная
Значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента (расчётное значение):
t =
Далее находят табличное значение коэффициентов корреляции для различного числа степеней свободы f = n-2 и различных уровней значимости a = 0,1; 0,05; 0,01 и 0,001. Считается, что корреляция значима, если рассчитанный коэффициент корреляции табличное значение коэффициента корреляции.
Коэффициент корреляции рангов - показатель, который был введён английским учёным-психологом Ч. Спирменом в конце ХХ века. Он основан не на изучении зависимости самих переменных, а только их рангов.
Ранг представляет собой порядковый номер, который присваивается каждому индивидуальному значению х и у отдельно после их упорядочения по возрастанию (или убыванию).
Коэффициент корреляции рангов определяется по формуле Спирмена:
R = 1 ,
где d - разность рангов х и у (d = dx -dy)
n - число наблюдаемых пар значений х и у.
Коэффициент ранговой корреляции может принимать значение от -1 до 1. Задача 2.1. Определить коэффициент корреляции между У и Х. Оценить значимость коэффициента корреляции при уровне 0,05.
Таблица 2.0 - Исходные данные
Х |
ХУ |
|
3,5 |
28.35 |
|
4,6 |
43,24 |
|
5,8 |
65,54 |
|
4,2 |
28,98 |
|
5,2 |
50,44 |
Решение.
Сначала находим значение У: каждое произведение значений Х и У делим на каждое значение Х.
Таблица 2.1 - промежуточные расчёты
Х |
У |
ХУ |
|
3,5 |
8,1 |
28.35 |
|
4,6 |
9,4 |
43,24 |
|
5,8 |
11,3 |
65,54 |
|
4,2 |
6,4 |
28,98 |
|
5,2 |
9,7 |
50,44 |
Увеличиваем значения Х и У на 9, затем находим ХУ и дисперсии Х и У. Сумму всех значений поделим на их количество и получим их среднее значение.
Таблица 2.2 - промежуточные расчёты
№ |
Х |
У |
ХУ |
(x -)2 |
(у -)2 |
|
1 |
12,5 |
17,1 |
213,75 |
1,3456 |
0,7744 |
|
2 |
13,6 |
18,4 |
250,24 |
0,0036 |
0,1764 |
|
3 |
14,8 |
20,3 |
300,44 |
1,2996 |
5,3824 |
|
4 |
13,2 |
15,4 |
203,28 |
0,2116 |
6,6564 |
|
5 |
14,2 |
18.7 |
265,54 |
0,2916 |
0,5184 |
|
, |
68,3 |
89,9 |
6140,17 |
3,152 |
13,508 |
|
, |
13,66 |
17,98 |
245,61 |
15,76 |
2,7 |
Зная дисперсии х и у, можем найти их среднеквадратические отклонения:
ух = = 3,97
уу = = 1,64
Зная все значения, находим коэффициент корреляции по формуле (2.1)
rxy = 0,16
Находим расчётное значение коэффициента по критерию Стьюдента. Вычислим по формуле (2.2)
t = = = 0,28
Далее определяем табличное значение коэффициента корреляции t (0,05;3) = 3,18
Отсюда следует, что t t (0,05;3) , т.е. 0,28 3,18
Ответ: коэффициент корреляции равен 0,16. Расчётное значение коэффициента меньше табличного. Это свидетельствует о том, что полученный коэффициент незначим, образует очень слабую связь между двумя переменными.
Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 28 32 23 30 25 24
у 27 30 21 28 24 20
Решение.
Строим таблицу аналогично таблице 2.2 и находим ХУ и дисперсии Х и У и их средние значения.
Таблица 2.3 - промежуточные расчёты
№ |
Х |
У |
ХУ |
(x -)2 |
(у -)2 |
|
1 |
27 |
26 |
702 |
1 |
4 |
|
2 |
31 |
29 |
899 |
25 |
25 |
|
3 |
22 |
20 |
440 |
16 |
16 |
|
4 |
29 |
27 |
783 |
9 |
9 |
|
5 |
24 |
23 |
552 |
4 |
1 |
|
6 |
23 |
19 |
437 |
9 |
25 |
|
, |
156 |
144 |
3813 |
64 |
80 |
|
, |
26 |
24 |
635,5 |
10,6 |
13,3 |
Определяем среднеквадратические отклонения х и у
ух = = 3,26
уу = =
Находим коэффициент корреляции
rxy = 0,97
Находим расчётное значение коэффициента по формуле (2.2)
t = = = 8,08
Далее определяем табличное значение коэффициента корреляции
t (0,05;6) = 2,447
Отсюда следует, что t t (0,05;6) .
Ответ: коэффициент корреляции равен 0,97. Расчётное значение коэффициента превышает табличное значение. Это значит, что полученный коэффициент значим, образует очень сильную связь между двумя переменными.
Задача 2.3. В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей (Х): 74 99 51 56 93 67 59
Статистика (У): 60 94 45 72 81 89 49.
Определить коэффициент ранговой корреляции Спирмена, расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение.
Проранжируем каждый из элементов X и Y, затем вычислим разность рангов по каждому случаю и возведём полученную разность в квадрат.
Полученные данные представлены в таблице 2.4
Таблица 2.4 - промежуточные расчёты
№ студента |
dx |
dy |
dx - dy |
d2 |
|
1 |
2 |
4 |
-2 |
4 |
|
2 |
0 |
0 |
0 |
0 |
|
3 |
6 |
6 |
0 |
0 |
|
4 |
5 |
3 |
2 |
4 |
|
5 |
1 |
2 |
-1 |
1 |
|
6 |
3 |
1 |
2 |
4 |
|
7 |
4 |
5 |
-1 |
1 |
Находим сумму квадратов разностей:
d2 = 4+0+0+4+1+4+1 = 14
Рассчитываем коэффициент ранговой корреляции по формуле (2.3)
R = 1 =1 - = 1- 0, 25 = 0,75
Находим расчётное значение критерия Стьюдента по формуле (2.2)
t = = = 2,55
Далее определяем табличное значение коэффициента
t (0,05;7) = 2,37
Отсюда следует, что t t (0,05;7) .
Ответ: коэффициент ранговой корреляции равен 0,75. Расчётное значение коэффициента больше табличного. Из этого можно сделать вывод, что полученный коэффициент значим, образует сильную связь между двумя переменными.
3. Регрессионный анализ
Регрессионный анализ позволяет установить аналитическую зависимость, в которой изменение среднего значения результативного признака обусловлено влиянием одной или нескольких независимых величин. Регрессионный анализ даёт изучить двухстороннюю зависимость между переменными, т.е. когда величина одного признака х изменяется в зависимости от другого у, и наоборот, у от х.
Уравнение регрессии представляет собой математическую модель, в которой усреднённое значение результативного признака х рассматривается как функция одного или нескольких факторных признаков.
С помощью регрессионного анализа можно осуществлять:
- построение эмпирических графиков (линий) регрессии (регрессия х по у и регрессия у по х);
- поиск уравнений, позволяющих по эмпирическим данным построить теоретическую, т.е. выровненную линию регрессии;
- вычисление коэффициентов, позволяющих судить, насколько в среднем результирующая величина изменяется при соответствующих изменениях факторного признака.
Аналитические зависимости между социально-экономическими показателями могут быть представлены простыми уравнениями в форме линейной и нелинейной связи:
х = a0 + a1x - прямолинейная зависимость;
х = a0 ха1 - степенная зависимость;
х = a0 + a1 - гиперболическая зависимость;
х = a0 + a1x + а2х2 - парабола второго порядка;
х = a0 + a1 - логарифмическая функция;
где х - теоретические значения результативного признака, рассчитанные по уравнению регрессии;
a0 , a1 , а2 - коэффициенты уравнения регрессии.
Для простоты расчётов нелинейные формы связи (путём логарифмирования или замены переменных) чаще всего преобразуют в линейную форму.
Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.
Первая система уравнения имеет вид:
{
Вторая система имеет вид:
Из 2.8 находим:
Подставляем в (2.8), имеем:
.
Из 2.7 находим а0:
.
Подставляем а0 в (2.8), имеем:
.
После определения коэффициентов регрессии проверяется их значимость по критерии Стьюдента.
Расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:
Выдвигается аналогичная гипотеза как и при проверке “r”: параметр а1 равен нулю. Если расчетное значение при заданном уровне значимости больше табличного, то нулевая гипотеза отвергается и параметр считается значимым.
Расчетное значение критерия Стьюдента для параметра а0 определяется по формуле:
.
Значимость модели проверяется по критерию Фишера:
где - табличное значение критерия;
- степень свободы факторной дисперсии
- степень свободы остаточной дисперсии
Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле, и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной.
Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.
После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка.
Ошибка аппроксимации рассчитывается по формуле:
где - исходное значение показателя;
- расчетное (прогнозное) значение показателя.
Ошибка аппроксимации не должна превышать 12-15%. Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения. Стандартная ошибка определяется по формуле:
.
Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Исходные данные:
у: 30; 25; 24; 23; 22; 21,5; 20; 20,5; 19; 17
х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10
Характеристики модели:
1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение
1) Уравнение обратной функции: y = +
Произведем замену X = . В результате получим линейное уравнение
= +X
Рассчитаем его параметры, используя расчетную таблицу 3.1
Таблица 3.1 - исходные данные
№ п/п |
|||||||
1 |
30 |
1 |
1 |
30 |
1 |
30,8232 |
|
2 |
25 |
2 |
0,5 |
12,5 |
0,25 |
24,7256 |
|
3 |
24 |
3 |
0,333333 |
7,999992 |
0,111111 |
22,69313 |
|
4 |
23 |
4 |
0,25 |
5,75 |
0,0625 |
21,67687 |
|
5 |
22 |
5 |
0,2 |
4,4 |
0,04 |
21,06712 |
|
6 |
21,5 |
6 |
0,166667 |
3,58 |
0,027778 |
20,66066 |
|
7 |
20 |
7 |
0,142857 |
2,85714 |
0,020408 |
20,370255 |
|
8 |
20,5 |
8 |
0,125 |
2,5625 |
0,015625 |
20,152488 |
|
9 |
19 |
9 |
0,111111 |
2,111109 |
0,012346 |
19,983110 |
|
10 |
17 |
10 |
0,1 |
1,7 |
0,01 |
19,84761 |
|
итого |
222 |
55 |
2,928968 |
73,460741 |
1,549768 |
202,016933 |
|
Ср. знач. |
22,2 |
5,5 |
0,292897 |
7,3460741 |
0,154977 |
= = =12,1951;
= = 22,2-12,19510,292897=18,6281
Получим следующее уравнение гиперболической модели:
y = 18,6281 +.
2) Определим индекс детерминации
Расчеты приведены в таблице 3.2
Таблица 3.2 - Расчет коэффициента детерминации
№ п/п |
||||||
1 |
30 |
1 |
30,8232 |
60,84 |
0,677659 |
|
2 |
25 |
2 |
24,7256 |
7,84 |
0,075295 |
|
3 |
24 |
3 |
22,69313 |
3,24 |
1,70791 |
|
4 |
23 |
4 |
21,67687 |
0,64 |
1,750672 |
|
5 |
22 |
5 |
21,06712 |
0,04 |
0,870265 |
|
6 |
21,5 |
6 |
20,66066 |
0,49 |
0,704491 |
|
7 |
20 |
7 |
20,370255 |
4,84 |
0,13709 |
|
8 |
20,5 |
8 |
20,152488 |
2,89 |
0,120764 |
|
9 |
19 |
9 |
19,983110 |
10,24 |
0,96665 |
|
10 |
17 |
10 |
19,84761 |
27,04 |
8,108882 |
|
итого |
222 |
55 |
202,016933 |
118,1 |
15,119642 |
|
Ср. знач. |
22,2 |
5,5 |
11,81 |
R2 = 1- 0,87.
Вариация результата у (себестоимость единицы продукции) на 87% объясняется вариацией фактора х (стоимостью основных фондов).
3) Определим стандартную ошибку модели по формуле (3.3)
== 1,3747
4) Определим F - критерий Фишера
F = 8 = 53,32;
для =0,05, , .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5) По вычисленному коэффициенту детерминации рассчитаем коэффициент корреляции.
rxy =
rxy = = 0,93
Определяем расчетное значение критерия Стьюдента для параметра а1 по формуле (2.9) вариация медиана дисперсия регрессионный
ta1 = 0,93 = 0,93 = 7,15
Табличное значение критерия Стьюдента: tкрит = 2,306
Вывод: расчётное значение параметра а1 больше табличного ( ta1> tкрит). Следовательно, параметр а1 является значимым.
Определяем расчетное значение критерия Стьюдента для параметра а0 по формуле (3.0)
уy = = 3,44
ta0 = = 43,83.
Табличное значение критерия Стьюдента: tкрит = 2,306.
Вывод: расчётное значение параметра а0 больше табличного ( ta0> tкрит). Следовательно, параметр а0 является значимым.
Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
у 10; 13,4; 15,4; 16,5; 18,6; 19,1
х 1; 2; 3; 4; 5; 6.
Определить характеристики модели:
1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение.
Исходные данные и промежуточные расчеты приведены в таблице 3.3
Таблица 3.3 - исходные данные и промежуточные расчёты
y |
x |
||||
19 22,4 24,4 25,5 27,6 28,1 |
1 2 3 4 5 6 |
0 0,69 1,10 1,39 1,61 1,79 |
0 0,48 1,21 1,93 2,59 3,20 |
0 16,15 27,94 36,84 46,05 52,09 |
|
147 |
21 |
6,58 |
9,41 |
179,07 |
1) Система уравнений имеет вид:
Подставляем значения и решаем систему
,
= 25,5 - 1,097a1
,
,
2,19= 179,07 - 167,79
2,19= 11,28
= 5,15
a0 = 25,5 - 1,097 11,28 = 19,85
Составляем модель:
у = 19,85 + 5,15
2) Находим индекс детерминации по формуле (3.5)
Таблица 3.4 - Расчет коэффициента детерминации
19,85 |
23,42 |
25.51 |
26,99 |
28,14 |
29,07 |
Сумма |
||
0,15 |
-0,02 |
0,11 |
-0,49 |
0,46 |
0,03 |
0,24 |
||
0,0225 |
0,0004 |
0,0121 |
0,2401 |
0,2116 |
0,0009 |
0,4876 |
||
30,25 |
4,41 |
0,01 |
1 |
9,61 |
12,96 |
58,24 |
R2 = 1 - = 0,99
Вариация результата у на 99 % объясняется вариацией фактора х.
3) Находим стандартную ошибку по формуле (3.3)
== 0,3576
4) Определим F - критерий Фишера
F = 4 = 396;
для =0,05, , .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
Задача 3.3 Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5
Таблица 3.5 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. Решение
1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК
Промежуточные расчеты представим в таблице 3.6
Таблица 3.6 - Промежуточные расчеты
Год |
t |
у |
t-tср |
ур |
еt |
||||||
1 |
1 |
7,5 |
-8 |
64 |
-1,95 |
15,6 |
7,698 |
-0,198 |
0,0392 |
2,65 |
|
2 |
2 |
7,5 |
-7 |
49 |
-1,95 |
13,65 |
7,917 |
-0,417 |
0,1739 |
5,56 |
|
3 |
3 |
8,0 |
-6 |
36 |
-1,45 |
8,7 |
8,136 |
-0,136 |
0,0185 |
1,7 |
|
4 |
4 |
8,4 |
-5 |
25 |
-1,05 |
5,25 |
8,355 |
0,045 |
0,00203 |
0,53571 |
|
5 |
5 |
8,6 |
-4 |
16 |
-0,85 |
3,4 |
8,574 |
0,026 |
0,00068 |
0,30233 |
|
6 |
6 |
8,4 |
-3 |
9 |
-1,05 |
3,15 |
8,793 |
-0,393 |
0,15445 |
4,67857 |
|
7 |
7 |
8,6 |
-2 |
4 |
-0,85 |
1,7 |
9,012 |
-0,412 |
0,16974 |
4,7907 |
|
8 |
8 |
9,7 |
-1 |
1 |
0,25 |
-0,25 |
9,231 |
0,469 |
0,21996 |
4,83505 |
|
9 |
9 |
10,2 |
0 |
0 |
0,75 |
0 |
9,45 |
0,75 |
0,5625 |
7,35294 |
|
10 |
10 |
10,3 |
1 |
1 |
0,85 |
0,85 |
9,669 |
0,631 |
0,39816 |
6,12621 |
|
11 |
11 |
10,2 |
2 |
4 |
0,75 |
1,5 |
9,888 |
0,312 |
0,09734 |
3,05882 |
|
12 |
12 |
10,1 |
3 |
9 |
0,65 |
1,95 |
10,107 |
-0,007 |
0,00005 |
0,06931 |
|
13 |
13 |
10,8 |
4 |
16 |
1,35 |
5,4 |
10,326 |
0,474 |
0,22468 |
4,38889 |
|
14 |
14 |
10,6 |
5 |
25 |
1,15 |
5,75 |
10,545 |
0,055 |
0,00303 |
0,51886 |
|
15 |
15 |
10,8 |
6 |
36 |
1,35 |
8,1 |
10,764 |
0,036 |
0,0013 |
0,33333 |
|
16 |
16 |
10,7 |
7 |
49 |
1,25 |
8,75 |
10,983 |
-0,283 |
0,08009 |
2,64486 |
|
17 |
17 |
10,2 |
8 |
64 |
0,75 |
6 |
11,202 |
-1,002 |
1,004 |
9,82352 |
|
Итого |
153 |
160,6 |
0 |
408 |
-0,05 |
89,5 |
160,65 |
-0,05 |
3,14961 |
59,3691 |
|
Ср. знач. |
9 |
9,45 |
a1 = = 0,219 a0 = 9,45 - 0,219 9 = 7,479
Линейная модель имеет вид yt = 7,479 + 0,219t.
2) Определим коэффициент детерминации.
Таблица 3.7 - Расчеты для коэффициента детерминации
t |
у |
ур |
еt |
еt2 |
|||
1 |
7,5 |
7,698 |
-0,198 |
0,0392 |
-1,95 |
3,8025 |
|
2 |
7,5 |
7,917 |
-0,417 |
0,1739 |
-1,95 |
3,8025 |
|
3 |
8,0 |
8,136 |
-0,136 |
0,0185 |
-1,45 |
2,1025 |
|
4 |
8,4 |
8,355 |
0,045 |
0,00203 |
-1,05 |
1,1025 |
|
5 |
8,6 |
8,574 |
0,026 |
0,00068 |
-0,85 |
0,7225 |
|
6 |
8,4 |
8,793 |
-0,393 |
0,15445 |
-1,05 |
1,1025 |
|
7 |
8,6 |
9,012 |
-0,412 |
0,16974 |
-0,85 |
0,7225 |
|
8 |
9,7 |
9,231 |
0,469 |
0,21996 |
0,25 |
0,0625 |
|
9 |
10,2 |
9,45 |
0,75 |
0,5625 |
0,75 |
0,5625 |
|
10 |
10,3 |
9,669 |
0,631 |
0,39816 |
0,85 |
0,7225 |
|
11 |
10,2 |
9,888 |
0,312 |
0,09734 |
0,75 |
0,5625 |
|
12 |
10,1 |
10,107 |
-0,007 |
0,00005 |
0,65 |
0,4225 |
|
13 |
10,8 |
10,326 |
0,474 |
0,22468 |
1,35 |
1,8225 |
|
14 |
10,6 |
10,545 |
0,055 |
0,00303 |
1,15 |
1,3225 |
|
15 |
10,8 |
10,764 |
0,036 |
0,0013 |
1,35 |
1,8225 |
|
16 |
10,7 |
10,983 |
-0,283 |
0,08009 |
1,25 |
1,5625 |
|
17 |
10,2 |
11,202 |
-1,002 |
1,004 |
0,75 |
0,5625 |
|
Итого |
160,6 |
160,65 |
-0,05 |
3,14961 |
-0,05 |
22,7825 |
|
Ср. знач. |
9,45 |
R2 = 1 - = 0,86
3) Определим стандартную ошибку по формуле (3.3)
== 0,4582
4) Определим F - критерий Фишера
для =0,05, ,
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5) Определим ошибку аппроксимации по формуле (3.2)
59,3691 = 3,5%
6) Осуществим прогноз на 2017
2017 г.: у18 = 7,479 + 0,219 18 = 11,4
Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 2.6. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.8 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение.
Построим линейную модель уt = а0 + аit, параметры которой оценим через систему
Все расчёты представим в таблице 3.9
Таблица 3.9 - промежуточные расчёты
Месяц |
t |
y |
t2 |
|||
1 |
1 |
59,6 |
1 |
59,6 |
58,075 |
|
2 |
2 |
58,5 |
4 |
117 |
58,15 |
|
3 |
3 |
58 |
9 |
174 |
58,225 |
|
4 |
4 |
56,4 |
16 |
225,6 |
58,3 |
|
5 |
5 |
57,0 |
25 |
285 |
58,375 |
|
6 |
6 |
57,9 |
36 |
347,4 |
58,45 |
|
7 |
7 |
59,7 |
49 |
417,9 |
58,525 |
|
8 |
8 |
59,6 |
64 |
476,8 |
58,6 |
|
Итого |
36 |
466,7 |
204 |
2103,3 |
466,7 |
|
Ср.знач. |
4,5 |
58,3375 |
25,5 |
262,9125 |
Значение х меняем на значение t и находим параметры а0 и а1.
,
,
,
,
,
,
,
,
Линейная модель будет выглядеть следующим образом:
уt = 58 + 0,075t
1) Определим коэффициент детерминации по формуле (3.5)
Таблица 3.10 - Расчет коэффициента детерминации
y |
||||||
59,6 |
58,075 |
1,525 |
2,325625 |
1,59 |
2,559 |
|
58,5 |
58,15 |
0,35 |
0,1225 |
0,03 |
0,59829 |
|
58 |
58,225 |
-0,225 |
0,050625 |
0,11 |
0,38793 |
|
56,4 |
58,3 |
-1,9 |
3,61 |
3,75 |
3.36879 |
|
57,0 |
58,375 |
-1,375 |
1,890625 |
1,79 |
2,41228 |
|
57,9 |
58,45 |
-0,55 |
0,3025 |
0,19 |
0,94991 |
|
59,7 |
58,525 |
1,175 |
1,380625 |
1,86 |
1,96817 |
|
59,6 |
58,6 |
1 |
1 |
1,59 |
1,67785 |
|
466,7 |
466,7 |
0 |
10,6825 |
10,91 |
13,92222 |
|
58,3375 |
R2 = 1 - = 0,02
2) Определим стандартную ошибку по формуле (3.3)
== 1,3343
3) Определим значимость модели с помощью F - критерия Фишера
для =0,05
Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.
4) Определим ошибку аппроксимации по формуле (3.2)
13,92222 = 1,7%
5) Осуществим прогноз цены одного доллара на декабрь 2017 года.
Декабрь: у12 = 58 + 0,075 12 = 58,9
Построим полулогарифмическую модель lnу = ао + а1t. Произведем замену У = . В результате получим линейное уравнение: У = ао + а1t.
Все расчёты представим в таблице 3.11
Таблица 3.11 - промежуточные расчёты
Месяц |
t |
y |
t2 |
У |
|||
1 |
1 |
59,6 |
1 |
4,09 |
4,09 |
58,07 |
|
2 |
2 |
58,5 |
4 |
4,07 |
8,14 |
58,15 |
|
3 |
3 |
58 |
9 |
4,06 |
12,18 |
58,22 |
|
4 |
4 |
56,4 |
16 |
4,03 |
16,12 |
58,3 |
|
5 |
5 |
57,0 |
25 |
4,04 |
20,2 |
58,38 |
|
6 |
6 |
57,9 |
36 |
4,06 |
24,36 |
58,45 |
|
7 |
7 |
59,7 |
49 |
4,09 |
28,63 |
58,53 |
|
8 |
8 |
59,6 |
64 |
4,09 |
32,72 |
58,6 |
|
Итого |
36 |
466,7 |
204 |
32,53 |
146,44 |
466,7 |
|
Ср.знач. |
4,5 |
58,3375 |
25,5 |
4,00625 |
18,305 |
,
,
,
,
,
,
,
,
Полулогарифмическая модель будет выглядеть следующим образом:
lnу = 4,0604 + 0,013t
1) Определим коэффициент детерминации по формуле (3.5)
Таблица 3.12 - Расчет коэффициента детерминации
y |
||||||
59,6 |
58,07 |
1,53 |
2,3409 |
1,59 |
2,5671 |
|
58,5 |
58,15 |
0,35 |
0,1225 |
0,03 |
0,5983 |
|
58 |
58,22 |
-0,22 |
0,0484 |
0,11 |
0,3793 |
|
56,4 |
58,3 |
-1,9 |
3,61 |
3,75 |
3,3688 |
|
57,0 |
58,38 |
-1,38 |
1,9044 |
1,79 |
2,42 |
|
57,9 |
58,45 |
-0,55 |
0,3025 |
0,19 |
0,9499 |
|
59,7 |
58,53 |
1,17 |
1,3689 |
1,86 |
1,9598 |
|
59,6 |
58,6 |
1 |
1 |
1,59 |
1,6778 |
|
466,7 |
466,7 |
0 |
10,6976 |
10,91 |
13,921 |
|
58,3375 |
R2 = 1 - = 0,02
2) Определим стандартную ошибку по формуле (3.3)
== 1,3353
3) Определим значимость модели с помощью F - критерия Фишера
для =0,05
Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.
4) Определим ошибку аппроксимации по формуле (3.2)
13,921 = 1,74%
5) Осуществим прогноз цены одного доллара на декабрь 2017 года.
Декабрь: у12 = = 58,9
Построим гиперболическую модель у = 1/(ао + а1t). Произведем замену У = . В результате получим линейное уравнение: У = ао + а1t.
Все расчёты представим в таблице 3.13
Таблица 3.13 - промежуточные расчёты
Месяц |
t |
y |
t2 |
У |
|||
1 |
1 |
59,6 |
1 |
0,0168 |
0,0168 |
58,04 |
|
2 |
2 |
58,5 |
4 |
0,0171 |
0,0342 |
58,13 |
|
3 |
3 |
58 |
9 |
0,0172 |
0,0516 |
58,21 |
|
4 |
4 |
56,4 |
16 |
0,0177 |
0,0708 |
58,3 |
|
5 |
5 |
57,0 |
25 |
0,0175 |
0,0875 |
58,38 |
|
6 |
6 |
57,9 |
36 |
0,0173 |
0,1038 |
58,47 |
|
7 |
7 |
59,7 |
49 |
0,0167 |
0,1169 |
58,55 |
|
8 |
8 |
59,6 |
64 |
0,0168 |
0,1344 |
58,64 |
|
Итого |
36 |
466,7 |
204 |
0,1371 |
0,616 |
466,72 |
|
Ср.знач. |
4,5 |
58,3375 |
25,5 |
0,01714 |
0,077 |
,
,
,
,
,
,
,
,
Гиперболическая модель будет выглядеть следующим образом:
у=
1) Определим коэффициент детерминации по формуле (3.5)
Таблица 3.14 - Расчет коэффициента детерминации
y |
||||||
59,6 |
58,04 |
1,56 |
2,4336 |
1,59 |
2,6175 |
|
58,5 |
58,13 |
0,37 |
0,1369 |
0,03 |
0,63248 |
|
58 |
58,21 |
-0,21 |
0,0441 |
0,11 |
0,36207 |
|
56,4 |
58,3 |
-1,9 |
3,61 |
3,75 |
3,3688 |
|
57,0 |
58,38 |
-1,38 |
1,9044 |
1,79 |
2,42105 |
|
57,9 |
58,47 |
-0,57 |
0,3249 |
0,19 |
0,9845 |
|
59,7 |
58,55 |
1,15 |
1,3225 |
1,86 |
1,9263 |
|
59,6 |
58,64 |
0,96 |
0,9216 |
1,59 |
1,6107 |
|
466,7 |
466,72 |
-0,02 |
10,698 |
10,91 |
13,354168 |
|
58,3375 |
R2 = 1 - = 0,02
2) Определим стандартную ошибку по формуле (3.3)
== 1,3353
3) Определим значимость модели с помощью F - критерия Фишера
для =0,05
Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не значима.
4) Определим ошибку аппроксимации по формуле (3.2)
13,354168 = 1,7%
5) Осуществим прогноз цены одного доллара на декабрь 2017 года.
Декабрь: у12 = = 59
Из 3 построенных моделей, судя по стандартной ошибке (наименьшей) лучшей из них является линейная модель: уt = 58 + 0,075t.
Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество.
Таблица 3.15 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
Испания |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
Решение.
1) Находим среднее значение иностранной валюты (у) и определяем по формуле (1.1). Исходные данные представлены в таблице 3.16
Таблица 3.16 - исходные данные
t |
1 |
2 |
3 |
4 |
5 |
6 |
|
у |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
= = 52,24.
2) Определяем структурные средние (моду и медиану).
Так как мода - это наиболее часто встречающееся значение признака в данной совокупности, то М0 = 79,7.
Чтобы определить медиану, нужно значения у проранжировать в порядке возрастания:
у 40,23;40,33;41,67;44,97;68,34;79,7.
Ранжированный ряд является чётным. Для нахождения медианы берём и складываем 2 значения, располагающиеся посередине и делим на 2, т.е. находим среднее значение.
Ме = =43,32
3) Находим показатели вариации: дисперсию, среднее квадратическое отклонение, коэффициент вариации. Дисперсию рассчитываем по формуле (1.5)
у2= = = 244.
Зная дисперсию, находим среднее квадратическое отклонение
у = = 15,62
Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)
V= 100% = 29,9%
4) Построим линейную модель yt = а0 + аit, параметры которой оценим МНК
Промежуточные расчеты представим в таблице 3.17
Таблица 3.17 - Промежуточные расчеты
Год |
t |
у |
t-tср |
ур |
еt |
||||||
1 |
1 |
40,33 |
-2,5 |
6,25 |
-12,21 |
30,525 |
31,955 |
8,375 |
70,141 |
20,766 |
|
2 |
2 |
41,67 |
-1,5 |
2,25 |
-10,87 |
16,305 |
40,069 |
1,601 |
2,563 |
3,842 |
|
3 |
3 |
40,23 |
-0,5 |
0,25 |
-12,01 |
6,005 |
48,183 |
-7,953 |
63,25 |
19,768 |
|
4 |
4 |
44,97 |
0,5 |
0,25 |
-7,27 |
-3,635 |
56,297 |
-11,327 |
128,3 |
25,188 |
|
5 |
5 |
68,34 |
1,5 |
2,25 |
16,1 |
24,15 |
64,411 |
3,929 |
15,347 |
5,749 |
|
6 |
6 |
79,70 |
2,5 |
6,25 |
27,46 |
68,65 |
72,525 |
7,175 |
51,48 |
9,002 |
|
Итого |
21 |
315,24 |
0 |
17,5 |
1,2 |
142 |
313,44 |
1,8 |
331,71 |
84,315 |
|
Ср. знач. |
3,5 |
52,24 |
a1 = = 8,114 a0 = 52,24 - 8,114 3,5 = 23,841
Линейная модель имеет вид yt = 23,841 + 8,114t.
Для оценки качества модели используем такие показатели, как коэффициент детерминации, стандартная ошибка, значимость модели с помощью расчётного и табличного значения критерия Фишера и ошибка аппроксимации.
5) Определим коэффициент детерминации по формуле (3.6)
Таблица 3.18 - Расчеты для коэффициента детерминации
t |
у |
ур |
еt |
еt2 |
|||
1 |
40,33 |
31,955 |
8,375 |
70,141 |
-12,21 |
149,0841 |
|
2 |
41,67 |
40,069 |
1,601 |
2,563 |
-10,87 |
118,1569 |
|
3 |
40,23 |
48,183 |
-7,953 |
63,25 |
-12,01 |
144,2401 |
|
4 |
44,97 |
56,297 |
-11,327 |
128,3 |
-7,27 |
52,8529 |
|
5 |
68,34 |
64,411 |
3,929 |
15,347 |
16,1 |
259,21 |
|
6 |
79,70 |
72,525 |
7,175 |
51,48 |
27,46 |
754,0516 |
|
Итого |
315,24 |
313,44 |
1,8 |
331,71 |
1,2 |
1477,5956 |
|
Ср. знач. |
52,24 |
R2 = 1 - = 0,78
6) Определим стандартную ошибку по формуле (3.3)
== 9,099
7) Определим значимость модели с помощью F - критерия Фишера
для =0,05
Вывод: расчётное значение критерия Фишера превышает табличное значение (F>Fтабл). Это свидетельствует о том, что модель имеет значимость.
8) Определим ошибку аппроксимации по формуле (3.2)
84,315 = 14%
Вывод: полученное значение не превышает 15%, что свидетельствует о хорошем качестве построенной модели.
Задача 3.6. По статистическим данным Росстата (таблица 3.7) выполнить комплексный статистический анализ инвестиций в основной капитал.
Таблица 3.19 - Инвестиции в основной капитал, млн. руб.
Номер студента |
Регионы |
2012 |
2013 |
2014 |
|
Приволжский федеральный округ |
2012877 |
2301298 |
2355973 |
||
1; 15 |
Республика Башкорто--стан |
233683 |
266396 |
285520 |
|
2; 16 |
Республика Маpий Эл |
31656 |
46178 |
48354 |
|
3; 17 |
Республика Моpдовия |
49825 |
53714 |
55292 |
|
4; 18 |
Республика Татарстан |
470751 |
525730 |
542781 |
|
5; 19 |
Удмуртская Республика |
64221 |
82678 |
89836 |
|
6; 20 |
Чувашская Республика |
65255 |
60122 |
56446 |
|
7; 21 |
Пермский край |
162241 |
219494 |
185649 |
|
8; 22 |
Киpовская область |
50545 |
58655 |
56294 |
|
9; 23 |
Нижегородская область |
257454 |
280884 |
286619 |
|
10; 24 |
Оренбургская область |
151250 |
152877 |
150208 |
|
11; 25 |
Пензенская область |
72343 |
82164 |
83690 |
|
12;26 |
Самарская область |
213022 |
269737 |
300311 |
|
13; 27 |
Саратовская область |
117646 |
125834 |
132804 |
|
14; 28 |
Ульяновская область |
72985 |
76835 |
82168 |
Таблица 3.20 - Инвестиции в основной капитал, млн. руб.
Регионы |
2012 |
2013 |
2014 |
|
Оренбургская область |
151250 |
152877 |
150208 |
Этапы:
- графическое представление информации и ее анализ;
- определение средних величин и показателей вариации;
- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;
- определение показателей динамики инвестиций и их анализ;
- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.
Решение
1) Рост благосостояния общества, а также развитие экономики основаны на высоком масштабе воспроизводства товаров и услуг. Не последнюю роль в этом процессе выполняют инвестиции. На данный момент капитальные вложения являются одним из основных направлений вложения инвестиций в нашей стране.
Построим графически динамику объёма инвестиций в основной капитал в Оренбургской области за 2012- 2014 гг.
Рисунок 1 - Динамика объёма инвестиций в основной капитал в Оренбургской области.
Из рисунка 1 видно, что с 2012 года наблюдается увеличение инвестиций, с 2013 года - снижение.
2) Находим среднее значение инвестиций в основной капитал (у) и определяем по формуле (1.1). Исходные данные представлены в таблице 3.21
Таблица 3.21 - исходные данные
t |
1 |
2 |
3 |
|
у |
151250 |
152877 |
150208 |
= = 151 445 млн.руб.
Находим показатели вариации: дисперсию, среднее квадратическое отклонение, коэффициент вариации. Дисперсию рассчитываем по формуле (1.5)
у2= = = 1 206 272,7.
Зная дисперсию, находим среднее квадратическое отклонение
у = = 1098,3 млн.руб.
Зная среднеквадратическое отклонение и среднее значение, находим коэффициент вариации по формуле (1.9)
V= 100% = 0,73%
3) Определим коэффициента корреляции между инвестициями (у) и числом предприятий (тыс.) (х). Расчёты коэффициента корреляции представлены в таблице 3.22
Таблица 3.22 - расчёты коэффициента корреляции
№ |
у |
х |
ху |
(x -)2 |
(у -)2 |
|
1 |
151 250 |
41,1 |
6 616 375 |
83 601 187 837,7 |
38 025 |
|
2 |
152 877 |
40,6 |
6 206 806 |
14 503 457 158,1 |
2 050 624 |
|
3 |
150 208 |
41 |
6 158 528 |
28 462 490 488,9 |
1 530 169 |
|
454 335 |
122,7 |
18 981 709 |
126 567 135 485 |
3 618 818 |
||
151 445 |
40,9 |
6 327 236,3 |
42 189 045 161,7 |
1 206 272,7 |
Определяем среднеквадратические отклонения х и у
ух = = 205 400
уу = = 1098,3
Находим коэффициент корреляции по формуле (2.1)
rxy = 0,0005
Находим расчётное значение коэффициента по формуле (2.2)
t = = = 0,0005
Далее определяем табличное значение коэффициента корреляции
t (0,05;3) = 3,18
Отсюда следует, что t t (0,05;6) .
Расчётное значение коэффициента не превышает табличное значение. Это значит, что полученный коэффициент не значим, образует очень слабую связь между двумя показателями.
4) Проанализируем данные показатели, и приведем в таблице 3.23 -- 3.24
Таблица 3.23 -- Анализ показателей Приволжского федерального округа
Год |
Приволжский федеральный округ (инвестиции млн.руб.) |
Абсолютный прирост, млн. руб. |
Темп роста % |
Темп прироста % |
||||
Цепной |
Базисный |
Цепной |
Базисный |
Цепной |
Базисный |
|||
2012 |
2012877 |
- |
- |
- |
- |
- |
- |
|
2013 |
2301298 |
288421 |
288421 |
114,33% |
114,33% |
14,33% |
14,33% |
|
2014 |
2355973 |
54675 |
343096 |
102,38% |
117,05% |
2,38% |
17,05% |
В 2013 году по сравнению с 2012 наблюдается прирост в 14,33% . Общий прирост за 2012 -2014 гг. составил 17,05%. За базисный год брался 2012. Из данной таблицы можно сделать вывод, что прирост снизился.
Далее проанализируем инвестиции в Оренбургской области.
Таблица 3.24 - Анализ инвестиций в Оренбургской области
Год |
Оренбургская область (инвестиции млн.руб.) |
Абсолютный прирост, млн. руб. |
Темп роста % |
Темп прироста % |
||||
Цепной |
Базисный |
Цепной |
Базисный |
Цепной |
Базисный |
|||
2012 |
151 250 |
- |
- |
- |
- |
- |
- |
|
2013 |
152 877 |
+ 1627 |
+ 1627 |
101,07 |
101,07 |
+ 1,07 |
+ 1,07 |
|
2014 |
150 208 |
- 2669 |
- 1042 |
98,25 |
99,31 |
- 1,75 |
- 0,69 |
Исходя из таблицы 3.11 можно сделать вывод, что темп прироста инвестиций в данном регионе в 2013 году по сравнению с 2012 увеличился и составил 1,07%, a в 2014 году по сравнению с 2013 уменьшился на 1,75%.
Таблица 3.25 - дополнительные расчеты для построения модели.
t |
y |
t-t? |
y-y? |
(y-y?)І |
(y-y?)*(t-t?) |
(t-t?)І |
|
1 |
151 250 |
-1 |
-195 |
38 025 |
195 |
1 |
|
2 |
152 877 |
0 |
1432 |
2 050 624 |
0 |
0 |
|
3 |
150 208 |
1 |
-1237 |
1 530 169 |
-1237 |
1 |
|
? 6 |
454 335 |
0 |
0 |
3 618 818 |
-1042 |
2 |
|
|
151 445 |
5) Построим регрессионную модель связи инвестиций со временем (годами) и проведем ее статистический анализ.
Рассчитаем коэффициенты уравнения регрессии:
a1 = = -521 a0 = 151 445- 2 (- 521) = 152 847
Тогда линейная модель имеет вид
уt = 152 847 - 521t
Определим коэффициент детерминации по формуле (3.5)
Таблица 3.26 - Расчет коэффициента детерминации
у |
||||||
151 250 |
152 326 |
- 1076 |
1 157 776 |
38 025 |
0,7114 |
|
152 877 |
151 805 |
1072 |
1 149 184 |
2 050 624 |
0,7012 |
|
150 208 |
151 284 |
- 1076 |
1 157 776 |
1 530 169 |
0,7163 |
|
? 454 335 |
455 415 |
- 1080 |
3 462 736 |
3 618 818 |
2,1289 |
R2 = 1 - = 0,04
Определим стандартную ошибку по формуле (3.3)
Sy == 1 860,84
Определим значимость модели с помощью F - критерия Фишера
для =0,05
Вывод: расчётное значение критерия Фишера не превышает табличное значение (F<Fтабл). Это свидетельствует о том, что модель не имеет значимости.
Определим ошибку аппроксимации по формуле (3.2)
2,1289 = 0,71%
Вывод: полученное значение не превышает 15%, что свидетельствует о хорошем качестве построенной модели.
Заключение
В заключении, можно сказать, что в ходе курсовой работы были закреплены знания, приобретённые в процессе изучения дисциплины «общая теория статистики» а именно:
- рассмотрены средние величины и показатели вариации;
- рассмотрены корреляционный анализ и регрессионный анализ.
Также на основе этих знаний были решены задачи и для каждой задачи сделаны выводы. Благодаря знаниям мы научились устанавливать связи в корреляционном анализе между двумя взаимосвязанными показателями, в регрессионном анализе - оценивать качество модели.
Статистка отражает количественные характеристики общественных явлений, событий. Числовые характеристики выступают в виде первичных (например, конкретные данные об организации или физическом лице) и сводных статистических показателей (информация об экономическом, демографическом, социальном положении в РФ), которые отражают реальные процессы в жизни общества.
Список использованных источников
1. Васильева Э.К, Лялин В.С. Статистика: учебник для вузов. - М.: ЮНИТИ-ДИНА, 2014 - 309 с.
2. Конденкова М. А. Инновационная экономика. -- Казань: Бук, 2017 - 98 с.
3. Статистика: учебник для вузов / под редакцией В.С. Мхитаряна - М.: Издательский центр «Академия», 2014 - 304 с.
Размещено на Allbest.ru
Подобные документы
Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.
контрольная работа [59,3 K], добавлен 26.06.2009Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.
контрольная работа [438,8 K], добавлен 06.11.2010Понятие и сущность типологической группировки. Расчет динамики и структуры изменения объема продукции в квартальном разрезе и в целом за год. Вычисление показателей вариации, дисперсии, среднего квадратичного отклонения. Определение моды и медианы.
контрольная работа [135,8 K], добавлен 24.09.2012Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Расчет средних уровней производительности труда и показателей вариации. Понятие моды и медианы признака, построение полигона и оценка характера асимметрии. Методика выравнивания ряда динамики по прямой линии. Индивидуальные и агрегатные индексы объема.
контрольная работа [682,4 K], добавлен 24.09.2012Вычисление средней арифметической заработных плат, моды и медианы, размаха вариации, дисперсии и среднего квадратичного отклонения. Статистический анализ товарооборота, его динамики и показателей. Оценка стоимости продукции, средней цены, удельного веса.
контрольная работа [152,5 K], добавлен 08.01.2013Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.
курсовая работа [218,5 K], добавлен 27.02.2011Распределение клиентов, воспользовавшихся услугами данной туристской фирмы в течение летнего сезона, по возрастному составу. Определение однородности представленного признака путем расчета коэффициента вариации. Расчет моды, медианы, линейного отклонения.
контрольная работа [164,9 K], добавлен 31.03.2016Группировка указанных данных с равными интервалами. Вычисление среднего арифметического, дисперсии и среднего квадратичного отклонения. Расчет коэффициентов вариации. Определение базисных показателей динамики. Построение столбиковых и круговых диаграмм.
контрольная работа [281,7 K], добавлен 24.09.2012Возрастание объемов продаж. Определение среднего, медианы и моды. Распределение цен на акции фармацевтической компании. Определение межквартильного размаха, среднего квадратичного отклонения, коэффициента вариации, дисперсии, показателя асимметрии.
курсовая работа [28,3 K], добавлен 03.12.2010