Общая теория статистики
Рассмотрение теоретического обоснования сущности, общих понятий и методов расчета средних величин. Характеристика системы показателей и информационной базы корреляционно-регрессионного анализа. Определение средних величин и показателей вариации.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 535,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Кафедра «Экономика и финансы»
Курсовая работа
по дисциплине «Общая теория статистики»
Направление подготовки -38.03.01 Экономика
Профиль подготовки - Мировая экономика
Выполнила студентка: Зябирова Д.И.
Группа:16ээ2
Руководитель: Деркаченко В.Н.
к.т.н., доцент
2017
Содержание
Введение
1. Средние величины и показатели вариации
2. Корреляционный анализ
3. Регрессионный анализ
Заключение
Список использованных источников
Введение
С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления.
Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития. Данные, упитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.
Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов- от численности взрослого мужского населения, доходов казны- от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.
С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.
Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика.
Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.
Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.
Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:
1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;
2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;
3. Выполнение расчетов.
корреляционный регрессионный вариация информационный
1. Средние величины и показатели вариации
Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
Существует 2 класса средних величин: степенные и структурные.
К структурным средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.
Степенные средние могут быть простыми и взвешенными.
Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:
где X - значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин:
Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.
Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.
Если X задан равными интервалами, то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:
где Мо - мода;
ХНМо - нижняя граница модального интервала;
hМо - размах модального интервала (разность между его верхней и нижней границей);
fМо - частота модального интервала;
fМо-1 - частота интервала, предшествующего модальному;
fМо+1 - частота интервала, следующего за модальным.
Статистическая медиана - это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.
Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).
Если X задан в виде равных интервалов, то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:
где Ме - медиана;
ХНМе - нижняя граница медианного интервала;
hМе - размах медианного интервала (разность между его верхней и нижней границей);
fМе - частота медианного интервала;
fМе-1 - сумма частот интервалов, предшествующих медианному.
Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации.
Линейный коэффициент вариации - это отношение среднего линейного отклонение к средней арифметической:
С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.
Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую:
Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперсию взвешенную:
Если значения X - это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:
.
Выше уже было рассказано о формуле средней квадратической, которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:
Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:
Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:
Задание 1.1
По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение было увеличено на номер классного журнала (7). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Дано (х): 10; 12; 9; 11; 14; 10; 15; 10; 17;
Определим среднее значение:
Моду: - наиболее часто встречающееся значение ряда.
Медиана. Для ее расчета расположим ряд в порядке возрастания:
9, 10, 10, 10, 11, 12, 14, 15, 17.
Количество элементов 9, нечетное количество, медианой будет являться число 11, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.
Вычислим дисперсию:
=6,7
Вычислим среднеквадратическое отклонение:
И коэффициент вариации составит:
Задание 1.2
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 28%, стоимость основных фондов увеличилась на 17%. Определить изменение фондоотдачи.
Фондоотдача - это финансовый коэффициент, характеризующий эффективность использования основных средств организации. Фондоотдача показывает, сколько выручки приходится на единицу стоимости основных средств.
, соответственно изменение фондоотдачи:
= 9,4%
Таким образом, фондоотдача увеличилась на 9,4%
Задание 1.3
Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Определим среднее значение моду и медиану. Промежуточные вычисления приведены в таблице 2
Таблица 2 - Промежуточные вычисления
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
|
У? |
90 |
110 |
130 |
150 |
170 |
190 |
|
m*У? |
540 |
1870 |
3250 |
4200 |
2380 |
1900 |
|
У?/2 |
45 |
55 |
65 |
75 |
85 |
95 |
|
Накопл. частота |
6 |
23 |
48 |
76 |
90 |
100 |
Общее число работников составляет человек
Среднее значение x?=
Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение . (76>50). Вычислим моду:
Вычислим медиану:
Задание 1.4
По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 3). Каждое значение Хi было увеличено на номер классного журнала (7).
Таблица 3 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
8,0-8,2 |
3 |
3 |
||
8,2-8,4 |
4 |
4 |
||
8,4-8,6 |
17 |
17 |
||
8,6-8,8 |
11 |
15 |
26 |
|
8,8-9,0 |
13 |
6 |
19 |
|
9,0-9,2 |
18 |
5 |
23 |
|
9,2-9,4 |
6 |
6 |
||
9,4-9,6 |
2 |
2 |
||
50 |
50 |
100 |
Для удобства расчета составим таблицу 4, в которой будут отражены промежуточные вычисления по нахождению общей дисперсии.
Таблица 4 - Расчет общей дисперсии
Число предприятий |
Расчет дисперсии |
|||||||
Хi (млн. руб) |
mгi |
mчi |
moi |
Хср.i |
Хср.i*moi |
(Хср.i-X?o)^2 |
(Хср.i-X?o)І*moi |
|
8,0-8,2 |
3 |
3 |
8,1 |
24,3 |
0,509796 |
1,529388 |
||
8,2-8,4 |
4 |
4 |
8,3 |
33,2 |
0,264196 |
1,056784 |
||
8,4-8,6 |
17 |
17 |
8,5 |
144,5 |
0,098596 |
1,676132 |
||
8,6-8,8 |
11 |
15 |
26 |
8,7 |
226,2 |
0,012996 |
0,337896 |
|
8,8-9,0 |
13 |
6 |
19 |
8,9 |
169,1 |
0,007396 |
0,140524 |
|
9,0-9,2 |
18 |
5 |
23 |
9,1 |
209,3 |
0,081796 |
1,881308 |
|
9,2-9,4 |
6 |
6 |
9,3 |
55,8 |
0,236196 |
1,417176 |
||
9,4-9,6 |
2 |
2 |
9,5 |
19 |
0,470596 |
0,941192 |
||
У |
50 |
50 |
100 |
881,4 |
8,9804 |
Общее среднее: млн. руб.
Общая дисперсия: у2о= млн.руб. (89804 руб.)
Далее рассчитаем дисперсию по группам: для государственных и частных предприятий.
Таблица 5 - Расчет дисперсии (гос. предприятия)
Хi (млн. руб) |
mгi |
Хср.i |
Хср.i*mгi |
(Хср.i-X?г)І |
(Хср.i-X?г)І*mгi |
|
8,6-8,8 |
11 |
8,7 |
95,7 |
0,09 |
0,99 |
|
8,8-9,0 |
13 |
8,9 |
115,7 |
0,01 |
0,13 |
|
9,0-9,2 |
18 |
9,1 |
163,8 |
0,01 |
0,18 |
|
9,2-9,4 |
6 |
9,3 |
55,8 |
0,09 |
0,54 |
|
9,4-9,6 |
2 |
9,5 |
19 |
0,25 |
0,5 |
|
У |
50 |
450 |
2,34 |
Среднее значение : млн. руб.
Дисперсия: у2г= млн.руб. (46800 руб.)
Таблица 6 - Расчет дисперсии (частные предприятия)
Хi (млн. руб) |
mчi |
Хср.i |
Хср.i*mчi |
(Хср.i-X?ч)І |
(Хср.i-X?ч)І*mчi |
|
8,0-8,2 |
3 |
8,1 |
24,3 |
0,278784 |
0,836352 |
|
8,2-8,4 |
4 |
8,3 |
33,2 |
0,107584 |
0,430336 |
|
8,4-8,6 |
17 |
8,5 |
144,5 |
0,016384 |
0,278528 |
|
8,6-8,8 |
15 |
8,7 |
130,5 |
0,005184 |
0,07776 |
|
8,8-9,0 |
6 |
8,9 |
53,4 |
0,073984 |
0,443904 |
|
9,0-9,2 |
5 |
9,1 |
45,5 |
0,222784 |
1,11392 |
|
У |
50 |
431,4 |
3,1808 |
Среднее значение : млн. руб.
Дисперсия: у2ч= млн.руб. (63616 руб.)
Средняя внутригрупповая дисперсия:
у?в=
Общая дисперсия равна сумме межгрупповой и среднегрупповой дисперсий, следовательно межгрупповая дисперсия будет равна:
уІмг= уІо - у?в= 89804 - 55208 = 34596 руб.
Вычислим коэффициент детерминации:
Таким образом, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.
Задание 1.5
Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 7 - Исходные данные
1 - группа |
||||
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
|
2 - группа |
||||
Хi |
1 |
6 |
||
mi |
10 |
15 |
||
3 - группа |
||||
Хi |
3 |
8 |
||
mi |
20 |
5 |
Для удобства расчета общей дисперсии составим таблицу 8, в которой будут представлены вычисления.
Таблица 8 - Вычисление общей дисперсии.
Xi |
mi |
Расчет дисперсии |
||||||
1 |
2 |
3 |
moi |
Х*moi |
(Х-Х?o)І |
(Х-Х?o)І*moi |
||
1 |
30 |
10 |
40 |
40 |
4 |
160 |
||
2 |
15 |
15 |
30 |
1 |
15 |
|||
3 |
20 |
20 |
60 |
0 |
0 |
|||
6 |
15 |
15 |
90 |
9 |
135 |
|||
8 |
5 |
5 |
10 |
80 |
25 |
250 |
||
Сумма |
100 |
300 |
560 |
Среднее общее значение : х?о=
Общая дисперсия:
Далее определим дисперсию для каждой группы в отдельности :
Таблица 9 - Вычисление дисперсии для 1 группы
Xi |
m1i |
X*m1i |
(Х-Х?1)І |
(Х-Х?1)І*m1i |
|
1 |
30 |
30 |
1 |
30 |
|
2 |
15 |
30 |
0 |
0 |
|
8 |
5 |
40 |
36 |
180 |
Среднее значение : X?1=
Дисперсия: уІ1=
Таблица 10 - Вычисление дисперсии для 2 группы
Xi |
m2i |
X*m2i |
(Х-Х?2)І |
(Х-Х?2)І*m2i |
|
1 |
10 |
10 |
9 |
90 |
|
6 |
15 |
90 |
4 |
60 |
Среднее значение : X?2=
Дисперсия: уІ2=
Таблица 11 - Вычисление дисперсии для 3 группы
Xi |
m3i |
X*m3i |
(Х-Х?3)І |
(Х-Х?3)І*m3i |
|
3 |
20 |
60 |
1 |
20 |
|
8 |
5 |
40 |
16 |
80 |
Среднее значение : X?3=
Дисперсия: уІ3=
Вычислим среднюю внутригрупповую дисперсию: у?Ів=
И межгрупповую: уІмг=уІо-у?Ів= 5,6 - 4,73 = 0,87
2. Корреляционный анализ
Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y.
Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:
1. Вычисление выборочных коэффициентов корреляции.
2.Составление корреляционной таблицы.
3. Проверка статистической гипотезы значимости связи.
Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и ц(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.
Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.
Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой:
где уX и уY выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:
Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r: r=rB (9)
Принимая во внимание формулы:
видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:
где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:
Основные свойства выборочного коэффициента линейной корреляции:
1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.
2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.
3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству 0<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. Чем ближе |r| к 1, тем теснее прямолинейная корреляция между величинами Y, X.
По своему характеру корреляционная связь может быть прямой и обратной, а по силе - сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.
Таблица 12 - Сила и характер связи между параметрами
Сила связи |
Характер связи |
||
Прямая (+) |
Обратная (-) |
||
Полная |
1 |
-1 |
|
Сильная |
От 0,7 до 1 |
От -0,7 до -1 |
|
Средняя |
От 0,3 до 0,7 |
От -0,3 до -0,7 |
|
Слабая |
От 0,3 до 0 |
От -0,3 до 0 |
|
Связь отсутсвует |
0 |
0 |
Задание 2.1
Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ:28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Определим У, увеличим Х и У на номер журнала.
Таблица 13 - Результаты вычислений
У |
15,1 |
16,4 |
18,3 |
13,9 |
16,7 |
|
Х |
10,5 |
11,6 |
12,8 |
11,2 |
12,2 |
|
ХУ |
158,55 |
190,24 |
234,24 |
155,68 |
203,74 |
|
(Хi-Х?)І |
1,3456 |
0,0036 |
1,2996 |
0,2116 |
0,2916 |
|
(Уi-У?)І |
0,9604 |
0,1024 |
4,9284 |
4,7524 |
0,3844 |
Вычислим средние значения:
- для Х : X?=
- для У: У?=
- для ХУ:
Определим дисперсии.
уІХ =
уІУ=
Вычислим коэффициент корреляции: rxy =
Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче: f= 5-2 =3.
Расчетное значение критерия Стьюдента:
Табличное значение критерия Стьюдента:
Таким образом, табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а следовательно коэффициент корреляции не значим.
Задание 2.2
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 18 22 13 20 15 14
у 17 20 11 18 14 10
Это нулевой вариант. Каждое значение х и у было увеличено на свой номер классного журнала (4).
Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 14
Таблица 14 - Результаты промежуточных вычислений.
Сумма |
||||||||
Х |
25 |
29 |
20 |
27 |
22 |
21 |
144 |
|
У |
24 |
27 |
18 |
25 |
21 |
17 |
132 |
|
ХУ |
600 |
783 |
360 |
675 |
462 |
357 |
3237 |
|
(Хi-Х?)І |
1 |
25 |
16 |
9 |
4 |
9 |
64 |
|
(Уi-У?)І |
4 |
25 |
16 |
9 |
1 |
25 |
80 |
Вычислим средние значения:
- для Х : X?=
- для У: У?=
- для ХУ:
Определим дисперсии.
уІХ =
уІУ=
Коэффициент корреляции: rxy =
Определим расчетное значение критерия Стьюдента. В данной задаче значение степени свободы: f= 6-2 =4.
Расчетное значение критерия Стьюдента:
Табличное значение критерия Стьюдента: :
Таким образом, табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а следовательно коэффициент корреляции значим
Задание 2.3
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.
Результаты:
1.Коэффициент ранговой корреляции.
2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение:
Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. Все эти вычисления представлены в таблице 15 (все значения баллов были увеличены на номер классного журнала - 7).
Таблица 15 - Расчет коэффициента ранговой корреляции Спирмена.
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Теория вероятностей |
72 |
97 |
49 |
54 |
91 |
65 |
57 |
|
Статистика |
58 |
92 |
43 |
70 |
79 |
87 |
47 |
|
Ранг (Rтв) |
5 |
7 |
1 |
2 |
6 |
4 |
3 |
|
Ранг (Rст) |
3 |
7 |
1 |
4 |
5 |
6 |
2 |
|
dІ |
4 |
0 |
0 |
4 |
1 |
4 |
1 |
Значение степени свободы составляет f = 7 - 2 =5
Количество ранжируемых элементов: n = 7
Коэффициент корреляции Спирмена:
Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости б=0,05, оно равно . Таким образом, расчетное значение критерия корреляции Спирмена меньше критического значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент корреляции не значим.
Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 16
Таблица 16 - Расчет коэффициента корреляции Стьюдента.
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Сумма |
|
Теория вероятностей (x) |
72 |
97 |
49 |
54 |
91 |
65 |
57 |
485 |
|
Статистика (y) |
58 |
92 |
43 |
70 |
79 |
87 |
47 |
476 |
|
хi-x? |
2,71 |
27,72 |
-20,28 |
-15,28 |
21,72 |
-4,28 |
-12,28 |
||
yi-y? |
-10,00 |
24,00 |
-25,00 |
2,00 |
11,00 |
19,00 |
-21,00 |
||
(хi-x?)(yi-y?) |
-27,1 |
665,28 |
507 |
-30,56 |
238,92 |
-81,32 |
257,88 |
1530,1 |
|
(хi-x?)І |
7,36735 |
768,082 |
411,51 |
233,653 |
471,51 |
18,3673 |
150,939 |
2061,43 |
|
(yi-yЇ)І |
100 |
576 |
625 |
4 |
121 |
361 |
441 |
2228 |
Среднее значение баллов по теории вероятности: х? =
Определим корреляционный момент: Кху =
Вычислим дисперсии:
уІх =
уІy =
Коэффициент корреляции:
Определим расчетное значение критерия Стьюдента: , соответственно табличное значение критерия
Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.
3. Регрессионный анализ
Регрессионный анализ - метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной.
Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для изучения по выборочным данным статистической зависимости ряда величин; некоторые из которых являются случайными. При статистической зависимости величины не связаны функционально, но как случайные величины заданы совместным распределением вероятностей.
Исследование зависимости случайных величин приводит к моделям регрессии и регрессионному анализу на базе выборочных данных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.
Числовые данные обычно имеют между собой явные (известные) или неявные (скрытые) связи.
Явно связаны показатели, которые получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, проценты выполнения плана, уровни, удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпы прироста, индексы и т. д.
Связи же второго типа (неявные) заранее неизвестны. Однако необходимо уметь объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.
Математические модели строятся и используются для трех обобщенных целей:
* для объяснения;
* для предсказания;
* для управления.
Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели.
Постановка задачи регрессионного анализа формулируется следующим образом.
Имеется совокупность результатов наблюдений. В этой совокупности один столбец соответствует показателю, для которого необходимо установить функциональную зависимость с параметрами объекта и среды, представленными остальными столбцами. Требуется: установить количественную взаимосвязь между показателем и факторами. В таком случае задача регрессионного анализа понимается как задача выявления такой функциональной зависимости y = f (x2, x3, …, xт), которая наилучшим образом описывает имеющиеся экспериментальные данные.
Допущения:
- количество наблюдений достаточно для проявления статистических закономерностей относительно факторов и их взаимосвязей;
- обрабатываемые данные содержат некоторые ошибки (помехи), обусловленные погрешностями измерений, воздействием неучтенных случайных факторов;
- матрица результатов наблюдений является единственной информацией об изучаемом объекте, имеющейся в распоряжении перед началом исследования.
Функция f (x2, x3, …, xт), описывающая зависимость показателя от параметров, называется уравнением (функцией) регрессии. Термин «регрессия» (regression (лат.) - отступление, возврат к чему-либо) связан со спецификой одной из конкретных задач, решенных на стадии становления метода.
Решение задачи регрессионного анализа целесообразно разбить на несколько этапов:
- предварительная обработка данных;
- выбор вида уравнений регрессии;
- вычисление коэффициентов уравнения регрессии;
- проверка адекватности построенной функции результатам наблюдений.
Задание 3.1
Требуется построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Исходные данные:
у: 28; 23; 22; 21; 20; 19,5; 18; 18,5; 17; 15
х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10
Характеристики модели:
1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение:
1) Уравнение обратной функции: .
Произведем замену . В результате получим линейное уравнение .
Для определения обратной модели связи составим таблицу, предварительно увеличив значения у на номер своего классного журнала (5)
Таблица - 17
№ |
y |
x |
X |
y*X |
X^2 |
y^2 |
x^2 |
x*y |
|
1 |
28 |
1 |
1 |
28 |
1 |
784 |
1 |
28 |
|
2 |
23 |
2 |
0,5 |
11,5 |
0,25 |
529 |
4 |
46 |
|
3 |
22 |
3 |
0,333 |
7,326 |
0,11 |
484 |
9 |
66 |
|
4 |
21 |
4 |
0,25 |
5,25 |
0,0625 |
441 |
16 |
64 |
|
5 |
20 |
5 |
0,2 |
4 |
0,04 |
400 |
25 |
100 |
|
6 |
19,5 |
6 |
0,167 |
3,25 |
0,027889 |
380,25 |
36 |
117 |
|
7 |
18 |
7 |
0,143 |
2,574 |
0,020449 |
324 |
49 |
126 |
|
8 |
18,5 |
8 |
0,125 |
2,313 |
0,015625 |
342,25 |
64 |
148 |
|
9 |
17 |
9 |
0,111 |
1,887 |
0,012321 |
289 |
81 |
153 |
|
10 |
15 |
10 |
0,1 |
1,5 |
0,01 |
225 |
100 |
150 |
|
Итого |
202 |
55 |
2,929 |
67,6 |
1,908784 |
4198,5 |
385 |
1018 |
|
Ср.знач. |
20,2 |
5,5 |
0,293 |
6,76 |
0,1908784 |
Далее строим систему:
10a + 55*b = 202
55*a + 385*b = 1018
Получаем эмпирические коэффициенты регрессии: b = -1.1273, a = 26.4
Уравнение регрессии (эмпирическое уравнение регрессии):
y = -1.1273 x + 26.4
2) Определим индекс детерминации - это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными.
Расчеты приведены в таблице 18
Таблица 18 - Расчет коэффициента детерминации
№ п/п |
||||||
1 |
28 |
1 |
25,87543 |
60,84 |
7,438 |
|
2 |
23 |
2 |
21,86228 |
7,84 |
1,312 |
|
3 |
22 |
3 |
20,52456 |
3,24 |
1,037 |
|
4 |
21 |
4 |
19,85570 |
0,64 |
0,794 |
|
5 |
20 |
5 |
19,45438 |
0,04 |
0,583 |
|
6 |
19,5 |
6 |
19,18684 |
0,49 |
0,0186 |
|
7 |
18 |
7 |
18,99573 |
4,84 |
0, 259 |
|
8 |
18,5 |
8 |
18,85241 |
2,89 |
1,25 |
|
9 |
17 |
9 |
18,74093 |
10,24 |
0,556 |
|
10 |
15 |
10 |
18,65175 |
27,04 |
0,0162 |
|
итого |
202 |
55 |
202 |
118,1 |
13,264 |
|
Ср. знач. |
20,2 |
5,5 |
.
Т.е. в 88.77% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 11.23% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
3) Определим стандартную ошибку модели
.
4) Определим F - критерий Фишера
;
для =0,05, , .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5). Далее определяем доверительные интервалы.
b - tкрит* Sb <b<b + tкрит *Sb
(-1.13 - 2.306*0.142; -1.13 + 2.306*0.142)
(-1.454;-0.8)
a - tкрит *Sa<a< a + tкрит *Sa
(26.4 - 2.306*0.88; 26.4 + 2.306*0.88)
(24.372;28.428)
Где Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
tкрит (n-m-1;б/2) = (8;0.025) = 2.306
В результате получаем:
24.372<a< 28.428
-1.454<b<-0.8
Задание 3.2
Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
у 10; 13,4; 15,4; 16,5; 18,6; 19,1
х 1; 2; 3; 4; 5; 6.
Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Характеристики модели: 1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение:
Таблица 19 - Исходные данные
y, % |
x, тыс.дол. |
||||
17 20,4 22,4 23,5 25,6 26,1 |
1 2 3 4 5 6 |
0 0,69 1,10 1,39 1,61 1,79 |
0 0,48 1,21 1,93 2,59 3,20 |
0 14,076 24,46 32,665 41,216 46,719 |
|
135 |
21 |
6,58 |
9,41 |
159,136 |
а) составляем систему уравнений
6a0+6,58a1=135
6,58a0+9,41a1=159,136
б) решаем систему и составляем модель
a0=16,95
a1=5,05
y=16,95+5,05lnx
Определим индекс детерминации
Расчеты приведены в таблице 20.
Таблица 20 - Расчет коэффициента детерминации
№ п/п |
||||||
1 |
17 |
1 |
16,8635 |
30,25 |
0,0186 |
|
2 |
20,4 |
2 |
20,4099 |
4,41 |
0,0001 |
|
3 |
22,4 |
3 |
22,5171 |
0,01 |
0,0137 |
|
4 |
23.5 |
4 |
24,0076 |
1 |
0,2577 |
|
5 |
25.6 |
5 |
25,1383 |
9,61 |
0,2131 |
|
6 |
26,1 |
6 |
26,0635 |
12,96 |
0,0013 |
|
итого |
135 |
21 |
135 |
58,24 |
0,5046 |
|
Ср. знач. |
22,5 |
3,5 |
.
Вариация результата у (себестоимость единицы продукции) на 99% объясняется вариацией фактора х (стоимостью основных фондов).
3) Определим стандартную ошибку модели
.
4) Определим F - критерий Фишера
;
для =0,05, , .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
Задание 3.3
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 21.
Таблица 21 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…
Решение:
1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК
Промежуточные расчеты представлены в таблице 22
Таблица 22
.
; .
Линейная модель имеет вид .
2) Определим коэффициент детерминации
Расчеты для коэффициента детерминации представлены в таблице 22.
3) Определим стандартную ошибку модели по формуле
.
4) Определим F - критерий Фишера
для =0,05, ,
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5)Определим .
6) Осуществим прогноз на 2017 г.
2017 г.: ;
Задание 3.4
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 23 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение:
Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +
Таблица 24 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|(yi- )/yi| |
||||
1 |
59,6 |
59,6 |
1 |
58,075 |
0,02559 |
2,32563 |
0,06891 |
|
2 |
58,5 |
117 |
4 |
58,15 |
0,00598 |
0,1225 |
0,03516 |
|
3 |
58 |
174 |
9 |
58,225 |
0,00388 |
0,05063 |
0,01266 |
|
4 |
56,4 |
225,6 |
16 |
58,3 |
0,03369 |
3,61 |
0,00141 |
|
5 |
57 |
285 |
25 |
58,375 |
0,02412 |
1,89063 |
0,00141 |
|
6 |
57,9 |
347,4 |
36 |
58,45 |
0,0095 |
0,3025 |
0,01266 |
|
7 |
59,7 |
417,9 |
49 |
58,525 |
0,01968 |
1,38063 |
0,03516 |
|
8 |
59,6 |
476,8 |
64 |
58,6 |
0,01678 |
1 |
0,06891 |
|
36 |
466,7 |
2103,3 |
204 |
466,7 |
0,1392 |
10,6825 |
0,2363 |
=58, =0,075.
Уравнение тренда (регрессии) будет иметь вид:
0,075t+58
коэффициент детерминации вычисляется по формуле
0,2363/(0,2363+10,6825)= 0,0216
Построенное уравнение на 2,16% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (0,2363/1)/( 10,6825/6)= 0,13
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=10,6825/6=1,7804-
остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.
|(yi- yi)/yi|
0,1392/8=1,74% -находится в допустимых пределах.
Построим нелинейную регрессионную модель вида: lnу = ао + а1t. Это показательная модель.
Найдем оценки коэффициентов показательной модели
,
Тогда линеаризованная модель имеет вид:
.
0,0013
4,0603
Таблица 25 - Оценка коэффициентов показательной модели
t |
y |
t2 |
t |
|(yi- )/yi| |
|||
1 |
59,6 |
1 |
4,0877 |
4,0877 |
58,068 |
0,0257 |
|
2 |
58,5 |
4 |
4,069 |
8,1381 |
58,144 |
0,0061 |
|
3 |
58 |
9 |
4,0604 |
12,181 |
58,219 |
0,0038 |
|
4 |
56,4 |
16 |
4,0325 |
16,13 |
58,295 |
0,0336 |
|
5 |
57 |
25 |
4,0431 |
20,215 |
58,371 |
0,0241 |
|
6 |
57,9 |
36 |
4,0587 |
24,352 |
58,447 |
0,0094 |
|
7 |
59,7 |
49 |
4,0893 |
28,625 |
58,523 |
0,0197 |
|
8 |
59,6 |
64 |
4,0877 |
32,701 |
58,599 |
0,0168 |
|
36 |
466,7 |
204 |
32,5284 |
146,431 |
466,7 |
0,1392 |
0,1392/8=1,74%
Проверка статистической значимости показательной модели также проводится по линеаризованной модели.
Таблица 26 - Проверка статистической значимости показательной модели
№ |
t |
|||||
1 |
1 |
4,0877 |
4,061588 |
1,99E-05 |
0,00068 |
|
2 |
2 |
4,069 |
4,062861 |
1,02E-05 |
3,8E-05 |
|
3 |
3 |
4,0604 |
4,064134 |
3,67E-06 |
1,4E-05 |
|
4 |
4 |
4,0325 |
4,065407 |
4,13E-07 |
0,00108 |
|
5 |
5 |
4,0431 |
4,06668 |
3,97E-07 |
0,00056 |
|
6 |
6 |
4,0587 |
4,067953 |
3,62E-06 |
8,6E-05 |
|
7 |
7 |
4,0893 |
4,069226 |
1,01E-05 |
0,0004 |
|
8 |
8 |
4,0877 |
4,070499 |
1,98E-05 |
0,0003 |
|
Сумма |
36 |
32,5284 |
32,5284 |
0,000068 |
0,0032 |
коэффициент детерминации :
0,000068/(0,000068+0,0032)= 0,0211
Построенное уравнение на 2,11% объясняет вариацию результативного признака.
(0,000068/1)/( 0,0032/6) =0,13
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=0,0032/6=0,00053-
остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Найдем оценки коэффициентов обратной (гиперболической) модели
.
Введем новую переменную . Тогда гиперболическая модель приводится к линейной:
.
1,2563
57,9107
Гиперболическое уравнение регрессии имеет вид:
y = 1,2563/ t + 57,9107.
Таблица 27 - Оценка коэффициентов гиперболической модели
t |
y |
yi |
|(yi- )/yi| |
||||||
1 |
59,6 |
1 |
1 |
59,6 |
59,167 |
0,0073 |
0,1875 |
0,6881 |
|
2 |
58,5 |
0,5 |
0,25 |
29,25 |
58,5389 |
0,0007 |
0,0015 |
0,0405 |
|
3 |
58 |
0,33333 |
0,1111 |
19,33333 |
58,3295 |
0,0057 |
0,1085 |
6E-05 |
|
4 |
56,4 |
0,25 |
0,0625 |
14,1 |
58,2248 |
0,0324 |
3,3298 |
0,0127 |
|
5 |
57 |
0,2 |
0,04 |
11,4 |
58,162 |
0,0204 |
1,3502 |
0,0308 |
|
6 |
57,9 |
0,16667 |
0,0278 |
9,65 |
58,1201 |
0,0038 |
0,0484 |
0,0473 |
|
7 |
59,7 |
0,14286 |
0,0204 |
8,528571 |
58,0902 |
0,027 |
2,5915 |
0,0612 |
|
8 |
59,6 |
0,125 |
0,0156 |
7,45 |
58,0677 |
0,0257 |
2,3478 |
0,0728 |
|
36 |
466,7 |
2,71786 |
1,5274 |
159,3119 |
466,7 |
0,1228 |
9,9653 |
0,9534 |
индекс детерминации вычисляется по формуле
0,9534/(0,9534+9,9653) =0,087
Построенное уравнение на 8,7% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (0,9534/1)/( 9,9653/6) = 0,57
к1 =1, к2 = 17-1-1=6, на уровне значимости 0,05 табличное значение Fт = 5,99. Для зависимости y от x выполняется неравенство Fт > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=9,9653/6=1,6609-
остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии.
У показательной модели наименьшая стандартная ошибка. Значит, показательная модель наилучшая.
Спрогнозируем цену одного доллара в декабре 2017 года. Если в августе 2017 г. t=8, то в декабре t=12.
Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.
Таблица 28 - Курсы иностранных валют по отношению к российскому рублю) (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
Австралия |
австралийский доллар |
31,01 |
32,72 |
31,55 |
28,96 |
45,91 |
53,12 |
|
2.Австрия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
3.Азербайджан |
азербайджанский манат |
38,11 |
40,98 |
38,74 |
41,78 |
71,84 |
46,74 |
|
4.Армения |
армянский драм |
84,132) |
83,742) |
75,372) |
80,712) |
12,103) |
15,053) |
|
5.Беларусь |
белорусский рубль |
10,162) |
38,564) |
35,344) |
34,314) |
38,804) |
38,954) |
|
6.Бельгия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
7.Германия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
8.Дания |
датская крона |
54,105) |
56,065) |
53,955) |
60,315) |
92,025) |
10,68 |
|
9.Испания |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
10.Италия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
11.Казахстан3) |
тенге |
20,68 |
21,69 |
20,21 |
21,31 |
30,83 |
21,52 |
|
12.Канада |
канадский доллар |
30,49 |
31,57 |
30,54 |
30,55 |
48,40 |
52,57 |
|
13.Киргизия3) |
сом |
64,84 |
69,56 |
64,08 |
66,34 |
95,52 |
94,84 |
|
14. Нидерланды |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
15.Норвегия5) |
норвежская крона |
51,61 |
53,64 |
54,53 |
53,21 |
75,79 |
83,38 |
|
16.Республика Молдова5) |
молдавский лей |
25,07 |
27,52 |
25,10 |
25,08 |
36,03 |
37,06 |
|
17. Соединенное Королевство (Великобритания) |
фунт стерлингов |
47,26 |
49,63 |
48,96 |
53,96 |
87,42 |
107,98 |
|
18.США |
доллар США |
30,48 |
32,20 |
30,37 |
32,73 |
56,26 |
72,88 |
|
19. Таджикистан |
сомони |
69,225) |
67,665) |
63,735) |
69,095) |
10,76 |
10,99 |
|
20.Туркмения |
новый туркменский манат |
10,70 |
11,29 |
10,65 |
11,48 |
19,74 |
21,44 |
|
21.Турция |
турецкая лира |
19,60 |
16,83 |
16,97 |
15,30 |
24,27 |
25,08 |
|
22.Узбекистан2) |
узбекский сум |
18,58 |
17,94 |
15,30 |
14,63 |
23,22 |
26,45 |
|
23.Украина5) |
гривна |
38,28 |
40,05 |
37,59 |
39,72 |
35,56 |
30,46 |
|
24.Финляндия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
25.Франция |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
26.Швеция5) |
шведская крона |
44,81 |
46,61 |
46,69 |
50,15 |
72,02 |
87,26 |
|
27.Япония3) |
иена |
37,38 |
41,50 |
35,15 |
31,06 |
47,06 |
60,51 |
1) По данным Банка России.
2) За 1000 единиц национальной валюты.
3) За 100 единиц национальной валюты.
4) За 10 000 единиц национальной валюты.
5) За 10 единиц национальной валюты.
Таблица 29 - Решение
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
7. Германия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:
=(40,33+41,67+40,23+44,97+68,34+79,70)/6=52,54
Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном распределении нет моды, так как все значения встречаются по одному разу.
Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. Поскольку у нас четное число уровней, то мода равна полусумме чисел, стоящих посередине.
40,23 40,33 41,67 44,97 68,34 79,70
Ме=(41,67+ 44,97)/2=43,32
Для несгруппированных данных дисперсия рассчитывается по формуле:
=((40,33-52,54)2+(41,67-52,54)2+(40,23-52,54)2+
+(44,27-52,54)2+(68,34 -52,54)2+(49,70-52,54)2)/6=115,2
среднеквадратическое отклонение
Индивидуальные значения отклоняются от среднего значения в среднем на ± 10,7.
Коэффициент вариации
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +
Таблица 30 - Оценка параметров линейной модели
t |
y |
yt |
t2 |
||||
1 |
40,33 |
40,33 |
1 |
32,426 |
62,477 |
404,573 |
|
2 |
41,67 |
83,34 |
4 |
40,471 |
1,437 |
145,66 |
|
3 |
40,23 |
120,69 |
9 |
48,517 |
68,678 |
16,185 |
|
4 |
44,97 |
179,88 |
16 |
56,563 |
134,394 |
16,185 |
|
5 |
68,34 |
341,7 |
25 |
64,608 |
13,923 |
145,636 |
|
6 |
79,70 |
478,2 |
36 |
72,654 |
49,642 |
404,573 |
|
21 |
315,24 |
207,35667 |
91 |
315,24 |
330,551 |
1132,812 |
=231,7 = -51,199
Уравнение тренда (регрессии) будет иметь вид:
= -51,99t+231,7
Определим коэффициент детерминации
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
;
к1 =1, к2 = 6-1-1=4, на уровне значимости 0,05 табличное значение Fт = 7,71. Для зависимости y от t выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Задача 3.6. По статистическим данным Росстата (таблица 31) выполнить комплексный статистический анализ инвестиций в основной капитал.
Таблица 31 - Инвестиции в основной капитал, млн. руб.
Номер студента |
Регионы |
2012 |
2013 |
2014 |
|
Приволжский федеральный округ |
2012877 |
2301298 |
2355973 |
||
1; 15 |
Республика Башкортостан |
233683 |
266396 |
285520 |
|
2; 16 |
Республика Маpий Эл |
31656 |
46178 |
48354 |
|
3; 17 |
Республика Моpдовия |
49825 |
53714 |
55292 |
|
4; 18 |
Республика Татарстан |
470751 |
525730 |
542781 |
|
5; 19 |
Удмуртская Республика |
64221 |
82678 |
89836 |
|
6; 20 |
Чувашская Республика |
65255 |
60122 |
56446 |
|
7; 21 |
Пермский край |
162241 |
219494 |
185649 |
|
8; 22 |
Киpовская область |
50545 |
58655 |
56294 |
|
9; 23 |
Нижегородская область |
257454 |
280884 |
286619 |
|
10; 24 |
Оренбургская область |
151250 |
152877 |
150208 |
|
11; 25 |
Пензенская область |
72343 |
82164 |
83690 |
|
12;26 |
Самарская область |
213022 |
269737 |
300311 |
|
13; 27 |
Саратовская область |
117646 |
125834 |
132804 |
|
14; 28 |
Ульяновская область |
72985 |
76835 |
82168 |
Этапы:
- графическое представление информации и ее анализ;
- определение средних величин и показателей вариации;
- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;
- определение показателей динамики инвестиций и их анализ;
- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.
Таблица 32 - Решение
Регионы |
2012 |
2013 |
2014 |
|
Пермский край |
162241 |
219494 |
185649 |
Представим графически динамику показателя.
Рис. 8. Динамика инвестиций в основной капитал по Пермскому краю за 2012-2014 гг.
По графику видно, что тенденция показателя положительная.
Среднее значение (средний уровень ряда) определим по формуле средней арифметической простой:
= (162241+219494+185649)/3=189128 млн. руб.
Структурные средние - это мода и медиана. Мода - это наиболее часто встречающийся признак в данной совокупности. В данном ряду нет моды, так как все значения встречаются по одному разу.
Медиана находится посередине ранжированного ряда. Запишем данные в порядке возрастания и определим число, которое находится посередине. 162241 185649 219494
Ме=185649 млн. руб.
Для несгруппированных данных дисперсия рассчитывается по формуле:
=((162241-189128)2+(219494-189128)2+
+(185649-189128)2)/3=544300428
среднеквадратическое отклонение 23330,2
Индивидуальные значения отклоняются от среднего значения в среднем на ± 23330,2.
Коэффициент вариации
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Определим коэффициент корреляции между инвестициями и выбранным фактором по данным Росстата - индексами промышленного производства по республике Башкортостан.
Таблица 33 - Инвестиции в основной капитал и индексы промышленного производства по республике Башкортостан
Год |
Инвестиции в основной капитал, млн. руб. |
Индексы промышленного производства (в процентах к предыдущему году) |
|
2012 |
162241 |
102,3 |
|
2013 |
219494 |
103,9 |
|
2014 |
185649 |
104,3 |
Таблица 34 - Расчетные значения для определения коэффициента корреляции
Год |
х |
y |
х2 |
xy |
y2 |
|
2012 |
162241 |
102,3 |
26322142081 |
1659754,3 |
104652,9 |
|
2013 |
219494 |
103,9 |
48177616036 |
22805426,6 |
10795,21 |
|
2014 |
185649 |
104,3 |
34465551201 |
19363190,7 |
10878,49 |
|
Сумма |
567384 |
310,5 |
77965309318 |
438283716 |
126326,6 |
Коэффициент корреляции:
=3,38
Имеется средняя отрицательная линейная связь между y и x: с ростом х снижается у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если ,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 3-2=1, tтабл= 12,71.
Для получаем расчетное значение:
.
Коэффициент корреляции несущественно отличается от нуля, его можно считать незначимым.
Определим цепные и базисные показатели ряда динамики инвестиций в основной капитал.
Абсолютный прирост цепной:
Абсолютный прирост базисный:
где - уровень i-го периода; - уровень предшествующего периода; - уровень базисного периода.
Темп роста цепной:
Темп роста базисный:
Темп прироста цепной:
, или
Темп прироста базисный:
, или
Абсолютное содержание 1% прироста:
, или
Результаты расчетов представим в таблице.
Таблица 35 - Вычисление показателей динамики
Год |
Инвестиции в основной капитал, млн. руб. |
, (млн. руб.) |
, (млн. руб.) |
,% |
,% |
,% |
,% |
А, млн. руб./% |
|
2012 |
162241 |
- |
- |
- |
- |
- |
- |
- |
|
2013 |
219494 |
57253 |
57253 |
135,2 |
135,2 |
35,2 |
35,2 |
1662,41 |
|
2014 |
185649 |
-33845 |
23408 |
84,5 |
114,4 |
-15,5 |
14,4 |
2194,94 |
Все показатели динамики положительные. С каждым годом идет прирост инвестиций.
Средний абсолютный прирост
23408/2=11704млн. руб.
Инвестиции в основной капитал ежегодно растет на 25918,5 млн. руб. в среднем.
Средний темп роста
Средний темп прироста
106,9%-100%=6,9%
Инвестиции в основной капитал ежегодно в среднем за год растет на 10,5%.
Найдем точечные оценки параметров линейной регрессионной модели Y = at + b +
Таблица 36 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|
1 |
162241 |
162241 |
1 |
|
2 |
219494 |
438988 |
4 |
|
3 |
185649 |
556947 |
9 |
|
6 |
567384 |
1158176 |
14 |
=165720, =11704.
Уравнение тренда (регрессии) будет иметь вид:
11704t+165720
Заключение
Статистика наука, которая изучает приемы систематического наблюдения массовых явлений социальной жизни человека, составление численных их описаний и научную обработку этих описаний. Статистическая закономерность составляет предмет статистической науки. Для изучения предмета статистики разработаны и применяются специфические приемы.
В данной работе были выполнены все задачи. В первой части были выведены основные термины, такие, как средние величины, вариация, мода, медиана, дисперсия, среднеквадратическое отклонение, дано определение и выведены формулы, по которым решены задачи на данную тему и сделаны выводы, все основные расчеты производились в «Excel».Во второй части был теоретически рассмотрен корреляционный анализ, выведены основные понятия и формулы, представлена таблица связи параметров, затем проведены расчёты по представленным задачам, был найден коэффициент корреляции, расчетное и табличное значение критерия Стьюдента, основные расчеты были произведены в «Excel». В третьей части был рассмотрен регрессионный анализ, более подробнее рассмотрены этапы решения задачи, проведены расчеты по заданным вопросам, таким, как, индекс детерминации, стандартная ошибка, расчетное значение критерия Фишера, доверительные коэффициенты интервалов, ошибка аппроксимации, коэффициент детерминации, были построены трендовая линейная регрессионная модель, полулогарифмическая модель, нелинейная обратная модель, сделаны выводы. Также был проведен комплексный статистический анализ инвестиций. Расчеты проводились в программе «Excel».
Список использованных источников
1. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебное пособие для бакалавров / В.Е. Гмурман. - М.: Юрайт, 2013. - 479 c.
2. Горлач, Б.А. Теория вероятностей и математическая статистика: Учебное пособие / Б.А. Горлач. - СПб.: Лань, 2013. - 320 c.
3. Калинина, В.Н. Теория вероятностей и математическая статистика: Учебник для бакалавров / В.Н. Калинина. - М.: Юрайт, 2013. - 472 c.
4. Кобзарь, А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь. - М.: ФИЗМАТЛИТ, 2012. - 816 c.
5. Колемаев, В.А. Теория вероятностей и математическая статистика: Учебник / В.А. Колемаев, В.Н. Калинина. - М.: КноРус, 2013. - 376 c.
6. Кочетков, Е.С. Теория вероятностей и математическая статистика: Учебник / Е.С. Кочетков, С.О. Смерчинская, В.В. Соколов. - М.: Форум, НИЦ ИНФРА-М, 2013. - 240 c.
7. Краснов, М.Л. Вся высшая математика. Т. 5. Теория вероятностей. Математическая статистика. Теория игр: Учебник / М.Л. Краснов, А.И. Киселев, Г.И. Макаренко [и др.]. - М.: ЛКИ, 2013. - 296 c.
8. Кошевой, О.С. Некрылова, Н.В. Общая теория статистики. Практикум.-Издательство ПГУ, 2017 г. - 136 с.
9. Сайт Росстата http://www.gks.ru, сайт Пензастата http://pnz.gks.ru
Размещено на Allbest.ru
Подобные документы
Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.
курсовая работа [177,4 K], добавлен 29.10.2015Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.
курсовая работа [91,7 K], добавлен 14.12.2008Понятие средних величин и их значение в экономике. Классификация видов средних величин и их краткая характеристика. Средняя гармоническая и арифметическая, способы их расчета. Примеры применения средних величин в практической работе экономистов.
курсовая работа [205,4 K], добавлен 17.09.2014Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.
курсовая работа [351,2 K], добавлен 20.05.2010Понятие и свойства средних величин. Характеристика и расчет их видов (средних арифметической, гармонической, геометрической, квадратической, кубической и структурных). Сфера их применения в экономическом анализе хозяйственной деятельности отраслей.
курсовая работа [56,8 K], добавлен 21.05.2014Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.
учебное пособие [276,4 K], добавлен 23.11.2010Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.
курсовая работа [895,1 K], добавлен 20.03.2015Определение показателей, описывающих динамику изменения грузооборота. Формулы расчета дисперсии и средних отклонений от начальных показателей. Нахождение индивидуальных и сводных индексов себестоимости единицы продукции и общих затрат по предприятиям.
контрольная работа [510,4 K], добавлен 15.03.2011