Общая теория статистики
Рассмотрение основных теоретических положений по определению средних величин, структурных средних и показателей вариации. Расчет общей, межгрупповой и средней внутригрупповой дисперсии. Анализ основных положений корреляционного и регрессионного анализа.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»
КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»
КУРСОВАЯ РАБОТА
по дисциплине:
«Общая теория статистики»
Автор работы Надеждин М.И.
Специальность: 38.03.01 Экономика. Финансы и кредит
Группа 16ЭЭ1
Руководитель работы В.Н. Деркаченко
Пенза 2017
Задание для выполнения курсовой работы
на тему:
«Построение нелинейных регрессионных моделей для прогнозирования курса валют»
Вариант 12
по дисциплине «Общая теория статистики»
студенту группы 16ЭЭ1
Надеждину Михаилу Игоревичу
Исходные данные к курсовой работе:
Исходные данные к курсовой работе приведены в пояснительной записке для каждой индивидуальной задаче.
Перечень подлежащих разработке вопросов:
рассмотреть основные теоретические положения по определению средних величин, структурных средних и показателей вариации;
определить среднее значение, моду, медиану, дисперсию, коэффициент вариации;
рассчитать общую, межгрупповую и среднюю внутригрупповую дисперсию;
рассмотреть теоретические положения корреляционного и регрессионного анализа;
определить коэффициенты корреляции и проанализировать их значимость;
Проанализировать применение нелинейных регрессионных моделей для прогнозирования курса валют;
Найти коэффициент корреляции и провести его статистический анализ;
построить линейную регрессионную модель, оценить ее качество и спрогнозировать курс валют страны в зависимости от индивидуального задания;
выполнить комплексный статистический анализ инвестиций в основной капитал регионов Приволжского ФО и построить регрессионную трендовую модель для региона, указанного в индивидуальном задании;
сделать выводы и дать рекомендации.
Дата выдачи задания «28» октября 2017г.
Научный руководитель Деркаченко В.Н.
Задание принял к исполнению Надеждин М.И.
Отзыв научного руководителя на курсовую работу
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Кафедра «Экономика и финансы»
ОТЗЫВ
на курсовую работу, выполненную на тему:
«Построение нелинейных регрессионных моделей для прогнозирования курса валют»
(вариант 12)
по дисциплине «Общая теория статистики»
студентом группы 16ЭЭ1
Надеждиным Михаилом Игоревичем
№ п/п |
Основание оценки |
Критерии оценивания |
Шкала оценивания |
||
100-балльная |
4-балльная |
||||
1 |
По результатам собеседования |
Степень авторского вклада в формулировании выводов и рекомендаций по результатам проекта |
35 баллов |
5 баллов |
|
2 |
По результатам собеседования |
Степень достижения студентом учебных целей и выполнения учебных задач |
35 баллов |
5 баллов |
|
3 |
По результатам собеседования |
Показанный при защите проекта уровень освоения необходимых компетенций |
35 баллов |
5 баллов |
|
4 |
По результатам оформления |
Качество подготовки и оформления основных разделов пояснительной записки проекта |
35 баллов |
5 баллов |
|
Суммарный балл текущего рейтинга |
53 баллов |
5 баллов |
|||
Средний балл по критериям оценивания курсовой работы |
35 баллов |
Оценка за курсовую работу 88 баллов по 100 балльной шкале, 5 баллов по 4 балльной шкале
Научный руководитель Деркаченко В.Н.
Дата составления отзыва «20» декабря 2017г.
Отчет о проверке курсовой работы на плагиат
ПРОТОКОЛ
проверки на оригинальность в системе «Антиплагиат.ВУЗ» курсовой работы по дисциплине «Общая теория статистики» на тему: «Построение нелинейных регрессионных моделей для прогнозирования курса валют» (вариант 12)» студента учебной группы 16ЭЭ1 Надеждина Михаила Игоревича направления подготовки бакалавриата 38.03.01 «Экономика», профиля подготовки бакалавриата «Финансы и кредит»
Руководитель курсовой работы к.т.н., профессор Деркаченко В.Н
«16» декабря 2017г. Деркаченко В.Н.
Содержание
Введение
1. Средние величины и показатели вариации
Задание 1.1
Задание 1.2
Задание 1.3
Задание 1.4
Задание 1.5
2. Корреляционный анализ
Задание 2.1
Задание 2.2
Задание 2.3
3. Регрессионный анализ
Задание 3.1
Задание 3.2
Задание 3.3
Задание 3.4
Задание 3.5
Задание 3.6
Вывод
Список использованных источников
Введение
Термин «статистика» происходит от латинского слова «status», что в средние века означало политическое состояние государства. В науку этот термин введен немецким ученым Готфридом Аванхелем, и означал он тогда «государствоведение».
Первые учетные операции проводились еще в глубокой древности. За 5 тыс. лет до н. э. проводился подсчет населения в Китае, велся учет имущества в Древнем Риме, в средние века проводились переписи населения, домашнего имущества, земель. Все эти эпизодические учеты носили примитивный характер и использовались в основном в военных целях и при налогообложении.
По мере развития производительных сил расширялся круг учитываемых явлений и собираемых о них сведений. Производство требовало информации об источниках сырья, рынках труда и сбыта продукции, международная торговля - информации об иностранных государствах, их городах, населения, ремеслах, торговле, ценах и т.д. Начиная с 16 века в Италии, Голландия и других странах создаются сборники, посвященные разным странам, их политическому устройству, населению, промышленности, с\х, торговле, путям сообщения. В странах начинают регулярно проводится статистические работы по рождаемости и смертности населения, по учету явлений хозяйственной жизни. Накапливается опыт, появляются рекомендации о том, как организовать учет и обработать собранные сведения, чтобы обобщить их, проанализировать и выявить различные закономерности. Так постепенно сформировалась отрасль знаний, названная в последствии «статистикой». Ее возникновение связано с потребностями общества в различного рода информации, без которой невозможно управлять государством, изучать отдельные явления и процессы, происходящие в различных областях жизни и сферах деятельности.
В процессе статистического наблюдения получают данные о значениях тех или иных признаков, характеризующих каждую единицу исследуемой совокупности. Для характеристики совокупности в целом или отдельных ее частей данные по отдельным единицам совокупности подвергают сводке и получают обобщающие показатели, в которых отражаются результаты познания количественной стороны изучаемых явлений. Обобщающие показатели могут быть представлены абсолютными, относительными и средними величинами.
Основная цель курсовой работы - развитие системного подхода при анализе статистических закономерностей в массовых социально-экономической явлениях, практическое применение классических методов статистической обработки данных, в целях эффективного информационного обеспечения управленческой деятельности.
Курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой части я рассмотрел теорию, привел все расчеты и сделал вывод.
Цель данной работы заключается в проведении корреляционно-регрессионного анализа и расчете средних величин. Главными задачами в работе являются: Теоретическое обоснование сущности, общих понятий и методов расчета средних величин, исследование системы показателей и информационной базы корреляционно-регрессионного анализа, выполнение расчетов. А также всестороннее изучение статистического наблюдения; умение идентифицировать данные задачи в реальной организационно-экономической среде; владение основными методами и алгоритмами, используемыми при статистической обработке данных.
вариация дисперсия корреляционный регрессионный
1. Средние величины и показатели вариации
Средняя величина представляет собой обобщенную характеристику уровня значений признака, которая получена в расчете на единицу совокупности. В отличие от относительной величины, которая является мерой соотношения показателей, средняя величина является мерой признака на единицу совокупности. Средние величины делятся на основные две категории: степенные средние; структурные средние.
Существуют разные виды средних величин. Среднее хронологическое :
. (1.1)
Среднее арифметическое простое:
(1.1.1),
где xi - i-тое значение случайной величины, n -число, вариант. Среднее арифметическое взвешенное:
= (1.1.2) ,
где mi - частота.[1]
Другие средние можно определить по общей формуле:
(1.1.3),
где k - степень, определяющая различные средние.
Средняя гармоническая высчитывается по формуле:
гм= (1.1.4),
где Vi - i-тый объем реализации. Ее используют в тех случаях, когда неизвестна частота, а известен только объем реализации.
Мода - значение признака, который встречается в совокупности наиболее часто.
М0 = хн + i (1.1.5),
где Хн - нижняя граница интервала, содержащего моду;
i - ширина интервала;
m2 - частота модального интервала;
m1- частота интервала, предшествующего модальному;
m3 - частота интервала, следующего за модальным.
Для дискретных распределений модой считают любое значение ai, вероятность которого pi больше, чем вероятности соседних значений [1].
Медиана - значение признака, который приходится на середину ранжированной совокупности.
Ме = Xн + i ) (1.1.6),
где Хн - нижняя граница интервала;
i - ширина интервала;
n - объем выборки (число наблюдений)
- накопленная частота интервала, предшествующего медианному;
mме - частота медианного интервала;
Вариация - это изменение признака в пределах изучаемой совокупности. Для измерения вариации признака применяются различные абсолютные и относительные показатели.
Размах колебаний (вариации) - разность между максимальным и минимальным значениями признака в изучаемой совокупности:
R = xmax - xmin, (1.1.7), где
xmax - наибольшее значение признака;
xmin - наименьшее значение признака
Среднее линейное отклонение:
= (1.1.8),
где - среднее значение показателя.
Взвешенное среднее линейное отклонение:
вз = (1.1.9)
Среднеквадратическое отклонение:
у = (1.2),
де - дисперсия.
Средняя дисперсия :
уІ(sІ) = (1.2.1).
Ее можно рассчитать еще таким образом:
уІ(sІ) = (1.2б)
Взвешенная дисперсия:
уІвз = (1.2.2).
Ее используют, когда все данные представлены в виде интервального ряда и вместо xi берем среднее значение интервала и соответственно частота i- ого интервала (mi).
Еще есть среднеквадратическое отклонение:
) = (1.2.3)
Взвешенное среднеквадратическое отклонение:
= (1.2.4)
Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квадратического отклонения к средней величине признака:
V = 100% (1.2.5)
Коэффициент вариации показывает, какую долю среднего значения этой величины составляет её средний разброс. Коэффициент вариации имеет смысл использовать при ненулевых средних значениях.
Коэффициент полезен в ситуациях, когда о размерах отклонения величины можно судить, зная ее среднее значение. Номер моего варианта 12.
Задание 1.1
По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение было увеличено на номер классного журнала (12). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Дано (х): 15; 17; 14; 16; 19; 15; 20; 15; 22;
Определим среднее значение:
(1.2)
Моду: - наиболее часто встречающееся значение ряда.
Медиана. Для ее расчета расположим ряд в порядке возрастания:
14, 15, 15, 15, 16, 17, 19, 20, 22.
Количество элементов 9, нечетное количество, медианой будет являться число 16, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.
Вычислим дисперсию:
= 6,7 (2)
Вычислим среднеквадратическое отклонение: (1.9)
И коэффициент вариации составит:
(2.5).
Задание 1.2
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 33%, стоимость основных фондов увеличилась на 22%. Определить изменение фондоотдачи.
Фондоотдача - это финансовый коэффициент, характеризующий эффективность использования основных средств организации. Фондоотдача показывает, сколько выручки приходится на единицу стоимости основных средств.
, соответственно изменение фондоотдачи:
= 9,02%
Таким образом, фондоотдача увеличилась на 9,02%
Задание 1.3
Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Определим среднее значение моду и медиану. Промежуточные вычисления приведены в таблице1.1
Таблица 1.1 - промежуточные вычисления.
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
|
У? |
90 |
110 |
130 |
150 |
170 |
190 |
|
m*У? |
540 |
1870 |
3250 |
4200 |
2380 |
1900 |
|
У?/2 |
45 |
55 |
65 |
75 |
85 |
95 |
|
Накопл. частота |
6 |
23 |
48 |
76 |
90 |
100 |
Общее число работников составляет человек
Среднее значение
x?=(1)
Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение . (76>50). Вычислим моду:
(1.4)
Вычислим медиану:
(1.5)
Задание 1.4
По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi было увеличено на номер классного журнала (12).
Таблица 2 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
13,0-13,2 |
3 |
3 |
||
13,2-13,4 |
4 |
4 |
||
13,4-13,6 |
17 |
17 |
||
13,6-13,8 |
11 |
15 |
26 |
|
13,8-13,0 |
13 |
6 |
19 |
|
14,0-14,2 |
18 |
5 |
23 |
|
14,2-14,4 |
6 |
6 |
||
14,4-14,6 |
2 |
2 |
||
50 |
50 |
100 |
Для удобства расчета составим таблицу 2.1, в которой будут отражены промежуточные вычисления по нахождению общей дисперсии.
Таблица 2.1 - Расчет общей дисперсии
Число предприятий |
Расчет дисперсии |
||||||||
Хi (млн. руб) |
mгi |
mчi |
moi |
Хср.i |
Хср.i*moi |
(Хср.i-X?o)^2 |
(Хср.i-X?o)^2*moi |
||
13.0 |
13.2 |
3 |
3 |
13.1 |
39.3 |
0.509796 |
1.529388 |
||
13.2 |
13.4 |
4 |
4 |
13.3 |
53.2 |
0.264196 |
1.056784 |
||
13.4 |
13.6 |
17 |
17 |
13.5 |
229.5 |
0.098596 |
1.676132 |
||
13.6 |
13.8 |
11 |
15 |
26 |
13.7 |
356.2 |
0.012996 |
0.337896 |
|
13.8 |
14.0 |
13 |
6 |
19 |
13.9 |
264.1 |
0.007396 |
0.140524 |
|
14.0 |
14.2 |
18 |
5 |
23 |
14.1 |
324.3 |
0.081796 |
1.881308 |
|
14.2 |
14.4 |
6 |
6 |
14.3 |
85.8 |
0.236196 |
1.417176 |
||
14.4 |
14.6 |
2 |
2 |
14.5 |
29 |
0.470596 |
0.941192 |
||
50 |
50 |
100 |
1381.4 |
8.9804 |
Общее среднее: млн. руб.
Общая дисперсия: у2о= млн.руб. (89804 руб.)
Далее рассчитаем дисперсию по группам: для государственных и частных предприятий.
Таблица 2.2 - расчет дисперсии (гос. предприятия)
Хi (млн. руб) |
mгi |
Хср.i |
Хср.i*mгi |
(Хср.i-X?г)^2 |
(Хср.i-X?o)^2*mгi |
||
13.6 |
13.8 |
11 |
13.7 |
150.7 |
0.09 |
0.99 |
|
13.8 |
14.0 |
13 |
13.9 |
180.7 |
0.01 |
0.13 |
|
14.0 |
14.2 |
18 |
14.1 |
253.8 |
0.01 |
0.18 |
|
14.2 |
14.4 |
6 |
14.3 |
85.8 |
0.09 |
0.54 |
|
14.4 |
14.6 |
2 |
14.5 |
29 |
0.25 |
0.5 |
|
50 |
700 |
2.34 |
Среднее значение : млн. руб.
Дисперсия: у2г= млн.руб. (46800 руб.)
Таблица 2.3 - расчет дисперсии (частные предприятия)
Хi (млн. руб) |
mчi |
Хср.i |
Хср.i*mчi |
(Хср.i-X?ч)^2 |
(Хср.i-X?o)^2*mчi |
||
13.0 |
13.2 |
3 |
13.1 |
39.3 |
0.278784 |
0.836352 |
|
13.2 |
13.4 |
4 |
13.3 |
53.2 |
0.107584 |
0.430336 |
|
13.4 |
13.6 |
17 |
13.5 |
229.5 |
0.016384 |
0.278528 |
|
13.6 |
13.8 |
15 |
13.7 |
205.5 |
0.005184 |
0.07776 |
|
13.8 |
14.0 |
6 |
13.9 |
83.4 |
0.073984 |
0.443904 |
|
14.0 |
14.2 |
5 |
14.1 |
70.5 |
0.222784 |
1.11392 |
|
50 |
681.4 |
3.1808 |
Среднее значение : млн. руб.
Дисперсия: у2ч= млн.руб. (63616 руб.)
Средняя внутригрупповая дисперсия: у?в=
Общая дисперсия равна сумме межгрупповой и среднегрупповой дисперсий, следовательно межгрупповая дисперсия будет равна:
уІмг= уІо - у?в= 89804 - 55208 = 34596 руб.
Вычислим коэффициент детерминации:
Таким образом, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.
Задание 1.5
Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 3 - Исходные данные 1, 2, 3 - группа
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
|
Хi |
1 |
6 |
||
mi |
10 |
15 |
||
Хi |
3 |
8 |
||
mi |
20 |
5 |
Для удобства расчета общей дисперсии составим таблицу 3.1, в которой будут представлены вычисления.
Таблица 3.1 - вычисление общей дисперсии.
Xi |
mi |
Расчет дисперсии |
||||||
1 |
2 |
3 |
moi |
Х*moi |
(Х-Х?o)І |
(Х-Х?o)І*moi |
||
1 |
30 |
10 |
40 |
40 |
4 |
160 |
||
2 |
15 |
15 |
30 |
1 |
15 |
|||
3 |
20 |
20 |
60 |
0 |
0 |
|||
6 |
15 |
15 |
90 |
9 |
135 |
|||
8 |
5 |
5 |
10 |
80 |
25 |
250 |
||
Сумма |
100 |
300 |
560 |
Среднее общее значение : х?о=
Общая дисперсия:
Далее определим дисперсию для каждой группы в отдельности :
Таблица 3.2 - вычисление дисперсии для 1 группы.
Xi |
m1i |
X*m1i |
(Х-Х?1)І |
(Х-Х?1)І*m1i |
|
1 |
30 |
30 |
1 |
30 |
|
2 |
15 |
30 |
0 |
0 |
|
8 |
5 |
40 |
36 |
180 |
Среднее значение : X?1=
Дисперсия: уІ1=
Таблица 3.2 - вычисление дисперсии для 2 группы.
Xi |
m2i |
X*m2i |
(Х-Х?2)І |
(Х-Х?2)І*m2i |
|
1 |
10 |
10 |
9 |
90 |
|
6 |
15 |
90 |
4 |
60 |
Среднее значение : X?2=
Дисперсия: уІ2=
Таблица 3.3 - вычисление дисперсии для 3 группы.
Xi |
m3i |
X*m3i |
(Х-Х?3)І |
(Х-Х?3)І*m3i |
|
3 |
20 |
60 |
1 |
20 |
|
8 |
5 |
40 |
16 |
80 |
Среднее значение : X?3=
Дисперсия: уІ3=
Вычислим среднюю внутригрупповую дисперсию: у?Ів=
И межгрупповую: уІмг=уІо-у?Ів= 5,6 - 4,73 = 0,87
2. Корреляционный анализ
Корреляция -- статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. [3]
Математической мерой корреляции двух случайных величин служит корреляционное отношение либо коэффициент корреляции . В случае если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.
Впервые ввел данный термин французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.
На основе статистических данных корреляционный момент определяется:
Kxy = + X?) (Yi +), (2.1.1) где
n - объем выборки, число наблюдений;
, Yi - i-тое значение фактора и показателя;
X?,- средние значения фактора и показателя.
Безразмерному коэффициент корреляции:
rxy = , (2.1.2)
где - среднеквадратические отклонения фактора и показателя.
На практике чаще всего используют данное выражение
rxy = , (2.1.3)
где - среднее значения произведения фактора на показатель.
Коэффициент корреляции может изменяться в данном диапазоне -1 r +1[5]
t-критерий Стьюдента -- общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках. расчетное значение критерия Стьюдента определяется по формуле:
t = (2.1.4)
После этого необходимо найти табличное значение критерия Стьюдента. Для этого нам нужны уровень значимости и степень свободы . Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим.
Коэффициент корреляции Спирменамера линейной связи между случайными величинами. Он рассчитывается по формуле
(2.1.5)
Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Задание 2.1
Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ:28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Определим У, увеличим Х и У на номер журнала.
Таблица 4.1 - результаты вычислений.
У |
20,1 |
21,4 |
23,3 |
18,9 |
21,7 |
|
Х |
15,5 |
16,6 |
17,8 |
16,2 |
17,2 |
|
ХУ |
311,55 |
355,24 |
414,74 |
306,18 |
373,24 |
|
(Хi-Х?)І |
1,3456 |
0,0036 |
1,2996 |
0,2116 |
0,2916 |
|
(Уi-У?)І |
0,9604 |
0,1024 |
4,9284 |
4,7524 |
0,3844 |
Вычислим средние значения:
- для Х : X?=
- для У: У?=
- для ХУ:
Определим дисперсии.
уІХ =
уІУ=
Вычислим коэффициент корреляции: rxy =
Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче: f= 5-2 =3.
Расчетное значение критерия Стьюдента:
Табличное значение критерия Стьюдента:
Таким образом, табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а следовательно коэффициент корреляции не значим
Задание 2.2
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 18 22 13 20 15 14
у 17 20 11 18 14 10
Это нулевой вариант. Каждое значение х и у было увеличено на свой номер классного журнала (12).
Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 4.2
Таблица 4.2 - результаты промежуточных вычислений.
Сумма |
||||||||
Х |
30 |
34 |
25 |
32 |
27 |
26 |
174 |
|
У |
29 |
32 |
23 |
30 |
26 |
22 |
162 |
|
ХУ |
870 |
1088 |
575 |
960 |
702 |
572 |
4767 |
|
(Хi-Х?)І |
1 |
25 |
16 |
9 |
4 |
9 |
64 |
|
(Уi-У?)І |
4 |
25 |
16 |
9 |
1 |
25 |
80 |
Вычислим средние значения:
- для Х : X?=
- для У: У?=
- для ХУ:
Определим дисперсии.
уІХ =
уІУ=
Коэффициент корреляции: rxy =
Определим расчетное значение критерия Стьюдента. В данной задаче значение степени свободы: f= 6-2 =4.
Расчетное значение критерия Стьюдента:
Табличное значение критерия Стьюдента: :
Таким образом, табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а следовательно коэффициент корреляции значим.
Задание 2.3
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.
Результаты:
1. Коэффициент ранговой корреляции.
2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение:
Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. Все эти вычисления представлены в таблице 4.3 (все значения баллов были увеличены на номер классного журнала - 12).
Таблица 4.3 - Расчет коэффициента ранговой корреляции Спирмена.
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Теория вероятностей |
77 |
102 |
54 |
59 |
96 |
70 |
62 |
|
Статистика |
63 |
97 |
48 |
75 |
84 |
92 |
52 |
|
Ранг (Rтв) |
5 |
7 |
1 |
2 |
6 |
4 |
3 |
|
Ранг (Rст) |
3 |
7 |
1 |
4 |
5 |
6 |
2 |
|
dІ |
4 |
0 |
0 |
4 |
1 |
4 |
1 |
Значение степени свободы составляет f =5
Количество ранжируемых элементов: n = 7
Коэффициент корреляции Спирмена:
Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости б/2=0,025 (0,02): . Таким образом, расчетное значение критерия корреляции Спирмена меньше табличного значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент ранговой корреляции Спирмена не значим.
Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 4.4
Таблица 4.4 - Расчет коэффициента корреляции Стьюдента.
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Сумма |
|
Теория вероятностей (x) |
77 |
102 |
54 |
59 |
96 |
70 |
62 |
520 |
|
Статистика (y) |
63 |
97 |
48 |
75 |
84 |
92 |
52 |
511 |
|
хi-x? |
2,71 |
27,71 |
-20,29 |
-15,29 |
21,71 |
-4,29 |
-12,29 |
||
yi-y? |
-10,00 |
24,00 |
-25,00 |
2,00 |
11,00 |
19,00 |
-21,00 |
||
(хi-x?)(yi-y?) |
-27,14 |
665,14 |
507,14 |
-30,571 |
238,86 |
-81,43 |
258 |
1530 |
|
(хi-x?)І |
7,36735 |
768,082 |
411,51 |
233,653 |
471,51 |
18,3673 |
150,939 |
2061,43 |
|
(yi-yЇ)І |
100 |
576 |
625 |
4 |
121 |
361 |
441 |
2228 |
Среднее значение баллов по теории вероятности: х? = 74,29
Определим корреляционный момент: Кху =
Вычислим дисперсии:
уІх =
уІy =
Коэффициент корреляции:
Определим расчетное значение критерия Стьюдента: , соответственно табличное значение критерия
Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.
3. Регрессионный анализ
Регрессионный анализ -- метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ -- раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных. Рассмотрим порядок определения параметров линейной модели:
. (3.1)
Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.
Метод наименьших квадратов обеспечивает такой выбор коэффициентов а0 и а1 для прямой, при котором достигается минимум суммы квадратов отклонений, т.е.
(3.2)
Выражение (3.2) есть числитель остаточной дисперсии. Можно записать:
Минимум функции двух переменных достигается при значениях и , которые обращают в нуль производные:
С учетом выше указанного запишем:
С учетом деления на n имеем:
(3.3)
Имеем без учета деления на n:
(3.4)
и с учетом деления на n:
(3.5)
Теперь, исходя из минимума остаточной дисперсии, необходимо определить коэффициенты регрессии.
Мы имеем две системы нормальных уравнений:
Первая:
(3.6; 3.7)
Опускаем обозначение i=1 до n.
Из (3.6) находим , подставляем в (2.7) и находим :
(3.8)
Из (2.6) находим , подставляем в (2.7) и находим а1:
(3.9)
Вторая: (3.10; 3.11)
Из 2.10 находим а1:
Подставляем а1 в (3.11), имеем:
. (3.12)
Из 2.10 находим а0:
.
Подставляем а0 в (2.11), имеем:
. (3.13)
Коэффициент а1 можно определить по следующей формуле:
. (3.14)
Как перейти от формулы (3.13) к (3.14)?
.
Отсюда мы можем сделать вывод, что коэффициенты линейной регрессии можно определить различными способами.
В матричной форме коэффициенты регрессии определяются по следующей зависимости:
(3.15)
где - транспонированная матрица;
- обратная матрица.
(3.16)
Далее проверяем значимость коэффициента регрессии по критерии Стьюдента. Значимость коэффициентов регрессии:
Так как то расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:
.
Этот же критерий мы можем рассчитать через отклонения коэффициентов:
- критерий Стьюдента для коэффициента а0
- критерий Стьюдента для коэффициента а1 (3.17)
Значимость данной модели мы можем определить по критерию Фишера:
(3.18)
где - табличное значение критерия;
- степень свободы факторной дисперсии
- степень свободы остаточной дисперсии
Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле (3.18 - левая часть) и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной.
Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.
После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка [5,7,8].
Ошибка аппроксимации рассчитывается по формуле:
(3.19)
где - исходное значение показателя;
- расчетное (прогнозное) значение показателя.
Стандартная ошибка определяется по формуле:
. (3.20)
В практических исследованиях, если ошибка аппроксимации имеет величину до 5%, то модель можно использовать для решения поставленных задач; если Е до 10%, то применение модели зависит от исследователя и если Е>10%, то модель нецелесообразно применять в эконометрических исследованиях.
Любое исследование начинается со спецификации модели, т.е. выбора вида модели. Как правило, парная регрессия используется, если имеется доминирующий фактор.
Известно, что выбор вида модели осуществляется либо графически, либо экспериментально.
Различают несколько видов нелинейных функций .
Из них можно выделить два класса нелинейных регрессий:
а) регрессии, нелинейные относительно факторов, но линейные по параметрам.
Примеры:
парабола: ;
равносторонняя гипербола: и др.;
б) регрессии, нелинейные по параметрам.
Примеры:
степенная: ;
показательная: ;
экспоненциальная: и др.
Нелинейная регрессия по факторам не вызывает сложностей в оценке параметров. Обычно используется МНК.
Нелинейные модели по параметрам делятся на два типа:
нелинейная модель внутренне линейна, т.е. она с помощью преобразований приводится к линейному виду.
Например, .
Оценки параметров и могут быть найдены МНК;
нелинейная модель внутренне не линейна, т.е. невозможно привести к линейной функции.
Например, .
Рассмотрим логарифмическую модель. Преобразовав степенную модель в линейную, получаем логарифмическую модель:
. (3.24)
Как правило, эта функция отражает зависимость спроса на благо от его цены () рисунок 2.3 или от дохода () или предложения от цены ().
Широко известна двухфакторная нелинейная модель, так называемая производственная функция Кобба-Дугласа:
, (2.27)
где - объем выпуска;
- затраты капитала;
- затраты труда;
- параметры модели.
Путем преобразования получаем линейную модель:
.
Полулогарифмические модели бывают двух видов:
(3.28)
(3.29)
Для модели (2.29) система уравнений имеет вид:
(3.30)
Такие модели обычно используют в тех случаях, когда необходимо определять темп роста или прироста каких-либо экономических показателей.
Например, при анализе банковского вклада по первоначальному вкладу и процентной ставке, при исследовании зависимости прироста объема выпуска продукции от увеличения затрат ресурсов и др.
Задание 3.1
Построить нелинейную обратную модель связи себестоимости единицы продукции (y) со стоимостью основных фондов (x). Определить характеристики модели.
Каждое значение (y) увеличить на свой номер классного журнала.
Исходные данные:
x |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
y |
21 |
16 |
15 |
14 |
13 |
12,5 |
11 |
11,5 |
10 |
8 |
Характеристики модели:
1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков)
3) стандартную ошибку (до 4-х знаков)
4) расчетное значение критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков)
Решение:
Прежде всего, увеличим все имеющиеся данные на номер моего классного журнала (12).
Для удобства вычисления построим таблицу с промежуточным вычислением. Введем замену: 1/х обозначим как Х
Таблица 5.1 - Промежуточные расчеты коэффициентов модели
Ср.знач. |
y |
x |
Х |
yХ |
X2 |
||
1 |
33 |
1 |
1 |
33 |
1 |
33,82725 |
|
2 |
28 |
2 |
0,5 |
14 |
0,25 |
27,72681 |
|
3 |
27 |
3 |
0,333 |
8,991 |
0,110889 |
25,68926 |
|
4 |
26 |
4 |
0,25 |
6,5 |
0,0625 |
24,67658 |
|
5 |
25 |
5 |
0,2 |
5 |
0,04 |
24,06654 |
|
6 |
24,5 |
6 |
0,167 |
4,0915 |
0,027889 |
23,66391 |
|
7 |
23 |
7 |
0,143 |
3,289 |
0,020449 |
23,37109 |
|
8 |
23,5 |
8 |
0,125 |
2,9375 |
0,015625 |
23,15147 |
|
9 |
22 |
9 |
0,111 |
2,442 |
0,012321 |
22,98066 |
|
10 |
20 |
10 |
0,1 |
2 |
0,01 |
22,84645 |
|
Итого |
252 |
55 |
2,929 |
82,251 |
1,549673 |
252 |
|
Ср.знач. |
25,2 |
5,5 |
0,293 |
8,225 |
0,1549673 |
1) Зная данные значения, можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:
а1 = = = 12,1590
- показывает среднее изменение результативного показателя с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 12,1590.
а0 = а1 = 25,2 - 12,1590 0,293 = 21,6264
- формально показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.
Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
По имеющимся данным можно построить модель. Она будет иметь следующий вид:
= 24,1562 +
Определим каждое значение .
Далее построим еще одну таблицу для нахождения следующих показателей:
Таблица 5.2 - Расчет показателей индекса детерминации, стандартной ошибки
№ |
y |
Х |
y? |
(y-yЇ)І |
(y-y^)І |
(Х-Х?)І |
|
1 |
33 |
1 |
33,82725 |
60,84 |
0,6843478 |
20,25 |
|
2 |
28 |
0,5 |
27,72681 |
7,84 |
0,0746353 |
12,25 |
|
3 |
27 |
0,333 |
25,68926 |
3,24 |
1,7180501 |
6,25 |
|
4 |
26 |
0,25 |
24,67658 |
0,64 |
1,7514363 |
2,25 |
|
5 |
25 |
0,2 |
24,06654 |
0,04 |
0,8713535 |
0,25 |
|
6 |
24,5 |
0,167 |
23,66391 |
0,49 |
0,6990511 |
0,25 |
|
7 |
23 |
0,143 |
23,37109 |
4,84 |
0,1377047 |
2,25 |
|
8 |
23,5 |
0,125 |
23,15147 |
2,89 |
0,1214734 |
6,25 |
|
9 |
22 |
0,111 |
22,98066 |
10,24 |
0,9616884 |
12,25 |
|
10 |
20 |
0,1 |
22,84645 |
27,04 |
8,1022621 |
20,25 |
|
Итого |
252 |
2,929 |
252 |
118,1 |
15,122003 |
82,5 |
|
Ср.знач. |
25,2 |
0,293 |
11,81 |
8,25 |
По данной таблице определим коэффициент детерминации: R 2 = 1- = 1- = 0,87 - показывает долю вариации результативного признака, объясненную вариацией факторного признака.
2) Следовательно, можно вычислить индекс детерминации (R), он равен:
R = = 0,93. - В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.
По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:
3) Соответственно, стандартная ошибка : Sy= = 1,3749
4) Критерий Фишера (F) : = = 53,54
Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f=8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.
5) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.
H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;
H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.
В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Вычислим стандартные отклонения величин параметров модели: - среднеквадратическое отклонение Х. Далее определим случайные отклонения a0 и а1
Далее определим критерий Стьюдента для коэффициентов:
Фактические значения t - статистики для параметров , превышают табличные:
поэтому параметры и а1 статистически значимы, нулевая гипотеза отвергается.
6) Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Таким образом, доверительный интервал:
Для а0:
21,6251- a0 <21,6251+ a0 ? (20,1246 ; 23,1256)
Для а1:
12,2009-12,2009+ а1 ? (8,3891;16,0127)
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью 95% параметры и будут находиться в указанных границах интервалов.
Задание 3.2
Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
x |
1 |
2 |
3 |
4 |
5 |
6 |
|
y |
10 |
13,4 |
15,4 |
16,5 |
18,6 |
19,1 |
Определить характеристики модели.
Каждое значение (y) увеличить на свой номер классного журнала.
Характеристики модели:
модель (коэффициенты до 2-х знаков)
индекс детерминации (до 2-х знаков)
стандартную ошибку ( до 4-х знаков);
расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение:
Построим таблицу с промежуточными решениями, для того, чтобы облегчить нахождение необходимых коэффициентов, увеличив все значения y на номер классного журнала (12)
Таблица 5.3 - промежуточные решения
у,% |
х, тыс. дол. |
lnx |
(lnx)І |
ylnx |
|
22 |
1 |
0 |
0 |
0 |
|
25,4 |
2 |
0,69 |
0,48 |
17,53 |
|
27,4 |
3 |
1,1 |
1,21 |
30,14 |
|
28,5 |
4 |
1,39 |
1.93 |
39,62 |
|
30,6 |
5 |
1,61 |
2,59 |
49,27 |
|
31,1 |
6 |
1.79 |
3,2 |
55,67 |
|
165 |
21 |
6,58 |
9,41 |
192,23 |
По данной таблице определим а0 и а1 , необходимые значения для построения нашей модели:
а1 = = = 5,14
а0 = = = 21,86
Далее, найдя коэффициенты, можем построить модель: = 21,86 + 5,14lnx
Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.
Таблица 5.1 - Расчет индекса детерминации
№ п/п |
y |
x |
||||
1 |
22 |
1 |
21,8615 |
30,25 |
0,0192 |
|
2 |
25,4 |
2 |
25,4091 |
4,41 |
0,0001 |
|
3 |
27,4 |
3 |
27,5171 |
0,01 |
0,0137 |
|
4 |
28,5 |
4 |
29,0082 |
1 |
0,2582 |
|
5 |
30,6 |
5 |
30,1393 |
9,61 |
0,2123 |
|
6 |
31,1 |
6 |
31,0647 |
12,96 |
0,0012 |
|
итого |
165 |
21 |
165 |
58,24 |
0,5047 |
|
Ср. знач. |
27,5 |
3,5 |
2) По найденным значениям определим индекс детерминации:
- связь между признаком Y и фактором X весьма высокая и прямая.
3) Определим стандартную ошибку:
4) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Так как наблюдаемое значение критерия больше табличного , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.
Задание 3.3
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…
Решение:
1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК
В таблице представлены промежуточные расчеты
Таблица - промежуточные расчеты.
Год |
t |
у |
t-t? |
(t-tЇ)І |
у-у? |
(t-t?)(y-y?) |
ур |
у-у? |
(у-у?)І |
(y-yЇ)І |
||
2000 |
1 |
7,5 |
-8 |
64 |
-1,947 |
15,576 |
7,692 |
-0,192 |
0,03694 |
2,56 |
3,791 |
|
2001 |
2 |
7,5 |
-7 |
49 |
-1,947 |
13,629 |
7,912 |
-0,412 |
0,16933 |
5,49 |
3,791 |
|
2002 |
3 |
8 |
-6 |
36 |
-1,447 |
8,6824 |
8,131 |
-0,131 |
0,01713 |
1,64 |
2,094 |
|
2003 |
4 |
8,4 |
-5 |
25 |
-1,047 |
5,2353 |
8,350 |
0,050 |
0,00248 |
0,59 |
1,096 |
|
2004 |
5 |
8,6 |
-4 |
16 |
-0,847 |
3,3882 |
8,570 |
0,030 |
0,00092 |
0,35 |
0,718 |
|
2005 |
6 |
8,4 |
-3 |
9 |
-1,047 |
3,1412 |
8,789 |
-0,389 |
0,15132 |
4,63 |
1,096 |
|
2006 |
7 |
8,6 |
-2 |
4 |
-0,847 |
1,6941 |
9,008 |
-0,408 |
0,16671 |
4,75 |
0,718 |
|
2007 |
8 |
9,7 |
-1 |
1 |
0,2529 |
-0,253 |
9,228 |
0,472 |
0,22307 |
4,87 |
0,064 |
|
2008 |
9 |
10,2 |
0 |
0 |
0,7529 |
0 |
9,447 |
0,753 |
0,56686 |
7,38 |
0,567 |
|
2009 |
10 |
10,3 |
1 |
1 |
0,8529 |
0,8529 |
9,666 |
0,634 |
0,40145 |
6,15 |
0,728 |
|
2010 |
11 |
10,2 |
2 |
4 |
0,7529 |
1,5059 |
9,886 |
0,314 |
0,09872 |
3,08 |
0,567 |
|
2011 |
12 |
10,1 |
3 |
9 |
0,6529 |
1,9588 |
10,105 |
-0,005 |
0,00003 |
0,05 |
0,426 |
|
2012 |
13 |
10,8 |
4 |
16 |
1,3529 |
5,4118 |
10,325 |
0,476 |
0,22610 |
4,40 |
1,83 |
|
2013 |
14 |
10,6 |
5 |
25 |
1,1529 |
5,7647 |
10,544 |
0,056 |
0,00315 |
0,53 |
1,329 |
|
2014 |
15 |
10,8 |
6 |
36 |
1,3529 |
8,1176 |
10,763 |
0,037 |
0,00135 |
0,34 |
1,83 |
|
2015 |
16 |
10,7 |
7 |
49 |
1,2529 |
8,7706 |
10,983 |
-0,283 |
0,07986 |
2,64 |
1,57 |
|
2016 |
17 |
10,2 |
8 |
64 |
0,7529 |
6,0235 |
11,202 |
-1,002 |
1,00400 |
9,82 |
0,567 |
|
У |
153 |
160,6 |
0 |
408 |
0 |
89,5 |
160,6 |
0 |
3,14943 |
59,281 |
22,78 |
|
Ср. знач. |
9 |
9,4471 |
, соответственно
Следовательно уравнение линейного тренда принимает вид:
Мы можем увидеть, что имеется тенденция к росту, так как коэффициент t имеет положительное значение, ежегодная величина роста составляет в среднем 0,219 единиц.
2) Определим коэффициент детерминации: 0,8617 - т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
3) Определим стандартную ошибку:
4) Оценим значимость модели с помощью критерия Фишера:
.
Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
5) Определим ошибку аппроксимации: . В среднем, расчетные значения отклоняются от фактических на 3.49%. Данное уравнение можно использовать в качестве регрессии, так как ошибка меньше 7%.
6) Спрогнозируем коэффициент рождаемости в 2017 :
.
Задание 3.4
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.2 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение:
1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :
Все промежуточные расчеты представлены в таблице 3.4.1
Таблица 3.4.1 - промежуточные расчеты к линейной модели регрессии.
t |
Цена (y) |
t-t? |
у-у? |
(t-t?)(у-у?) |
(t-tЇ)І |
у? |
у-у? |
(у-у?)І |
(у-у?)І |
||
1 |
59,6 |
-3,5 |
1,2625 |
-4,41875 |
12,25 |
58,075 |
1,525 |
2,325625 |
2,5587 |
1,5939 |
|
2 |
58,5 |
-2,5 |
0,1625 |
-0,40625 |
6,25 |
58,15 |
0,35 |
0,1225 |
0,59829 |
0,0264 |
|
3 |
58 |
-1,5 |
-0,3375 |
0,50625 |
2,25 |
58,225 |
-0,225 |
0,050625 |
0,38793 |
0,1139 |
|
4 |
56,4 |
-0,5 |
-1,9375 |
0,96875 |
0,25 |
58,3 |
-1,9 |
3,61 |
3,36879 |
3,7539 |
|
5 |
57 |
0,5 |
-1,3375 |
-0,66875 |
0,25 |
58,375 |
-1,375 |
1,890625 |
2,41228 |
1,7889 |
|
6 |
57,9 |
1,5 |
-0,4375 |
-0,65625 |
2,25 |
58,45 |
-0,55 |
0,3025 |
0,94991 |
0,1914 |
|
7 |
59,7 |
2,5 |
1,3625 |
3,40625 |
6,25 |
58,525 |
1,175 |
1,380625 |
1,96817 |
1,8564 |
|
8 |
59,6 |
3,5 |
1,2625 |
4,41875 |
12,25 |
58,6 |
1 |
1 |
1,67785 |
1,5939 |
|
36 |
466,7 |
0 |
0 |
3,15 |
42 |
466,7 |
0 |
10,6825 |
13,92196 |
10,91875 |
|
Сред. знач 4,5 |
58,3375 |
58,3375 |
. тогда : a0= 58,3375 - 4,5?0,075 = 58
Таким образом, линейная модель будет выглядеть как:
1.1) Определим коэффициент детерминации:
.
1.2) Определим стандартную ошибку:
1.3) Определим значимость модели используя критерий Фишера:
.
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
1.4) Вычислим ошибку аппроксимации:
- в среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Осуществим прогноз на декабрь 2017 года:
2) Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.4.2. Для удобства расчета проведем замену: lny=У
Таблица 3.4.2 - Промежуточные расчеты для модели lnу = ао + а1t
t |
Цена (y) |
У |
tІ |
t*У |
У? |
У-У? |
У-У? |
(У-У?)І |
(У-У?)І |
||
1 |
59,6 |
4,0877 |
1 |
4,0877 |
4,061592 |
0,02611 |
0,02165 |
0,0006817 |
0,000468723 |
0,6387455 |
|
2 |
58,5 |
4,069 |
4 |
8,138 |
4,062865 |
0,00613 |
0,00295 |
0,00003758 |
0,0000087025 |
0,15065127 |
|
3 |
58 |
4,0604 |
9 |
12,1812 |
4,064139 |
-0,00374 |
-0,00565 |
0,00001399 |
0,0000319225 |
0,09210915 |
|
4 |
56,4 |
4,0325 |
16 |
16,13 |
4,065413 |
-0,03291 |
-0,03355 |
0,00108307 |
0,001125603 |
0,81611903 |
|
5 |
57 |
4,0431 |
25 |
20,2155 |
4,066687 |
-0,02359 |
-0,02295 |
0,000556488 |
0,000526703 |
0,58346318 |
|
6 |
57,9 |
4,0587 |
36 |
24,3522 |
4,067961 |
-0,00926 |
-0,00735 |
0,0000857 |
0,00005402 |
0,22815187 |
|
7 |
59,7 |
4,0893 |
49 |
28,6251 |
4,069235 |
0,02007 |
0,02325 |
0,000402805 |
0,000540563 |
0,49079305 |
|
8 |
59,6 |
4,0877 |
64 |
32,7016 |
4,070508 |
0,01719 |
0,02165 |
0,000295496 |
0,000468723 |
0,42052988 |
|
36 |
466,7 |
32,5284 |
204 |
146,4313 |
32,5284 |
0 |
0 |
0,003156901 |
0,00322496 |
3,42056294 |
|
Ср. знач4,5 |
58,3375 |
4,06605 |
25,5 |
18,3039 |
4,06605 |
. тогда: a0 = 4,06605 - 4,5?0,00127 = 4,0603.
Таким образом, модель будет иметь вид:
lny
2.1) Определим коэффициент детерминации:
.
2.2) Определим стандартную ошибку:
2.3) Определим значимость модели используя критерий Фишера:
.
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
2.4) Вычислим ошибку аппроксимации:
- в среднем, расчетные значения отклоняются от фактических на 0.43%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Осуществим прогноз на декабрь:
3) Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.4.3. Для удобства расчета проведем замену : 1/у = У
Таблица 3.4.3 - Промежуточные расчеты для модели у = 1/(ао + а1t)
t |
Цена (y) |
У |
tІ |
tУ |
У? |
у-у? |
(у-у?)І |
(У-У?)І |
||
1 |
59,6 |
0,0168 |
1 |
0,0168 |
58,11138 |
1,48862 |
2,21599 |
1,59391 |
2,49768 |
|
2 |
58,5 |
0,0171 |
4 |
0,0342 |
58,16772 |
0,33228 |
0,11041 |
0,02641 |
0,56801 |
|
3 |
58 |
0,0172 |
9 |
0,0516 |
58,22416 |
-0,22416 |
0,05025 |
0,11391 |
0,38649 |
|
4 |
56,4 |
0,0177 |
16 |
0,0708 |
58,28072 |
-1,88072 |
3,53710 |
3,75391 |
3,33461 |
|
5 |
57 |
0,0175 |
25 |
0,0875 |
58,33738 |
-1,33738 |
1,78860 |
1,78891 |
2,34629 |
|
6 |
57,9 |
0,0173 |
36 |
0,1038 |
58,39416 |
-0,49416 |
0,24419 |
0,19141 |
0,85347 |
|
7 |
59,7 |
0,0168 |
49 |
0,1176 |
58,45105 |
1,24895 |
1,55988 |
1,85641 |
2,09205 |
|
8 |
59,6 |
0,0168 |
64 |
0,1344 |
58,50804 |
1,09196 |
1,19237 |
1,59391 |
1,83214 |
|
466,7 |
0,1372 |
204 |
0,6167 |
466,4746 |
0,22538 |
10,69879 |
10,91875 |
13,9107 |
||
Сред знач 4,5 |
58,3375 |
0,01715 |
25,5 |
0,0770875 |
58,30933 |
. тогда : a0 = 0,01715 + 4,5?0,0000167 = 0,017225.
Таким образом, модель будет иметь вид:
2.1) Определим коэффициент детерминации:
.
2.2) Определим стандартную ошибку:
2.3) Определим значимость модели используя критерий Фишера:
.
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
2.4) Вычислим ошибку аппроксимации:
- в среднем, расчетные значения отклоняются от фактических на 1.73%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Осуществим прогноз на декабрь:
Таким образом, лучшей моделью с наименьшей стандартной ошибкой является: lny
Задание 3.5
По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.
Таблица 3.3 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ1) (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
Австралия |
австралийский доллар |
31,01 |
32,72 |
31,55 |
28,96 |
45,91 |
53,12 |
|
2.Австрия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
3.Азербайджан |
азербайджанский манат |
38,11 |
40,98 |
38,74 |
41,78 |
71,84 |
46,74 |
|
4.Армения |
армянский драм |
84,132) |
83,742) |
75,372) |
80,712) |
12,103) |
15,053) |
|
5.Беларусь |
белорусский рубль |
10,162) |
38,564) |
35,344) |
34,314) |
38,804) |
38,954) |
|
6.Бельгия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
7.Германия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
8.Дания |
датская крона |
54,105) |
56,065) |
53,955) |
60,315) |
92,025) |
10,68 |
|
9.Испания |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
10.Италия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
11.Казахстан3) |
тенге |
20,68 |
21,69 |
20,21 |
21,31 |
30,83 |
21,52 |
|
12.Канада |
канадский доллар |
30,49 |
31,57 |
30,54 |
30,55 |
48,40 |
52,57 |
|
13.Киргизия3) |
сом |
64,84 |
69,56 |
64,08 |
66,34 |
95,52 |
94,84 |
|
14. Нидерланды |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
15.Норвегия5) |
норвежская крона |
51,61 |
53,64 |
54,53 |
53,21 |
75,79 |
83,38 |
|
16.Республика Молдова5) |
молдавский лей |
25,07 |
27,52 |
25,10 |
25,08 |
36,03 |
37,06 |
|
17. Соединенное Королевство (Великобритания) |
фунт стерлингов |
47,26 |
49,63 |
48,96 |
53,96 |
87,42 |
107,98 |
|
18.США |
доллар США |
30,48 |
32,20 |
30,37 |
32,73 |
56,26 |
72,88 |
|
19. Таджикистан |
сомони |
69,225) |
67,665) |
63,735) |
69,095) |
10,76 |
10,99 |
|
20.Туркмения |
новый туркменский манат |
10,70 |
11,29 |
10,65 |
11,48 |
19,74 |
21,44 |
|
21.Турция |
турецкая лира |
19,60 |
16,83 |
16,97 |
15,30 |
24,27 |
25,08 |
|
22.Узбекистан2) |
узбекский сум |
18,58 |
17,94 |
15,30 |
14,63 |
23,22 |
26,45 |
|
23.Украина5) |
гривна |
38,28 |
40,05 |
37,59 |
39,72 |
35,56 |
30,46 |
|
24.Финляндия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
25.Франция |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
|
26.Швеция5) |
шведская крона |
44,81 |
46,61 |
46,69 |
50,15 |
72,02 |
87,26 |
|
27.Япония3) |
иена |
37,38 |
41,50 |
35,15 |
31,06 |
47,06 |
60,51 |
1) По данным Банка России.
2) За 1000 единиц национальной валюты.
3) За 100 единиц национальной валюты.
4) За 10 000 единиц национальной валюты.
5) За 10 единиц национальной валюты.
Решение:
Поскольку данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:
руб.
Мода - это значение признака, наиболее часто повторяющееся в совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.
Определим медиану. Ранжируем ряд данных:
30,49; 30,54; 30,55; 31,57; 48,40; 52,57
.
Рассчитаем дисперсию: 149,5130093333 руб.
Определим среднее квадратическое отклонение: 12,2275512403 руб.
Рассчитаем коэффициент вариации:
Таким образом, среднегодовой курс канадского доллара составил 36,518 руб. средним квадратическим отклонением12,2275512403. Дисперсия составила 149,5130093333. Медиана показывает, что курс половины лет не превышал руб., а другой половины - не менее . Коэффициент вариации, равный и превышающий 33,3%, указывает на неоднородность совокупности.
Построим линейную модель связи показателя со временем, которое будет выглядеть следующим образом: , где t - год.
Таблица 3.5 - расчеты данных уравнения тренда.
Год |
t |
y |
t-t? |
y-y? |
(y-y?)*(t- t?) |
(t-tЇ)І |
(y-yЇ)І |
|
2010 |
1 |
30.49 |
-2.5 |
-6.863333 |
17.158333 |
6.25 |
47.1053 |
|
2011 |
2 |
31.57 |
-1.5 |
-5.783333 |
8.675 |
2.25 |
33.4469 |
|
2012 |
3 |
30.54 |
-0.5 |
-6.813333 |
3.4066667 |
0.25 |
46.4215 |
|
2013 |
4 |
30.55 |
0.5 |
-6.803333 |
-3.4016667 |
0.25 |
46.2853 |
|
2014 |
5 |
48.4 |
1.5 |
11.046667 |
16.57 |
2.25 |
122.0288 |
|
2015 |
6 |
52.57 |
2.5 |
15.216667 |
38.041667 |
6.25 |
231.5469 |
|
Сумма |
21 |
224.12 |
0 |
0 |
80.45 |
17.5 |
526.83493 |
|
Среднее значение |
3.5 |
37.35333333 |
.
тогда : a0= 37.35333333- 3,5? = 21.2633
Таким образом, линейная модель имеет вид:
Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса AMD, причем величина прироста ежегодно составляет в среднем руб.
Для анализа полученной модели постоим таблицу.
Таблица 3.5.1 - анализ модели, дополнительные вычисления
у? |
y-y? |
(y-y^)І |
||
25,86047619 |
4,62952381 |
21,4324907 |
15,18374487 |
|
30,45761905 |
1,112380952 |
1,237391383 |
3,523538018 |
|
35,0547619 |
-4,514761905 |
20,38307506 |
14,78311036 |
|
39,65190476 |
-9,101904762 |
82,84467029 |
29,79346894 |
|
44,24904762 |
4,150952381 |
17,23040567 |
8,576347895 |
|
48,84619048 |
3,723809524 |
13,86675737 |
7,08352582 |
|
224,12 |
0 |
156,9947905 |
78,9437359 |
Определим коэффициент детерминации:
.
Таким образом на 29,79% вариация курса обусловлена зависимостью от времени, на 70.21% - влиянием прочих факторов, не включенных в данную модель.
Определим стандартную ошибку:
Определим значимость модели используя критерий Фишера:
.
При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически не значимым.
Далее вычислим ошибку аппроксимации:
- в среднем, расчетные значения отклоняются от фактических на 13.16%. Поскольку ошибка выше 10%, то данное уравнение некачественно описывает тенденцию курса национальной валюты.
Подобные документы
Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.
курсовая работа [91,7 K], добавлен 14.12.2008Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.
учебное пособие [276,4 K], добавлен 23.11.2010Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Объект наблюдения, единица наблюдения, единица совокупности. Вычисление общей, внутригрупповой и межгрупповой дисперсии себестоимости единицы продукции, средней из внутригрупповых. Показатели динамики объема товарооборота. Определение индекса средних цен.
контрольная работа [349,6 K], добавлен 11.12.2009Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.
контрольная работа [59,3 K], добавлен 26.06.2009Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.
контрольная работа [438,8 K], добавлен 06.11.2010Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.
курсовая работа [177,4 K], добавлен 29.10.2015Сводка и группировка. Абсолютные и относительные величины. Расчет соотношения потребленного и вывезенного сахара. Сущность и значение средних показателей. Исчисление средней из интервального ряда распределения по методу моментов. Показатели вариации.
контрольная работа [75,7 K], добавлен 20.09.2013