Множественная регрессия и корреляция

Порядок построения многофакторного регрессионного уравнения, отражающего зависимость нескольких экономических переменных. Применение критерия Стьюдента для оценки значимости коэффициентов. Расчет среднего отклонения расчетных значений от фактических.

Рубрика Экономико-математическое моделирование
Вид лабораторная работа
Язык русский
Дата добавления 28.06.2017
Размер файла 967,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Федеральное государственное автономное образовательное учреждение высшего профессионального образования

«Сибирский федеральный университет»

Институт управления бизнес процессами и экономики

Кафедра Бизнес-информатики

Отчет по лабораторной работе

Множественная регрессия и корреляция

Преподаватель

О.И. Завьялова

Студент УБ 11-09431102396

Б.А. Сычева

Красноярск 2015

Цель работы

Целью лабораторной работы является построение многофакторного регрессионного уравнения, отражающего зависимость нескольких экономических переменных.

Постановка задачи

Требуется проанализировать, как уровень заработной платы в России зависит от ряда факторов. За зависимую переменную взят уровень доходов граждан в России, а в роли независимых переменных выступают: численность населения, минимальный размер оплаты труда (МРОТ), ВВП, индекс потребительских цен, уровень инфляции, уровень безработицы, уровень рождаемости.

Данные взяты с официального сайта территориального органа Федеральной службы государственной статистики по Красноярскому краю http://krasstat.gks.ru/ и представлены в таблице 1.

Таблица 1. Исходные данные

Ход работы

Построение корреляционной матрицы в среде MS Exсel при помощи пакета анализа данных Корреляция. Результаты представлены в таблице 2.

Таблица 2. Корреляционная матрица

На основе корреляционной матрицы необходимо определить попарно зависимые переменные и удалить ту из них, которая имеет наименьшее влияние на у. Таким образом, наиболее значимыми параметрами являются ВВП (х3) и Индекс потребительских цен (х4).

Расчет параметров уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной регрессий.

Линейная регрессия:

При помощи пакета анализа данных Регрессия найдем коэффициенты линейной регрессии по двум оставшимся параметрам.

Применим критерий Стьюдента для оценки значимости коэффициентов.

tтабл=2,20098516

ta=-0,514213753

tb1=16,62411687

tb2=0,535549089

Так как коэффициент второго параметра меньше табличного значения, Индекс потребительских цен (х4) можно убрать из модели и построить линейную модель с одним входящим параметром ВВП (х3).

Проверим полученные коэффициенты на значимость по Стьюденту.

tтабл=2,1788

ta=2,228665981

tb=22,60384361

Статистика по Стьюденту обоих коэффициентов превышает табличное значение, следовательно, они значимы. Чтобы проверить значимость всей модели, применим метод Фишера. Пакет анализа данных Регрессия, помимо расчета t-статистики, также предоставляет коэффициент значимости по Фишеру, который необходимо сравнить с табличным значением.

Fфакт=510,9337458

Fтабл=3,805565253

Фактическое значение значительно превышает табличное, следовательно уравнение регрессии статистически значимо. Визуальное представление на рисунке 1.

Рассчитаем ошибку аппроксимации для полученной модели:

А=6,32%

График полученно линейной зависимости изображен на рисунке 1.

Рисунок 1. Линейная корреляция

Степенная регрессия:

Для нахождения параметров линеаризуем функцию:

Применим критерий Стьюдента для оценки значимости коэффициентов.

tтабл=2,20098516

ta=-0,062536101

tb1=15,09284954

tb2=0,314520408

Так как коэффициент второго параметра меньше табличного значения, Индекс потребительских цен (х4) можно убрать из модели и построить линейную модель с одним входящим параметром ВВП (х3).

Проверим полученные коэффициенты на значимость по Стьюденту.

tтабл=2,20098516

ta=46,40484421

tb=20,21895142

Статистика по Стьюденту обоих коэффициентов превышает табличное значение, следовательно, они значимы. Чтобы проверить значимость всей модели, применим метод Фишера.

Fфакт=408,8059964

Fтабл=3,805565253

Фактическое значение значительно превышает табличное, следовательно уравнение регрессии статистически значимо. Визуальное представление на рисунке 2.

Рассчитаем ошибку аппроксимации для полученной модели:

А=2,99%

График полученного уравнения изображен на рисунке 2.

Рисунок 2. Степенная корреляция

Экспоненциальная регрессия:

Для нахождения параметров линеаризуем функцию:

Применим критерий Стьюдента для оценки значимости коэффициентов.

tтабл=2,20098516

ta=0,412400534

tb1=10,53008245

tb2=0,608091466

Так как коэффициент второго параметра меньше табличного значения, Индекс потребительских цен (х4) можно убрать из модели и построить линейную модель с одним входящим параметром ВВП (х3).

Проверим полученные коэффициенты на значимость по Стьюденту.

tтабл=2,20098516

ta=106,2546707

tb=14,00691087

Статистика по Стьюденту обоих коэффициентов превышает табличное значение, следовательно они значимы. Чтобы проверить значимость всей модели, применим метод Фишера.

Fфакт=196,1935521

Fтабл=3,805565253

Фактическое значение значительно превышает табличное, следовательно уравнение экспоненциальной регрессии статистически значимо. Визуальное представление на рисунке 3.

Рассчитаем ошибку аппроксимации для полученной модели:

А=15,13%

График полученного уравнения изображен на рисунке 3.

Рисунок 3. Экспоненциальная корреляция

Обратная регрессия:

Применим критерий Стьюдента для оценки значимости коэффициентов.

tтабл=2,20098516

ta=0,493422728

tb1= -6,204218864

tb2=-0,34631001

Так как коэффициент свободного параметра и коэффициент первой объясняющей переменной меньше табличного значения, то х4 можно убрать из модели и построить обратную регрессию с одним входящим параметром (х3).

Проверим полученные коэффициенты на значимость по Стьюденту.

tтабл=2,20098516

ta=0,000205002

tb=-0,0000030968469065626

Статистика по Стьюденту обоих коэффициентов меньше табличного значения, следовательно они не значимы. Чтобы проверить значимость всей модели, применим метод Фишера.

Fфакт=70,1602870562202

Fтабл=3,805565253

Фактическое значениепревышает табличное, следовательно, уравнение регрессии статистическизначимо.

Качество уравнений оцените с помощью средней ошибки аппроксимации.

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Допустимый предел значений A - не более 8 - 10%. Рассчитанные показатели представлены на таблице 3.

Таблица 3. Средняя ошибка аппроксимации

№ п/п

Уравнение регрессии

Ошибка аппроксимации

1

Линейное

6,32

2

Степенное

15,13

4

Экспоненциальное

10,37

5

Обратное

100

Таким образом, наименьшую ошибку дает линейная модель.

С помощью F-критерия Фишера определите статистическую надежность результатов регрессионного моделирования. Выберите лучшее уравнение регрессии и дайте его обоснование.

Для исходных данных m=1 (число параметров при переменных х) и n=14 (количество измерений объясняющей переменной).

В таблице значений F-критерия Фишера при уровне значимости б=0,05, значения k1=2 и k2=14 - число степеней свободы, 14 - объём выборочной совокупности, 2 - число оцениваемых по выборке параметров.

Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а. Уровень значимости б - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно б принимается равной 0,05 или 0,01.

Гипотеза H0: уравнение регрессии не значимо.

Гипотеза H1: уравнение регрессии значимо.

Если Fтабл<Fфакт, то H0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл>Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Таблица 5. Значимость уравнений регрессий

№ п/п

Уравнение регрессии

Fтабл критерия Фишера при уровне значимости б=0,05

Fфакт

Значимость уравнения регрессии

1

Линейное

3,805565253

510,9337458

значимо

2

Степенное

3,805565253

408,8059964

значимо

4

Экспоненциальное

3,805565253

196,1935521

значимо

5

Обратное

3,805565253

70,16028706

значимо

По критерию Фишера, наиболее значимым является линейное уравнение регрессии. Именно эту модель и будем использовать для построения прогноза.

Рассчитайте прогнозное значение результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости б=0,05.

Доверительный интервал для параметра а: (0,292583047;2473,748414).

Доверительный интервал для параметра b: (316,7248061;385,9942477).

Прогнозирование:

хпр=хср*1,07=31,62261538

упр=12347,92768

Интерпретация данных: если доходы населения в 2016 году составят 13480 руб., то можно ожидать уровень рождаемости 35272 человек.

Ошибка прогноза:

,

где .

Таким образом, доверительный интервал для прогноза с вероятностью 0,95 равен (10342,54836; 14353,30699).

В ходе выполнения лабораторной работы был проведен многофакторный статистический анализ реальных данных в среде MS Exel, построены линейные и нелинейные модели регрессий и сделан прогноз на основе линейной модели.

При оценке значимости по критерию Фишера, а также по критерию Стьюдента, была выявлена статистическая значимость линейной модели. Следуя из этого, можно заключить, что полученный прогноз правдоподобен.

многофакторный регрессионный уравнение

Размещено на Allbest.ru


Подобные документы

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Расчёт параметров линейного уравнения регрессии. Оценка регрессионного уравнения через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента. Анализ корреляционной матрицы. Расчёт коэффициентов множественной детерминации и корреляции.

    контрольная работа [241,8 K], добавлен 29.08.2013

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Приведение логарифмированием уравнения к линейному виду. Расчет средних значений арифметических переменных и коэффициентов регрессии. Определение средних квадратичных отклонений. Корреляционный анализ экспериментальных данных с помощью критерия Стьюдента.

    контрольная работа [312,7 K], добавлен 10.03.2015

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление коэффициентов регрессии. Определение критериев Стьюдента. Расчет статистических характеристик модели.

    контрольная работа [137,2 K], добавлен 14.09.2009

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

  • Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.

    контрольная работа [994,1 K], добавлен 29.06.2013

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.