Построение линейной модели парной корреляции
Составление сводной таблицы вычислений, выбор лучшей модели, интерпретация рассчитанных характеристик и индекса корреляции. Рассчет прогнозных значений результативного признака, при увеличении прогнозного значения фактора относительно среднего уровня.
Рубрика | Математика |
Вид | задача |
Язык | русский |
Дата добавления | 06.08.2010 |
Размер файла | 339,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Задача 1
По предприятиям легкой промышленности региона получена информация характеризующая зависимость объема выпуска продукции (Y, млн.руб.)от объема капиталовложений (Х, млн.руб.).
Требуется:
1. Для характеристики Y от Х построить следующие модели:
- линейную,
- степенную,
- показательную,
- гиперболическую.
2. Оценить каждую модель, определив:
- индекс корреляции,
- среднюю относительную ошибку,
- коэффициент детерминации,
- F-критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.
5. Результаты расчетов отобразить на графике.
Задание к задаче№1
Таблица 1
y |
32 |
40 |
44 |
28 |
50 |
56 |
50 |
|
х |
60 |
68 |
80 |
76 |
74 |
87 |
96 |
Решение:
1. Построение линейной модели парной корреляции.
Определим линейный коэффициент парной корреляции по следующей формуле:
По данным вычислениям видно, что связь между объемом капиталовложений и выпуском продукции прямая и достаточно сильная.
Уравнение линейной регрессии имеет вид:
Уравнение линейной регрессии имеет вид:
С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличивается в среднем на 558 тыс.руб. Это свидетельствует об прямой связи данных показателей и эффективности работы предприятия.
Расчеты производились исходя из данных, указанных в таблице 2,3
Таблица 2
№п/п |
Y |
X |
Y-Yср |
(Y-Yср)кв |
X-Xср |
(X-Xср)кв |
(Y-Yср)(X-Xср) |
|
1 |
32 |
60 |
-10,857 |
117,878 |
-17,286 |
298,796 |
187,673 |
|
2 |
40 |
68 |
-2,857 |
8,163 |
-9,286 |
86,224 |
26,531 |
|
3 |
44 |
80 |
1,143 |
1,306 |
2,714 |
7,367 |
3,102 |
|
4 |
28 |
76 |
-14,857 |
220,735 |
-1,286 |
1,653 |
19,102 |
|
5 |
50 |
74 |
7,143 |
51,020 |
-3,286 |
10,796 |
-23,469 |
|
6 |
56 |
87 |
13,143 |
172,735 |
9,714 |
94,367 |
127,673 |
|
7 |
50 |
96 |
7,143 |
51,020 |
18,714 |
350,224 |
133,673 |
|
Сумма |
300 |
541 |
0,000 |
622,857 |
0,000 |
849,429 |
474,286 |
|
Среднее |
42,86 |
77,29 |
|
88,980 |
|
121,347 |
67,755 |
Таблица 3
№п/п |
YX |
Xкв |
Yкв |
В |
А |
Yрасч |
е=Y-Yрасч |
e/Y*100% |
|
1 |
1920,000 |
3600,000 |
1024,000 |
0,558 |
-0,268 |
33,212 |
-1,212 |
-3,788 |
|
2 |
2720,000 |
4624,000 |
1600,000 |
|
|
37,676 |
2,324 |
5,810 |
|
3 |
3520,000 |
6400,000 |
1936,000 |
|
|
44,372 |
-0,372 |
-0,845 |
|
4 |
2128,000 |
5776,000 |
784,000 |
|
|
42,140 |
-14,140 |
-50,500 |
|
5 |
3700,000 |
5476,000 |
2500,000 |
|
|
41,024 |
8,976 |
17,952 |
|
6 |
4872,000 |
7569,000 |
3136,000 |
|
|
48,278 |
7,722 |
13,789 |
|
7 |
4800,000 |
9216,000 |
2500,000 |
|
|
53,300 |
-3,300 |
-6,600 |
|
Сумма |
23660,000 |
42661,000 |
13480,000 |
|
|
300,002 |
-0,002 |
-24,182 |
|
Среднее |
3380,000 |
6094,429 |
1925,714 |
|
|
42,857 |
|
-3,455 |
Рассчитаем коэффициент детерминации:
Вариация результата Y (объема выпуска продукции) на 99,8% объясняется вариацией фактора Х (объем капиталовложений).
Оценку значимости равнения регрессии проведем с помощь. F-критерия Фишера:
для ; , .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. .
Определим среднюю относительную ошибку:
Данный показатель отражает на сколько в среднем расчетные значения для линейной модели отличаются от фактических значений (на 3,455%).
2. Построение степенной модели парной регрессии.
Уравнение степенной модели имеет вид: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
.
Таблица 4
№п/п |
Факт Y(t) |
lg (Y) |
Переменная Х(t) |
lg (X) |
|
1 |
32 |
1,505 |
60 |
1,778 |
|
2 |
40 |
1,602 |
68 |
1,833 |
|
3 |
44 |
1,643 |
80 |
1,903 |
|
4 |
28 |
1,447 |
76 |
1,881 |
|
5 |
50 |
1,699 |
74 |
1,869 |
|
6 |
56 |
1,748 |
87 |
1,940 |
|
7 |
50 |
1,699 |
96 |
1,982 |
|
Сумма |
300 |
11,344 |
541 |
13,186 |
|
Среднее |
42,857 |
1,621 |
77,286 |
1,884 |
Обозначим Y=lg, Х=lgx, А=lga.
Тогда уравнение имеет вид: Y=A+bX - линейное уравнение регрессии.
Рассчитаем его параметры, используя таблицу 5.
Уравнение регрессии будет иметь вид: .
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения и получим уравнение степенной модели регрессии.
.
Определим индекс корреляции:
Связь между показателем и фактором можно считать средней по силе.
Рассчитаем коэффициент детерминации:
Вариация результата Y (объема выпуска продукции) на 41,7% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
для ; , .
Средняя относительная ошибка:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,287%.
3. Построение показательной функции.
Уравнение показательной кривой: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
, обозначим: , , .
Получим линейное уравнение регрессии: .
Рассчитаем его параметры, используя данные таблицы 6.
Уравнение будет иметь вид: .
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Определим индекс корреляции:
Данный показатель характеризует среднюю связь между показателем и фактором.
Индекс детерминации:
Вариация результата Y на 40,7% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
для ; , .
Средняя относительная ошибка:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,231%.
4. Построение гиперболической функции.
Уравнение гиперболической функции: .
Произведем линеаризацию модели путем замены Х=1/х.
В результате получим линейное уравнение: .
Получим следующие уравнение гиперболической модели: .
Определим индекс корреляции:
Исходя их данного показателя силу связи можно оценить средним уровнем.
Индекс детерминации:
=0,421
То есть вариация результата Y (объема выпуска продукции) на 42,1% объясняется вариацией фактора Х (объемом капиталовложений).
Рассчитаем F-критерий Фишера:
для ; , .
Средняя относительная ошибка:
В среднем расчетные значения у для гиперболической модели отличаются от фактических значений на 0,0082%.
Для выбора лучшей модели построим сводную таблицу результатов:
В качестве лучшей модели для построения прогноза можно взять линейную модель, так как она имеет большее значение F-критерия Фишера и коэффициента детерминации.
Расчет прогнозного значения результативного показателя:
Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению линейной модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений.
По условию нужно рассчитать прогнозное значение результативного признака (объема выпускаемой продукции), если прогнозное значение фактора увеличится на 110% относительно среднего уровня. Средний уровень значения фактора (объема капиталовложений-Х) составляет 77,29млн. руб.
При увеличении на 110% он составит 85,019 млн.руб.:
Из этого уравнения следует, что при увеличении объема капиталовложений на 110% относительно среднего уровня объем выпуска продукции повысится в среднем до 47,708 млн.руб.
Фактический, расчетные и прогнозные значения по лучшей модели отобразим на графике:
Задача 2
По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (), ставки по депозитам () и размера внутрибанковских расходов ().
Требуется:
1. Осуществить отбор факторных признаков для построения двухфакторной регрессионной модели.
2. Рассчитать параметры модели.
3. Для характеристики модели определить:
- линейный коэффициент множественной корреляции,
- коэффициент детерминации,
- средние коэффициенты эластичности,
- бета-, дельта - коэффициенты.
Дать их интерпретацию.
4. Осуществить оценку надежности уравнения регрессии.
5. Оценить с помощь t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
6. Построить точечный и интервальный прогнозы результирующего показателя.
7. Отразить результаты расчетов на графике.
Задание к задаче 2.
Таблица 1
Объем прибыли Y |
Ставки по кредитам |
Ставки по депозитам |
Внутрибанковские расходы |
|
50 |
22 |
176 |
150 |
|
54 |
30 |
170 |
154 |
|
60 |
20 |
156 |
146 |
|
62 |
32 |
172 |
134 |
|
70 |
44 |
162 |
132 |
|
54 |
34 |
160 |
126 |
|
84 |
52 |
166 |
134 |
|
82 |
56 |
156 |
126 |
|
86 |
66 |
152 |
88 |
|
84 |
68 |
138 |
120 |
1. Выбор факторных признаков для построения двухфакторной модели регрессии.
n=10, m=3
С помощью MS Excel проведем корреляционный анализ. Результаты корреляционного анализа представлены в таблице 2.
Таблица 2
|
Объем прибыли Y |
Ставки по кредитам |
Ставки по депозитам |
Внутрибанковские расходы |
|
Объем прибыли Y |
1 |
|
|
|
|
Ставки по кредитам |
0,925 |
1 |
|
|
|
Ставки по депозитам |
-0,645 |
-0,705 |
1 |
|
|
Внутрибанковские расходы |
-0,705 |
-0,793 |
0,606 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает что Y имеет тесную связь со всеми факторами но между факторами Х1 и Х3 связь теснее а значит можно говорить о мультиколлинеарности этих факторов поэтому мы выбираем фактор Х2
1. Выбор вида модели и оценка ее параметров.
С помощью MS Excel проведем регрессионный анализ, результаты отразим в таблицах 3, 4, 5, 6.
Таблица 3
Регрессионная статистика |
||
Множественный R |
0,925 |
|
R-квадрат |
0,855 |
|
Нормированный R-квадрат |
0,813 |
|
Стандартная ошибка |
6,190 |
|
Наблюдения |
10,000 |
Таблица 4
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
|
Регрессия |
2,000 |
1580,193 |
790,097 |
20,621 |
|
Остаток |
7,000 |
268,207 |
38,315 |
||
Итого |
9,000 |
1848,400 |
|
|
|
Таблица 5
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
Y-пересечение |
33,295 |
47,311 |
0,704 |
|
X1 |
0,767 |
0,167 |
4,604 |
|
X2 |
0,017 |
0,261 |
0,066 |
Таблица 6
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
|
1,000 |
53,220 |
-3,220 |
|
2,000 |
59,251 |
-5,251 |
|
3,000 |
51,340 |
8,660 |
|
4,000 |
60,819 |
1,181 |
|
5,000 |
69,848 |
0,152 |
|
6,000 |
62,145 |
-8,145 |
|
7,000 |
76,052 |
7,948 |
|
8,000 |
78,946 |
3,054 |
|
9,000 |
86,545 |
-0,545 |
|
10,000 |
87,835 |
-3,835 |
Уравнение регрессии зависимости объема прибыли от Ставки по кредитам и Ставки по депозитам можно записать в следующем виде:
у=33,295+0,767х1+0,017х2
2. Оценка качества модели.
В таблице 14 приведены вычисленные по модели значения Y и значения остаточной компоненты.
Рис.2
Вычислим для модели коэффициент детерминации.
Этот коэффициент уже вычислен нами и находится в таблице 3.
R2 = 0,855
Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
Fтабл мы вычисляем с помощью функции FРАСПОБР
Fтабл = 4,737
Fрасч уже вычислено и находится в таблице 4
Fрасч = 20,621
Поскольку .Ррасч > Ртабл, уравнение регрессии следует признать адекватным.
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые соответственно рассчитываются по формулам:
Эj = аj*xср j / yср
= ai * Sxi / Sy
Таблица 7
S2y |
205,3778 |
|
S2x1 |
304,7111 |
|
S2x2 |
123,7333 |
Э1 = 0,767*42,4/68,6 = 0,474
Э2 = 0,017*160,8/68,6 = 0,040
= 0,767 * 304,7111 / 205,3778 = 1,138
= 0,017 * 123,7333 / 205,3778 = 0,010
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных.
2. Оценка статистической значимости
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии а,, а2 приведены в четвертом столбце таблицы 5.
Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЫОДРАСПОБР
tтабл=2,36462256
tрасч=0,704
tрасч =4,604критерий статистически значим
tрасч =0,066
3. Точечный и интервальный прогноз
Прогноз показателя «Ставка по кредитам»
Рис
Прогноз показателя «Ставка по депозитам»
Рис.2
Подобные документы
Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.
курсовая работа [862,4 K], добавлен 06.05.2009Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Аппроксимация функции y = f(x) линейной функцией y = a1 + a2x. Логарифмирование заданных значений. Расчет коэффициентов корреляции и детерминированности. Построение графика зависимости и линии тренда. Числовые характеристики коэффициентов уравнения.
курсовая работа [954,7 K], добавлен 10.01.2015Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.
контрольная работа [178,0 K], добавлен 23.11.2013Обработка данных измерений величин и представление результатов с нужной степенью вероятности. Определение среднего арифметического и вычисление среднего значения измеренных величин. Выявление грубых ошибок. Коэффициенты корреляции. Косвенные измерения.
реферат [116,2 K], добавлен 16.02.2016Основные правила расчета значений дифференциального уравнения. Изучение выполнения оценки погрешности вычислений, осуществления аппроксимации решений. Разработка алгоритма и написание соответствующей программы. Построение интерполяционного многочлена.
курсовая работа [212,6 K], добавлен 11.12.2013Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.
курсовая работа [575,5 K], добавлен 19.05.2015Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Обзор адаптивных методов прогнозирования. Построение модели Брауна. Применение методов прогнозирования на примере СПК колхоза "Новоалексеевский" в рамках модели авторегрессии и проинтегрированного скользящего среднего, предложенной Боксом и Дженкинсом.
дипломная работа [9,0 M], добавлен 28.06.2011