Парная и множественная регрессия
Вычисление коэффициентов регрессии и выявление тенденции развития процессов. Обработка табличных данных. Отчет кредитной организации о прибыли, убытка. Корреляционный анализ. Парная и множественная регрессии. Решение математических задач средствами Excel.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 05.06.2022 |
Размер файла | 91,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Контрольная работа
Парная и множественная регрессия
Введение
Статистический анализ позволяет выявлять связи между различными процессами, определять, насколько закономерны или случайны наблюдаемые зависимости, а также прогнозировать развитие процессов во времени, или при неких значениях влияющих факторов.
В данной работе, на примере отчёта коммерческого банка, выполнен корреляционный анализ, выявлены связи между различными доходами и расходами, а также вычислены коэффициенты регрессии для парной и множественной регрессии.
1. Вычисление коэффициентов регрессии и выявление тенденции развития процессов
Одна из важных функций статистики - на основании собранных данных делать прогноз на будущие периоды. Для того, чтобы иметь возможность сделать прогноз, нужно построить аппроксимирующую функцию. В данной работе рассматривается построение парной и множественной регрессии
При вычислении коэффициентов регрессии используется метод наименьших квадратов. Его принцип заключается в том, что если аппроксимирующую функцию изобразить на графике вместе с измеренными значениями параметров, то должна быть минимальной сумма квадратов расстояний от точек, соответствующих измеренным значениям, до линии тренда.
В методе наименьших квадратов использовано свойство экстремума функции: в точке экстремума производная функции равна нулю. Записав формулу суммы квадратов расстояний и найдя её производную, а потом приравняв производную нулю, получаем уравнение относительно коэффициентов аппроксимирующей функции. Решение этого уравнения даёт возможность вычислить коэффициенты и составить аппроксимирующую функцию. Все эти математические преобразования сделаны при разработке методики, и вычисление аппроксимирующей функции сводится в выбору её вида, к заполнению вспомогательной таблицы результатами элементарных вычислений и к расчёту коэффициентов.
Ошибки аппроксимации вычисляются как квадратный корень из среднего значения суммы квадратов.
Построение линии тренда можно выполнить вручную, а можно воспользоваться возможностями программного пакета Excel.
2. Обработка табличных данных
Исходные данные для статистического анализа содержатся в таблице 1.
Таблица 1 Фрагмент отчёта кредитной организации о прибыли и убытках, ОАО Севзапинвестбанк, форма 102, квартальная (с нарастающими итогами в течение года)
Квартал года |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
3/2007 |
361 |
52179 |
2466 |
9513 |
1187 |
2192 |
16321 |
13796 |
22 |
4531 |
43488 |
|
4/2007 |
498 |
78021 |
2967 |
11705 |
1388 |
2898 |
19552 |
21545 |
22 |
9198 |
53962 |
|
1/2008 |
134 |
32634 |
737 |
2087 |
887 |
762 |
3493 |
4782 |
97 |
3750 |
6122 |
|
2/2008 |
1411 |
66850 |
1487 |
4818 |
1503 |
1283 |
6552 |
7459 |
141 |
7297 |
10954 |
|
3/2008 |
2285 |
98965 |
2317 |
7212 |
1995 |
1717 |
9098 |
9914 |
185 |
10586 |
16679 |
|
4/2008 |
3129 |
129879 |
3246 |
8713 |
2837 |
2172 |
12577 |
16130 |
185 |
13382 |
13698 |
|
1/2009 |
738 |
28481 |
922 |
2981 |
886 |
433 |
1860 |
21342 |
7 |
3439 |
21304 |
|
2/2009 |
1356 |
55781 |
1761 |
5399 |
1285 |
870 |
3513 |
24608 |
8 |
6427 |
4274 |
|
3/2009 |
1828 |
82492 |
2538 |
10848 |
2012 |
13071 |
5344 |
29140 |
8 |
8932 |
7096 |
|
4/2009 |
2195 |
104791 |
3168 |
15148 |
2718 |
1726 |
7558 |
37114 |
9 |
10478 |
7123 |
|
1/2010 |
261 |
18472 |
613 |
4256 |
641 |
400 |
1697 |
3588 |
0 |
1898 |
6954 |
|
2/2010 |
465 |
34060 |
1293 |
6818 |
1174 |
770 |
3556 |
8936 |
0 |
4044 |
7969 |
|
3/2010 |
608 |
46650 |
1979 |
10591 |
2229 |
1130 |
5555 |
2588 |
0 |
5989 |
3497 |
|
4/2010 |
677 |
61650 |
2567 |
19137 |
4366 |
1448 |
8013 |
30949 |
0 |
7786 |
16836 |
|
1/2011 |
22 |
17056 |
363 |
8775 |
4515 |
310 |
1572 |
2212 |
0 |
1985 |
1874 |
|
2/2011 |
28 |
32741 |
870 |
49442 |
5758 |
624 |
3558 |
5620 |
0 |
3853 |
-3420 |
1 - процентные доходы по предоставленным кредитам негосударственным финансовым организациям
2 - процентные доходы по предоставленным кредитам негосударственным коммерческим организациям
3 - процентные доходы по предоставленным кредитам физическим лицам
4 - процентные доходы по предоставленным кредитам кредитным организациям
5 - доходы по вложениям в долговые обязательства РФ
6 - доходы по вложениям в долговые обязательства РФ
7 - доходы от ведения счетов, расчётного и кассового обслуживания
8 - доходы от продажи валюты
9 - расходы по процентам за привлечённые кредиты
10 - расходы по процентам, выплаченным физическим лицам
11 - прибыль банка после налогообложения
Преобразуем таблицу, заменив возрастающий результат в течение года конкретными значениями по кварталам.
Вычислим средние значения, средние линейные отклонения, дисперсию,
Таблица 2
Квартал года |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
3/2007 |
361 |
52179 |
2466 |
9513 |
1187 |
2192 |
16321 |
13796 |
22 |
4531 |
43488 |
|
4/2007 |
137 |
25842 |
501 |
2192 |
201 |
706 |
3231 |
7749 |
0 |
4667 |
10474 |
|
1/2008 |
134 |
32634 |
737 |
2087 |
887 |
762 |
3493 |
4782 |
97 |
3750 |
6122 |
|
2/2008 |
1277 |
34216 |
750 |
2731 |
616 |
521 |
3059 |
2677 |
44 |
3547 |
4832 |
|
3/2008 |
874 |
32115 |
830 |
2394 |
492 |
434 |
2546 |
2455 |
44 |
3289 |
5725 |
|
4/2008 |
844 |
30914 |
929 |
1501 |
842 |
455 |
3479 |
6216 |
0 |
2796 |
-2981 |
|
1/2009 |
738 |
28481 |
922 |
2981 |
886 |
433 |
1860 |
21342 |
7 |
3439 |
21304 |
|
2/2009 |
618 |
27300 |
839 |
2418 |
399 |
437 |
1653 |
3266 |
1 |
2988 |
-17030 |
|
3/2009 |
472 |
26711 |
777 |
5449 |
727 |
12201 |
1831 |
4532 |
0 |
2505 |
2822 |
|
4/2009 |
367 |
22299 |
630 |
4300 |
706 |
-11345 |
2214 |
7974 |
1 |
1546 |
27 |
|
1/2010 |
261 |
18472 |
613 |
4256 |
641 |
400 |
1697 |
3588 |
0 |
1898 |
6954 |
|
2/2010 |
204 |
15588 |
680 |
2562 |
533 |
370 |
1859 |
5348 |
0 |
2146 |
1015 |
|
3/2010 |
143 |
12590 |
686 |
3773 |
1055 |
360 |
1999 |
-6348 |
0 |
1945 |
-4472 |
|
4/2010 |
69 |
15000 |
588 |
8546 |
2137 |
318 |
2458 |
28361 |
0 |
1797 |
13339 |
|
1/2011 |
22 |
17056 |
363 |
8775 |
4515 |
310 |
1572 |
2212 |
0 |
1985 |
1874 |
|
2/2011 |
6 |
15685 |
507 |
40667 |
1243 |
314 |
1986 |
3408 |
0 |
1868 |
-5294 |
|
Ср .зн. |
408 |
25443 |
801 |
6509 |
1067 |
554 |
3204 |
6960 |
14 |
2794 |
5512 |
|
Лин.откл |
297 |
7676 |
248 |
5183 |
602 |
1706 |
1714 |
5553 |
19 |
832 |
8602 |
|
Дисп. |
211087560 |
206088578 |
51833691 |
51466914 |
9614461 |
16982118 |
42122358 |
44805271 |
2472139 |
87801362 |
176527235 |
|
Ср.кв. откл. |
14529 |
14356 |
7200 |
7174 |
3101 |
4121 |
6490 |
6694 |
1572 |
9370 |
13286 |
Построим графики:
Рис.1. Графики доходов и расходов банка, построенные на основании данных
По графику можно проследить тенденцию изменения параметров, примерно определить наличие связи между теми или иными процессами. Для того, чтобы
3. Корреляционный анализ
Рассчитаем коэффициенты корреляции между доходами, расходами, прибылью банка, а также тесноту связи между влияющими факторами.
Линейный коэффициент корреляции может быть рассчитан по формуле:
Существует методика ручного расчета, при котором требуется составление вспомогательной таблицы.
Построим вспомогательную таблицу для расчета.
Таблица 3. Вспомогательная таблица для расчёта коэффициента корреляции между показателями 1 и 2
Квартал года |
1 |
2 |
||||||
3/2007 |
361 |
52179 |
-47 |
26736 |
2209 |
7,15E+08 |
-1256592 |
|
4/2007 |
137 |
25842 |
-271 |
399 |
73441 |
159201 |
-108129 |
|
1/2008 |
134 |
32634 |
-274 |
7191 |
75076 |
51710481 |
-1970334 |
|
2/2008 |
1277 |
34216 |
869 |
8773 |
755161 |
76965529 |
7623737 |
|
3/2008 |
874 |
32115 |
466 |
6672 |
217156 |
44515584 |
3109152 |
|
4/2008 |
844 |
30914 |
436 |
5471 |
190096 |
29931841 |
2385356 |
|
1/2009 |
738 |
28481 |
330 |
3038 |
108900 |
9229444 |
1002540 |
|
2/2009 |
618 |
27300 |
210 |
1857 |
44100 |
3448449 |
389970 |
|
3/2009 |
472 |
26711 |
64 |
1268 |
4096 |
1607824 |
81152 |
|
4/2009 |
367 |
22299 |
-41 |
-3144 |
1681 |
9884736 |
128904 |
|
1/2010 |
261 |
18472 |
-147 |
-6971 |
21609 |
48594841 |
1024737 |
|
2/2010 |
204 |
15588 |
-204 |
-9855 |
41616 |
97121025 |
2010420 |
|
3/2010 |
143 |
12590 |
-265 |
-12853 |
70225 |
1,65E+08 |
3406045 |
|
4/2010 |
69 |
15000 |
-339 |
-10443 |
114921 |
1,09E+08 |
3540177 |
|
1/2011 |
22 |
17056 |
-386 |
-8387 |
148996 |
70341769 |
3237382 |
|
2/2011 |
6 |
15685 |
-402 |
-9758 |
161604 |
95218564 |
3922716 |
Средние значения показателей:
= 408; = 25443
Вычисление коэффициента корреляции с использованием аппарата Excel дают такой же результат. Применим функцию КОРРЕЛ(), занесём в открывшееся окно сравниваемые массивы данных, получаем значение 0,904.
Коэффициент корреляции от 0,3 до 0,5 определяется как слабая связь, от 0,5 до 0,7 - средняя, от 0,7 до 1 - сильная. В данном случае коэффициент корреляции 0,904, это соответствует сильной связи.
Для того, чтобы проверить, является ли полученное значение статистически значимым, сравним его с критическим значением распределения Стьюдента.
Воспользуемся формулой:
Вычислим t для значения rxy 0.904
Полученные значения сравним с критическими значениями распределения Стьюлента. Воспользуемся аппаратом Excel.
Для уровня значимости 0,01 и количества степеней свободы 16 вычисляем функцию СТЬЮДРАСПОБР(0,01; 16)=2,9.
Если выбрать понизить требования и выбрать уровень значимости 0,05, то СТЬЮДРАСПОБР(0,01; 16)=2,1.
Оба значения меньше вычисленного значения t.
Это свидетельствует о том, что корреляция в данном случае является статистически значимой.
Современные компьютерные программы позволяют сделать эти вычисления быстро.
Вычислим коэффициент корреляции с помощью аппарата Excel. Для вычисления корреляции между парами значений можно применять функцию КОРРЕЛ(), Занесём в диалоговое окно ряды данных 1 и 2,, получаем значение корреляции 0,904
Для того, чтобы определить корреляцию между несколькими выборками, воспользуемся надстройкой Excel. Выберем в меню Сервис > Анализ данных > Корреляция. Введём диапазон значений, приведенных в таблице 2, и получим результат, приведенный в Таблице 4.
Таблица 4. Коэффициенты корреляции
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
Столбец 1 |
1,000 |
||||||||||
Столбец 2 |
0,907 |
1,000 |
|||||||||
Столбец 3 |
0,680 |
0,885 |
1,000 |
||||||||
Столбец 4 |
-0,189 |
-0,030 |
0,016 |
1,000 |
|||||||
Столбец 5 |
-0,060 |
0,032 |
-0,002 |
0,794 |
1,000 |
||||||
Столбец 6 |
0,338 |
0,369 |
0,404 |
-0,009 |
-0,059 |
1,000 |
|||||
Столбец 7 |
0,260 |
0,590 |
0,760 |
0,012 |
-0,101 |
0,161 |
1,00 |
||||
Столбец 8 |
0,459 |
0,530 |
0,668 |
0,027 |
0,013 |
0,424 |
0,27 |
1,000 |
|||
Столбец 9 |
0,628 |
0,589 |
0,252 |
-0,263 |
-0,136 |
-0,046 |
0,28 |
-0,194 |
1,00 |
||
Столбец 10 |
0,879 |
0,986 |
0,887 |
-0,010 |
0,062 |
0,369 |
0,57 |
0,543 |
0,56 |
1,00 |
|
Столбец 11 |
-0,044 |
0,227 |
0,466 |
-0,201 |
-0,356 |
0,070 |
0,84 |
0,247 |
0,05 |
0,22 |
В результате расчёта получена корреляционная матрица, по которой можно оценить наличие и тесноту связи между различными выборками данных. На таблице цветом выделены значения сильной и средней корреляции. Можно отметить, что не все последовательности коррелируют друг с другом; например, выборка под номером 6 (доходы по вложениям в долговые обязательства РФ) не обнаруживает значимой связи с другими данными, выборка 11 (прибыль после налогообложения) имеет достаточно тесную связь с выборкой 7 (доходы от ведения счетов, расчётного и кассового обслуживания). Наиболее тесная связь существует между выборками 2 и 10 (процентные доходы по предоставленным кредитам негосударственным коммерческим организациям и расходы по процентам, выплаченным физическим лицам). Также сильная связь наблюдается между выборками 1 и 2, 2 и 3, 4 и 5.
Для того, чтобы проверить, являются ли полученные значения статистически значимыми, сравним их с критическим значением распределения Стьюдента.
Воспользуемся формулой:
Для уровня значимости 0,05 и количества степеней свободы 11 вычисляем функцию СТЬЮДРАСПОБР(0,05; 11)=2,2.
Вычислим t для значений rxy =0.9, 0.52, 0.5
Полученные значения сравним с критическими значениями распределения Стьюдента (2,2). Коэффициент корреляции меньше 0,52 не является значимым для выборки из 11 значений.
4. Парная регрессия
Парная регрессия показывает связь между факторным и результативным признаком в виде: y=ax+b
Выберем в качестве факторного признака выборку 1, а в качестве результативного - выборку 2. Между этими рядами данных существует
Составим уравнение регрессии с помощью программы Excel. Выберем опции Сервис - Анализ данных - Регрессия. В открывшемся окне укажем диапазоны данных. Получаем результаты:
Таблица 5
Множественный R |
0,907196806 |
||
R-квадрат |
0,823006045 |
||
Нормированный R-квадрат |
0,81036362 |
||
Стандартная ошибка |
406,39437 |
||
Наблюдения |
16 |
||
Дисперсионный анализ |
|||
df |
SS |
||
Регрессия |
1 |
10751473,62 |
|
Остаток |
14 |
2312189,376 |
|
Итого |
15 |
13063663 |
Таблица 6
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-512,609 |
213,207 |
-2,404 |
0,031 |
-969,892 |
-55,327 |
-969,892 |
-55,327 |
|
Переменная X 1 |
0,026 |
0,003 |
8,068 |
0,000 |
0,019 |
0,033 |
0,019 |
0,033 |
Оценим значимость и точность регрессии. Значение F из таблицы Дисперсионный анализ сравним с критической границей критерия - Значимость F. Поскольку F> Значимость F, регрессия является значимой.
5. Множественная регрессия
Рассмотрим уравнение регрессии, в котором значение 10 записывается как функция от значений выборок 2 и 3.
Уравнение регрессии ищем в следующем виде:
Z=Ax+By+C
Применим метод наименьших квадратов. Уравнение запишем в виде:
Коэффициенты A, B вычисляются по формулам:
- коэффициенты корреляции, соответственно между элементами x и z, y и z, x и y,
- средние квадратические отклонения.
Выборочный совокупный коэффициент корреляции:
То есть
Используем функции из библиотеки Excel для нахождения средних и среднеквадратичных значений по трём столбцам.
Подставляя значения в формулы, получаем коэффициенты регрессии:
А=;
0.23
Подставив коэффициенты в уравнение и преобразовав его, найдём С: С= 0
Получается уравнение: z=-0,093x+0.23y
Подставим значения x, y и вычислим z в диапазоне значений. Соответствие аппроксимации и исходных данных хорошее, на графике присутствуют реальная выборка и аппроксимирующая функция.
Рисунок 2
Заключение
Выполнен корреляционный анализ данных, относящихся к деятельности коммерческого банка. На основании таблицы, включающей различные доходы и расходы банка, построена корреляционная матрица. Использование программы Excel позволило оперативно коэффициенты корреляции между 11 выборками значений.
Определены статьи доходов и расходов, между которыми существует значимая связь. Критерием значимости корреляции является сравнение с критическим значением распределения Стьюдента, также вычисленного в рамках программы Excel. В частности, отмечена слабая связь прибыли после налогообложения со статьями дохода и расхода, но при этом имеется сильная связь между некоторыми статьями дохода.
Для построения линий тренда парной и множественной регрессии взяты выборки, между которыми наблюдается значимая связь.
Параметры парной регрессии определены с помощью надстройки Excel Регрессия.
Параметры множественной регрессии вычислены по формулам, с использованием коэффициентов корреляции, полученных на этапе корреляционного анализа. Составлено уравнение множественной регрессии. Результаты, вычисленные при подстановке значений влияющих факторов в уравнение регрессии, достаточно точно соответствуют реальным значениям зависимого параметра.
регрессия прибыль математический корреляционный
Литература
1. Шмойлова Р.А. и др. Теория статистики. М. Финансы и статистика 2007
2. Поллард Дж. Справочник по вычислительным методам в статистике. - М. Финансы и статистика 1982.
3. Гельман В.Я. Решение математических задач средствами Excel. -СПб: Питер, 2001
4. Макарова Н.В., Трофимец В.Я., Статистика в Excel -М. Финансы и статистика, 2003.
5. Чёрный В.В. Практикум по дисциплине «Теория статистики» - СПб: БАТиП, 2008.
Размещено на Allbest.ru
Подобные документы
Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
контрольная работа [814,0 K], добавлен 19.12.2013Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.
контрольная работа [99,4 K], добавлен 22.07.2009Показатели тесноты связи. Смысл коэффициентов регрессии и эластичности. Выявление наличия или отсутствия корреляционной связи между изучаемыми признаками. Расчет цепных абсолютных приростов, темпов роста абсолютного числа зарегистрированных преступлений.
контрольная работа [1,5 M], добавлен 02.02.2014Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015