Многомерный регрессионный анализ
Определение набора возможных независимых переменных. Исключение переменных, не имеющих существенного отношения к решению поставленной задачи. Выбор окончательного вида уравнения с "наилучшими" независимыми переменными для решения поставленной задачи.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 07.05.2012 |
Размер файла | 28,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Лабораторная работа
Тема: Многомерный регрессионный анализ
Цель работы: приобретение практических навыков построения уравнения многомерной регрессии предлагаемой социально-экономической ситуации с помощью инструмента анализа данных Excel.
Задачи:
· Определение набора возможных независимых переменных.
· Исключение переменных, не имеющих существенного отношения к решению поставленной задачи (если переменная характеризуется значительными ошибками измерения, дублирует другие независимые переменные (мультиколлинеарность), точные данные по ней недоступны);
· Выбор окончательного вида уравнения с «наилучшими» независимыми переменными, при этом решается задача обеспечения наилучшего прогноза с наименьшими затратами.
Ход решения для построения модели многомерной регрессии:
переменная уравнение задача независимый
Исходные данные
Объем продаж за месяц (в единицах) Y |
Результат теста способностей X1 |
Возраст X2 |
Результат теста тревожности X3 |
Опыт работы X4 |
Средний балл школьного аттестата X5 |
|
44 |
10 |
22,1 |
4,9 |
0 |
2,4 |
|
47 |
19 |
22,5 |
3,0 |
1 |
2,6 |
|
60 |
27 |
23,1 |
1,5 |
0 |
2,8 |
|
71 |
31 |
24 |
0,6 |
3 |
2,7 |
|
61 |
64 |
22,6 |
1,8 |
2 |
2,0 |
|
60 |
81 |
21,7 |
3,3 |
1 |
2,5 |
|
58 |
42 |
22 |
3,2 |
0 |
2,5 |
|
56 |
67 |
22,4 |
2,1 |
0 |
2,3 |
|
66 |
48 |
22,6 |
6,0 |
1 |
2,8 |
|
61 |
64 |
21,1 |
1,8 |
1 |
3,4 |
|
51 |
57 |
22,5 |
3,8 |
0 |
3,0 |
|
47 |
10 |
22,2 |
4,5 |
1 |
2,7 |
|
53 |
48 |
24,8 |
4,5 |
0 |
2,8 |
|
74 |
96 |
24,8 |
0.1 |
3 |
3,8 |
|
65 |
75 |
22,6 |
0,9 |
0 |
3,7 |
|
33 |
12 |
20,5 |
4,8 |
0 |
2,1 |
|
54 |
47 |
21,9 |
2,3 |
1 |
1,8 |
1. На первом этапе оценивается показатель вариации каждого признака. Для этого необходимо составить сводную таблицу основных статистических характеристик для одного или нескольких массивов данных.
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|||||||
Среднее |
56,53 |
Среднее |
46,94 |
Среднее |
22,55 |
Среднее |
2,89 |
Среднее |
0,82 |
Среднее |
2,7 |
|
Стандартная ошибка |
2,49 |
Стандартная ошибка |
6,31 |
Стандартная ошибка |
0,27 |
Стандартная ошибка |
0,41 |
Стандартная ошибка |
0,24 |
Стандартная ошибка |
0,13 |
|
Медиана |
58 |
Медиана |
48 |
Медиана |
22,5 |
Медиана |
3 |
Медиана |
1 |
Медиана |
2,7 |
|
Мода |
47 |
Мода |
10 |
Мода |
22,6 |
Мода |
1,8 |
Мода |
0 |
Мода |
2,8 |
|
Стандартное отклонение |
10,26 |
Стандартное отклонение |
26,04 |
Стандартное отклонение |
1,14 |
Стандартное отклонение |
1,69 |
Стандартное отклонение |
1,01 |
Стандартное отклонение |
0,55 |
|
Дисперсия выборки |
105,26 |
Дисперсия выборки |
678,06 |
Дисперсия выборки |
1,29 |
Дисперсия выборки |
2,87 |
Дисперсия выборки |
1,03 |
Дисперсия выборки |
0,3 |
|
Эксцесс |
0,45 |
Эксцесс |
-0,85 |
Эксцесс |
0,64 |
Эксцесс |
-0,91 |
Эксцесс |
0,68 |
Эксцесс |
0,13 |
|
Асиммет-ричность |
-0,45 |
Асиммет-ричность |
0,08 |
Асиммет-ричность |
0,63 |
Асиммет-ричность |
0,1 |
Асиммет-ричность |
1,21 |
Асиммет-ричность |
0,56 |
|
Интервал |
41 |
Интервал |
86 |
Интервал |
4,3 |
Интервал |
5,9 |
Интервал |
3 |
Интервал |
2 |
|
Минимум |
33 |
Минимум |
10 |
Минимум |
20,5 |
Минимум |
0,1 |
Минимум |
0 |
Минимум |
1,8 |
|
Максимум |
74 |
Максимум |
96 |
Максимум |
24,8 |
Максимум |
6 |
Максимум |
3 |
Максимум |
3,8 |
|
Сумма |
961 |
Сумма |
798 |
Сумма |
383,4 |
Сумма |
49,1 |
Сумма |
14 |
Сумма |
45,9 |
|
Счет |
17 |
Счет |
17 |
Счет |
17 |
Счет |
17 |
Счет |
17 |
Счет |
17 |
При сравнении значений средних квадратических отклонений и средних величин определяются коэффициенты вариации:
Оценив результаты проведённых расчётов можно сделать вывод о высоком уровне варьирования признаков, некоторые из которых превышают допустимые пределы (больше 35%).
2. На втором этапе определяются линейные коэффициенты парной корреляции, с помощью инструмента анализ данных Корреляция. Результаты расчётов приведены в табл. 1.
Таблица 1. Матрица коэффициентов парной корреляции
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
||
Y |
1 |
||||||
X1 |
0,678785 |
1 |
|||||
X2 |
0,562183 |
0,272706 |
1 |
||||
X3 |
-0,63753 |
-0,50795 |
-0,34461 |
1 |
|||
X4 |
0,603936 |
0,285827 |
0,42621 |
-0,50309 |
1 |
||
X5 |
0,524972 |
0,45567 |
0,405022 |
-0,37037 |
0,16835 |
1 |
Значения коэффициентов парной корреляции указывают на не очень тесную связь выработки y с показателями результатов теста способностей и тревожности, возрастом, а также опытом работы и средним баллом школьного аттестата. Межфакторная связь также не тесная и не превышает тесноту связи всех факторов с y.
3. На третьем этапе производится вычисление параметров линейного уравнения множественной регрессии. С этой целью используется инструмент анализа данных Регрессия. Результаты применения этого инструмента отражены в табл. 2, 3 и 4.
Таблица 2. Регрессионная статистика
Множественный R |
0,862167 |
|
R-квадрат |
0,743332 |
|
Нормированный R-квадрат |
0,626664 |
|
Стандартная ошибка |
6,268897 |
|
Наблюдения |
17 |
Таблица 3. Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
5 |
1251,946 |
250,3891 |
6,371375 |
0,005151 |
|
Остаток |
11 |
432,2898 |
39,29907 |
|||
Итого |
16 |
1684,235 |
переменная уравнение задача независимый
Таблица 4. Результаты анализа
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-1,31 |
35,33 |
-0,04 |
0,97 |
-79,08 |
76,45 |
-79,08 |
76,45 |
|
X1 |
0,15 |
0,07 |
2,03 |
0,07 |
-0,01 |
0,31 |
-0,01 |
0,31 |
|
X2 |
1,93 |
1,65 |
1,17 |
0,27 |
-1,69 |
5,55 |
-1,69 |
5,55 |
|
X3 |
-0,99 |
1,21 |
-0,82 |
0,43 |
-3,66 |
1,67 |
-3,66 |
1,67 |
|
X4 |
2,99 |
1,90 |
1,57 |
0,14 |
-1,19 |
7,17 |
-1,19 |
7,17 |
|
X5 |
2,87 |
3,45 |
0,83 |
0,42 |
-4,72 |
10,47 |
-4,72 |
10,47 |
По результатам вычислений можно составить уравнение множественной регрессии следующего вида:
У = -1,31 + 0,15х1 + 1,93х2 - 0,99х3 + 2,99х4 + 2,87х5
Из этого уравнения следует вывод о том, что с увеличением результатов теста способностей, возраста, опыта работы и среднего балла аттестата на единицу объём продаж увеличится соответственно на 0,15; 1,93; 2,99 и 2,87 единиц. Однако повышение результатов теста тревожности на единицу повлечёт снижение объёма продаж на 0,99 единиц.
Значения случайных ошибок параметров b0, b1, b2, b3, b4 и b5 с учетом округления составят (табл. 4): mb0 = 35,33; mb1 = 0,07; mb2 = 1,65; mb3 = 1,21; mb4 = 1,9; mb5 = 3,45. Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента: tb0 = -0,04; tb1 = 2,03; tb2 = 1,17; tb3 = -0,82; tb4 = 1,57; tb5 = 0,83.
Таким образом, можно сделать вывод, что статистически значимым являются параметры b1 и b4. Остальные величины сформировались под воздействием случайных причин, поэтому факторы х2, х3 и х5, силы влияния которых оценивают b2, b3 и b5, можно исключить как несущественно влияющие, неинформативные.
Исходя из вышесказанного, можно сделать вывод, что на объём продаж существенное влияние оказывают результат теста способностей и опыт работы. Возраст, результат теста тревожности и средний балл аттестата не оказывают существенного влияния на объём продаж, поэтому их можно исключить как не существенные.
4. На четвёртом этапе определяется F-критерий Фишера, который даёт оценку надежности уравнения регрессии. По данным табл. 3 Fфакт = 6,37.
Вероятность случайно получить такое значение F-критерия составляет 0,5% (табл. 3), что не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость уравнения.
Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены в табл. 2. Нескорректированный коэффициент множественной детерминации равен 0,7433 и оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 74,3% и указывает на не очень тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации равен 0,63 и определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Таким образом, оба коэффициента указывают на не очень высокую (менее 90%) детерминированность результата у.
5. На пятом этапе производится исключение несущественных факторов, выявленных на третьем этапе. Таким образом, если исключить факторы х2, х3 и х5, то получится уравнение парной регрессии следующего вида:
У = -36,958+0,224х1+3,6797х2
Такое уравнение является более простым, хорошо детерминированным, пригодным для анализа и для прогноза.
6. На шестом этапе определяются коэффициенты эластичности. В результате расчётов значения коэффициентов эластичности составят:
Э1 = 0,1253
Э2 = 0,7681
Э3 = -0,0508
Э4 = 0,0435
Э5 = 0,1372
По значениям частных коэффициентов эластичности можно сделать вывод о том, что более сильное влияние на результат у оказывает фактор х2 в сравнении с влиянием остальных факторов, так как его коэффициент больше всех остальных.
Размещено на Allbest.ru
Подобные документы
Формулировка задачи о замочной скважине, подойдет ли ключ к замку. Составление блок-схемы, которая позволяет наглядно увидеть ход выполнения поставленной задачи. Описание использованных переменных. Анализ результатов вычислений, листинг программы.
курсовая работа [134,1 K], добавлен 07.05.2012Описание решения задачи, ее постановка, общий подход к решению. Представление исходных данных, условий задачи и целей ее решения. Составление алгоритма решения поставленной задачи. Написание программного обеспечения и тестирование конечного продукта.
курсовая работа [1,1 M], добавлен 03.07.2011Краткий обзор решения транспортных задач. Экономическая интерпретация поставленной задачи. Разработка и описание алгоритма решения задачи. Построение математической модели. Решение задачи вручную и с помощью ЭВМ. Анализ модели на чувствительность.
курсовая работа [844,3 K], добавлен 16.06.2011Определение недостатков итерационного численного способа нахождения корня заданной функции (метод Ньютона). Рассмотрение основ математического и алгоритмического решения поставленной задачи, ее функциональной модели, блок-схемы и программной реализации.
курсовая работа [364,8 K], добавлен 25.01.2010Решение задачи аппроксимации поверхности при помощи системы нечёткого вывода. Определение входных и выходных переменных, их термы; алгоритм Сугено. Подбор функций принадлежности, построение базы правил, необходимых для связи входных и выходных переменных.
курсовая работа [1,8 M], добавлен 31.05.2014Транспортная задача как одна из самых распространенных специальных задач линейного программирования: понятие, основное назначение. Формальное описание метода минимального элемента. Характеристика этапов разработки алгоритма решения поставленной задачи.
курсовая работа [713,3 K], добавлен 19.10.2012Обзор методов и подходов решения поставленной задачи аппроксимации логического вывода экспертной системы. Разработка и описание метода сетевого оператора для решения данной задачи. Разработка алгоритма решения. Проведение вычислительного эксперимента.
дипломная работа [1,5 M], добавлен 23.02.2015Реализация информационной системы для компаний по продаже недвижимости. Обзор методов решения поставленной задачи. Описание программы для программиста. Диаграмма классов: FlatBase, Flat, House, Commercial, Human, ContH. Способы и алгоритмы решения задачи.
курсовая работа [1,6 M], добавлен 18.08.2014Постановка задачи нелинейного программирования. Критерии оптимальности в задачах с ограничениями. Задачи с ограничением в виде равенств. Метод исключения переменных. Интерпретация условий Куна-Таккера. Функции нескольких переменных. Методы прямого поиска.
реферат [330,0 K], добавлен 29.09.2008Решение задачи на тему максимизации функций многих переменных. Описание метода дихотомии, его применение для решения нелинейных уравнений. Решение данной задачи с использованием метода покоординатного спуска. Составление алгоритмов, листинг программы.
курсовая работа [138,5 K], добавлен 01.10.2009