Многомерный регрессионный анализ

Определение набора возможных независимых переменных. Исключение переменных, не имеющих существенного отношения к решению поставленной задачи. Выбор окончательного вида уравнения с "наилучшими" независимыми переменными для решения поставленной задачи.

Рубрика Программирование, компьютеры и кибернетика
Вид лабораторная работа
Язык русский
Дата добавления 07.05.2012
Размер файла 28,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Лабораторная работа

Тема: Многомерный регрессионный анализ

Цель работы: приобретение практических навыков построения уравнения многомерной регрессии предлагаемой социально-экономической ситуации с помощью инструмента анализа данных Excel.

Задачи:

· Определение набора возможных независимых переменных.

· Исключение переменных, не имеющих существенного отношения к решению поставленной задачи (если переменная характеризуется значительными ошибками измерения, дублирует другие независимые переменные (мультиколлинеарность), точные данные по ней недоступны);

· Выбор окончательного вида уравнения с «наилучшими» независимыми переменными, при этом решается задача обеспечения наилучшего прогноза с наименьшими затратами.

Ход решения для построения модели многомерной регрессии:

переменная уравнение задача независимый

Исходные данные

Объем продаж за месяц (в единицах)

Y

Результат теста способностей

X1

Возраст

X2

Результат теста тревожности X3

Опыт работы X4

Средний балл школьного аттестата X5

44

10

22,1

4,9

0

2,4

47

19

22,5

3,0

1

2,6

60

27

23,1

1,5

0

2,8

71

31

24

0,6

3

2,7

61

64

22,6

1,8

2

2,0

60

81

21,7

3,3

1

2,5

58

42

22

3,2

0

2,5

56

67

22,4

2,1

0

2,3

66

48

22,6

6,0

1

2,8

61

64

21,1

1,8

1

3,4

51

57

22,5

3,8

0

3,0

47

10

22,2

4,5

1

2,7

53

48

24,8

4,5

0

2,8

74

96

24,8

0.1

3

3,8

65

75

22,6

0,9

0

3,7

33

12

20,5

4,8

0

2,1

54

47

21,9

2,3

1

1,8

1. На первом этапе оценивается показатель вариации каждого признака. Для этого необходимо составить сводную таблицу основных статистических характеристик для одного или нескольких массивов данных.

Y

X1

X2

X3

X4

X5

Среднее

56,53

Среднее

46,94

Среднее

22,55

Среднее

2,89

Среднее

0,82

Среднее

2,7

Стандартная ошибка

2,49

Стандартная ошибка

6,31

Стандартная ошибка

0,27

Стандартная ошибка

0,41

Стандартная ошибка

0,24

Стандартная ошибка

0,13

Медиана

58

Медиана

48

Медиана

22,5

Медиана

3

Медиана

1

Медиана

2,7

Мода

47

Мода

10

Мода

22,6

Мода

1,8

Мода

0

Мода

2,8

Стандартное отклонение

10,26

Стандартное отклонение

26,04

Стандартное отклонение

1,14

Стандартное отклонение

1,69

Стандартное отклонение

1,01

Стандартное отклонение

0,55

Дисперсия выборки

105,26

Дисперсия выборки

678,06

Дисперсия выборки

1,29

Дисперсия выборки

2,87

Дисперсия выборки

1,03

Дисперсия выборки

0,3

Эксцесс

0,45

Эксцесс

-0,85

Эксцесс

0,64

Эксцесс

-0,91

Эксцесс

0,68

Эксцесс

0,13

Асиммет-ричность

-0,45

Асиммет-ричность

0,08

Асиммет-ричность

0,63

Асиммет-ричность

0,1

Асиммет-ричность

1,21

Асиммет-ричность

0,56

Интервал

41

Интервал

86

Интервал

4,3

Интервал

5,9

Интервал

3

Интервал

2

Минимум

33

Минимум

10

Минимум

20,5

Минимум

0,1

Минимум

0

Минимум

1,8

Максимум

74

Максимум

96

Максимум

24,8

Максимум

6

Максимум

3

Максимум

3,8

Сумма

961

Сумма

798

Сумма

383,4

Сумма

49,1

Сумма

14

Сумма

45,9

Счет

17

Счет

17

Счет

17

Счет

17

Счет

17

Счет

17

При сравнении значений средних квадратических отклонений и средних величин определяются коэффициенты вариации:

Оценив результаты проведённых расчётов можно сделать вывод о высоком уровне варьирования признаков, некоторые из которых превышают допустимые пределы (больше 35%).

2. На втором этапе определяются линейные коэффициенты парной корреляции, с помощью инструмента анализ данных Корреляция. Результаты расчётов приведены в табл. 1.

Таблица 1. Матрица коэффициентов парной корреляции

Y

X1

X2

X3

X4

X5

Y

1

X1

0,678785

1

X2

0,562183

0,272706

1

X3

-0,63753

-0,50795

-0,34461

1

X4

0,603936

0,285827

0,42621

-0,50309

1

X5

0,524972

0,45567

0,405022

-0,37037

0,16835

1

Значения коэффициентов парной корреляции указывают на не очень тесную связь выработки y с показателями результатов теста способностей и тревожности, возрастом, а также опытом работы и средним баллом школьного аттестата. Межфакторная связь также не тесная и не превышает тесноту связи всех факторов с y.

3. На третьем этапе производится вычисление параметров линейного уравнения множественной регрессии. С этой целью используется инструмент анализа данных Регрессия. Результаты применения этого инструмента отражены в табл. 2, 3 и 4.

Таблица 2. Регрессионная статистика

Множественный R

0,862167

R-квадрат

0,743332

Нормированный R-квадрат

0,626664

Стандартная ошибка

6,268897

Наблюдения

17

Таблица 3. Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

5

1251,946

250,3891

6,371375

0,005151

Остаток

11

432,2898

39,29907

Итого

16

1684,235

переменная уравнение задача независимый

Таблица 4. Результаты анализа

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-1,31

35,33

-0,04

0,97

-79,08

76,45

-79,08

76,45

X1

0,15

0,07

2,03

0,07

-0,01

0,31

-0,01

0,31

X2

1,93

1,65

1,17

0,27

-1,69

5,55

-1,69

5,55

X3

-0,99

1,21

-0,82

0,43

-3,66

1,67

-3,66

1,67

X4

2,99

1,90

1,57

0,14

-1,19

7,17

-1,19

7,17

X5

2,87

3,45

0,83

0,42

-4,72

10,47

-4,72

10,47

По результатам вычислений можно составить уравнение множественной регрессии следующего вида:

У = -1,31 + 0,15х1 + 1,93х2 - 0,99х3 + 2,99х4 + 2,87х5

Из этого уравнения следует вывод о том, что с увеличением результатов теста способностей, возраста, опыта работы и среднего балла аттестата на единицу объём продаж увеличится соответственно на 0,15; 1,93; 2,99 и 2,87 единиц. Однако повышение результатов теста тревожности на единицу повлечёт снижение объёма продаж на 0,99 единиц.

Значения случайных ошибок параметров b0, b1, b2, b3, b4 и b5 с учетом округления составят (табл. 4): mb0 = 35,33; mb1 = 0,07; mb2 = 1,65; mb3 = 1,21; mb4 = 1,9; mb5 = 3,45. Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента: tb0 = -0,04; tb1 = 2,03; tb2 = 1,17; tb3 = -0,82; tb4 = 1,57; tb5 = 0,83.

Таким образом, можно сделать вывод, что статистически значимым являются параметры b1 и b4. Остальные величины сформировались под воздействием случайных причин, поэтому факторы х2, х3 и х5, силы влияния которых оценивают b2, b3 и b5, можно исключить как несущественно влияющие, неинформативные.

Исходя из вышесказанного, можно сделать вывод, что на объём продаж существенное влияние оказывают результат теста способностей и опыт работы. Возраст, результат теста тревожности и средний балл аттестата не оказывают существенного влияния на объём продаж, поэтому их можно исключить как не существенные.

4. На четвёртом этапе определяется F-критерий Фишера, который даёт оценку надежности уравнения регрессии. По данным табл. 3 Fфакт = 6,37.

Вероятность случайно получить такое значение F-критерия составляет 0,5% (табл. 3), что не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость уравнения.

Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены в табл. 2. Нескорректированный коэффициент множественной детерминации равен 0,7433 и оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 74,3% и указывает на не очень тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации равен 0,63 и определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Таким образом, оба коэффициента указывают на не очень высокую (менее 90%) детерминированность результата у.

5. На пятом этапе производится исключение несущественных факторов, выявленных на третьем этапе. Таким образом, если исключить факторы х2, х3 и х5, то получится уравнение парной регрессии следующего вида:

У = -36,958+0,224х1+3,6797х2

Такое уравнение является более простым, хорошо детерминированным, пригодным для анализа и для прогноза.

6. На шестом этапе определяются коэффициенты эластичности. В результате расчётов значения коэффициентов эластичности составят:

Э1 = 0,1253

Э2 = 0,7681

Э3 = -0,0508

Э4 = 0,0435

Э5 = 0,1372

По значениям частных коэффициентов эластичности можно сделать вывод о том, что более сильное влияние на результат у оказывает фактор х2 в сравнении с влиянием остальных факторов, так как его коэффициент больше всех остальных.

Размещено на Allbest.ru


Подобные документы

  • Формулировка задачи о замочной скважине, подойдет ли ключ к замку. Составление блок-схемы, которая позволяет наглядно увидеть ход выполнения поставленной задачи. Описание использованных переменных. Анализ результатов вычислений, листинг программы.

    курсовая работа [134,1 K], добавлен 07.05.2012

  • Описание решения задачи, ее постановка, общий подход к решению. Представление исходных данных, условий задачи и целей ее решения. Составление алгоритма решения поставленной задачи. Написание программного обеспечения и тестирование конечного продукта.

    курсовая работа [1,1 M], добавлен 03.07.2011

  • Краткий обзор решения транспортных задач. Экономическая интерпретация поставленной задачи. Разработка и описание алгоритма решения задачи. Построение математической модели. Решение задачи вручную и с помощью ЭВМ. Анализ модели на чувствительность.

    курсовая работа [844,3 K], добавлен 16.06.2011

  • Определение недостатков итерационного численного способа нахождения корня заданной функции (метод Ньютона). Рассмотрение основ математического и алгоритмического решения поставленной задачи, ее функциональной модели, блок-схемы и программной реализации.

    курсовая работа [364,8 K], добавлен 25.01.2010

  • Решение задачи аппроксимации поверхности при помощи системы нечёткого вывода. Определение входных и выходных переменных, их термы; алгоритм Сугено. Подбор функций принадлежности, построение базы правил, необходимых для связи входных и выходных переменных.

    курсовая работа [1,8 M], добавлен 31.05.2014

  • Транспортная задача как одна из самых распространенных специальных задач линейного программирования: понятие, основное назначение. Формальное описание метода минимального элемента. Характеристика этапов разработки алгоритма решения поставленной задачи.

    курсовая работа [713,3 K], добавлен 19.10.2012

  • Обзор методов и подходов решения поставленной задачи аппроксимации логического вывода экспертной системы. Разработка и описание метода сетевого оператора для решения данной задачи. Разработка алгоритма решения. Проведение вычислительного эксперимента.

    дипломная работа [1,5 M], добавлен 23.02.2015

  • Реализация информационной системы для компаний по продаже недвижимости. Обзор методов решения поставленной задачи. Описание программы для программиста. Диаграмма классов: FlatBase, Flat, House, Commercial, Human, ContH. Способы и алгоритмы решения задачи.

    курсовая работа [1,6 M], добавлен 18.08.2014

  • Постановка задачи нелинейного программирования. Критерии оптимальности в задачах с ограничениями. Задачи с ограничением в виде равенств. Метод исключения переменных. Интерпретация условий Куна-Таккера. Функции нескольких переменных. Методы прямого поиска.

    реферат [330,0 K], добавлен 29.09.2008

  • Решение задачи на тему максимизации функций многих переменных. Описание метода дихотомии, его применение для решения нелинейных уравнений. Решение данной задачи с использованием метода покоординатного спуска. Составление алгоритмов, листинг программы.

    курсовая работа [138,5 K], добавлен 01.10.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.