Построение линейной модели парной корреляции

Составление сводной таблицы вычислений, выбор лучшей модели, интерпретация рассчитанных характеристик и индекса корреляции. Рассчет прогнозных значений результативного признака, при увеличении прогнозного значения фактора относительно среднего уровня.

Рубрика Математика
Вид задача
Язык русский
Дата добавления 06.08.2010
Размер файла 339,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Задача 1

По предприятиям легкой промышленности региона получена информация характеризующая зависимость объема выпуска продукции (Y, млн.руб.)от объема капиталовложений (Х, млн.руб.).

Требуется:

1. Для характеристики Y от Х построить следующие модели:

- линейную,

- степенную,

- показательную,

- гиперболическую.

2. Оценить каждую модель, определив:

- индекс корреляции,

- среднюю относительную ошибку,

- коэффициент детерминации,

- F-критерий Фишера.

3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

4. рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.

5. Результаты расчетов отобразить на графике.

Задание к задаче№1

Таблица 1

y

32

40

44

28

50

56

50

х

60

68

80

76

74

87

96

Решение:

1. Построение линейной модели парной корреляции.

Определим линейный коэффициент парной корреляции по следующей формуле:

По данным вычислениям видно, что связь между объемом капиталовложений и выпуском продукции прямая и достаточно сильная.

Уравнение линейной регрессии имеет вид:

Уравнение линейной регрессии имеет вид:

С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличивается в среднем на 558 тыс.руб. Это свидетельствует об прямой связи данных показателей и эффективности работы предприятия.

Расчеты производились исходя из данных, указанных в таблице 2,3

Таблица 2

№п/п

Y

X

Y-Yср

(Y-Yср)кв

X-Xср

(X-Xср)кв

(Y-Yср)(X-Xср)

1

32

60

-10,857

117,878

-17,286

298,796

187,673

2

40

68

-2,857

8,163

-9,286

86,224

26,531

3

44

80

1,143

1,306

2,714

7,367

3,102

4

28

76

-14,857

220,735

-1,286

1,653

19,102

5

50

74

7,143

51,020

-3,286

10,796

-23,469

6

56

87

13,143

172,735

9,714

94,367

127,673

7

50

96

7,143

51,020

18,714

350,224

133,673

Сумма

300

541

0,000

622,857

0,000

849,429

474,286

Среднее

42,86

77,29

 

88,980

 

121,347

67,755

Таблица 3

№п/п

YX

Xкв

Yкв

В

А

Yрасч

е=Y-Yрасч

e/Y*100%

1

1920,000

3600,000

1024,000

0,558

-0,268

33,212

-1,212

-3,788

2

2720,000

4624,000

1600,000

 

 

37,676

2,324

5,810

3

3520,000

6400,000

1936,000

 

 

44,372

-0,372

-0,845

4

2128,000

5776,000

784,000

 

 

42,140

-14,140

-50,500

5

3700,000

5476,000

2500,000

 

 

41,024

8,976

17,952

6

4872,000

7569,000

3136,000

 

 

48,278

7,722

13,789

7

4800,000

9216,000

2500,000

 

 

53,300

-3,300

-6,600

Сумма

23660,000

42661,000

13480,000

 

 

300,002

-0,002

-24,182

Среднее

3380,000

6094,429

1925,714

 

 

42,857

 

-3,455

Рассчитаем коэффициент детерминации:

Вариация результата Y (объема выпуска продукции) на 99,8% объясняется вариацией фактора Х (объем капиталовложений).

Оценку значимости равнения регрессии проведем с помощь. F-критерия Фишера:

для ; , .

Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. .

Определим среднюю относительную ошибку:

Данный показатель отражает на сколько в среднем расчетные значения для линейной модели отличаются от фактических значений (на 3,455%).

2. Построение степенной модели парной регрессии.

Уравнение степенной модели имеет вид: .

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

.

Таблица 4

№п/п

Факт Y(t)

lg (Y)

Переменная Х(t)

lg (X)

1

32

1,505

60

1,778

2

40

1,602

68

1,833

3

44

1,643

80

1,903

4

28

1,447

76

1,881

5

50

1,699

74

1,869

6

56

1,748

87

1,940

7

50

1,699

96

1,982

Сумма

300

11,344

541

13,186

Среднее

42,857

1,621

77,286

1,884

Обозначим Y=lg, Х=lgx, А=lga.

Тогда уравнение имеет вид: Y=A+bX - линейное уравнение регрессии.

Рассчитаем его параметры, используя таблицу 5.

Уравнение регрессии будет иметь вид: .

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения и получим уравнение степенной модели регрессии.

.

Определим индекс корреляции:

Связь между показателем и фактором можно считать средней по силе.

Рассчитаем коэффициент детерминации:

Вариация результата Y (объема выпуска продукции) на 41,7% объясняется вариацией фактора Х.

Рассчитаем F-критерий Фишера:

для ; , .

Средняя относительная ошибка:

В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,287%.

3. Построение показательной функции.

Уравнение показательной кривой: .

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

, обозначим: , , .

Получим линейное уравнение регрессии: .

Рассчитаем его параметры, используя данные таблицы 6.

Уравнение будет иметь вид: .

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:

Определим индекс корреляции:

Данный показатель характеризует среднюю связь между показателем и фактором.

Индекс детерминации:

Вариация результата Y на 40,7% объясняется вариацией фактора Х.

Рассчитаем F-критерий Фишера:

для ; , .

Средняя относительная ошибка:

В среднем расчетные значения для степенной модели отличаются от фактических значений на 0,231%.

4. Построение гиперболической функции.

Уравнение гиперболической функции: .

Произведем линеаризацию модели путем замены Х=1/х.

В результате получим линейное уравнение: .

Получим следующие уравнение гиперболической модели: .

Определим индекс корреляции:

Исходя их данного показателя силу связи можно оценить средним уровнем.

Индекс детерминации:

=0,421

То есть вариация результата Y (объема выпуска продукции) на 42,1% объясняется вариацией фактора Х (объемом капиталовложений).

Рассчитаем F-критерий Фишера:

для ; , .

Средняя относительная ошибка:

В среднем расчетные значения у для гиперболической модели отличаются от фактических значений на 0,0082%.

Для выбора лучшей модели построим сводную таблицу результатов:

В качестве лучшей модели для построения прогноза можно взять линейную модель, так как она имеет большее значение F-критерия Фишера и коэффициента детерминации.

Расчет прогнозного значения результативного показателя:

Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению линейной модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений.

По условию нужно рассчитать прогнозное значение результативного признака (объема выпускаемой продукции), если прогнозное значение фактора увеличится на 110% относительно среднего уровня. Средний уровень значения фактора (объема капиталовложений-Х) составляет 77,29млн. руб.

При увеличении на 110% он составит 85,019 млн.руб.:

Из этого уравнения следует, что при увеличении объема капиталовложений на 110% относительно среднего уровня объем выпуска продукции повысится в среднем до 47,708 млн.руб.

Фактический, расчетные и прогнозные значения по лучшей модели отобразим на графике:

Задача 2

По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (), ставки по депозитам () и размера внутрибанковских расходов ().

Требуется:

1. Осуществить отбор факторных признаков для построения двухфакторной регрессионной модели.

2. Рассчитать параметры модели.

3. Для характеристики модели определить:

- линейный коэффициент множественной корреляции,

- коэффициент детерминации,

- средние коэффициенты эластичности,

- бета-, дельта - коэффициенты.

Дать их интерпретацию.

4. Осуществить оценку надежности уравнения регрессии.

5. Оценить с помощь t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.

6. Построить точечный и интервальный прогнозы результирующего показателя.

7. Отразить результаты расчетов на графике.

Задание к задаче 2.

Таблица 1

Объем прибыли

Y

Ставки по кредитам

Ставки по депозитам

Внутрибанковские расходы

50

22

176

150

54

30

170

154

60

20

156

146

62

32

172

134

70

44

162

132

54

34

160

126

84

52

166

134

82

56

156

126

86

66

152

88

84

68

138

120

1. Выбор факторных признаков для построения двухфакторной модели регрессии.

n=10, m=3

С помощью MS Excel проведем корреляционный анализ. Результаты корреляционного анализа представлены в таблице 2.

Таблица 2

 

Объем прибыли Y

Ставки по кредитам

Ставки по депозитам

Внутрибанковские расходы

Объем прибыли Y

1

 

 

 

Ставки по кредитам

0,925

1

 

 

Ставки по депозитам

-0,645

-0,705

1

 

Внутрибанковские расходы

-0,705

-0,793

0,606

1

Анализ матрицы коэффициентов парной корреляции показывает что Y имеет тесную связь со всеми факторами но между факторами Х1 и Х3 связь теснее а значит можно говорить о мультиколлинеарности этих факторов поэтому мы выбираем фактор Х2

1. Выбор вида модели и оценка ее параметров.

С помощью MS Excel проведем регрессионный анализ, результаты отразим в таблицах 3, 4, 5, 6.

Таблица 3

Регрессионная статистика

Множественный R

0,925

R-квадрат

0,855

Нормированный R-квадрат

0,813

Стандартная ошибка

6,190

Наблюдения

10,000

Таблица 4

Дисперсионный анализ

 

df

SS

MS

F

Регрессия

2,000

1580,193

790,097

20,621

Остаток

7,000

268,207

38,315

Итого

9,000

1848,400

 

 

Таблица 5

 

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

33,295

47,311

0,704

X1

0,767

0,167

4,604

X2

0,017

0,261

0,066

Таблица 6

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

1,000

53,220

-3,220

2,000

59,251

-5,251

3,000

51,340

8,660

4,000

60,819

1,181

5,000

69,848

0,152

6,000

62,145

-8,145

7,000

76,052

7,948

8,000

78,946

3,054

9,000

86,545

-0,545

10,000

87,835

-3,835

Уравнение регрессии зависимости объема прибыли от Ставки по кредитам и Ставки по депозитам можно записать в следующем виде:

у=33,295+0,767х1+0,017х2

2. Оценка качества модели.

В таблице 14 приведены вычисленные по модели значения Y и значения остаточной компоненты.

Рис.2

Вычислим для модели коэффициент детерминации.

Этот коэффициент уже вычислен нами и находится в таблице 3.

R2 = 0,855

Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:

Fтабл мы вычисляем с помощью функции FРАСПОБР

Fтабл = 4,737

Fрасч уже вычислено и находится в таблице 4

Fрасч = 20,621

Поскольку .Ррасч > Ртабл, уравнение регрессии следует признать адекватным.

Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые соответственно рассчитываются по формулам:

Эj = аj*xср j / yср

= ai * Sxi / Sy

Таблица 7

S2y

205,3778

S2x1

304,7111

S2x2

123,7333

Э1 = 0,767*42,4/68,6 = 0,474

Э2 = 0,017*160,8/68,6 = 0,040

= 0,767 * 304,7111 / 205,3778 = 1,138

= 0,017 * 123,7333 / 205,3778 = 0,010

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.

Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных.

2. Оценка статистической значимости

Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии а,, а2 приведены в четвертом столбце таблицы 5.

Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЫОДРАСПОБР

tтабл=2,36462256

tрасч=0,704

tрасч =4,604критерий статистически значим

tрасч =0,066

3. Точечный и интервальный прогноз

Прогноз показателя «Ставка по кредитам»

Рис

Прогноз показателя «Ставка по депозитам»

Рис.2


Подобные документы

  • Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.

    курсовая работа [862,4 K], добавлен 06.05.2009

  • Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.

    курсовая работа [352,9 K], добавлен 26.01.2010

  • Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.

    лабораторная работа [22,3 K], добавлен 15.04.2014

  • Аппроксимация функции y = f(x) линейной функцией y = a1 + a2x. Логарифмирование заданных значений. Расчет коэффициентов корреляции и детерминированности. Построение графика зависимости и линии тренда. Числовые характеристики коэффициентов уравнения.

    курсовая работа [954,7 K], добавлен 10.01.2015

  • Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.

    контрольная работа [178,0 K], добавлен 23.11.2013

  • Обработка данных измерений величин и представление результатов с нужной степенью вероятности. Определение среднего арифметического и вычисление среднего значения измеренных величин. Выявление грубых ошибок. Коэффициенты корреляции. Косвенные измерения.

    реферат [116,2 K], добавлен 16.02.2016

  • Основные правила расчета значений дифференциального уравнения. Изучение выполнения оценки погрешности вычислений, осуществления аппроксимации решений. Разработка алгоритма и написание соответствующей программы. Построение интерполяционного многочлена.

    курсовая работа [212,6 K], добавлен 11.12.2013

  • Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.

    курсовая работа [575,5 K], добавлен 19.05.2015

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Обзор адаптивных методов прогнозирования. Построение модели Брауна. Применение методов прогнозирования на примере СПК колхоза "Новоалексеевский" в рамках модели авторегрессии и проинтегрированного скользящего среднего, предложенной Боксом и Дженкинсом.

    дипломная работа [9,0 M], добавлен 28.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.