Практическая эконометрия

Вычисление описательных (дескриптивных) статистик и построение уравнения регрессии на основе данных об удельном весе пашни, лугов и пастбищ в сельскохозяйственных угодьях и уровне рентабельности производства сельскохозяйственной продукции за год.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 06.03.2011
Размер файла 201,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Известны следующие данные об удельном весе пашни, лугов и пастбищ в сельскохозяйственных угодьях и уровне рентабельности производства сельскохозяйственной продукции по КСП административных районов области за год:

№ района

Фактор

Уровень рентабельности всей сельскохозяйственной продукции,%

удельный вес пашни в сельскохозяйственных угодьях, %

удельный вес лугов и пастбищ в сельскохозяйственных угодьях, %

1

80,0

20,0

2,0

2

87,2

12,8

1,8

3

90,8

9,2

1,1

4

94,7

5,3

3,5

5

81,4

18,6

10,1

6

89,2

10,8

3,3

7

71,3

28,7

24,2

8

86,2

13,8

1,9

9

71,4

28,6

20,8

10

77,1

22,9

19,2

11

86,0

14,0

3,4

12

87,0

13,0

2,7

13

87,2

12,8

1,4

14

75,0

25,0

20,1

15

86,2

13,8

7,8

16

86,1

13,9

7,7

17

85,9

14,1

3,3

18

94,4

5,6

1,1

19

84,4

13,6

2,2

20

98,3

1,7

1,1

По имеющимся данным требуется:

1 . вычислить описательные (дескриптивные) статистики;

вычислить параметры уравнения множественной регрессионной модели;

требуется исследовать зависимость результативного показателя от переменных факторов и отобрав наиболее значимые, построить уравнение регрессии. В случае обнаружения мультиколлинеарности использовать методы позволяющие уменьшить ее влияние;

оценить качество построенного уравнения регрессии с помощью коэффициента детерминации R"h скорректированного коэффициента корреляции;

оценить значимость построенного уравнения регрессии с помощью F- критерия;

построить 95%-ные интервалы для оценок параметров уравнения регрессии;

рассчитать прогнозное значение результативного показателя, если значение каждой независимой переменной увеличится на 10% от его среднего значения;

рассчитать частные коэффициенты эластичности.

1. Вычислить описательные (дескриптивные) статистики

Решение

Задачи проведем с использованием ППП MS Excel и Statgraphics. Результаты вычисления соответствующих показателей для каждого признака представлены в таб.1.2

Таблица 1.1

у

Х1

Х2

1

2

80

20

2

1,8

87,2

12,8

3

1,1

90,8

9,2

4

3,5

94,7

5,3

5

10,1

81,4

18,6

6

3,3

89,2

10,8

7

24,2

71,3

28,7

8

1,9

86,2

13,8

9

20,8

71,4

28,6

10

19,2

77,1

22,9

11

3,4

86

14

12

2,7

87

13

13

1,4

87,2

12,8

14

20,1

75

25

15

7,8

86,2

13,8

16

7,7

86,1

12,9

17

3,3

85,9

14,1

18

1,1

94,4

5,6

19

2,2

84,4

13,6

20

1,1

98,3

1,7

Таблица 1.2.

y

x1

x2

Среднее

6,935

Среднее

84,99

Среднее

14,86

Стандартная ошибка

1,720882194

Стандартная ошибка

1,625113761

Стандартная ошибка

1,628680447

Медиана

3,3

Медиана

86,15

Медиана

13,7

Мода

1,1

Мода

87,2

Мода

12,8

Стандартное отклонение

7,696019135

Стандартное отклонение

7,267729682

Стандартное отклонение

7,283680388

Дисперсия выборки

59,22871053

Дисперсия выборки

52,81989474

Дисперсия выборки

53,052

Эксцесс

0,29908623

Эксцесс

-0,082633291

Эксцесс

-0,073181947

Асимметричность

1,34190185

Асимметричность

-0,353531273

Асимметричность

0,418200554

Интервал

23,1

Интервал

27

Интервал

27

Минимум

1,1

Минимум

71,3

Минимум

1,7

Максимум

24,2

Максимум

98,3

Максимум

28,7

Сумма

138,7

Сумма

1699,8

Сумма

297,2

Счет

20

Счет

20

Счет

20

Для провидения Многофункционального анализа в ППП Statgraphics используется пункт меню Multiple Variable Analysis. Для получения показателей описательной статистики необходимо просчитать итоговую статистику. Итоговая статистика - показатели вариации . Результат представлен в таб. 1.3. дескриптивный статистика регрессия

Таблица 1.3. Summary Statistics

y

x1

x2

Count

20

20

20

Average

6,935

84,99

14,86

Variance

59,2287

52,8199

53,052

Standard deviation

7,69602

7,26773

7,28368

Minimum

1,1

71,3

1,7

Maximum

24,2

98,3

28,7

Range

23,1

27,0

27,0

Stnd. skewness

2,44997

-0,645457

0,763526

Stnd. kurtosis

0,273027

-0,0754335

-0,0668057

Эта таблица показывает итоговую статистику для каждой из отобранных переменных данных. Она включает меры центральной тенденции, меры изменчивости, и мер формы. Особенно интересный - стандартизированный перекос и стандартизированный эксцесс, который может использоваться, чтобы определить, прибывает ли образец от нормального распределения. Ценности этих статистических данных вне диапазона-2 к 2 указывают существенные отклонения от нормальности, которая имела бы тенденцию лишать законной силы многие из статистических процедур обычно, обращались к этим данным. В этом случае, следующие переменные показывают стандартизированные ценности перекоса вне ожидаемого диапазона: x2 Следующие переменные показывают стандартизированные ценности эксцесса вне ожидаемого диапазона: «ни один»

Сравнивая значение средних квадратных отклонений и средних величин и определяя коэффициенты

2.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии. Линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии.

Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. результаты вычислений -- матрица коэффициентов парной корреляции -- представлены в таб. 1.4.

Таблица 1.4.

y

x1

x2

y

1

x1

-0,842473764

1

x2

0,848802124

-0,997740478

1

1) у = f(x1)

у

x1

y

1

x1

-0,84247

1

2) y = f(x2)

у

x2

y

1

x2

0,848802

1

При проведении многофакторного анализа -- Multiple Variable Analysis -- вычисляются линейные коэффициенты парной корреляции и линейные коэффициенты частной корреляции.

В результате получаем матрицы коэффициентов парной и частной корреляции таб.1.5.(1;2)

Таблица 1.5.(1)

Correlations

y

x1

x2

y

-0,8425

( 20)

0,0000

0,8488

( 20)

0,0000

x1

-0,8425

( 20)

0,0000

0,9977

( 20)

0,0000

x2

0,8488

( 20)

0,0000

0,9977

( 20)

0,0000

Корреляция

(Типовой Размер)

P-ценность

Эта таблица показывает корреляции момента продукта Pearson между каждой парой переменных. Эти коэффициенты корреляции располагаются между-1 и 1 и мера сила линейных отношений между переменными. Также показанный в круглых скобках - число пар ценностей данных, используемых, чтобы вычислить каждый коэффициент. Третье число в каждом местоположении стола - P-ценность, которая проверяет статистическое значение предполагаемых корреляций. P-ценности ниже 0.05 указывают статистически существенные корреляции отличные от нуля на 95%-ом уровне веры. Следующие пары переменных имеют P-ценности ниже 0.05: y и x1; y и x2; x1 и x2

Таблица 1.5.(2)

Partial Correlations

y

x1

x2

y

0,1242

( 20)

0,2274

( 20)

x1

0,1242

( 20)

-0,9923

( 20)

x2

0,2274

( 20)

-0,9923

( 20)

Корреляция

(Типовой Размер)

Эта таблица(1.5.(2)) показывает частичные коэффициенты корреляции между каждой парой переменных. Частичные корреляции измеряют силу линейных отношений между переменными, сначала регулировавшими для их отношений к другим переменным в таблице. Они полезны в оценке, насколько полезный одна переменная был бы в улучшении предсказания второй переменной, данной, что информация от всех других переменных была уже принята во внимание. Также показанный в круглых скобках - число пар ценностей данных, используемых, чтобы вычислить каждый коэффициент.

Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки у как с коэффициентом обновления основных фондов -- х1 так и с долей рабочих высокой квалификации - х2 (ryx1 = -0,8425 и ryx2 = -0,8488). Но в то же время межфакторная связь rx1x2 -= 0,9977 весьма тесная и превышает тесноту связи х2 с у. В связи с этим для улучшения данной модели можно исключить из нее фактор х2 как малоинформативный, недостаточно статистически надежный.

Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленными в модели. Более тесно связаны у и х1: ryx1 x2 = -0,1242, связь у и х2 гораздо слабее: ryx2 x1 = -0,2274, а межфакторная зависимость х1 и х2 выше, чем парная у и х2: ryx2 x1 = 0,2274 > rx1x2 y = -0,9923. Все это приводит к выводу о необходимости исключить фактор х2 из правой части уравнения множественной регрессии.

При сравнении коэффициентов парной и частной корреляции видно, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи:

ryx1= -0,8425 ; ryx1 x2=-0,1242; ryx2 =-0,8488; ryx2 x1=-0,2274

Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, теснота парной зависимости которого меньше тесноты межфакторной связи.

3.Вычисление параметров линейного уравнения множественной регрессии.

Результаты анализа представлены в таб.1.6.(1,2,3)

Таблица 1.6.(1)

Регрессионная статистика

Множественный R

0,851336846

R-квадрат

0,724774426

Нормированный R-квадрат

0,692394946

Стандартная ошибка

4,268377991

Наблюдения

20

Таблица 1.6.(2)

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

815,6216385

407,81082

22,38375789

1,7272E-05

Остаток

17

309,7238615

18,219051

Итого

19

1125,3455

Таблица 1.6. (3)

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-109,6345589

200,1229127

-0,547836

0,590925787

x1

1,034658425

2,0054393

0,5159261

0,612551119

x2

1,926913819

2,00104754

0,9629525

0,349069893

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-531,85699

312,5879

-531,857

312,5879

x1

-3,1964486

5,265765

-3,19645

5,265765

x2

-2,2949274

6,148755

-2,29493

6,148755

1)у = f(x1)

Регрессионная статистика

Множественный R

0,842474

R-квадрат

0,709762

Нормированный R-квадрат

0,693638

Стандартная ошибка

4,259747

Наблюдения

20

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

798,7275

798,7275

44,01808

3,16E-06

Остаток

18

326,618

18,14544

Итого

19

1125,346

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

82,75636

11,46778

7,216425

1,03E-06

x1

-0,89212

0,134465

-6,63461

3,16E-06

Продолжение Таблицы

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

58,66345

106,8493

58,66345

106,8493

x1

-1,17462

-0,60962

-1,17462

-0,60962

2)y = f(x2)

Регрессионная статистика

Множественный R

0,848802

R-квадрат

0,720465

Нормированный R-квадрат

0,704935

Стандартная ошибка

4,180467

Наблюдения

20

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

810,7721

810,7721

46,39266

2,24E-06

Остаток

18

314,5734

17,4763

Итого

19

1125,346

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-6,39225

2,168488

-2,94779

0,008608

x1

0,896854

0,131673

6,811216

2,24E-06

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-10,9481

-1,83642

-10,9481

-1,83642

x1

0,620219

1,173489

0,620219

1,173489

Для вычисления параметров множественной регрессии можно использовать процедуру Multiple Regression.

Результаты вычисления функции Multiple Regression будут в таб.1.7.

По результатам вычислений составим уравнение множественной регрессии вида

Значение случайных ошибок параметров b0 , b1 и b2 с учетом округления:

mb0=200,1229127; mb1=2,0054393; mb2=2,00104754.

Таблица 1.7.

Multiple Regression Analysis

Dependent variable: y

Parameter

Estimate

Standard Error

T Statistic

P-Value

CONSTANT

-109,635

200,123

-0,547836

0,5989

x1

1,03466

2,00544

0,515926

0,6126

x2

1,92691

2,00105

0,962953

0,3491

Analysis of Variance

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

Model

815,622

2

407,811

22,38

0,0000

Residual

309,724

17

18,2191

Total (Corr.)

1125,35

19

R-squared = 72,4774 percent

R-squared (adjusted for d.f.) = 69,2395 percent

Standard Error of Est. = 4,26838

Mean absolute error = 3,31222

Durbin-Watson statistic = 1,71883 (P=0,2578)

Lag 1 residual autocorrelation = -0,0639807

Продукция показывает результаты приспособления линейному кратному числу модели регрессии, чтобы описать отношения между y и 2 независимые переменные. Уравнение подогнанной модели

у = -109,635 + 1,03466*Х1 + 1,92691*Х2

Так как P-ценность в столе ANOVA - меньше чем 0.01, есть a статистически существенные отношения между переменными в 99%-ый уровень доверия Статистическое R-Squared указывает что модель как приспособлено объясняют 72,4774 % изменчивости в y. Откорректированный R-squared статистический, то, который является более подходящим для того, чтобы сравнить модели с различными числами независимых переменных, является 69,2395 %. Стандартная ошибка оценки показывает стандартное отклонение residuals, чтобы быть 4,26838. Эта ценность может использоваться, чтобы строить пределы предсказания для новых наблюдений, выбирая возможность Сообщений из текстового меню. Средняя абсолютная ошибка (БОЛЬШЕ) 3,31222- средняя ценность residuals. Durbin-Уотсон (СОБСТВЕННЫЙ ВЕС) статистические тесты residuals, чтобы определить, есть ли какая-нибудь существенная корреляция, основанная на заказе, в котором они происходят в вашей картотеке данных. Так как P-ценность больше чем 0.05, нет никакого признака последовательной автокорреляции в residuals. В определении, может ли модель быть упрощена, заметим, что самая высокая P-ценность на независимых переменных - 0,6126, принадлежа x1. Так как P-ценность больше или равна 0.10, тот срок не статистически существенен в 90%-ом или более высоком уровне веры.

Они по показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета f-критерия Стьюдента:

.

Величина bо оценивает агрегированное влияние прочих (кроме учтенных в модели факторов x1, и х2) факторов на результат у.

Величины Ь{ и Ь2 указывают, что с увеличением x1, и х2 на единицу их значений результат увеличивается соответственно на и на . при фиксированном значении другого фактора. Сравнивать эти значения не следует, так как они зависят от единиц измерения каждого признака и потому несопоставимы между собой.

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи Ryx1x2 дает F-критерий Фишера:

По данным таблиц 1.6; 1.7., дисперсионного анализа, = 22,3837. Вероятность случайно получить такое значение F-критерия составляет 0,0000, что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина Р-- значения из этих же таблиц. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи R2yx1x2

Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены в таблицах 1.6; 1.7., в рамках регрессионной статистики.

Нескорректированный коэффициент множественной детерминации R2yx1x2 = 0,7248 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 72,4% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами, -- на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации R2yx1x2 = 0,6924 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и потому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую детерминированность результата у в модели факторами х1 и х2.

5.Информация для оценки целесообразности включения в модель фактора х1 после фактора х2 и фактора х2 после фактора х1 может быть получена в ППП Statgraphics с помощью частных F-критериев Фишера.

Результаты вычисления показаны в таблице 1.8.(1,2)

Частный F-критерий -- Fчастн х2, показывает статистическую значимость включения фактора х2 в модель после того, как в нее включен фактор х1

Таблица 1.8.(1)

Further ANOVA for Variables in the Order Fitted

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

x1

798,728

1

798,728

43,84

0,0000

x2

16,8941

1

16,8941

0,93

0,3491

Model

815,622

2

Fчастн х2 = 0,93. Вероятность случайной природы его значения (Р - значение = 0,3491) составляет 34,9% против принятого уровня значимости б = 0,05, (5%). Следовательно, включение в модель фактора х2 -- уровень рентабельности всей сельскохозяйственной продукции - после того как в уравнение включен фактор х1 - коэффициент обновления основных фондов -- статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака х2 оказывается незначимым, несущественным; фактор х2 включать в уравнение после фактора х1 не следует.

Таблица 1.8.(2)

Further ANOVA for Variables in the Order Fitted

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

x1

810,772

1

810,772

44,50

0,0000

x2

4,84954

1

4,84954

0,27

0,6126

Model

815,622

2

Эта таблица показывает статистическое значение каждой переменной, поскольку это было добавлено к модели. Мы можете использовать эту таблицу, чтобы помочь определять насколько модель могла быть упрощена, особенно если Вы приспосабливаете полиномиалу.

При включении х1 после х2 результат расчета частного F-критерия для х1 будет иным: Fчастн х1=0,27. Вероятность его случайного формирования составила 61,2%, что значительно меньше принятого стандарта а = 0,05 (5%). Следовательно, значение частного F-критерия для дополнительно включенного фактора х1 не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора х1 является существенным. Фактор х1 должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора х2.

-80,9959

6. Средние частные коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора . на 1% от своей средней и при фиксированном воздействии на у всех прочих Факторов, включенных в уравнение регрессии. Для линейной зависимости

где - коэффициент регрессии при в уравнении множественной регрессии.

Здесь

Значения частных коэффициентов эластичности говорят о более сильном влиянии на результат у признака фактора х1, чем признака фактора х2: 12,6799% против 4,1289%.

7. Определяем точечный прогноз годового производства сельскохозяйственной продукции путем подстановки в уравнение регрессии прогнозных значений факторных признаков (х1 = 85 и х2 = 15):

Стандартная ошибка регрессии (S) определена в «Регрессионной статистике» ППП Excel: S=4,2684.

Размещено на Allbest.ru


Подобные документы

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Факторные и результативные признаки адекватности модели. Исследование взаимосвязи энерговооруженности и выпуска готовой продукции. Построение уравнения регрессии и вычисление коэффициента регрессии. Графики практической и теоретической линии регрессии.

    контрольная работа [45,2 K], добавлен 20.01.2015

  • Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.

    контрольная работа [222,5 K], добавлен 08.05.2014

  • Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.

    контрольная работа [216,6 K], добавлен 12.05.2010

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Прямая регрессии. Стандартная ошибка оценки. Использование функции "Линейная линия тренда" электронных таблиц Microsoft Excell для выведения на график уравнения регрессии. Оценка случайного отклонения. Построение прогнозного значения на основе данных.

    контрольная работа [44,0 K], добавлен 08.02.2015

  • Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.

    контрольная работа [250,5 K], добавлен 11.04.2015

  • Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.

    контрольная работа [1,4 M], добавлен 25.06.2010

  • Расчет параметров A и B уравнения линейной регрессии. Оценка полученной точности аппроксимации. Построение однофакторной регрессии. Дисперсия математического ожидания прогнозируемой величины. Тестирование ошибок уравнения множественной регрессии.

    контрольная работа [63,3 K], добавлен 19.04.2013

  • Расчет уравнения линейной регрессии. Построение на экран графика и доверительной области уравнения. Разработка программы, генерирующей значения случайных величин, имеющих нормальный закон распределения для определения параметров уравнения регрессии.

    лабораторная работа [18,4 K], добавлен 19.02.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.