Дослідження залежності виробництва продукції підприємств від чисельності робітників
Побудова парної лінійної кореляційно-регресійної моделі. Перевірка формули декомпозиції загальної дисперсії результуючої змінної. Розрахунок емпіричного значення відношення детермінації, їх економічна інтерпретація. Оцінка коефіцієнта кореляції.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | украинский |
Дата добавления | 15.11.2014 |
Размер файла | 235,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Індивідуальна робота з дисципліни
«Економетрія»
На тему: «Дослідження залежності виробництва продукції підприємств від чисельності робітників »
Львів - 2011
План
- 1. Побудова аналітичного групування
- 2. Побудова парної лінійної кореляційно-регресійної моделі
- 3. Економічна інтерпретація параметрів моделі
- 4. Обчислення випадкових відхилень та їх інтерпретація
- 5. Перевірка моделі на наявність автокореляції
- 6. Визначення тісноти зв'язку між змінними
- 7. Побудова спряженої кореляційно-регресійної моделі
- 8. Геометрична інтерпретація спряжених моделей
- 9. Перевірка формули декомпозиції загальної дисперсії результуючої змінної
- 10. Обчислення стандартної похибки моделі
- 11. Побудова довірчих інтервалів для оцінки фактичного значення результуючої змінної, його геометрична інтерпретація
- 12. Розрахунок теоретичного та емпіричного значення відношення детермінації, їх економічна інтерпретація. Обчислення кореляційного відношення
- 13. Обчислення вибіркових похибок параметрів регресії. Побудова довірчих інтервалів для істинних значень параметрів регресії, їх геометрична інтерпретація
- 14. Розрахунок вибіркової похибки моделі. Побудова довірчих інтервалів для середнього прогнозного значення результуючої змінної, його геометрична інтерпретація
- 15. Обчислення похибки індивідуального прогнозу. Побудова довірчих інтервалів для середнього прогнозного значення результуючої змінної, геометрична інтерпретація
- 16. Оцінка коефіцієнта кореляції
- 17. Перевірка статистичної значущості параметрів зв'язку між змінними
- 18. Експрес-діагностика моделі
- 19. Економічна інтерпретація результатів економетричного дослідження та їх використання
- регресійний декомпозиція дисперсія кореляція
- Таблиця 1. Вибіркова сукупність даних про чисельність робітників та виробництво продукції на 50 підприємтсвах.
- Факторна ознака (x)- виробничі основні фонди у млн.крб.
- Результуюча змінна (у) - виробництво продукції у млн. крб.
- 1. Побудова аналітичного групування
- Аналітичне групування - це статистична таблиця в якій вказані інтервали значень факторної ознаки, згідно з якими згруповані одиниці сукупності, а також наведені групові середні значення результуючої змінної.
- Кількість груп аналітичного групування встановимо за формулою Стерджеса:
- k=1+3,322Lg507
- Розмір інтервалу:
- ,
- - розмір сукупності,
- ,- відповідно найменше і найбільше значення факторної ознаки.
- ;
- Побудуємо аналітичне групування:
- Таблиця 2 Аналітичне групування виробництва продукції у млн. крб. за чисельністю робітників, чол. по підприємтсвах.
- Результати аналітичного групування можна подати у графічному вигляді. Для цього у декартовій системі координат по осі абсцис відкладають середини інтервалів значень факторної ознаки, а по осі ординат групові середні значення результуючої змінної. Отримана ламана лінія називається емпіричною лінією регресії.
- Малюнок 1 Емпірична лінія регресії залежності виробництва продукції (млн. крб.) підприємств від чисельності робітників (чол.)
- Основним недоліком аналітичного групування є низька точність. У цьому легко переконатися, змінивши кількість груп.
- На основі отриманих даних не можна зробити чіткого висновку про те, що між виробництвом продукції підприємств та чисельністю робітників існує кореляційна залежність.
№ пор. підприємтсва |
Чисельність робітників, чол.. |
Виробництво продукції, млн. крб. |
|
X |
Y |
||
1 |
270 |
5 |
|
2 |
280 |
6 |
|
3 |
210 |
10 |
|
4 |
320 |
7,7 |
|
5 |
160 |
10,6 |
|
6 |
130 |
8,7 |
|
7 |
170 |
5,9 |
|
8 |
220 |
9,4 |
|
9 |
200 |
7,5 |
|
10 |
100 |
5,4 |
|
11 |
150 |
11,4 |
|
12 |
210 |
5,9 |
|
13 |
200 |
9,5 |
|
14 |
300 |
8,6 |
|
15 |
140 |
5 |
|
16 |
170 |
6,1 |
|
17 |
130 |
8,2 |
|
18 |
200 |
9,5 |
|
19 |
150 |
4,8 |
|
20 |
100 |
3,5 |
|
21 |
160 |
7,6 |
|
22 |
190 |
6,3 |
|
23 |
210 |
6,6 |
|
24 |
130 |
7,5 |
|
25 |
240 |
10,7 |
|
26 |
250 |
6,4 |
|
27 |
160 |
7,3 |
|
28 |
130 |
4,1 |
|
29 |
140 |
6 |
|
30 |
150 |
7,4 |
|
31 |
220 |
9,9 |
|
32 |
170 |
7,4 |
|
33 |
100 |
11 |
|
34 |
170 |
5,2 |
|
35 |
230 |
6,2 |
|
36 |
200 |
6,8 |
|
37 |
280 |
8,9 |
|
38 |
180 |
7,1 |
|
39 |
140 |
5,2 |
|
40 |
202 |
6,4 |
|
41 |
270 |
8,5 |
|
42 |
150 |
9,7 |
|
43 |
143 |
5,7 |
|
44 |
141 |
4,7 |
|
45 |
302 |
5,6 |
|
46 |
110 |
5,5 |
|
47 |
250 |
11,9 |
|
48 |
180 |
6,3 |
|
49 |
108 |
8,4 |
|
50 |
190 |
6,5 |
Номер з/п |
чисельність робітників, чол. |
Кількість підприємтсв |
Середнє значення виробництва продукції, млн. крб. |
|
1 |
100-131,4 |
9 |
6,92 |
|
2 |
131,4-162,8 |
12 |
7,12 |
|
3 |
162,8-194,2 |
8 |
6,35 |
|
4 |
194,2-225,6 |
10 |
8,15 |
|
5 |
225,6-257,0 |
4 |
8,8 |
|
6 |
257,0-288,4 |
4 |
7,1 |
|
7 |
288,4-320 |
3 |
7,3 |
|
Разом |
50 |
|||
У середньому |
7,31 |
2. Побудова парної лінійної кореляційно-регресійної моделі
Будемо вважати, що кореляційна залежність результуючої змінної від факторної ознаки є лінійною і описується рівнянням регресії (узагальнена ПЛКРМ):
- коефіцієнт регресії,
- вільний член регресії.
- випадкова величина, яка містить різноманітні стохастичні збурення, помилки спостереження та вимірювання тощо. Вона не спостерігається
Оскільки ці параметри нам невідомі, то ми повинні здійснити їх оцінку. Щоб одержати оцінки параметрів на основі заданих статистичних даних необхідно побудувати рівняння регресії (вибіркову ПЛКРМ) :
- теоретичне, нормативне або прогнозне значення результуючої змінної.
Емпіричні дані, на підставі яких будують модель це вибірка значень двовимірного випадкового вектора (X;Y). Вважатимемо, що параметри моделі для кожного спостереження залишаються постійними, а змінна епсілон набуває різних значень, проте її неможливо спостерігати.
Щоб одержати оцінки застосуємо метод найменших квадратів, знайшовши мінімум функції:
Тобто знаходимо такі значення параметрів , при яких значення суми квадратів відхилень заданих значень результуючих змінних від відповідних їм нормативних значень найменше. Щоб знайти слід розв'язати систему:
Скористаємося формулами для практичного розрахунку :
Таблиця 3. Вихідні дані та допоміжні розрахунки для обчислення залежності виробництва продукції підприємств (млн.. крб.) від чисельністі робітників (чол.) цих підприємств
№ пор. |
чисельність робітників (чол.) |
Виробництво продукції, млн. крб. |
|
||
1 |
270 |
5 |
1350 |
72900 |
|
2 |
280 |
6 |
1680 |
78400 |
|
3 |
210 |
10 |
2100 |
44100 |
|
4 |
320 |
7,7 |
2464 |
102400 |
|
5 |
160 |
10,6 |
1696 |
25600 |
|
6 |
130 |
8,7 |
1131 |
16900 |
|
7 |
170 |
5,9 |
1003 |
28900 |
|
8 |
220 |
9,4 |
2068 |
48400 |
|
9 |
200 |
7,5 |
1500 |
40000 |
|
10 |
100 |
5,4 |
540 |
10000 |
|
11 |
150 |
11,4 |
1710 |
22500 |
|
12 |
210 |
5,9 |
1239 |
44100 |
|
13 |
200 |
9,5 |
1900 |
40000 |
|
14 |
300 |
8,6 |
2580 |
90000 |
|
15 |
140 |
5 |
700 |
19600 |
|
16 |
170 |
6,1 |
1037 |
28900 |
|
17 |
130 |
8,2 |
1066 |
16900 |
|
18 |
200 |
9,5 |
1900 |
40000 |
|
19 |
150 |
4,8 |
720 |
22500 |
|
20 |
100 |
3,5 |
350 |
10000 |
|
21 |
160 |
7,6 |
1216 |
25600 |
|
22 |
190 |
6,3 |
1197 |
36100 |
|
23 |
210 |
6,6 |
1386 |
44100 |
|
24 |
130 |
7,5 |
975 |
16900 |
|
25 |
240 |
10,7 |
2568 |
57600 |
|
26 |
250 |
6,4 |
1600 |
62500 |
|
27 |
160 |
7,3 |
1168 |
25600 |
|
28 |
130 |
4,1 |
533 |
16900 |
|
29 |
140 |
6 |
840 |
19600 |
|
30 |
150 |
7,4 |
1110 |
22500 |
|
31 |
220 |
9,9 |
2178 |
48400 |
|
32 |
170 |
7,4 |
1258 |
28900 |
|
33 |
100 |
11 |
1100 |
10000 |
|
34 |
170 |
5,2 |
884 |
28900 |
|
35 |
230 |
6,2 |
1426 |
52900 |
|
36 |
200 |
6,8 |
1360 |
40000 |
|
37 |
280 |
8,9 |
2492 |
78400 |
|
38 |
180 |
7,1 |
1278 |
32400 |
|
39 |
140 |
5,2 |
728 |
19600 |
|
40 |
202 |
6,4 |
1292,8 |
40804 |
|
41 |
270 |
8,5 |
2295 |
72900 |
|
42 |
150 |
9,7 |
1455 |
22500 |
|
43 |
143 |
5,7 |
815,1 |
20449 |
|
44 |
141 |
4,7 |
662,7 |
19881 |
|
45 |
302 |
5,6 |
1691,2 |
91204 |
|
46 |
110 |
5,5 |
605 |
12100 |
|
47 |
250 |
11,9 |
2975 |
62500 |
|
48 |
180 |
6,3 |
1134 |
32400 |
|
49 |
108 |
8,4 |
907,2 |
11664 |
|
50 |
190 |
6,5 |
1235 |
36100 |
|
сума |
9306 |
365,5 |
69099 |
1891502 |
За методом найменших квадратів маємо:
=6,0587 (млн.. крб.)
= 0,0067 (млн.. крб./робочого)
Рівняння регресії має вигляд:
6,0587+0,0067 х
Областю існування кореляційно-регресійної моделі є інтервал X [100; 320]
Таблиця 4. Теоретичні значення виробництва продукції підприємств (млн.. крб.) від величини чисельності робітників (чол.) цих підприємств.
X |
||
270 |
7,87394 |
|
280 |
7,94117 |
|
210 |
7,47055 |
|
320 |
8,2101 |
|
160 |
7,13439 |
|
130 |
6,9327 |
|
170 |
7,20162 |
|
220 |
7,53778 |
|
200 |
7,40332 |
|
100 |
6,731 |
|
150 |
7,06716 |
|
210 |
7,47055 |
|
200 |
7,40332 |
|
300 |
8,07564 |
|
140 |
6,99993 |
|
170 |
7,20162 |
|
130 |
6,9327 |
|
200 |
7,40332 |
|
150 |
7,06716 |
|
100 |
6,731 |
|
160 |
7,13439 |
|
190 |
7,33609 |
|
210 |
7,47055 |
|
130 |
6,9327 |
|
240 |
7,67224 |
|
250 |
7,73948 |
|
160 |
7,13439 |
|
130 |
6,9327 |
|
140 |
6,99993 |
|
150 |
7,06716 |
|
220 |
7,53778 |
|
170 |
7,20162 |
|
100 |
6,731 |
|
170 |
7,20162 |
|
230 |
7,60501 |
|
200 |
7,40332 |
|
280 |
7,94117 |
|
180 |
7,26885 |
|
140 |
6,99993 |
|
202 |
7,41676 |
|
270 |
7,87394 |
|
150 |
7,06716 |
|
143 |
7,0201 |
|
141 |
7,00665 |
|
302 |
8,08908 |
|
110 |
6,79823 |
|
250 |
7,73948 |
|
180 |
7,26885 |
|
108 |
6,78479 |
|
190 |
7,33609 |
Пряма регресії матиме вигляд:
Малюнок 2 Пряма регресії, яка описує залежність виробництва продукції підприємств (млн.. крб.) від чисельність робітників (чол.) цих підприємств.
3. Економічна інтерпретація параметрів моделі
На основі аналізу коефіцієнта регресії = 0,0067 (млн.. крб./робочого) можна зробити висновки:
ь оскільки він відмінний від 0, то на підставі вибірки можна стверджувати, що між виробництвом продукції підприємств та чисельністю робітників (чол.) існує лінійна кореляційна залежність;
ь оскільки значення додатнє, то при збільшенні чисельністі робітників середнє значення виробництва продукції на підприємствах зростає;
ь при збільшенні чисельністі робітників на 1 середнє значення виробництва продукції на підприємствах зросте на 0,0067 млн. крб.;
Вільний член рівняння регресії =6,0587 (млн.. крб.) показує нам ,що при відсутності працівників виробництво продукції у середньому буде становити 6,0587 (млн.. крб.). Слід зауважити, що таке інтерпретування вільного члена є достатньо умовним, оскільки значення факторної ознаки х=0 не входить в область існування моделі. Ми всі добре розуміємо, що без виробничих фондів неможливий випуск продукції.
4. Обчислення випадкових відхилень та їх інтерпретація
Маючи рівняння регресії можна обчислити відхилення фактичних значень результуючої змінної від відповідних теоретичних (нормативних) значень .
Таблиця 5. Випадкові відхилення виробництва продукції (млн. крб.) підприємств
№ п/п |
Виробництво продукції (млн. крб.) фактичне значення |
Виробництво продукції (млн. крб.)теоретичне значення |
Випадкові відхилення, (млн. крб.) |
|
1 |
5 |
7,87394 |
-2,87394 |
|
2 |
6 |
7,94117 |
-1,94117 |
|
3 |
10 |
7,47055 |
2,52945 |
|
4 |
7,7 |
8,2101 |
-0,5101 |
|
5 |
10,6 |
7,13439 |
3,46561 |
|
6 |
8,7 |
6,9327 |
1,7673 |
|
7 |
5,9 |
7,20162 |
-1,30162 |
|
8 |
9,4 |
7,53778 |
1,86222 |
|
9 |
7,5 |
7,40332 |
0,09668 |
|
10 |
5,4 |
6,731 |
-1,331 |
|
11 |
11,4 |
7,06716 |
4,33284 |
|
12 |
5,9 |
7,47055 |
-1,57055 |
|
13 |
9,5 |
7,40332 |
2,09668 |
|
14 |
8,6 |
8,07564 |
0,52436 |
|
15 |
5 |
6,99993 |
-1,99993 |
|
16 |
6,1 |
7,20162 |
-1,10162 |
|
17 |
8,2 |
6,9327 |
1,2673 |
|
18 |
9,5 |
7,40332 |
2,09668 |
|
19 |
4,8 |
7,06716 |
-2,26716 |
|
20 |
3,5 |
6,731 |
-3,231 |
|
21 |
7,6 |
7,13439 |
0,46561 |
|
22 |
6,3 |
7,33609 |
-1,03609 |
|
23 |
6,6 |
7,47055 |
-0,87055 |
|
24 |
7,5 |
6,9327 |
0,5673 |
|
25 |
10,7 |
7,67224 |
3,02776 |
|
26 |
6,4 |
7,73948 |
-1,33948 |
|
27 |
7,3 |
7,13439 |
0,16561 |
|
28 |
4,1 |
6,9327 |
-2,8327 |
|
29 |
6 |
6,99993 |
-0,99993 |
|
30 |
7,4 |
7,06716 |
0,33284 |
|
31 |
9,9 |
7,53778 |
2,36222 |
|
32 |
7,4 |
7,20162 |
0,19838 |
|
33 |
11 |
6,731 |
4,269 |
|
34 |
5,2 |
7,20162 |
-2,00162 |
|
35 |
6,2 |
7,60501 |
-1,40501 |
|
36 |
6,8 |
7,40332 |
-0,60332 |
|
37 |
8,9 |
7,94117 |
0,95883 |
|
38 |
7,1 |
7,26885 |
-0,16885 |
|
39 |
5,2 |
6,99993 |
-1,79993 |
|
40 |
6,4 |
7,41676 |
-1,01676 |
|
41 |
8,5 |
7,87394 |
0,62606 |
|
42 |
9,7 |
7,06716 |
2,63284 |
|
43 |
5,7 |
7,0201 |
-1,3201 |
|
44 |
4,7 |
7,00665 |
-2,30665 |
|
45 |
5,6 |
8,08908 |
-2,48908 |
|
46 |
5,5 |
6,79823 |
-1,29823 |
|
47 |
11,9 |
7,73948 |
4,16052 |
|
48 |
6,3 |
7,26885 |
-0,96885 |
|
49 |
8,4 |
6,78479 |
1,61521 |
|
50 |
6,5 |
7,33609 |
-0,83609 |
На основі таблиці 5 можна стверджувати, що продуктивність праці робітників найгірша на 20 підприємстві (3,231 млн. крб.), а найкраща - на 11 підприємстві (4,33284 млн. крб.), ніж в середньому на підприємствах.
5. Перевірка моделі на наявність автокореляції
Одним з припущень класичного кореляційно-регресійного аналізу є припущення про незалежність випадкових величин .
Для перевірки моделі на наявність автокореляції використаємо коефіцієнт Дарбіна - Уотсона, який обчислимо за формулою:
Його ще називають d-статистика.
Автокореляція визначає зв'язок між значеннями результуючої змінної, які спостерігаються.
Таблиця 6.Допоміжні розрахунки для обчислення DW-критерію Дарбіна-Уотсона
№ п/п |
Виробництво продукції (млн. крб.) фактичне значення |
Виробництво продукції (млн. крб.) теоретичне значення |
Випадкові відхилення, (млн. крб.) |
||||
1 |
5 |
7,87394 |
-2,87394 |
8,25953 |
|||
2 |
6 |
7,94117 |
-1,94117 |
0,93277 |
0,87006 |
3,76815 |
|
3 |
10 |
7,47055 |
2,52945 |
4,47062 |
19,9865 |
6,39812 |
|
4 |
7,7 |
8,2101 |
-0,5101 |
-3,03955 |
9,23886 |
0,2602 |
|
5 |
10,6 |
7,13439 |
3,46561 |
3,97571 |
15,8063 |
12,0104 |
|
6 |
8,7 |
6,9327 |
1,7673 |
-1,6983 |
2,88424 |
3,12337 |
|
7 |
5,9 |
7,20162 |
-1,30162 |
-3,06893 |
9,41831 |
1,69422 |
|
8 |
9,4 |
7,53778 |
1,86222 |
3,16384 |
10,0099 |
3,46786 |
|
9 |
7,5 |
7,40332 |
0,09668 |
-1,76554 |
3,11712 |
0,00935 |
|
10 |
5,4 |
6,731 |
-1,331 |
-1,42768 |
2,03828 |
1,77156 |
|
11 |
11,4 |
7,06716 |
4,33284 |
5,66384 |
32,0791 |
18,7735 |
|
12 |
5,9 |
7,47055 |
-1,57055 |
-5,90339 |
34,85 |
2,46663 |
|
13 |
9,5 |
7,40332 |
2,09668 |
3,66723 |
13,4486 |
4,39608 |
|
14 |
8,6 |
8,07564 |
0,52436 |
-1,57232 |
2,47218 |
0,27496 |
|
15 |
5 |
6,99993 |
-1,99993 |
-2,52429 |
6,37205 |
3,99971 |
|
16 |
6,1 |
7,20162 |
-1,10162 |
0,8983 |
0,80695 |
1,21357 |
|
17 |
8,2 |
6,9327 |
1,2673 |
2,36893 |
5,61182 |
1,60606 |
|
18 |
9,5 |
7,40332 |
2,09668 |
0,82938 |
0,68787 |
4,39608 |
|
19 |
4,8 |
7,06716 |
-2,26716 |
-4,36384 |
19,0431 |
5,14001 |
|
20 |
3,5 |
6,731 |
-3,231 |
-0,96384 |
0,92899 |
10,4394 |
|
21 |
7,6 |
7,13439 |
0,46561 |
3,69661 |
13,6649 |
0,21679 |
|
22 |
6,3 |
7,33609 |
-1,03609 |
-1,5017 |
2,25509 |
1,07347 |
|
23 |
6,6 |
7,47055 |
-0,87055 |
0,16554 |
0,0274 |
0,75786 |
|
24 |
7,5 |
6,9327 |
0,5673 |
1,43785 |
2,06742 |
0,32183 |
|
25 |
10,7 |
7,67224 |
3,02776 |
2,46045 |
6,05382 |
9,1673 |
|
26 |
6,4 |
7,73948 |
-1,33948 |
-4,36723 |
19,0727 |
1,7942 |
|
27 |
7,3 |
7,13439 |
0,16561 |
1,50509 |
2,26528 |
0,02743 |
|
28 |
4,1 |
6,9327 |
-2,8327 |
-2,9983 |
8,98983 |
8,02416 |
|
29 |
6 |
6,99993 |
-0,99993 |
1,83277 |
3,35904 |
0,99985 |
|
30 |
7,4 |
7,06716 |
0,33284 |
1,33277 |
1,77627 |
0,11078 |
|
31 |
9,9 |
7,53778 |
2,36222 |
2,02938 |
4,11837 |
5,58008 |
|
32 |
7,4 |
7,20162 |
0,19838 |
-2,16384 |
4,68221 |
0,03935 |
|
33 |
11 |
6,731 |
4,269 |
4,07062 |
16,57 |
18,2244 |
|
34 |
5,2 |
7,20162 |
-2,00162 |
-6,27062 |
39,3207 |
4,00649 |
|
35 |
6,2 |
7,60501 |
-1,40501 |
0,59661 |
0,35594 |
1,97406 |
|
36 |
6,8 |
7,40332 |
-0,60332 |
0,8017 |
0,64272 |
0,36399 |
|
37 |
8,9 |
7,94117 |
0,95883 |
1,56215 |
2,4403 |
0,91935 |
|
38 |
7,1 |
7,26885 |
-0,16885 |
-1,12768 |
1,27167 |
0,02851 |
|
39 |
5,2 |
6,99993 |
-1,79993 |
-1,63107 |
2,6604 |
3,23974 |
|
40 |
6,4 |
7,41676 |
-1,01676 |
0,78316 |
0,61334 |
1,03381 |
|
41 |
8,5 |
7,87394 |
0,62606 |
1,64282 |
2,69887 |
0,39195 |
|
42 |
9,7 |
7,06716 |
2,63284 |
2,00678 |
4,02717 |
6,93185 |
|
43 |
5,7 |
7,0201 |
-1,3201 |
-3,95294 |
15,6257 |
1,74266 |
|
44 |
4,7 |
7,00665 |
-2,30665 |
-0,98655 |
0,97329 |
5,32064 |
|
45 |
5,6 |
8,08908 |
-2,48908 |
-0,18243 |
0,03328 |
6,19553 |
|
46 |
5,5 |
6,79823 |
-1,29823 |
1,19085 |
1,41812 |
1,68541 |
|
47 |
11,9 |
7,73948 |
4,16052 |
5,45876 |
29,798 |
17,31 |
|
48 |
6,3 |
7,26885 |
-0,96885 |
-5,12938 |
26,3105 |
0,93868 |
|
49 |
8,4 |
6,78479 |
1,61521 |
2,58407 |
6,67741 |
2,60892 |
|
50 |
6,5 |
7,33609 |
-0,83609 |
-2,4513 |
6,00887 |
0,69904 |
|
Всього |
415,449 |
195,197 |
Отже:
Після обчислення d-статистики задамо рівень значущості =0,05 і за таблицями d-статистики Дарбіна-Уотсона при заданому рівні значущості, кількості факторів k (в нашому випадку k=1) та кількості спостережень n (n=50) знаходять критичні значення статистики.
· якщо емпіричне значення d-статистики попадає в інтервал ( ; 4-), то автокореляції відсутня;
· якщо емпіричне значення d-статистики потрапляє в інтервал (0 ; ), то це свідчить про наявність додатної автокореляції;
· якщо емпіричне значення d-статистики потрапляє в інтервал (4 - ; 4), то наявна відємна автокореляція;
· якщо емпіричне значення d-статистики потрапляє в інтервал [ ; ], [4 - ; 4 - ] то неможливо зробити висновок про наявність чи відсутність автокореляції.
Із таблиць Дарбіна-Уотсона =1,503, =1,585
додатня автокореляція автокореляція відсутня від'ємна автокореляція
01,5031,585 2 2,415 2.497 4
Оскільки емпіричне значення d-статистики потрапляє в інтервал, де автокореляція відсутня, то з довірчою ймовірністю 0,95 можна стверджувати, що у вибірковій сукупності автокореляція відсутня.
Оскільки маємо справу з малою вибіркою, можемо застосувати також критерій фон Неймана:
Критичне значення критерію фон Неймана при рівні значущості =0,05 та ступенях вільності 50 дорівнює =1,65. Оскільки критерій фон Неймана є більшим за критичне значення (2,1718>1,65), то з ймовірністю 0,95 можна стверджувати, що у вибірковій сукупності автокореляція відсутня. Тобто, для оцінювання невідомих параметрів парної кореляційно-регресійної моделі можна використовувати метод найменших квадратів.
6. Визначення тісноти зв'язку між змінними
Коефіцієнти різних рівнянь регресії при неоднакових одиницях вимірювання результуючої або факторної змінної не можна зіставляти чи порівнювати між собою. В той же час на практиці часто виникає необхідність зіставлення двох чи декількох рівнянь регресії й оцінки їх тісноти зв'язку. Таке зіставлення різних рівнянь регресії можливе лише на основі деяких безрозмірних одиниць виміру.
Для лінійної форми зв'язку між результуючою й факторною змінними найчастіше використовують коефіцієнт кореляції, який обчислюють за такою формулою:
.
1. -1 r 1
2. Якщо значення коефіцієнта кореляції дорівнює за модулем одиниці, то це означає, що між результуючою і фактичною змінними є функціональний зв'язок.
3. Якщо коефіцієнт кореляції близький до нуля, то зв'язок між змінними х та у відсутній.
4. Із зростанням абсолютної величини r лінійна залежність між факторами стає більш тісною.
5. При додатних значеннях r із зростанням факторної змінної середнє значення результуючої змінної збільшується, а при від'ємних зменшується.
6. Знак r співпадає із знаком коефіцієнта регресії b1.
Таблиця 7.Допоміжні розрахунки для обчислення коефіцієнта кореляції r
№ п/п |
Чисельність робітників (чол.) |
Виробництво продукції, млн. крб. |
Xi*Yi |
Xi^2 |
Yi^2 |
|
1 |
270 |
5 |
1350 |
72900 |
25 |
|
2 |
280 |
6 |
1680 |
78400 |
36 |
|
3 |
210 |
10 |
2100 |
44100 |
100 |
|
4 |
320 |
7,7 |
2464 |
102400 |
59,29 |
|
5 |
160 |
10,6 |
1696 |
25600 |
112,36 |
|
6 |
130 |
8,7 |
1131 |
16900 |
75,69 |
|
7 |
170 |
5,9 |
1003 |
28900 |
34,81 |
|
8 |
220 |
9,4 |
2068 |
48400 |
88,36 |
|
9 |
200 |
7,5 |
1500 |
40000 |
56,25 |
|
10 |
100 |
5,4 |
540 |
10000 |
29,16 |
|
11 |
150 |
11,4 |
1710 |
22500 |
129,96 |
|
12 |
210 |
5,9 |
1239 |
44100 |
34,81 |
|
13 |
200 |
9,5 |
1900 |
40000 |
90,25 |
|
14 |
300 |
8,6 |
2580 |
90000 |
73,96 |
|
15 |
140 |
5 |
700 |
19600 |
25 |
|
16 |
170 |
6,1 |
1037 |
28900 |
37,21 |
|
17 |
130 |
8,2 |
1066 |
16900 |
67,24 |
|
18 |
200 |
9,5 |
1900 |
40000 |
90,25 |
|
19 |
150 |
4,8 |
720 |
22500 |
23,04 |
|
20 |
100 |
3,5 |
350 |
10000 |
12,25 |
|
21 |
160 |
7,6 |
1216 |
25600 |
57,76 |
|
22 |
190 |
6,3 |
1197 |
36100 |
39,69 |
|
23 |
210 |
6,6 |
1386 |
44100 |
43,56 |
|
24 |
130 |
7,5 |
975 |
16900 |
56,25 |
|
25 |
240 |
10,7 |
2568 |
57600 |
114,49 |
|
26 |
250 |
6,4 |
1600 |
62500 |
40,96 |
|
27 |
160 |
7,3 |
1168 |
25600 |
53,29 |
|
28 |
130 |
4,1 |
533 |
16900 |
16,81 |
|
29 |
140 |
6 |
840 |
19600 |
36 |
|
30 |
150 |
7,4 |
1110 |
22500 |
54,76 |
|
31 |
220 |
9,9 |
2178 |
48400 |
98,01 |
|
32 |
170 |
7,4 |
1258 |
28900 |
54,76 |
|
33 |
100 |
11 |
1100 |
10000 |
121 |
|
34 |
170 |
5,2 |
884 |
28900 |
27,04 |
|
35 |
230 |
6,2 |
1426 |
52900 |
38,44 |
|
36 |
200 |
6,8 |
1360 |
40000 |
46,24 |
|
37 |
280 |
8,9 |
2492 |
78400 |
79,21 |
|
38 |
180 |
7,1 |
1278 |
32400 |
50,41 |
|
39 |
140 |
5,2 |
728 |
19600 |
27,04 |
|
40 |
202 |
6,4 |
1292,8 |
40804 |
40,96 |
|
41 |
270 |
8,5 |
2295 |
72900 |
72,25 |
|
42 |
150 |
9,7 |
1455 |
22500 |
94,09 |
|
43 |
143 |
5,7 |
815,1 |
20449 |
32,49 |
|
44 |
141 |
4,7 |
662,7 |
19881 |
22,09 |
|
45 |
302 |
5,6 |
1691,2 |
91204 |
31,36 |
|
46 |
110 |
5,5 |
605 |
12100 |
30,25 |
|
47 |
250 |
11,9 |
2975 |
62500 |
141,61 |
|
48 |
180 |
6,3 |
1134 |
32400 |
39,69 |
|
49 |
108 |
8,4 |
907,2 |
11664 |
70,56 |
|
50 |
190 |
6,5 |
1235 |
36100 |
42,25 |
|
Сума |
9306 |
365,5 |
69099 |
1891502 |
2874,21 |
У нашому прикладі коефіцієнт кореляції r = 0,1887. Це свідчить про те, що кореляційний зв'язок між виробництвом продукції (млн. крб.) підприємств та чисельністю робітників (чол.) є дуже слабкий.
7. Побудова спряженої кореляційно-регресійної моделі
Якщо за факторну ознаку взяти виробництво продукції підприємтсрв. А за результуючу - чисельність робітників, то можна побудувати рівняння прямої регресії x на y:
,
яке називають спряженим до рівняння регресії y на x.
Параметри і можна знайти декількома способами
· аналогічно параметрам та :
· за допомогою формули:
З цієї формули випливає, що:
Модуль розкриваємо зі знаком коефіцієнта регресії.
визначаємо з формули:
За обома способами отримуємо:
= 5,297 (робочих/ млн. крб.)
= 147,3989 (робочих)
Спряжену кореляційно-регресійну модель можна зобразити так:
=147,3989+5,297y
На основі аналізу коефіцієнта регресії = 5,297 (робочих/ млн. крб.) можна зробити наступні висновки:
· оскільки він відмінний від 0, то на підставі вибірки можна стверджувати,що між виробництвом продукції та чисельністю працівників на підприємтсвах існує лінійна кореляційна залежність;
· оскільки значення додатнє, то при збільшенні виробництва продукції середнє значення чисельністі працівників в середньому зростає;
· при збільшенні виробництва продукції на 1 млн. крб. середнє значення чисельністі працівників на підприємтсвах в середньому зросте на 5 працівників.
Вільний член рівняння регресії показує нам ,що при відсутності виробництва продукції - в середньому чисельність працівників на підприємтсвах буде становити 147 (робочих).
Розрахуємо теоретичні значення величини виробничих фондів на основі спряженої моделі:
Таблиця 8. Теоретичні значення величини виробничих фондів, млн.крб. на основі побудованого спряженого рівняння регресії
№ п/п |
Чисельність робітників чол. (фактичні значення) |
Чисельність робітників чол. (нормативні значення) |
|
1 |
270 |
173,88392 |
|
2 |
280 |
179,18093 |
|
3 |
210 |
200,36894 |
|
4 |
320 |
188,18583 |
|
5 |
160 |
203,54714 |
|
6 |
130 |
193,48283 |
|
7 |
170 |
178,65123 |
|
8 |
220 |
197,19074 |
|
9 |
200 |
187,12643 |
|
10 |
100 |
176,00272 |
|
11 |
150 |
207,78474 |
|
12 |
210 |
178,65123 |
|
13 |
200 |
197,72044 |
|
14 |
300 |
192,95313 |
|
15 |
140 |
173,88392 |
|
16 |
170 |
179,71063 |
|
17 |
130 |
190,83433 |
|
18 |
200 |
197,72044 |
|
19 |
150 |
172,82452 |
|
20 |
100 |
165,93842 |
|
21 |
160 |
187,65613 |
|
22 |
190 |
180,77003 |
|
23 |
210 |
182,35913 |
|
24 |
130 |
187,12643 |
|
25 |
240 |
204,07684 |
|
26 |
250 |
181,29973 |
|
27 |
160 |
186,06703 |
|
28 |
130 |
169,11662 |
|
29 |
140 |
179,18093 |
|
30 |
150 |
186,59673 |
|
31 |
220 |
199,83924 |
|
32 |
170 |
186,59673 |
|
33 |
100 |
205,66594 |
|
34 |
170 |
174,94332 |
|
35 |
230 |
180,24033 |
|
36 |
200 |
183,41853 |
|
37 |
280 |
194,54224 |
|
38 |
180 |
185,00763 |
|
39 |
140 |
174,94332 |
|
40 |
202 |
181,29973 |
|
41 |
270 |
192,42343 |
|
42 |
150 |
198,77984 |
|
43 |
143 |
177,59182 |
|
44 |
141 |
172,29482 |
|
45 |
302 |
177,06212 |
|
46 |
110 |
176,53242 |
|
47 |
250 |
210,43325 |
|
48 |
180 |
180,77003 |
|
49 |
108 |
191,89373 |
|
50 |
190 |
181,82943 |
Малюнок 3 Спряжена пряма регресії, яка описує залежність чисельності працівників (чол..) від виробництва продукції (млн. крб.) на підприємтсвах.
8. Геометрична інтерпретація спряжених моделей
1. Якщо кореляційний взаємозв'язок відсутній між змінними х та у спряжені рівняння регресії зображуються двома перпендикулярними прямими, де ;
2. Якщо між змінними х та у існує функціональний зв'язок то спряжені лінії регресії зливаються в одну пряму;
3. Якщо взаємозв'язок між змінними х та у кореляційний то спряжені лінії регресії перетинаються утворюючи між собою гострий кут .
Побудуємо спряжені лінії регресії на одній координатній площині:
Пару взаємно спряжених моделей можна подати як
Або:
Маємо рівняння прямих, що проходять через 2 точки. Точкою їх перетину є точка ()
Малюнок 4. Спряжені лінії регресії
З графічного зображення спряжених ліній регресії можна зробити про те, що кореляційний зв'язок є дуже слабким. Розрахуємо тангенс кута між прямими:
Таке значення тангенса відповідає куту у 60 градусів.
9. Перевірка формули декомпозиції загальної дисперсії результуючої змінної
Рівність називають формулою декомпозиції загального відхилення;
Різницю називають загальним відхиленням результуючої змінної;
Різницю називають відхиленням, яке можна пояснити з огляду на кореляційно-регресійну модель (пояснене відхилення);
Різницю (випадкове відхилення) називають ще непоясненим відхиленням
Аналогічне співвідношення спостерігається для сум квадратів відхилень:
Якщо дану тотожність поділити на кількість елементів у вибірці, то отримаємо наступне відношення (формула декомпозиції дисперсії):
або
В нашому випадку маємо:
№ п/п |
Виробництво продукції (млн. крб.) фактичне значення |
Виробництво продукції (млн. крб.)теоретичне значення |
||||
1 |
5 |
7,87394 |
5,3361 |
0,31803 |
8,25953 |
|
2 |
6 |
7,94117 |
1,7161 |
0,39838 |
3,76815 |
|
3 |
10 |
7,47055 |
7,2361 |
0,02578 |
6,39812 |
|
4 |
7,7 |
8,2101 |
0,1521 |
0,81018 |
0,2602 |
|
5 |
10,6 |
7,13439 |
10,8241 |
0,03084 |
12,0104 |
|
6 |
8,7 |
6,9327 |
1,9321 |
0,14236 |
3,12337 |
|
7 |
5,9 |
7,20162 |
1,9881 |
0,01175 |
1,69422 |
|
8 |
9,4 |
7,53778 |
4,3681 |
0,05188 |
3,46786 |
|
9 |
7,5 |
7,40332 |
0,0361 |
0,00871 |
0,00935 |
|
10 |
5,4 |
6,731 |
3,6481 |
0,33524 |
1,77156 |
|
11 |
11,4 |
7,06716 |
16,7281 |
0,05897 |
18,7735 |
|
12 |
5,9 |
7,47055 |
1,9881 |
0,02578 |
2,46663 |
|
13 |
9,5 |
7,40332 |
4,7961 |
0,00871 |
4,39608 |
|
14 |
8,6 |
8,07564 |
1,6641 |
0,5862 |
0,27496 |
|
15 |
5 |
6,99993 |
5,3361 |
0,09615 |
3,99971 |
|
16 |
6,1 |
7,20162 |
1,4641 |
0,01175 |
1,21357 |
|
17 |
8,2 |
6,9327 |
0,7921 |
0,14236 |
1,60606 |
|
18 |
9,5 |
7,40332 |
4,7961 |
0,00871 |
4,39608 |
|
19 |
4,8 |
7,06716 |
6,3001 |
0,05897 |
5,14001 |
|
20 |
3,5 |
6,731 |
14,5161 |
0,33524 |
10,4394 |
|
21 |
7,6 |
7,13439 |
0,0841 |
0,03084 |
0,21679 |
|
22 |
6,3 |
7,33609 |
1,0201 |
0,00068 |
1,07347 |
|
23 |
6,6 |
7,47055 |
0,5041 |
0,02578 |
0,75786 |
|
24 |
7,5 |
6,9327 |
0,0361 |
0,14236 |
0,32183 |
|
25 |
10,7 |
7,67224 |
11,4921 |
0,13122 |
9,1673 |
|
26 |
6,4 |
7,73948 |
0,8281 |
0,18445 |
1,7942 |
|
27 |
7,3 |
7,13439 |
1E-04 |
0,03084 |
0,02743 |
|
28 |
4,1 |
6,9327 |
10,3041 |
0,14236 |
8,02416 |
|
29 |
6 |
6,99993 |
1,7161 |
0,09615 |
0,99985 |
|
30 |
7,4 |
7,06716 |
0,0081 |
0,05897 |
0,11078 |
|
31 |
9,9 |
7,53778 |
6,7081 |
0,05188 |
5,58008 |
|
32 |
7,4 |
7,20162 |
0,0081 |
0,01175 |
0,03935 |
|
33 |
11 |
6,731 |
13,6161 |
0,33524 |
18,2244 |
|
34 |
5,2 |
7,20162 |
4,4521 |
0,01175 |
4,00649 |
|
35 |
6,2 |
7,60501 |
1,2321 |
0,08703 |
1,97406 |
|
36 |
6,8 |
7,40332 |
0,2601 |
0,00871 |
0,36399 |
|
37 |
8,9 |
7,94117 |
2,5281 |
0,39838 |
0,91935 |
|
38 |
7,1 |
7,26885 |
0,0441 |
0,00169 |
0,02851 |
|
39 |
5,2 |
6,99993 |
4,4521 |
0,09615 |
3,23974 |
|
40 |
6,4 |
7,41676 |
0,8281 |
0,0114 |
1,03381 |
|
41 |
8,5 |
7,87394 |
1,4161 |
0,31803 |
0,39195 |
|
42 |
9,7 |
7,06716 |
5,7121 |
0,05897 |
6,93185 |
|
43 |
5,7 |
7,0201 |
2,5921 |
0,08404 |
1,74266 |
|
44 |
4,7 |
7,00665 |
6,8121 |
0,09202 |
5,32064 |
|
45 |
5,6 |
8,08908 |
2,9241 |
0,60697 |
6,19553 |
|
46 |
5,5 |
6,79823 |
3,2761 |
0,26191 |
1,68541 |
|
47 |
11,9 |
7,73948 |
21,0681 |
0,18445 |
17,31 |
|
48 |
6,3 |
7,26885 |
1,0201 |
0,00169 |
0,93868 |
|
49 |
8,4 |
6,78479 |
1,1881 |
0,27585 |
2,60892 |
|
50 |
6,5 |
7,33609 |
0,6561 |
0,00068 |
0,69904 |
|
Сума/50 |
4,0481 |
0,14416 |
3,90394 |
Як бачимо формула декомпозиції загальної дисперсії результуючої змінної справджується доволі точно.
Чим більша пояснена дисперсія і, відповідно, менша непояснена, тим точніше кореляційно-регресійна модель пояснює зв'язок між змінними, і навпаки. В нашому випадку можна зробити висновок, що дана модель не достатньо точно пояснює зв'язок між виробництвом продукції та чисельністю працівників підприємств. Пояснена дисперсія приблизно становить 3,56% від загальної дисперсії, а непояснена відповідно 96,44%
10. Обчислення стандартної похибки моделі
Стандартна похибка оцінки за рівнянням характеризує варіацію фактичних уі навколо теоретичних , знайдених за допомогою рівняння регресії.
На практиці для обчислення стандартної похибки використовують формулу:
,
Або
.
Стандартна похибка моделі за рівнянням регресії має ті ж одиниці вимірювання, що і результуюча змінна .
Стандартна похибка моделі лежить в межах:
є зміщеною оцінкою дисперсії випадкових відхилень. Незміщеною оцінкою дисперсії випадкових відхилень є варіанса:
= 4,0666 (млн. крб.).
11. Побудова довірчих інтервалів для оцінки фактичного значення результуючої змінної, їх геометрична інтерпретація
Інтервал довір'я оцінки за рівнянням регресії можна побудувати маючи значення граничної похибки оцінки. Гранична похибка оцінки обчислюють так:
-- гранична похибка оцінки,
tр - імовірнісний коефіцієнт, який при заданих значеннях ймовірностей знаходять за таблицями нормального закону розподілу, якщо обсяг вибірки великий, а якщо кількість спостережень невелика - за таблицями розподілу Стьюдента,
- стандартна похибка оцінки.
tp =1,677 (користуємося таблицями розподілу Стьюдента), тоді:
Отже довірчий інтервал має вигляд:
Гранична похибка оцінки для окремої задачі є постійною величиною, тому межі довір'я оцінки за рівнянням регресії можна подати у виді лінійних рівнянь:
2,6769 +0,0067 х
9,4405+0,0067 х
Дві прямі на графіку зображуються як лінії, паралельні лінії регресії і віддалені від неї на відстань по вертикалі.
чисельність робітників (чол.) |
||||
270 |
4,49213 |
7,87394 |
11,25575 |
|
280 |
4,55936 |
7,941172 |
11,32298 |
|
210 |
4,08874 |
7,470549 |
10,85236 |
|
320 |
4,82829 |
8,210099 |
11,59191 |
|
160 |
3,75258 |
7,134391 |
10,5162 |
|
130 |
3,55089 |
6,932695 |
10,3145 |
|
170 |
3,81982 |
7,201622 |
10,58343 |
|
220 |
4,15597 |
7,537781 |
10,91959 |
|
200 |
4,02151 |
7,403318 |
10,78512 |
|
100 |
3,34919 |
6,731 |
10,11281 |
|
150 |
3,68535 |
7,067159 |
10,44897 |
|
210 |
4,08874 |
7,470549 |
10,85236 |
|
200 |
4,02151 |
7,403318 |
10,78512 |
|
300 |
4,69383 |
8,075635 |
11,45744 |
|
140 |
3,61812 |
6,999927 |
10,38173 |
|
170 |
3,81982 |
7,201622 |
10,58343 |
|
130 |
3,55089 |
6,932695 |
10,3145 |
|
200 |
4,02151 |
7,403318 |
10,78512 |
|
150 |
3,68535 |
7,067159 |
10,44897 |
|
100 |
3,34919 |
6,731 |
10,11281 |
|
160 |
3,75258 |
7,134391 |
10,5162 |
|
190 |
3,95428 |
7,336086 |
10,71789 |
|
210 |
4,08874 |
7,470549 |
10,85236 |
|
130 |
3,55089 |
6,932695 |
10,3145 |
|
240 |
4,29044 |
7,672245 |
11,05405 |
|
250 |
4,35767 |
7,739476 |
11,12128 |
|
160 |
3,75258 |
7,134391 |
10,5162 |
|
130 |
3,55089 |
6,932695 |
10,3145 |
|
140 |
3,61812 |
6,999927 |
10,38173 |
|
150 |
3,68535 |
7,067159 |
10,44897 |
|
220 |
4,15597 |
7,537781 |
10,91959 |
|
170 |
3,81982 |
7,201622 |
10,58343 |
|
100 |
3,34919 |
6,731 |
10,11281 |
|
170 |
3,81982 |
7,201622 |
10,58343 |
|
230 |
4,22321 |
7,605013 |
10,98682 |
|
200 |
4,02151 |
7,403318 |
10,78512 |
|
280 |
4,55936 |
7,941172 |
11,32298 |
|
180 |
3,88705 |
7,268854 |
10,65066 |
|
140 |
3,61812 |
6,999927 |
10,38173 |
|
202 |
4,03496 |
7,416764 |
10,79857 |
|
270 |
4,49213 |
7,87394 |
11,25575 |
|
150 |
3,68535 |
7,067159 |
10,44897 |
|
143 |
3,63829 |
7,020097 |
10,4019 |
|
141 |
3,62484 |
7,00665 |
10,38846 |
|
302 |
4,70727 |
8,089082 |
11,47089 |
|
110 |
3,41642 |
6,798232 |
10,18004 |
|
250 |
4,35767 |
7,739476 |
11,12128 |
|
180 |
3,88705 |
7,268854 |
10,65066 |
|
108 |
3,40298 |
6,784786 |
10,16659 |
|
190 |
3,95428 |
7,336086 |
10,71789 |
Малюнок 6. Геометрична інтерпретація довірчого інтервалу для оцінки за рівнянням регресії
Тобто, з ймовірністю 0,95 можна стверджувати, що фактичні значення результуючої змінної, зумовлене значенням факторної ознаки, має знаходитися між цими прямими.
12. Розрахунок теоретичного та емпіричного значення відношення детермінації, його економічна інтерпретація. Обчислення кореляційного відношення
Стандартна похибка моделі виражається в одиницях вимірювання результуючої змінної. Це робить неможливим порівняння 2-ох чи кількох КРМ на точність, якщо в них результуюча змінна вимірюється різними одиницями.
Для такого порівняння використовується безвимірна характеристика точності моделі і тісноти зв'язку - відношення детермінації.
Відношенням детермінації називають відношення поясненої дисперсії до всієї дисперсії результуючої змінної:
Із формули випливає, що відношення детермінації може приймати значення з інтервалу: .
Відношення детермінації є показником адекватності усіх кореляційно-регресійних моделей. А в нашому випадку (парна ЛКРМ) його називають коефіцієнтом детермінації
Для обчислення похибки моделі використовують пояснену дисперсію , то для обчислення відношення детермінації зручніше використовувати формулу:
Оскільки обсяг вибірки малий, то під час розрахунку використовуємо варіанси
R2 =0,0356
Отже, в середньому по підприємствах 3,56% зміни випуску продукції пояснюється зміною чисельності робітників.
Кореляційним відношенням називають арифметичне значення кореня квадратного з відношення детермінації:
Є показником сили зв'язку та адекватності моделі для всіх КРМ. Якщо КРМ є парною лінійною, то кореляційне відношення рівне абсолютному значенню коефіцієнта кореляції.
Оскільки R= 0,1887, то зв'язок між факторною ознакою та результуючою змінною можна вважати дуже слабким.
Загальну дисперсію результуючої змінної можна розкласти на суму поясненої та непоясненої дисперсії, як на основі ПЛКРМ так і на основі аналітичного групування. Формула декомпозиції загальної дисперсії змінної у має вигляд:
- кількість груп аналітичного групування;
- число одиниць сукупності в j-ій групі;
- фактичне значення результуючої змінної для і-тої одиниці сукупності j-тої групи;
- середнє значення результуючої змінної в j-ій групі.
Емпіричним відношенням детермінації називають величину:
Порівняння теоретичного відношення детермінації з емпіричним відношенням детермінації, дає змогу робити висновки про адекватність моделі.
= 3,5423
=0,1599
У нашому випадку емпірична регресія пояснює 15,99% усієї дисперсії результуючої змінної, що на 12,43% більше ніж теоретична пряма регресії, побудована методом найменших квадратів. Це означає, що зв'язок між виробництвом продукції та чисельності робітників на підприємствах для заданої вибіркової сукупності краще описувати нелінійною залежністю (степеневою, показниковою тощо), позаяк форма емпіричної лінії регресії є нелінійною.
13. Обчислення вибіркових похибок параметрів регресії. Побудова довірчих інтервалів для істинних значень параметрів регресії, їх геометрична інтерпретація
Якщо при побудові ПЛКРМ методом найменших квадратів виконуються усі припущення класичного кореляційно-регресійного аналізу, то параметри є величинами, які розподілені за нормальним законом.
Параметри нормального закону розподілу випадкових величин невідомі. Якщо замість дисперсії випадкових величин вз'яти її оцінку , то формули для оцінки дисперсій b0 i b1:
Стандартною вибірковою похибкою b0 ПЛКРМ називають величину:
На підставі стандартної похибки при заданому значенні довірчої ймовірності р можна знайти граничну похибку b0 та побудувати довірчий інтервал для істинного значення параметра узагальненої ПЛКРМ:
Геометрично довірчий інтервал інтерпретується парою паралельних прямих, між початковими координатами яких з довірчою ймовірністю р знаходиться істинне значення параметра ПЛКРМ:
Стандартною вибірковою похибкою коефіцієнта регресії b0 ПЛКРМ:
= 0,9822 (млн. крб.)
tp =2,011 (користуємося таблицями розподілу Стьюдента), тоді:
= 2,011 * 0,9822= 1,9752(млн. крб.)
:
5,89876 |
7,87394 |
9,84912 |
|
5,96599 |
7,94117 |
9,91636 |
|
5,49536 |
7,47055 |
9,44573 |
|
6,23491 |
8,2101 |
10,1853 |
|
5,15921 |
7,13439 |
9,10958 |
|
4,95751 |
6,9327 |
8,90788 |
|
5,22644 |
7,20162 |
9,17681 |
|
5,5626 |
7,53778 |
9,51297 |
|
5,42813 |
7,40332 |
9,3785 |
|
4,75582 |
6,731 |
8,70618 |
|
5,09197 |
7,06716 |
9,04234 |
|
5,49536 |
7,47055 |
9,44573 |
|
5,42813 |
7,40332 |
9,3785 |
|
6,10045 |
8,07564 |
10,0508 |
|
5,02474 |
6,99993 |
8,97511 |
|
5,22644 |
7,20162 |
9,17681 |
|
4,95751 |
6,9327 |
8,90788 |
|
5,42813 |
7,40332 |
9,3785 |
|
5,09197 |
7,06716 |
9,04234 |
|
4,75582 |
6,731 |
8,70618 |
|
5,15921 |
7,13439 |
9,10958 |
|
5,3609 |
7,33609 |
9,31127 |
|
5,49536 |
7,47055 |
9,44573 |
|
4,95751 |
6,9327 |
8,90788 |
|
5,69706 |
7,67224 |
9,64743 |
|
5,76429 |
7,73948 |
9,71466 |
|
5,15921 |
7,13439 |
9,10958 |
|
4,95751 |
6,9327 |
8,90788 |
|
5,02474 |
6,99993 |
8,97511 |
|
5,09197 |
7,06716 |
9,04234 |
|
5,5626 |
7,53778 |
9,51297 |
|
5,22644 |
7,20162 |
9,17681 |
|
4,75582 |
6,731 |
8,70618 |
|
5,22644 |
7,20162 |
9,17681 |
|
5,62983 |
7,60501 |
9,5802 |
|
5,42813 |
7,40332 |
9,3785 |
|
5,96599 |
7,94117 |
9,91636 |
|
5,29367 |
7,26885 |
9,24404 |
|
5,02474 |
6,99993 |
8,97511 |
|
5,44158 |
7,41676 |
9,39195 |
|
5,89876 |
7,87394 |
9,84912 |
|
5,09197 |
7,06716 |
9,04234 |
|
5,04491 |
7,0201 |
8,99528 |
|
5,03147 |
7,00665 |
8,98183 |
|
6,1139 |
8,08908 |
10,0643 |
|
4,82305 |
6,79823 |
8,77342 |
|
5,76429 |
7,73948 |
9,71466 |
|
5,29367 |
7,26885 |
9,24404 |
|
4,8096 |
6,78479 |
8,75997 |
|
5,3609 |
7,33609 |
9,31127 |
Малюнок 7. Геометрична інтерпретація довірчого інтервалу для істинного значення
З ймовірністю 95% фактичне значення параметра є між початковим ординатами цих прямих
Стандартна похибка оцінки коефіцієнта регресії B1 обчислюється за формулою:
Гранична похибка оцінки коефіцієнта регресії B0 обчислюється за формулою:
Геометрично довірчий інтервал інтерпретується парою прямих, що перетинаються у точці :
tp =2,011 (користуємося таблицями розподілу Стьюдента), тоді:
= 2,011 * 0,0007= 0,0014
З ймовірністю 95% фактичне значення параметра b1 належить цьому проміжку:
:
Малюнок 8. Геометрична інтерпретація довірчого інтервалу для істинного значення
14. Розрахунок вибіркової похибки моделі. Побудова довірчих інтервалів для середнього прогнозного значення результуючої змінної, геометрична інтерпретація
Знаючи вибіркові похибки параметрів моделі, можна знайти вибіркову похибку всієї моделі. Очевидно, що задача знаходження вибіркової похибки усієї регресії рівносильна задачі знаходження вибіркової похибки теоретичного значення результуючої змінної.
Для того, щоб представити це значення, запишемо ПЛКРМ у такому вигляді:
Згідно теореми про дисперсію двох незалежних випадкових величин маємо:
Дисперсія збігається з дисперсією при нульовому значення факторної ознаки, отже, шляхом математичних перетворень отримаємо таку формулу для обчислення стандартної вибіркової похибки моделі:
Стандартна вибіркова похибка моделі відображає похибку вибірки.
Стандартна вибіркова похибка моделі залежить від конкретного значення факторної ознаки і дає оцінку середнього значення результуючої змінної для цього значення факторної ознаки.
Гранична вибіркова похибка моделі
Геометрично, довірчий інтервал інтерпретується смугою між двома гіперболами:
Нехай x= 100 чол.
За даними обчислень:
За таблицями розподілу Стьюдента з рівнем значущості б=0,05 значення імовірнісного коефіцієнта tp=2,011.
Гранична вибіркова похибка моделі дорівнює:
(млн. крб.)
6,731 (млн . крб.)
Довірчий інтервал за заданого рівня імовірності:
6,1448? y ? 7,3172
Малюнок 9. Геометрична інтерпретація довірчого інтервалу для фактичних значень результуючої змінної
15. Обчислення похибки індивідуального прогнозу. Побудова довірчих інтервалів для середнього прогнозного значення результуючої змінної, геометрична інтерпретація
Похибка оцінки індивідуального прогнозу обчислюється за формулою:
На основі стандартної похибки оцінки індивідуального прогнозу при заданому значенні ймовірності р можна визначити граничну похибку індивідуального прогнозу та побудувати довірчий інтервал для індивідуального прогнозу.
Гранична похибка знаходиться як добуток стандартної похибки на заданий імовірнісний коефіцієнт .
Для х = 100 чол.:
За таблицями розподілу Стьюдента з рівнем значущості б=0,05 значення імовірнісного коефіцієнта tp=2,011.
(млн. крб.)
Малюнок 10. Геометрична інтерпретація довірчого інтервалу індивідуального прогнозу
16. Оцінка коефіцієнта кореляції
Всі випадкові величини ми оцінювали до цього часу (випадкові відхилення, параметри b0 , b1) мали нормальний закон розподілу (або близький до нього), тому для їхньої оцінки можна було будувати симетричний довірчий інтервал, використовуючи таблиці нормального закону розподілу або розподілу Стьюдента:
Коефіцієнт кореляції r не є нормально розподілена випадкова величина. Областю його допустимих значень є інтервал [-1;1], а нормального закону розподілу(-?;+?).
Особливо сильно розподіл r відрізняється від нормального при тісному зв'язку між змінними, тобто коли r за абсолютною величиною близький до одиниці.
Вибіркове значення коефіцієнта кореляції рівне r=-0.1396. Оскільки значення коефіцієнта кореляції r наближене до 0, тобто зв'язок між змінними слабкий, то його розподіл наближається до нормального. Утакому разі стандартну похибку коефіцієнта кореляції визначають за такою формулою:
Гранична вибіркова похибка Z при заданому значенні довірчої ймовірності p=0,95 становить:
ДZ=1,677*0,1378= 0,231;
Припустимо, що ж - невідоме значення випадкової величини Z, яке відповідає істинному значення коефіцієнта кореляції с.
Тоді довірчий інтервал невідомого значення ж має вигляд
,
де zp - значення випадкової величини z, яке згідно з відповідає вибірковому коефіцієнту кореляції r.
Введемо позначення:
z1=zr-Дz z2=zr+Дz
Тоді:
.
0,191-0,231? ж ?0,191+0,231
-0,04? ж ?0,422
Здійснивши обернене перетворення від змінної z до змінної r за формулою:
Отримаємо довірчий інтервал для істинного значення коефіцієнта кореляції с генеральної сукупності
,
-0,0399? с ?0,3976
Отже, з довірчою ймовірністю 0,95 можна стверджувати, що істинне значення коефіцієнта кореляції с генеральної сукупності повинно лежати в межах від -0,0399 до 0,3976.
17. Перевірка статистичної значущості параметрів зв'язку між змінними
Перевірка статистичної значущості параметрів зв'язку між змінними.
Гіпотези - судження про генеральну сукупність. Такі судження стосуються виду невідомого розподілу або параметрів відомого розподілу. Сформульовану гіпотезу будемо називати нульовою (основною) і позначимо . Протилежну називають конкуруючою (альтернативною) і позначають . Обґрунтувати або спростувати гіпотези про генеральну сукупність на основі даних вибірки з цієї сукупності називається статистичним доведенням. Висновки отримані статистичним доведенням здійснюється за такою схемою:
1. на основі даних вибірки формуємо нульову гіпотезу , яку хочемо обґрунтувати або спростувати;
2. відповідно до нульової гіпотези вибираємо критерій (статистику);
Критерій - спеціальна підібрана випадкова величина, точний або наближений розподіл, якої відомий і яка служить для перевірки нульової гіпотези.
Статистика часто має розподіл Гауса (нормальний) або близький до нього, а саме розподіл Стьюдента, розподіл Фішера- Стьюдента, Хі -квадрат.
3. вибираємо рівень значущості - ймовірність відкинути згідно вибраного критерію істинну гіпотезу (має бути малою);
4. знаходимо, як правило, з таблиць критичні значення статистики kкр= kб, які відповідають рівню значущості б;
5. на основі даних вибірки обчислюємо емпіричне значення статистики;
6. робимо висновок про правомірність нульової гіпотези
Для коефіцієнта кореляції формулюється нульова гіпотеза, що реальний коефіцієнт кореляції в генеральній сукупності рівний нулю (с =0).
Необхідно дослідити сумісність вибіркового коефіцієнта кореляції з цією гіпотезою.
Перевірка нульової гіпотези: реальний коефіцієнт кореляції в генеральній сукупності рівний нулю (с =0).
Обсяг вибірки є малий, але зв'язок між змінними не є тісним (r=0,3943), , тому перевіримо цю гіпотезу використаємо статистику:
Критичне значення tакр цієї статистики при заданому рівні значущості б=0,01 знаходимо за таблицями розподілу Стьюдента з n-2 ступенями вільності, tакр =2,682.
Оскільки tем<tтаб (1.3314<2.682), то нульову гіпотезу приймаємо і з довірчою ймовірністю р=0,99 вважаємо, що коефіцієнт кореляції с генеральної сукупності дорівнює нулю, тобто кореляційна залежність виробництва продукції від чисельності робітників на підприємтсвах є статистично незначущою.
Для коефіцієнта регресії формулюється така нульова гіпотеза: коефіцієнт регресії генеральної сукупності в1=0.
Щоб перевірити гіпотезу про статистичну значущість коефіцієнта регресії b1 використаємо t-статистику Стьюдента, емпіричне значення статистики:
Критичні значення tкр= tб цієї статистики призаданому рівні значущості б знаходять за таблицями розподілу Стьюдента з (n-2) ступенями вільності.
Якщо tем > tкр, то нульову гіпотезу відхиляють і з довірчою ймовірністю р=1-б вважають, що коефіцієнт кореляції с генеральної сукупності відмінний від 0.
Якщо tем ? tкр, то з ймовірністю р=1-б немає підстав відхиляти нульову гіпотезу.
tтаб=2,682; tем>tтаб (9,6083>2.682), отже нульову гіпотезу відхиляємо і з довірчою ймовірністю р=0,99 вважаємо, що в1 генеральної сукупності не дорівнює нулю, тобто кореляційна залежність виробництва продукції від чисельності робітників на підприємтсвах є статистично значущою.
18. Експрес-діагностика моделі
В деяких випадках використання аналізу соціально-економічних об'єктів можна обмежитись лише простою перевіркою моделі на адекватність без обчислення стандартної похибки, побудови довірчих інтервалів для істинних значень параметрів моделі та прогнозних значень результуючої змінної. Таку просту і швидку перевірку моделі на адекватність називають експрес-діагностикою моделі.
Експрес-діагностику ПЛКРМ можна здійснити за допомогою критерію Фішера за такою схемою:
1. Формуємо нульову гіпотезу H0: коефіцієнт регресії генеральної сукупності =0:
2. Розраховуємо емпіричне значення F-критерію за формулою:
3. З таблиці F-розподілу при заданому рівні значущості б=0,01 знаходимо критичне значення Fкр=7,077.
Оскільки Fe < Fкр, то H0 приймаємо і з довірчою ймовірністю 0,99 стверджуємо, що ПЛКРМ не відповідає дійсності, тобто не описує адекватно кореляційну залежність виробництва продукції від чисельності робітників на підприємтсвах.
19. Економічна інтерпретація результатів економетричного дослідження та їх використання
Метою економетричного дослідження було визначити наявність і форму кореляційного зв'язку між виробництвом продукції та чисельністю робітників на підприємтсвах.
Методом найменших квадратів була побудована наступна парна лінійна кореляційно-регресійна модель, яка описує залежність виробництва продукції від чисельності робітників на підприємтсвах:
6,0587+0,0067 х
Її областю існування є інтервал : .
За критерієм Дарбіна-Уотсона з довірчою ймовірністю p=0,95 та за критерієм фон Неймана з тією ж самою довірчою ймовірністю стверджуємо що у вибірковій сукупності автокореляція відсутня, і для оцінки невідомих параметрів ПЛКРМ можна використовувати метод найменших квадратів, за допомогою якого отримано ефективні оцінки.
Про те що кореляційна залежність існує можна стверджувати, тому що:
1) коефіцієнт регресії b1 (b1=0,0067) відмінний від нуля;
2) відмінний від нуля коефіцієнт кореляції: r=0,1887;
3) кут між спряженими лініями регресії не рівний 90° (ц=60°);
4) пояснена дисперсія відмінна від нуля, але в нашому випадку є дуже малою і становить всого 3,56 % від загальної;
5) відношення детермінації R2=0,0356 показує, що в середньому по підприємствах 3,56% зміни випуску продукції пояснюється зміною чисельності робітників;
6) порівняння теоретичного відношення детермінації (3,56%) з емпіричним відношенням детермінації (15,99%) дало змогу зробити висновок, що зв'язок між виробництвом продукції та чисельності робітників на підприємствах для заданої вибіркової сукупності краще описувати нелінійною залежністю (степеневою, показниковою тощо), позаяк форма емпіричної лінії регресії є нелінійною;
7) оцінка істинного значення коефіцієнта кореляції показала, що з довірчою ймовірністю 0,95 можна стверджувати, що істинне значення коефіцієнта кореляції с генеральної сукупності повинно лежати в межах від -0,0399 до 0,3976, а оскільки воно відмінне від нуля то це свідчить про існування кореляційного зв'язку;
На основі аналізу коефіцієнта регресії = 0,0067 (млн.. крб./робочого) можна зробити висновки:
ь оскільки він відмінний від 0, то на підставі вибірки можна стверджувати, що між виробництвом продукції підприємств та чисельністю робітників (чол.) існує лінійна кореляційна залежність;
ь оскільки значення додатнє, то при збільшенні чисельністі робітників середнє значення виробництва продукції на підприємствах зростає;
ь при збільшенні чисельністі робітників на 1 середнє значення виробництва продукції на підприємствах зросте на 0,0067 млн. крб.;
Вільний член рівняння регресії =6,0587 (млн.. крб.) показує нам ,що при відсутності працівників виробництво продукції у середньому буде становити 6,0587 (млн.. крб.).
Про правильність проведених обчислень під час побудови моделі свідчить рівність коефіцієнта кореляції обчисленого на основі даних вибірки з коефіцієнтом обчисленим за формулою r= (корінь з добутку коефіцієнтів регресії спряжених моделей) та кореляційним відношенням.
Істинні значення параметрів моделі з довірчою ймовірністю р=0,95 лежать в таких межах:
Гранична вибіркова похибка моделі з довірчою ймовірністю р=0,95 становить 4,0666 (млн. крб.) тобто з ймовірністю 0,95 фактичне значення виробництва продукції за кожного значення чисельності робітників не повинно відхилятися більше як на цю величину.
Виходячи з побудованої моделі можна говорити, що зв'язок між виробництвом продукції (млн. крб.) підприємств та чисельністю робітників (чол.) існує, але він є слабким. Виробництво продукції може залежати від багатьох інших чинників. Тому для моделювання цієї ситуації варто було б скористатися багатофакторною кореляційно-регресійною моделлю.
Размещено на Allbest.ru
Подобные документы
Перевірка загальної якості рівняння регресі та статистичної значущості оцінок параметрів економетричної моделі. Прогнозування значень залежної змінної. Визначення коефіцієнта еластичності. Економетричний аналіз лінійної функції парної регресії в MS Exel.
презентация [1,4 M], добавлен 10.10.2013Параметри проведення економетричного аналізу. Метод найменших квадратів. Оцінка параметрів лінійної регресії за методом найменших квадратів. Властивості простої лінійної регресії. Коефіцієнти кореляції і детермінації. Ступені вільності, аналіз дисперсій.
контрольная работа [994,5 K], добавлен 29.03.2009Аналіз прогнозу заробітної плати при прогнозному значенні середнього добового прожиткового мінімуму. Побудова лінійного рівняння парної регресії. Розрахунок лінійного коефіцієнта парної кореляції, коефіцієнта детермінації й середньої помилки апроксимації.
лабораторная работа [409,7 K], добавлен 24.09.2014Побудова економетричної моделі парної регресії. На основі даних про витрати обігу (залежна змінна) і вантажообігу (незалежна змінна) побудувати економетричну модель. Рівняння регресії. Коефіцієнт парної детермінації та кореляції. Перевірка надійності.
задача [563,6 K], добавлен 28.12.2008Оцінка коефіцієнта парної кореляції. Встановлення аналітичної залежності між вихідною і вхідною величинами. Обробка степеневої і експоненціальної залежностей. Накопичення сум для логарифмічної залежності. Визначення і виведення мінімального значення.
курсовая работа [1,1 M], добавлен 01.09.2015Специфікація економетричної моделі парної регресії. Побудова лінійної, степеневої та показникової економетричної моделі, поняття коефіцієнта регресії та детермінації. Графічне зображення моделювання лінійного зв’язку, застосування F–критерію Фішера.
контрольная работа [5,1 M], добавлен 17.03.2010Застосування функції "ЛИНЕЙН" для оцінки параметрів та аналізу моделі. Перевірка загальної якості товару за допомогою коефіцієнта детермінації. Модель з якісними змінними. Значення F-критерію, який відповідає за статичну значущість всієї моделі.
контрольная работа [28,5 K], добавлен 09.11.2014Застосування електоронних таблиць та пакетів прикладних програм у статистичних та економетричних розрахунках. Побудова парної та непарної лінійної регресійної моделі економічних процесів. Моделювання економічних процесів для прогнозу та прийняття рішень.
методичка [232,8 K], добавлен 17.10.2009Статистичний і економічний зміст коефіцієнтів кореляції і детермінації. Економічне тлумачення довірчих інтервалів коефіцієнтів моделі, точкового значення прогнозу. Форма відображення статистичних даних моделі. Параметри стандартного відхилення асиметрії.
контрольная работа [20,1 K], добавлен 03.08.2010Поняття лагової змінної; загальна характеристика моделі розподіленого лага, його структура. Інтерпретація коефіцієнтів моделей з розподіленим лагом. Побудова моделі, процедура застосування методу Алмон. Оцінка моделей с лагами в незалежних змінних.
курсовая работа [264,3 K], добавлен 18.12.2014