Кореляційний і регресивний методи аналізу зв’язку

Сутність кореляційного і регресійного методів аналізу статистичних даних, типи зв’язків. Розрахунок параметрів лінійного рівняння зв’язку між вартістю основних виробничих фондів і випуском продукції за даними підприємств. Обчислення коефіцієнта кореляції.

Рубрика Экономико-математическое моделирование
Вид лекция
Язык украинский
Дата добавления 19.11.2009
Размер файла 31,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Кореляційний і регресивний

методи аналізу зв'язку

Основне завдання кореляційного і регресійного методів полягає в аналізі статистичних даних для виявлення математичної залежності між досліджуваними ознаками і встановлення за допомогою коефіцієнта кореляції порівняльної оцінки щільності взаємозв'язку.

Після того, як через економічний аналіз встановлено, що зв'язок між явищами є, і визначено загальний характер цього зв'язку, статистика за допомогою кореляційного і регресійного методів надає цим зв'язкам числового виразу.

Кореляційний і регресійний методи аналізу вирішують два основні завдання:

- визначають за допомогою рівнянь регресії аналітичного форму зв'язку між варіацією ознак X i Y,

- встановлюють ступінь щільності зв'язку між ознаками.

Найчастіше трапляються такі типи кореляційних зв'язків:

- факторна ознака безпосередньо пов'язана з результативною,

- результативна ознака визначається комплексом діючих факторів,

- дві результативні ознаки спричинені дією однієї загальної причини.

У практиці економіко-статистичних досліджень часто доводиться мати справу з прямолінійною формою зв'язку яку описує рівняння регресії (рис.1).

На цьому графіку середній арифметичній результативної ознаки Y відповідає пряма, паралельна осі абсцис, лінійне кореляційне рівняння Y(X) зображує похила пряма, а кут нахилу між ними характеризує щільність зв'язку.

Рівняння регресії характеризує зміну середнього рівня результативної ознаки Y залежно від зміни факторної ознаки X. Воно визначає математичне сподівання групових середніх результативної ознаки під впливом різних значень факторної ознаки.

У разі лінійної форми зв'яку результативна ознака зміняються під впливом факторної ознаки рівномірно:

Yx = a0 +a1 X,

Де, Yx - згладжене середнє значення результативної ознаки , X - факторна ознака,

a0 і a1 - параметри рівняння , a0 - значення Y при X = 0, a1 - коефіцієнт регресії.

Коефіцієнт регресії a1, вказує на те, наскільки змінюється результативна ознака Y внаслідок зміни факторної ознаки X на одиницю.

Якщо a1 має позитивний знак,то зв'язок прямий, якщо від'ємний - зв'язок обернений.

Рис. 1. Теоретична лінія регресії

Параметри рівняння зв'язку визначають за способом найменших квадратів складеної і роз'язаної системи двох рівнянь з двома невідомими:

Y= na0 +a1 X ,

YX= a0 X + a1 X 2,

де n - число членів у кожному з двох порівнюваних рядів,

X - сума значень факторної ознаки , X 2 - сума квадратів значень факторної ознаки, Y - сума значень результативної ознаки, YX - cума добутків значень факторної та результативної ознак.

Розв'язавши дану систему рівнянь, дістанемо такі параметри:

X 2 Y - X XY n XY - X Y

a0 = , a1 = n X 2 - X X n X 2 - X X

Обчисливши за фактичними даними всі записані вище суми й підставивши їх у наведені формули, знайдемо параметри прямої.

Розглянемо розрахунок параметрів лінійного рівняння зв'язку між вартістю основних виробничих фондів і випуском продукції за даними десяти однорідних підприємств. (табл.1.)

Табл. 1. Розрахунки для визначення параметрів лінійного рівняння зв'язку факторної та результативної ознак.

Номер

заводу

Вартість основних виробничих фондів X,

млн. грн

Випуск продукції Y, млн. грн

X 2

XY

Y2

Yx = 0.167+0.421X

1

2

3

4

5

6

7

8

9

10

12

8

10

6

9

15

11

13

14

10

5,6

4,0

4,0

2,4

3,6

5,0

4,6

6,5

7,0

4,5

144

64

100

36

81

225

121

169

196

100

67,2

32,0

40,0

14,4

32,4

75,0

50,6

84,5

98,0

45,0

31,36

16,00

16,00

5,76

12,96

25,00

21,16

42,25

49,00

20,25

5,2

3,5

4,4

2,7

4,0

6,5

4,8

5,6

6,1

4,4

Разом

108

47,2

1236

539,1

239,74

47,2

У середньому на один завод

10,8

4,72

123,6

53,91

23,972

-

Тоді лінійне рівняння регресії зв'язку між вартістю основних виробничих фондів і випуском продукції матиме такий вигляд :

Yx = 0.167 + 0.421X.

Отже, при збільшенні вартості основних виробничих фондів на 1 млн. грн. Випуск продукції зросте на 0,42 млн. грн.

Послідовно підставляючи в дане рівняння значення факторної ознаки X, дістанемо згладжені значення результативної ознаки Yx, які й укажуть на те, яким має бути середній розмір випущеної продукції для даного розміру основних виробничих фондів ( за інших рівних умов ).

Згладжені ( теоретичні ) значення ( із заокругленням до десятих ) наведено в останній графі табл. 1. Якщо параметри рівняння визначено правильно,то

Y = Yх = 47,2.

Побудуємо графік, який покаже згладжування емпіричних даних рівняння прямої ( рис.1.).

Рис. 2. Емпіричний і згладжені рівні ряду : 1 - Y, 2 - Yx =0.167+ 0.421 X, 3- Y = 4.72

Для економічної інтерпретації лінійних і нелінійних зв'язків між двома досліджуваними явищами часто використовують розраховані за рівняннями регресії коефіцієнти еластичності.

Коефіцієнт еластичності показує,на скільки процентів зміниться в середньому результативна ознака Y при зміненні факторної ознаки X на 1 %.

Відповідно до лінійної залежності коефіцієнт еластичності визначається за формулою

Підставивши в формулу різні значення X, дістанемо різні .

У наведеному прикладі коефіцієнт еластичності на першому підприємстві при X= 12: фондів випуск продукції зростає на 0,97%. На п'ятому підприємстві при X=9: 5 =0.421· = 0.95, 4

На десятому при X = 10: 10 =0.96%.

Для всіх підприємств разом коефіцієнт еластичності

X 10.8

= a1 = 0.421 · = 0.963 % .

Y 4.72

Це означає, що при збільшенні середньої вартості основних виробничих фондів на 1 % випуск продукції зростає в середньому на 0,963 %.

Якщо залежність між ознаками представити за даними,згладженими параболою другого порядку, то коефіцієнт еластичності має такий вигляд:

X

= (a1 + a2 X ) .

Y

Визначення щільності зв'язку в кореляційно-регресійному аналізі ґрунтується на правилі додавання дисперсій,як і в методі аналітичного групування. Але на відміну від нього, де для оцінки лінії регресії застосовують групові середні результативної ознаки, в кореляційно-регресійному аналізі для цієї мети використовують теоретичні значення результативної ознаки.

Зобразити і обґрунтувати кореляційно-регресійний аналіз можна на прикладі графіка на рис.1. На ньому є три лінії Y - ламана лінія фактичних даних(1),YX - пряма похила лінія 2 теоретичних значень Y при абстрагуванні від впливу всіх факторів, крім фактора X(змінна середня) ,Y - пряма горизонтальна лінія 3, із середнього значення якої виключено вплив на Y всіх без винятку факторів ( стала середня ).

Розбіг лінії змінної середньої Yх з лінією сталої середньої Y пояснюється впливом факторної ознаки Х, що,в свою чергу , свідчить про існування між ознаками Y і X неповного не функціонального зв'язку. Для визначення щільності цього зв'язку потрібно обчислити дисперсію відхилень Y і Yх , тобто залишкову дисперсію,яка зумовлена впливом усіх факторів, крім Х. Різниця між загальною і залишковою дисперсіями дає теоретичну ( факторну ) дисперсію , яка вимірює варіацію,зумовлену фактором Х . На зіставленні цієї різниці із загальною дисперсією побудовано індекс кореляції, або теоретичне кореляційне відношення:

2 заг - 2 е 2 е 2 у

R = = 1 - , або R =

2 заг заг 2 заг

де 2 заг - загальна дисперсія, 2 е - залишкова дисперсія, 2 у - факторна (теоретична) дисперсія.

Факторну дисперсію обчислюють з теоретичних значень за формулою:

( Yx - Y ) 2

2Y = n

або за формулою без теоретичних значень:

( a 0 Y + a 1 XY ) - (Y) 2

2Y = .

n ( Y - Y x )

Залишку дисперсію визначають або за формулою 2 е = n, або за правилом додавання дисперсій 2 е = 2 заг - 2 Y .

У наведеному прикладі ( за даними розрахунків у табл..1 ) факторна дисперсія

( 0.167 · 47.2 + 0.421 · 539.1 ) - 4.72 2

2 Y = = 1.206.

Загальну дисперсію обчислимо за формулою

2 заг = Y2 - ( Y )2 = 23.974 - 22.278 = 1.696.

Залишкову дисперсію визначаємо як різницю між загальною і факторною дисперсіями :

2 е = 2 заг - 2Y = 1.696 -1.206 = 0.409

Отже, знаходимо індекс кореляції за наведеними вище формулами :

2 заг - 2 е 1.696 - 0.490

R = = = 0.843.

2 заг 1.696

або 2 е 0.490

R = 1 - = 1 - = 0.843

2 заг 1.696

2 Y 1.206

або

R = = = 0.711 = 0.843 2 заг 1.696

Індекс кореляції вказує на щільну залежність випуску продукції від вартості основних виробничих фондів.

Коефіцієнт детермінації ( R 2 ) характеризує ту частину варіації результативної ознаки Y, яка відповідає лінійному рівнянню регресії:

2Y 1.206

R2 = = = 0.711

2 заг 1.696

Отже, в обстеженій сукупності заводів 71.1% варіації випуску продукції пояснюється різними рівнями оснащеності заводів основними виробничими фондами.

Індекс кореляції набирає значень від 0 до 1. Коли R=0, то зв'язку між варіацією ознак Y i X немає. Залишкова дисперсія дорівнює загальній, 2 е = 2 заг , а теоретична дисперсія дорівнює нулю, 2 заг= 0, Всі теоретичні значення YX збігаються із середніми значеннями Y, лінія YX на графіку збігається з лінією Y, тобто набуває горизонтального положення .

При R=1 теоретична дисперсія дорівнює загальний, 2 Y = 2 заг , а залишкова 2 е = 0.

Фактичні значення Y збігається з теоретичними YX , зв'язок між досліджуваними ознаками лінійно-функціональний.

Індекс кореляції оцінює щільність зв'язку. Він, як і емпіричне кореляційне відношення, вимірює лише щільність зв'язку і не вказує на її напрямок.

Аби доповнити дослідження визначенням напрямку зв'язку в разі лінійної залежності використовують лінійний коефіцієнт кореляції.

XY - X Y

r = x у

Значення r коливається в межах від - 1 до +1. Додатне значення відповідає прямому зв'язку між ознаками, а від'ємне - зворотному. Оцінюють щільність зв'язку за схемою ( табл. 1 )

Таблиця 2

Зв'язок

Лінійний коефіцієнт кореляції

Прямий зв'язок

Зворотний зв'язок

Слабкий

Середній

Щільний

0.1....0.30

0.3....0.70

0.7....0.99

- 0.1... - 0.30

- 0.3....- 0.70

- 0.7....- 0.99

Всі дані для обчислення лінійного коефіцієнта кореляції в наведеному прикладі є в табл.1.

x= Х2 - (Х)2 = 123.6 - 10.82 = 6.96 = 2.638

y= Y2 - (Y)2 = 23.974 - 4.722 = 1.302

XY - X Y 53.91 - 10.8 · 4.72 2.9340

r = 0.854

x у 2.638 · 1.302 3.4349

Скористуємося для знаходження лінійного коефіцієнта кореляції іншою формулою:

x 2.638

r = а1 = 0.421 · = 0.853,

у 1.302

тобто відповідь вийшла ідентичною. Це означає,що зв'язок між вартістю основних виробничих фондів і випуском продукції сильний (щільний) і прямий.

Абсолютне значення лінійного коефіцієнта кореляції збігається з індексом кореляції ( відхилення становить 0.01 ).

З наведених формул коефіцієнта кореляції можна визначити коефіцієнт регресії, не розраховуючи рівняння зв'язку:

XY - X Y 2.934

a1 = = = 0.421

2x 6.960

або y 1.302

а1 = r = 0.853 · = 0.421.

x 2.638

Перевірку сили зв'язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і процедур,що й у аналітичному групуванні. Ступені вільності залежать від числа параметрів рівняння регресії k1 = m -1 і кількості одиниць досліджуваної сукупності

k2 = n - m.

Істотність зв'язку коефіцієнта детермінації R2 перевіряють за допомогою таблиці критерію F для 5 % - го рівня значущості. Так, при k1 = m -1= 2 - 1 = 1 ( для лінійної моделі) і k2 = n - m = 10 - 2 = 8.

Фактичне значення F-критерію у наведеному вище прикладі визначають за формулою

R2 k2 0.711 8

F ф = = · = 19.68.

1 - R2 k1 1 - 0.711 1

Критичне значення Fт ( 0.95 ) = 5.32 набагато менше від фактичного Fт (0.95) Fф ( 5.32 19.68) , що підтверджує істотність кореляційного зв'язку між досліджуваними ознаками.

Для встановлення достовірності обчисленого нами лінійного коефіцієнта кореляції використовують критерій Стьюдента ( t - критерій ):

де r - середня похибка коефіцієнта кореляції,яку визначають за формулою :

1 - r2

r = n - 1

При достатньо великому числі спостережень ( n > 50) коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою похибку в три і більше разів, а якщо він менший ніж три, то зв'язок між досліджуваними ознаками X i Y не доведено.

У наведеному прикладі середня похибка коефіцієнта кореляції

1 - r2 1 - 0.853 2 1 - 0.723 0.277

r = 0.092

n - 1 9 3 3

Відношення коефіцієнта кореляції до його середньої похибки 0.853

tr = 9.27

0.092

Це дає підставу вважати, що обчислений лінійний коефіцієнт кореляції достатньо точно характеризує щільність зв'язку між досліджуваними ознаками.


Подобные документы

  • Вивчення прийомів кореляційного аналізу, які дозволяють кількісно виразити взаємозв’язок між економічними показниками. Особливості розрахунку коефіцієнту кореляції та побудови лінії тренду, де показане рівняння та показник достовірності апроксимації.

    лабораторная работа [57,7 K], добавлен 12.05.2010

  • Поняття про кореляцію і регресію. Сутність дисперсійного аналізу. Однофакторний дисперсійний аналіз. Функціональна і статистична залежності. Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних.

    реферат [123,3 K], добавлен 12.02.2011

  • Визначення кореляційної залежності ціни і витрат від кількості реалізованої продукції; встановлення зв'язку між відповідними ознаками та обчислення коефіцієнту детермінації; перевірка адекватності значень параметрів параболічної однофакторної моделі.

    практическая работа [613,4 K], добавлен 30.03.2013

  • Аналіз прогнозу заробітної плати при прогнозному значенні середнього добового прожиткового мінімуму. Побудова лінійного рівняння парної регресії. Розрахунок лінійного коефіцієнта парної кореляції, коефіцієнта детермінації й середньої помилки апроксимації.

    лабораторная работа [409,7 K], добавлен 24.09.2014

  • Методи одержання стійких статистичних оцінок. Агломеративні методи кластерного аналізу. Грубі помилки та методи їх виявлення. Множинна нелінійна регресія. Метод головних компонент. Сутність завдання факторного аналізу. Робастне статистичне оцінювання.

    курсовая работа [1,2 M], добавлен 28.04.2014

  • Особливість проведення розрахунків параметрів чотирьохфакторної моделі, обчислення розрахунків значень Yр за умови варіювання. Аналіз методів перевірки істотності моделі за допомогою коефіцієнтів кореляції і детермінації, наявності мультиколінеарності.

    контрольная работа [36,2 K], добавлен 24.01.2010

  • Призначення, описання й характеристики властивості программного забезпечення та метрик, які будуть досліджуватися. Статистичний аналіз метрик та експертних оцінок. Результати даних кореляційного та регресійного аналізу, зарозумілість інтерфейсу.

    курсовая работа [1,6 M], добавлен 12.12.2010

  • Основні принципи технічного аналізу Доу, типи трендів та закони руху цін. Види та методи обчислення простих, експонентних і лінійно зважених ковзних середніх, їх оцінка як інструменту технічного аналізу. Правила побудови графіків "смуг Болінджера".

    эссе [1,4 M], добавлен 07.07.2011

  • Математична модель та план перевезень по доставках продукції в пункти розподілу, який мінімізує сумарні транспортні витрати. Побудова лінійної моделі регресивного аналізу для економічного показника, зміни якого спостерігалися в певному інтервалі часу.

    контрольная работа [493,2 K], добавлен 19.09.2009

  • Багатокритеріальність, існуючі методи розв’язку задач лінійного програмування. Симплекс метод в порівнянні з графічним. Вибір методу розв’язання багатокритеріальної задачі лінійного програмування. Вирішення задачі визначення максимального прибутку.

    курсовая работа [143,7 K], добавлен 15.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.