Оцінка рангової кореляції за коефіцієнтами Кендела і Спірмена

Коефіцієнт рангової кореляції Спірмена. Визначення тісноти зв'язку між продуктивністю праці і рівнем механізації робіт на промислових підприємствах. Дослідження зв'язків між явищами, що не піддаються кількісній оцінці. Рангова кореляція Кендела.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык украинский
Дата добавления 13.04.2011
Размер файла 339,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контрольна робота

Оцінка рангової кореляції за коефіцієнтами Кендела і Спірмена

1. Коефіцієнт рангової кореляції Спірмена

Поряд з коефіцієнтом кореляції існують інші показники тісноти зв'язку, які широко застосовують в економіці у тих випадках, коли ознакам явища, що спостерігається, не можуть однозначно надаватись ті чи інші абсолютні значення. До них відноситься коефіцієнт рангової кореляції Спірмена. Його застосування не пов'язано з передумовою нормальності розподілу вихідних даних.

При застосуванні методів рангової кореляції ґрунтуються не на точних кількісних оцінках значень ознак-змінних, а на рангах. Для цього елементи сукупності розташовуються у визначеному порядку відповідно до конкретної ознаки. Отриманий ряд елементів називають упорядкованим. Сам процес упорядкування називається ранжуванням, а кожному члену ряду ставиться у відповідність ранг, чи рангове число (порядковий номер). Наприклад, елементу з найменшим значенням ознаки ставиться у відповідність ранг 1, наступному за ним елементу - ранг 2 і т.д. Елементи можна розташовувати також у порядку убування значень їх ознаки. Таким чином, відбувається порівняння кожного елемента зі всіма іншими елементами сукупності. Якщо елемент описується не одним, а двома ознаками "х" і "у", то для дослідження їхнього впливу один на одного кожному елементу надається два порядкових номери згідно з правилом ранжування. В подальшому здійснюється перехід від кореляції ознак-змінних "х" і "у" до вивчення зв'язку між ранговими числами шляхом визначення відповідності між двома послідовностями порядкових оцінок. Іншими словами, вимірюється тіснота рангової кореляції. Коефіцієнт рангової кореляції Спірмена є парним, оскільки вивчається зв'язок між двома змінними.

Позначимо ранги, що відповідають значенням змінної "у", через v, а ранги, що відповідають значенням змінної "х" - через w (таблиця 2). Коефіцієнт рангової кореляції Спірмена обчислюється по формулі:

де n - обсяг вибірки. Видно, що для розрахунку коефіцієнта необхідно визначити тільки квадрати відхилень рангів. Існують випадки, коли два чи більше елементів сукупності мають однакові значення ознаки і не можливо знайти істотну різницю між ними. Елементи, що володіють такою властивістю - відсутністю переваг, - називаються зв'язаними, а група що з них утворена - ланцюгом. Метод, що застосовується для надання порядкового номера зв'язаним елементам, називається методом середніх рангів. Він полягає в усередненні рангів, що мали б елементи, якби вони були різними. Сума рангів при цьому залишається такою, як і при ранжуванні без зв'язків. Наприклад, якщо у змінної "у" четверте, п'яте і шосте значення однакові по величині, тоді кожному із них надається ранг (1/3)*(4+5+6)=5. Наступному ж по величині значенню надається ранг 7. При наявності зв'язаних рангів до коефіцієнта рангової кореляції Спірмена вводиться поправка:

де А і В - поправочні коефіцієнти для ланцюгів відповідно в послідовностях рангів v і w:

(2)

j - порядкові номери ланцюгів серед рангів v, якщо існує один ланцюг, то j == 1, якщо два, то j = 1, 2 і т.д.; Aj - число однакових значень ряду v, що належать одному ланцюгу; у випадку коли другому ланцюгу належить п'ять однакових значень, вони позначаються як: А2 = 5. k і Bk визначаються по аналогії.

Коефіцієнт рангової кореляції приймає значення всередині інтервалу -1 rs +1. Якщо vі = wі, то rs=1. У цьому випадку є повна погодженість між елементами двох рядів. Кожен елемент займає одне і теж саме місце в обох рядах, що означає повну позитивну кореляцію рангів. Якщо rs = -1, то елементи двох рядів розташовані в зворотному порядку і між ними повна неузгодженість. Це означає повну від'ємну кореляцію рангів. І нарешті, якщо rs = 0, те це свідчить про відсутність кореляції між рангами.

1.1 Розрахунки коефіцієнта Спірмена

Визначимо тісноту зв'язку між продуктивністю праці і рівнем механізації робіт на 10 промислових підприємствах. Дані наведені в таблиці 2.

Таблиця 2 Продуктивність праці і рівень механізації робіт на 10 підприємствах

Підприємство

Середній вихід продукції в одиницю робочого часу, вир./год.

Коефіцієнт механізації

робіт, %

Ранги значень змінних

Різниці рангів

t

yi

хi

(vі - wі)

(vі - wі)2

1

127

43

1

4

+3

9

2

120

51

2

1

-1

1

3

125

55

3

2

-1

1

4

126

57

4

3

-1

1

5

133

60

5

7

+2

4

6

129

62

6

5

-1

1

7

132

65

7

6

-1

1

8

135

68

8

8,5

+0.5

0,25

9

135

70

9

8,5

-0,5

0,25

10

140

74

10

10

0

0

Сума

1302

605

55

55

0

18,5

Наприклад, ранг v5=7 означає, що підприємство 5 за рівнем механізації робіт стоїть на сьомому місці при розташуванні підприємств за зростанням відповідного показника. За даними табл.3 розрахуємо коефіцієнт рангової кореляції:

У послідовності рангів vі існує одна зв'язана пара ("ланцюг"). Знайдемо поправочний коефіцієнт за формулами (2). У нашій задачі введення поправки не приведе до істотної зміни величини коефіцієнта рангової кореляції, тому що число ланцюгів і кількість рангів у ланцюзі невелике. Отже, маємо (j = 1):

Величина rs свідчить про тісний позитивний зв'язок між продуктивністю праці і рівнем механізації робіт. Коефіцієнт парної кореляції, розрахований безпосередньо по вихідним даним, дорівнює: rух=0,833. Співставлення rs і rух переконує в тому, що вони мало відрізняються один від одного. Коефіцієнт рангової кореляції в загальному є досить гарною характеристикою ступеню зв'язку досліджуваних змінних. Його перевага полягає в тому, що він не пов'язаний з передумовою нормальності розподілу вихідних даних. Але не слід уникати того, що при переході від початкових значень до рангів відбувається певна втрата інформації. Коефіцієнт рангової кореляції тим більше наближається до коефіцієнта парної кореляції, чим менше кореляційний зв'язок між досліджуваними змінними відрізняється від лінійного і чим тісніший цей зв'язок.

Метод рангової кореляції не вимагає лінійної кореляції між змінними. Однак, необхідно, щоб функція регресії, що відображує цей зв'язок, була монотонною.

Особливо корисною рангова кореляція є при дослідженні зв'язків між явищами, що не піддаються кількісній оцінці. У таких випадках дослідник на основі свого досвіду, чи порівнянь з яким-небудь еталоном, надає елементам вибірки ранги по кожному з досліджуваних якісних ознак. Наприклад, рангову кореляцію можна використовувати при дослідженні залежності між сортами продукції і виробничими витратами. При вивченні якості виробів їх часто класифікують по наступних рівнях: «відмінне, дуже гарне, гарне, середнє, погане». Аналогічно можна скласти шкалу і для інших ознак.

Рангову кореляцію широко використовують також при анкетуванні й опитуваннях населення, при обробці результатів різноманітних тестів. Таким чином, рангова кореляція виявляється корисною завжди для вивчення зв'язків там, де властивості явищ не піддаються точному кількісному виміру, але дозволяють робити порівняльну оцінку, завдяки якій складають послідовності рангів.

2. Коефіцієнт рангової кореляції Кендела

спірмен кендел кореляція

Наступний коефіцієнт рангової кореляції , не пов'язаний з передумовою нормальності генеральної сукупності, був запропонований Кенделом. Він обчислюється по рангах vі і wі. При цьому елементи вибірки розташовують так, щоб послідовність рангів однієї із змінних була натуральним рядом 1,2,...,п. Для кожного i-го члена послідовності рангів другої змінної встановлюємо числа pi і qi, що відображують відповідно прямій і зворотній порядок розташування наступних рангів. Потім підраховуємо суми цих чисел та , а також різницю отриманих S=Р-Q. Коефіцієнт рангової кореляції є відношенням цієї різниці до найбільшого можливого значення Р и Q, тобто до найбільшої можливої суми pi або qi. Таку величину можна отримати лише тоді, коли порядок рангів в обох послідовностях цілком збігається. Вона дорівнює:

Коефіцієнт рангової кореляції Кендела можна обчислювати по одній з еквівалентних формул:

Таким чином, для визначення досить розрахувати величину Р, або Q. Найчастіше в формулу підставляють ту величину, яка має найменше значення. Величина лежить у межах -1 +1. За даними таблиці 3 отримуємо:

По величині цього коефіцієнту можна зробити висновок про тісний зв'язок між продуктивністю праці і рівнем механізації робіт.

Розрахунок по таблиці 3.

Таблиця 3

Ранги

Число рангів, розташованих у прямому порядку

Число рангів, розташованих у зворотному порядку

i

vi

wi

pi

qi

1

4

1

6

3

2

1

2

8

0

3

2

3

7

0

4

3

4

6

0

5

7

5

3

2

6

5

6

4

0

7

6

7

3

0

8

8,5

8

2

0

9

8,5

9

1

0

10

10

10

0

0

Сума:

55

55

Р=40

Q=5

Для цього використовуємо тільки послідовність рангів vі. За першим числом цього ряду v1 = 4 розташовано 6 рангів, які більше 4, і 3 рангів, які менші 4. За другим членом v2=1 знаходяться 8 рангів, які більше 1, і 0 рангів, які менше 1. П'яте місце в послідовності займає ранг v5=7, за яким знаходяться 3 більших рангів і 2 менших ранги. Число можливих положень і-го рангу в послідовності дорівнює: (pi + qi) = п - i. Наприклад, для першого члена послідовності 10 - 1 = 9, для другого 10 - 2 = 8. Цим можна скористатися для контролю. Коефіцієнти Спірмена та Кендела побудовані по-різному, тому порівнювати ці коефіцієнти по величині само по собі не дає ніякої додаткової інформації про інтенсивність зв'язку.

3. Індекс Фехнера

Простим показником ступеню взаємозв'язку між двома статистичними рядами є індекс Фехнера. Для його визначення спочатку по кожному ряду обчислюють середні () і визначають знаки відхилень і . Кожна пара спостережень (xi, yi) буде характеризуватися співпаданням знаків (+ +; - -; + -; - +). Позначимо через v кількість співпадань, а через w- кількість розбіжностей знаків " - ". Індекс Фехнера i визначається за формулою:

Половину відхилень, що дорівнюють нулю, відносять до v, половину - до w. Значення і знаходиться у інтервалі +1 і -1. При i > 0 маємо позитивну кореляцію, при i < 0 - від'ємну, а при i = 0 зв'язок відсутній.

Безсумнівною перевагою індексу Фехнера є простота обчислення. Але його великий недолік полягає в тому, що він враховує тільки кількість збігів і розбіжностей знаків відхилень. Тому він рекомендується лише для приблизної оцінки зв'язку.

4. Коефіцієнт конкордації

В економіці існує велике число причинно-обумовлених явищ, ознаки яких не піддаються точній кількісній оцінці. Це так названі атрибутивні ознаки. Наприклад, професія, форма власності, якість виробу, технологічні операції і т.д. Фахівець або експерт ранжує елементи сукупності, при цьому надає кожному з них порядковий номер, що відповідає підсумкам порівняння даної ознаки з іншими елементами. Якщо кількість ознак-змінних більше двох, то в результаті ранжування n елементів (підприємств або установ) з'являються т послідовностей рангів. Для перевірки, чи добре погоджені між собою отримані т рядів, використовується коефіцієнт погодження W, який називається коефіцієнтом конкордації Кендела і розраховується:

При наявності пов'язаних рангів коефіцієнт конкордації W обчислюється по формулі:

де , i = 1,2, ..., т - сума рангів, наданих всіма експертами і-му елементу вибірки, мінус середнє значення цих сум рангів; т - число експертів або ознак, зв'язок між якими оцінюється; п - обсяг вибірки (число підприємств чи установ), , де Bk - число пов'язаних рангів k=1,...z. Наприклад, якщо пов'язуються елементи від восьмого до одинадцятого включно, тоді Вk=4. Коефіцієнт W приймає значення в інтервалі 0 W 1.

4.1 Розрахунки

Маємо групу, яка складається з трьох експертів і оцінює якість однотипних виробів, виготовлених на 6 підприємствах. Кожен експерт упорядкував вироби за ступенем переваги. Результати наведені в стовпцях 2,3, 4 таблиці 4.

Сума рангів для кожного і-го підприємства зазначена в стовпці 5. Для визначення D необхідно спочатку обчислити середнє значення по сумах рангів:

Таблиця 4 Висновки експертів про якість виробів, які виготовлені на 6 підприємствах

Підприємство

Експерти

Сума рангів

і

1

2

3

Dі2

(1)

(2)

(3)

(4)

(5)

(6)

(7)

1

1

2

1

4

-6,5

42,25

2

2

1

3

6

-4,5

20,25

3

4

4,5

3

11,5

+1,0

1,00

4

5

4,5

6

15,5

+5,0

25,00

5

3

3

3

9

-1,5

2,25

6

6

6

5

17

+6,5

42,25

Сума

21

21

21

63

133,00

Отримане середнє значення віднімаємо із кожної i-ої суми рангів і різницю записуємо в стовпець 6. Суму квадратів відхилень підставляємо в чисельник формули. У знаменнику формули міститься величина В. Для нашого приклада В = (23-2) + (33-3) = 30. Число підприємств n = 6, число експертів т = 3. Таким чином, коефіцієнт W:

Величина коефіцієнта W дозволяє зробити висновок, що при оцінці якості виробів думки експертів погоджуються між собою. Якщо замість експертів розглядати ознаки явищ, то цілком очевидно, що коефіцієнт W буде єдиною вибірковою мірою зв'язку між цими ознаками. Таким чином, коефіцієнт конкордації можна розглядати як показник тісноти зв'язку у випадку множинної регресії.

Размещено на Allbest.ru


Подобные документы

  • Непараметричні (емпіричні) методи оцінки тісноти зв’язку. Розрахунки рангових коефіцієнтів кореляції Спірмена та Кендала. Найпростіші показники кореляційної залежності Фехнера. Коефіцієнти асоціації і контингенції, взаємної спряженості Пірсона і Чупрова.

    контрольная работа [72,4 K], добавлен 18.06.2010

  • Оцінка коефіцієнта парної кореляції. Встановлення аналітичної залежності між вихідною і вхідною величинами. Обробка степеневої і експоненціальної залежностей. Накопичення сум для логарифмічної залежності. Визначення і виведення мінімального значення.

    курсовая работа [1,1 M], добавлен 01.09.2015

  • Побудова економетричної моделі парної регресії. На основі даних про витрати обігу (залежна змінна) і вантажообігу (незалежна змінна) побудувати економетричну модель. Рівняння регресії. Коефіцієнт парної детермінації та кореляції. Перевірка надійності.

    задача [563,6 K], добавлен 28.12.2008

  • Особливість проведення розрахунків параметрів чотирьохфакторної моделі, обчислення розрахунків значень Yр за умови варіювання. Аналіз методів перевірки істотності моделі за допомогою коефіцієнтів кореляції і детермінації, наявності мультиколінеарності.

    контрольная работа [36,2 K], добавлен 24.01.2010

  • Визначення оптимального плану графічним та симплексним методом. Побудова економетричної моделі залежності між витратами обігу та вантажообігом. Розрахунок детермінаціі, кореляції, еластичності. Виявлення мультиколінеарності між заданими факторами.

    контрольная работа [451,8 K], добавлен 03.12.2013

  • Поняття про кореляцію і регресію. Сутність дисперсійного аналізу. Однофакторний дисперсійний аналіз. Функціональна і статистична залежності. Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних.

    реферат [123,3 K], добавлен 12.02.2011

  • Зміст методики перевірки статистичної вибірки на розподіл за нормальним законом. Формування рандомізованого плану проведення спостережень за обсягами перевезень, поняття регресійної моделі та коефіцієнтів детермінації і кореляції, виявлення помилок.

    контрольная работа [77,8 K], добавлен 18.05.2011

  • Вивчення прийомів кореляційного аналізу, які дозволяють кількісно виразити взаємозв’язок між економічними показниками. Особливості розрахунку коефіцієнту кореляції та побудови лінії тренду, де показане рівняння та показник достовірності апроксимації.

    лабораторная работа [57,7 K], добавлен 12.05.2010

  • Середні значення та стандартні відхилення. Нормалізація змінних за допомогою формул. Розрахунок кореляційних матриць, частинних коефіцієнтів кореляції. Способи звільнення від мультиколінеарності методом перетворення інформації, темпів зміни показників.

    лабораторная работа [152,1 K], добавлен 07.05.2009

  • Статистичний і економічний зміст коефіцієнтів кореляції і детермінації. Економічне тлумачення довірчих інтервалів коефіцієнтів моделі, точкового значення прогнозу. Форма відображення статистичних даних моделі. Параметри стандартного відхилення асиметрії.

    контрольная работа [20,1 K], добавлен 03.08.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.