Кластерний аналіз

Завдання та основні етапи кластерного аналізу, вимоги до інформації. Методи перевірки стійкості кластеризації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу. Інтерпретація результатів та побудування дендрограми.

Рубрика Экономико-математическое моделирование
Вид реферат
Язык украинский
Дата добавления 10.12.2014
Размер файла 171,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Військовий інститут

Київський національний університет імені Тараса Шевченка

Військовий гуманітарно-лінгвістичний факультет

Практична робота № 5

З предмету: « Технології математичного моделювання психологічних явищ»

На тему: «Кластерний аналіз»

Виконала:

курсант 511 пс групи

Кисельова Каріна

Київ 2014

Для того щоб виконати завдання з використанням кластерного аналізу ми скористаємося статистичним пакетом обробки даних SPSS та файлом з результатами щодо використання людьми захисних механізмів та копінг-стратегій.

Наша вибірка становить 20 осіб.

Ми обрали 4 фактори:

Захисні механізми:

Ш Витіснення;

Ш Заміщення;

Копінг-стратегії:

ь Активний відпочинок.

ь Духовність;

Кластер

1

2

3

4

5

6

Вытеснение

8,00

2,50

4,50

4,00

6,00

4,00

Замещение

8,00

8,00

4,25

3,50

5,67

3,25

14.Духовность

50,00

67,50

80,00

60,00

60,00

68,75

18.Активный отдых

49,00

84,00

57,75

63,00

39,67

54,25

кластерний аналіз алгоритм дендрограма

Перша таблиця - Кінцеві центри кластерів, дає нам змогу дізнатися який фактор є центральним для виділення кожного кластеру:

1 кластер- - кожен фактор є досить значним для досліджуваних,

2 кластер - фактори «Активний відпочинок» та «Заміщення »є центральними і «Духовність»;

3 кластер - «Духовність», «Активний відпочинок»;

4 кластер -фактор «Духовність», «Активний відпочинок» та ;

5 фактор - фактор «Духовність» і «Витіснення» «Заміщення» .

6 фактор- фактори «Духовність» та «Активний відпочинок».

Число наблюдений в каждом кластере

Кластер

1

1,000

2

2,000

3

4,000

4

6,000

5

3,000

6

4,000

Валидные

20,000

Пропущенные значения

,000

Таблиця «Число наблюдений в каждом кластере» допомагає нам дізнатись яка кількість досліджуваних увійшла до кожного кластеру:

1ий кластер - 1особа;

2ий кластер - 2 особи;

3ій кластер - 4 особи;

4ий кластер - 6 осіб;

5иій кластер - 3 особи.

6иій кластер - 4 особи.

Після використання кластеризації К-середніми ми скористаємося Ієрархічним кластерним аналізом для порівняння результатів.

Метод кластеризації - Міжгрупові зв'язки - порівнює відстань між об'єктами різних кластерів.

Этап

Кластер объединен с

Коэффициенты

Этап первого появления кластера

Следующий этап

Кластер 1

Кластер 2

Кластер 1

Кластер 2

1

3

15

,000

0

0

6

2

2

20

1,000

0

0

12

3

18

19

1,000

0

0

6

4

1

12

1,000

0

0

14

5

4

9

1,000

0

0

10

6

3

18

1,500

1

3

13

7

7

16

2,000

0

0

12

8

11

14

2,000

0

0

9

9

10

11

3,000

0

8

11

10

4

6

3,500

5

0

15

11

8

10

4,667

0

9

16

12

2

7

5,000

2

7

17

13

3

5

5,750

6

0

15

14

1

13

6,500

4

0

17

15

3

4

8,667

13

10

16

16

3

8

14,250

15

11

19

17

1

2

16,417

14

12

18

18

1

17

27,000

17

0

19

19

1

3

41,729

18

16

0

З таблиці «Кроки агломерації» ми можемо зрозуміти на якому етапі які досліджувані об'єдналися у кластер. Наприклад, на 5му етапі досліджувані 4 і 9 об'єдналися у кластер.

Також в цій таблиці ми можемо прослідкувати Евклідову відстань між кожним кластером і завдяки визначенню «скачка» ми дізнаємося яку кількість кластерів ми отримуємо.

Перший найбільший відрив ми спостерігаємо на 14 кроці. Скористаємося формулою на визначимо кількість кластерів.

Формула:

Загальна кількість досліджуваних відняти номер етапу, на якому відбувся скачок.

20 - 14 (15) = 6(5)

Визначити скільки саме(6 чи 5) ми маємо кластерів нам допоможе дендограма

Дана дендограма допомагає побачити на якій відстані один від одного знаходяться кластери та на якому рівні вони утворюються. Ми розуміємо, що чим раніше утворюється кластер, тим більш схожі між собою його члени. Ми приймаємо рішення про загальну кількість кластерів - 6. Ці 6 кластерів утворюються приблизно на одному рівні, а отже їх члени достатньо схожі між собою за своїми характерами, звичками чи іншим.

Принадлежность к кластерам

Наблюдение

6 кластеров

5 кластеров

1

1

1

2

2

2

3

3

3

4

4

3

5

3

3

6

4

3

7

2

2

8

5

4

9

4

3

10

5

4

11

5

4

12

1

1

13

1

1

14

5

4

15

3

3

16

2

2

17

6

5

18

3

3

19

3

3

20

2

2

Таблиця «Приналежність до кластерів» допомагає нам побачити в якому кластері був би кожен досліджуваний, якби кластерів була інша кількість, ніж ми визначили. Наприклад, якщо ми маємо 6 кластерів, то досліджуваний №11 входить до 5го кластеру, але якщо ми зменшимо кількість кластерів до 5ти, то цей досліджуваний буде входити до 4го кластеру.

Далі завдяки функції SPSS «середні значення» ми маємо змогу визначити, які фактори є найбільш впливовими для кожного кластеру.

Отчет

Average Linkage (Between Groups)

Вытеснение

Замещение

18.Активный отдых

14.Духовность

1

Среднее

4,0000

2,5000

61,2500

63,1250

N

8

8

8

8

Стд.Отклонение

1,69031

1,92725

3,24037

7,03943

2

Среднее

3,5000

10,0000

73,5000

67,5000

N

2

2

2

2

Стд.Отклонение

2,12132

2,82843

4,94975

3,53553

3

Среднее

4,3333

4,6667

56,0000

81,6667

N

3

3

3

3

Стд.Отклонение

1,52753

2,08167

,00000

2,88675

4

Среднее

4,0000

2,5000

49,0000

70,0000

N

2

2

2

2

Стд.Отклонение

,00000

3,53553

,00000

,00000

5

Среднее

6,5000

6,2500

42,0000

57,5000

N

4

4

4

4

Стд.Отклонение

1,29099

2,36291

5,71548

6,45497

6

Среднее

3,0000

8,0000

91,0000

65,0000

N

1

1

1

1

Стд.Отклонение

.

.

.

.

Итого

Среднее

4,4500

4,6000

58,1000

66,0000

N

20

20

20

20

Стд.Отклонение

1,73129

3,21837

12,66533

9,26226

До першого кластеру входить досліджуваний для якого є властивими захисні механізми -витіснення та копінг-стратегії - духовність і активний відпочинок.

Другий кластер складають особи, для яких притаманна копінг-стратегія «Духовність» та «Активний відпочинок»та захисний механізм «Заміщення»

Третій кластер - це люди, для яких притаманні всі фактори окрім «Активного відпочинку»

До Четвертого кластеру «Духовність»

П'ятий кластер: «Витіснення» і «Заміщення»

Шостий кластер: «Заміщення», «Активний відпочинок», «Духовність»

Висновок

В ході виконання роботи ми використали кластерний аналіз, здійснено це було двома шляхами - Ієрархічним кластерним аналізом та кластеризацією К-середніх. Для того щоб виконувати роботу ефективно варто застосовувати обидва способи.

Размещено на Allbest.ru


Подобные документы

  • Завдання та етапи кластерного аналізу, вимоги до інформації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу, методи перевірки стійкості кластеризації, інтерпретація результатів аналізу та побудування дендрограми.

    реферат [311,2 K], добавлен 15.07.2011

  • Зміст і мета кластеризації. Переваги її застосування перед іншими методами класифікації даних. Ієрархічні і неієрархічні методи кластерного аналізу. Приклад вертикальної дендрограми. Алгоритми найближчого і дальнього сусіда. Схема ітеративного методу.

    контрольная работа [2,4 M], добавлен 12.06.2019

  • Методи одержання стійких статистичних оцінок. Агломеративні методи кластерного аналізу. Грубі помилки та методи їх виявлення. Множинна нелінійна регресія. Метод головних компонент. Сутність завдання факторного аналізу. Робастне статистичне оцінювання.

    курсовая работа [1,2 M], добавлен 28.04.2014

  • Мета кластерного аналізу: поняття, алгоритм, завдання. Головні особливості процедури Мак-Кіна. Графік середніх значень за трьома кластерами. Метод К-методів, переваги та недоліки використання. Поняття про сіткові алгоритми кластеризації (grid-based).

    реферат [238,3 K], добавлен 27.05.2013

  • Упорядкування одиниць сукупності за допомогою інтегральних оцінок. Багатовимірне ранжування у системі Statistica. Формування однорідних одиниць сукупності за допомогою кластерного аналізу. Порядок об’єднання в кластери через опцію Amalgamation schedule.

    контрольная работа [1,8 M], добавлен 08.12.2010

  • Сутність та предмет економічного аналізу. Визначення понять "технологія", "фактор", "резерв", "аналіз". Класифікація господарських резервів. Управлінський та оперативний аналіз. Основні джерела інформації у процесі здійснення аналітичного дослідження.

    тест [13,0 K], добавлен 09.09.2010

  • Основні принципи технічного аналізу Доу, типи трендів та закони руху цін. Види та методи обчислення простих, експонентних і лінійно зважених ковзних середніх, їх оцінка як інструменту технічного аналізу. Правила побудови графіків "смуг Болінджера".

    эссе [1,4 M], добавлен 07.07.2011

  • Методи розв’язування, аналізу та використання задач зі знаходженням екстремуму функції на множині допустимих варіантів у широкому спектрі теоретико-економічних та практичних проблем. Модель задачі лінійного програмування. Складання симплексної таблиці.

    контрольная работа [960,6 K], добавлен 08.10.2013

  • Розробка структури інформаційної системи. Характеристика економічних задач і функцій. Розробка математичного і машинного алгоритмів рішення задач. Інформаційне і організаційне забезпечення. Технічне і програмне забезпечення. Контрольний приклад.

    курсовая работа [293,2 K], добавлен 08.11.2008

  • Використання абсолютних, відносних та середніх величин, рядів динаміки у фінансовому аналізі, складання аналітичних таблиць. Застосування індексного та графічного методів. Послідовність аналізу економічних показників, взаємозв’язок факторних показників.

    курсовая работа [145,2 K], добавлен 31.05.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.