Кластерний аналіз
Завдання та основні етапи кластерного аналізу, вимоги до інформації. Методи перевірки стійкості кластеризації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу. Інтерпретація результатів та побудування дендрограми.
Рубрика | Экономико-математическое моделирование |
Вид | реферат |
Язык | украинский |
Дата добавления | 10.12.2014 |
Размер файла | 171,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Військовий інститут
Київський національний університет імені Тараса Шевченка
Військовий гуманітарно-лінгвістичний факультет
Практична робота № 5
З предмету: « Технології математичного моделювання психологічних явищ»
На тему: «Кластерний аналіз»
Виконала:
курсант 511 пс групи
Кисельова Каріна
Київ 2014
Для того щоб виконати завдання з використанням кластерного аналізу ми скористаємося статистичним пакетом обробки даних SPSS та файлом з результатами щодо використання людьми захисних механізмів та копінг-стратегій.
Наша вибірка становить 20 осіб.
Ми обрали 4 фактори:
Захисні механізми:
Ш Витіснення;
Ш Заміщення;
Копінг-стратегії:
ь Активний відпочинок.
ь Духовність;
Кластер |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
||
Вытеснение |
8,00 |
2,50 |
4,50 |
4,00 |
6,00 |
4,00 |
|
Замещение |
8,00 |
8,00 |
4,25 |
3,50 |
5,67 |
3,25 |
|
14.Духовность |
50,00 |
67,50 |
80,00 |
60,00 |
60,00 |
68,75 |
|
18.Активный отдых |
49,00 |
84,00 |
57,75 |
63,00 |
39,67 |
54,25 |
кластерний аналіз алгоритм дендрограма
Перша таблиця - Кінцеві центри кластерів, дає нам змогу дізнатися який фактор є центральним для виділення кожного кластеру:
1 кластер- - кожен фактор є досить значним для досліджуваних,
2 кластер - фактори «Активний відпочинок» та «Заміщення »є центральними і «Духовність»;
3 кластер - «Духовність», «Активний відпочинок»;
4 кластер -фактор «Духовність», «Активний відпочинок» та ;
5 фактор - фактор «Духовність» і «Витіснення» «Заміщення» .
6 фактор- фактори «Духовність» та «Активний відпочинок».
Число наблюдений в каждом кластере
Кластер |
1 |
1,000 |
|
2 |
2,000 |
||
3 |
4,000 |
||
4 |
6,000 |
||
5 |
3,000 |
||
6 |
4,000 |
||
Валидные |
20,000 |
||
Пропущенные значения |
,000 |
Таблиця «Число наблюдений в каждом кластере» допомагає нам дізнатись яка кількість досліджуваних увійшла до кожного кластеру:
1ий кластер - 1особа;
2ий кластер - 2 особи;
3ій кластер - 4 особи;
4ий кластер - 6 осіб;
5иій кластер - 3 особи.
6иій кластер - 4 особи.
Після використання кластеризації К-середніми ми скористаємося Ієрархічним кластерним аналізом для порівняння результатів.
Метод кластеризації - Міжгрупові зв'язки - порівнює відстань між об'єктами різних кластерів.
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
|||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
||||
1 |
3 |
15 |
,000 |
0 |
0 |
6 |
|
2 |
2 |
20 |
1,000 |
0 |
0 |
12 |
|
3 |
18 |
19 |
1,000 |
0 |
0 |
6 |
|
4 |
1 |
12 |
1,000 |
0 |
0 |
14 |
|
5 |
4 |
9 |
1,000 |
0 |
0 |
10 |
|
6 |
3 |
18 |
1,500 |
1 |
3 |
13 |
|
7 |
7 |
16 |
2,000 |
0 |
0 |
12 |
|
8 |
11 |
14 |
2,000 |
0 |
0 |
9 |
|
9 |
10 |
11 |
3,000 |
0 |
8 |
11 |
|
10 |
4 |
6 |
3,500 |
5 |
0 |
15 |
|
11 |
8 |
10 |
4,667 |
0 |
9 |
16 |
|
12 |
2 |
7 |
5,000 |
2 |
7 |
17 |
|
13 |
3 |
5 |
5,750 |
6 |
0 |
15 |
|
14 |
1 |
13 |
6,500 |
4 |
0 |
17 |
|
15 |
3 |
4 |
8,667 |
13 |
10 |
16 |
|
16 |
3 |
8 |
14,250 |
15 |
11 |
19 |
|
17 |
1 |
2 |
16,417 |
14 |
12 |
18 |
|
18 |
1 |
17 |
27,000 |
17 |
0 |
19 |
|
19 |
1 |
3 |
41,729 |
18 |
16 |
0 |
З таблиці «Кроки агломерації» ми можемо зрозуміти на якому етапі які досліджувані об'єдналися у кластер. Наприклад, на 5му етапі досліджувані 4 і 9 об'єдналися у кластер.
Також в цій таблиці ми можемо прослідкувати Евклідову відстань між кожним кластером і завдяки визначенню «скачка» ми дізнаємося яку кількість кластерів ми отримуємо.
Перший найбільший відрив ми спостерігаємо на 14 кроці. Скористаємося формулою на визначимо кількість кластерів.
Формула:
Загальна кількість досліджуваних відняти номер етапу, на якому відбувся скачок.
20 - 14 (15) = 6(5)
Визначити скільки саме(6 чи 5) ми маємо кластерів нам допоможе дендограма
Дана дендограма допомагає побачити на якій відстані один від одного знаходяться кластери та на якому рівні вони утворюються. Ми розуміємо, що чим раніше утворюється кластер, тим більш схожі між собою його члени. Ми приймаємо рішення про загальну кількість кластерів - 6. Ці 6 кластерів утворюються приблизно на одному рівні, а отже їх члени достатньо схожі між собою за своїми характерами, звичками чи іншим.
Принадлежность к кластерам
Наблюдение |
6 кластеров |
5 кластеров |
|
1 |
1 |
1 |
|
2 |
2 |
2 |
|
3 |
3 |
3 |
|
4 |
4 |
3 |
|
5 |
3 |
3 |
|
6 |
4 |
3 |
|
7 |
2 |
2 |
|
8 |
5 |
4 |
|
9 |
4 |
3 |
|
10 |
5 |
4 |
|
11 |
5 |
4 |
|
12 |
1 |
1 |
|
13 |
1 |
1 |
|
14 |
5 |
4 |
|
15 |
3 |
3 |
|
16 |
2 |
2 |
|
17 |
6 |
5 |
|
18 |
3 |
3 |
|
19 |
3 |
3 |
|
20 |
2 |
2 |
Таблиця «Приналежність до кластерів» допомагає нам побачити в якому кластері був би кожен досліджуваний, якби кластерів була інша кількість, ніж ми визначили. Наприклад, якщо ми маємо 6 кластерів, то досліджуваний №11 входить до 5го кластеру, але якщо ми зменшимо кількість кластерів до 5ти, то цей досліджуваний буде входити до 4го кластеру.
Далі завдяки функції SPSS «середні значення» ми маємо змогу визначити, які фактори є найбільш впливовими для кожного кластеру.
Отчет
Average Linkage (Between Groups) |
Вытеснение |
Замещение |
18.Активный отдых |
14.Духовность |
||
1 |
Среднее |
4,0000 |
2,5000 |
61,2500 |
63,1250 |
|
N |
8 |
8 |
8 |
8 |
||
Стд.Отклонение |
1,69031 |
1,92725 |
3,24037 |
7,03943 |
||
2 |
Среднее |
3,5000 |
10,0000 |
73,5000 |
67,5000 |
|
N |
2 |
2 |
2 |
2 |
||
Стд.Отклонение |
2,12132 |
2,82843 |
4,94975 |
3,53553 |
||
3 |
Среднее |
4,3333 |
4,6667 |
56,0000 |
81,6667 |
|
N |
3 |
3 |
3 |
3 |
||
Стд.Отклонение |
1,52753 |
2,08167 |
,00000 |
2,88675 |
||
4 |
Среднее |
4,0000 |
2,5000 |
49,0000 |
70,0000 |
|
N |
2 |
2 |
2 |
2 |
||
Стд.Отклонение |
,00000 |
3,53553 |
,00000 |
,00000 |
||
5 |
Среднее |
6,5000 |
6,2500 |
42,0000 |
57,5000 |
|
N |
4 |
4 |
4 |
4 |
||
Стд.Отклонение |
1,29099 |
2,36291 |
5,71548 |
6,45497 |
||
6 |
Среднее |
3,0000 |
8,0000 |
91,0000 |
65,0000 |
|
N |
1 |
1 |
1 |
1 |
||
Стд.Отклонение |
. |
. |
. |
. |
||
Итого |
Среднее |
4,4500 |
4,6000 |
58,1000 |
66,0000 |
|
N |
20 |
20 |
20 |
20 |
||
Стд.Отклонение |
1,73129 |
3,21837 |
12,66533 |
9,26226 |
До першого кластеру входить досліджуваний для якого є властивими захисні механізми -витіснення та копінг-стратегії - духовність і активний відпочинок.
Другий кластер складають особи, для яких притаманна копінг-стратегія «Духовність» та «Активний відпочинок»та захисний механізм «Заміщення»
Третій кластер - це люди, для яких притаманні всі фактори окрім «Активного відпочинку»
До Четвертого кластеру «Духовність»
П'ятий кластер: «Витіснення» і «Заміщення»
Шостий кластер: «Заміщення», «Активний відпочинок», «Духовність»
Висновок
В ході виконання роботи ми використали кластерний аналіз, здійснено це було двома шляхами - Ієрархічним кластерним аналізом та кластеризацією К-середніх. Для того щоб виконувати роботу ефективно варто застосовувати обидва способи.
Размещено на Allbest.ru
Подобные документы
Завдання та етапи кластерного аналізу, вимоги до інформації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу, методи перевірки стійкості кластеризації, інтерпретація результатів аналізу та побудування дендрограми.
реферат [311,2 K], добавлен 15.07.2011Зміст і мета кластеризації. Переваги її застосування перед іншими методами класифікації даних. Ієрархічні і неієрархічні методи кластерного аналізу. Приклад вертикальної дендрограми. Алгоритми найближчого і дальнього сусіда. Схема ітеративного методу.
контрольная работа [2,4 M], добавлен 12.06.2019Методи одержання стійких статистичних оцінок. Агломеративні методи кластерного аналізу. Грубі помилки та методи їх виявлення. Множинна нелінійна регресія. Метод головних компонент. Сутність завдання факторного аналізу. Робастне статистичне оцінювання.
курсовая работа [1,2 M], добавлен 28.04.2014Мета кластерного аналізу: поняття, алгоритм, завдання. Головні особливості процедури Мак-Кіна. Графік середніх значень за трьома кластерами. Метод К-методів, переваги та недоліки використання. Поняття про сіткові алгоритми кластеризації (grid-based).
реферат [238,3 K], добавлен 27.05.2013Упорядкування одиниць сукупності за допомогою інтегральних оцінок. Багатовимірне ранжування у системі Statistica. Формування однорідних одиниць сукупності за допомогою кластерного аналізу. Порядок об’єднання в кластери через опцію Amalgamation schedule.
контрольная работа [1,8 M], добавлен 08.12.2010Сутність та предмет економічного аналізу. Визначення понять "технологія", "фактор", "резерв", "аналіз". Класифікація господарських резервів. Управлінський та оперативний аналіз. Основні джерела інформації у процесі здійснення аналітичного дослідження.
тест [13,0 K], добавлен 09.09.2010Основні принципи технічного аналізу Доу, типи трендів та закони руху цін. Види та методи обчислення простих, експонентних і лінійно зважених ковзних середніх, їх оцінка як інструменту технічного аналізу. Правила побудови графіків "смуг Болінджера".
эссе [1,4 M], добавлен 07.07.2011Методи розв’язування, аналізу та використання задач зі знаходженням екстремуму функції на множині допустимих варіантів у широкому спектрі теоретико-економічних та практичних проблем. Модель задачі лінійного програмування. Складання симплексної таблиці.
контрольная работа [960,6 K], добавлен 08.10.2013Розробка структури інформаційної системи. Характеристика економічних задач і функцій. Розробка математичного і машинного алгоритмів рішення задач. Інформаційне і організаційне забезпечення. Технічне і програмне забезпечення. Контрольний приклад.
курсовая работа [293,2 K], добавлен 08.11.2008Використання абсолютних, відносних та середніх величин, рядів динаміки у фінансовому аналізі, складання аналітичних таблиць. Застосування індексного та графічного методів. Послідовність аналізу економічних показників, взаємозв’язок факторних показників.
курсовая работа [145,2 K], добавлен 31.05.2010