Перевірка статистичної значущості результатів педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов вищих військових навчальних закладів із використанням методів машинного навчання
Порівняння методів Agglomerative Clustering, DBSCAN, Gaussian Mixture Model, та K-Means, для оцінки статистичної значущості результатів педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов військових ВНЗ.
| Рубрика | Педагогика |
| Вид | статья |
| Язык | украинский |
| Дата добавления | 24.11.2023 |
| Размер файла | 81,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Національний університет оборони України
ПЕРЕВІРКА СТАТИСТИЧНОЇ ЗНАЧУЩОСТІ РЕЗУЛЬТАТІВ ПЕДАГОГІЧНОГО ЕКСПЕРИМЕНТУ ЩОДО РОЗВИТКУ ДІАГНОСТИЧНОЇ КОМПЕТЕНТНОСТІ ВИКЛАДАЧІВ ІНОЗЕМНИХ МОВ ВИЩИХ ВІЙСЬКОВИХ НАВЧАЛЬНИХ ЗАКЛАДІВ ІЗ ВИКОРИСТАННЯМ МЕТОДІВ МАШИНОГО НАВЧАННЯ
Грищук Юлія Володимирівна ад'юнкт наукового центру
мовного тестування навчально-наукового центру іноземних мов
Миколайчук Роман Антонович доктор технічних наук,
доцент кафедри інформаційно-аналітичних технологій
м. Київ
Анотація
діагностичний компетентність військовий іноземний
Наукова стаття присвячена дослідженню та порівнянню різних методів машинного навчання, таких як Agglomerative Clustering, DBSCAN, Gaussian Mixture Model, та K-Means, для оцінки статистичної значущості результатів педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов вищих військових навчальних закладів. Дослідження проводились за допомогою об'єктноорієнтованої, високорівневої мови програмування Python та інтерактивного середовище Jupyter Notebook для запису, передачі й запуску коду, які були використані для кластеризації даних і оцінки точності з використанням методів кластеризації. Було виявлено, що кластерний метод GMM можна успішно застосовувати до результатів експерименту з метою виявлення групи об'єктів, які мають подібні характеристики або показники. З метою забезпечення об'єктивності, точності, якості кластерного аналізу та ґрунтовного й всебічного розуміння отриманих результатів, було застосовано декілька метрик, як-от: Adjusted Rand Index (ARI), Fowlkes-Mallows Index (FMI) і Silhouette Coefficient (індекс силуету). Застосування t-тетсу, уможливило визначити значення p-value, які були наближені до нуля, що засвідчило статистично значущу різницю в середніх значеннях між кластерами, підтверджуючи статистичну значущість педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ.
Кластерний аналіз дозволив виявити групи об'єктів зі схожими характеристиками або показниками, що відображають ефективність педагогічного експерименту та його вплив на розвиток діагностичної компетентності у викладачів іноземних мов ВВНЗ. Після статистичного опрацювання експериментальних даних було підтверджено значущість результатів розвитку діагностичної компетентності викладачів іноземних мов у вищих військових навчальних закладах.
Ключові слова: машинне навчання, професійна компетентність, педагогічне діагностування, змішане навчання, штучний інтелект, вищий військовий навчальний заклад, іншомовна компетентність, система, якість іншомовної підготовки, оцінювання, адаптивність.
Annotation
Hryshchuk Yuliia Volodymyrivna PhD military student of the Language Testing and Research Centre of the Foreign Languages and Education and Research Centre of the National Defence University of Ukraine, Language Testing and Research Centre of the Foreign Languages and Education and Research Centre, Kyiv
Mykolaichuk Roman Antonovych Doctor of Technical Sciences, associate professor Department of Information and Analytical Technologies", National Defence University of Ukraine, Kyiv
VERIFICATION OF THE STATISTICAL SIGNIFICANCE OF THE RESULTS OF A PEDAGOGICAL EXPERIMENT ON THE DEVELOPMENT OF DIAGNOSTIC COMPETENCE OF TEACHERS OF FOREIGN LANGUAGES AT HIGHER MILITARY EDUCATIONAL INSTITUTIONS USING MACHINE LEARNING METHODS
This scientific article is devoted to the investigation and comparison of various machine learning methods, such as Agglomerative Clustering, DBSCAN, Gaussian Mixture Model, and K-Means, for assessing the statistical significance of the results of a pedagogical experiment on the development of diagnostic competence of foreign language teachers at higher military educational institutions. The research was conducted using Python - the object-oriented, highlevel programming language and the Jupyter Notebook - interactive environment for code recording, transmission, and running, which were utilized for data clustering and accuracy evaluation using clustering methods. It was found that the GMM clustering method can be successfully applied to the experiment's results for identifying groups of objects with similar characteristics or indicators. In order to ensure objectivity, accuracy, quality of the clustering analysis, and comprehensive understanding of the obtained results, the following metrics were applied, such as Adjusted Rand Index (ARI), Fowlkes-Mallows Index (FMI), and Silhouette Coefficient. The use of the t-test enabled the determination of p-value that were approximated to zero, indicating a statistically significant difference in the mean values between clusters, confirming the statistical significance of the pedagogical experiment on the development of diagnostic competence of foreign language instructors at higher military educational institutions.
The clustering analysis allowed identifying groups of objects with similar characteristics or indicators, reflecting the effectiveness of the pedagogical experiment and its impact on the development of diagnostic competence of foreign language instructors at higher military educational institutions. After the statistical processing of the experimental data, the significance of the results on the development of diagnostic competence of foreign language teachers at higher military educational institutions was confirmed.
Keywords: machine learning, professional competence, pedagogical diagnosis, blended learning, artificial intelligence, higher education institution, foreign language competence, system, quality of foreign language training, assessment, adaptability.
Постановка проблеми
Педагогічний експеримент є невід'ємною складовою сучасного дослідницького підходу у галузі освіти та педагогічної практики. Впровадження нових методик, технологій та інновацій у навчальний процес вимагає належного наукового обґрунтування та оцінки їх ефективності. Одним із ключових аспектів такої оцінки є визначення статистичної значущості отриманих результатів.
Традиційні статистичні методи виявлення статистичної значущості, такі як t-тест та аналіз дисперсії (ANOVA), використовуються дослідниками десятиліттями. Однак, внаслідок зростання обсягу даних та збільшенням складності дослідницьких завдань, ці традиційні підходи можуть бути недостатньо ефективними. У зв'язку з цим, в останні роки виникла потреба у застосуванні методів машинного навчання для вирішення завдань оцінки статистичної значущості в педагогічних експериментах. Машинне навчання - це сучасна галузь штучного інтелекту, яка дозволяє автоматично виявляти закономірності та залежності у великих обсягах даних без необхідності формулювання жорстких апріорних припущень [5; 10].
Застосування методів машинного навчання в контексті статистичної значущості дозволить отримати більш об'єктивні та точні результати, а також зробить процес аналізу ефективнішим та менш витратним з точки зору часу та ресурсів. Окрім того підсумкові висновки даного дослідження допоможуть науковцям та педагогам зрозуміти можливості та обмеження використання методів машинного навчання для оцінки статистичної значущості в контексті будь -яких педагогічних досліджень. З метою перевірки ефективності педагогічної моделі розвитку діагностичної компетентності викладачів іноземних мов вищих військових навчальних закладів (далі - ВВНЗ) було організовано педагогічний експеримент, який проводився у три етапи:
На пошуково-констатувальному етапі було теоретично проаналізовано та систематизовано наукові джерела, визначено поняттєво-категоріальний апарат, основне теоретичне та методологічне підґрунтя дослідження, обєкт, предмет, мету завдання й гіпотезу дослідження, з ясовано сучасний стан розвиненості діагностичної компетентності викладачів іноземних мов ВВНЗ, здійснено педагогічне моделювання розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ з розробленням авторської методики адаптивного навчання, визначено й розроблено критерії, показники, методики її діагностуванням, сформовано контрольну групу (далі - КГ) та експериментальну групу (далі - ЕГ).
На формувальному етапі було здійснено експериментальну перевірку ефективності педагогічного моделювання розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ з опрацюванням отриманих результатів та визначенням рівнів їхньої розвиненості.
Завершальний етап передбачав статистичне опрацювання експериментальних даних з метою доведення значущості отриманих результатів, а також їх узагальнення та систематизацію.
Аналіз наукових джерел та публікацій
Іеоретико-методологічні основи компетентнісного підходу в педагогічній науці досліджували українські (А. Вітченко, М. Головань, О. Діденко, І. Драч, О. Дубасенюк, Л. А. Зельницький, І. Зязюн, Н. Ничкало, О. Овчарук, Л. Олійник, В. Осьодло, O. Пометун, О. Федоренко, І. Чистовська, Н. Шалигіна, В. Ягупов) та іноземні (Л. Дарлінг-Гаммонд (L. Darling-Hammond), С. Моншатр (S. Monchatre) та P. Арпан (R. Arpin), К. Шовіне (C. Chauvigne) та Ж.-К. Куле (J.-C. Coulet) науковці; питання професійної компетентності у вищу військову школу віднайшли своє відображення у працях М. Арістархової, І. Бєлікова, Л. Заїки, Н. Замотаєвої, В. Киви, В. Крикун, Д. Погребняка, О. Рибчука, В. Скрипнікової; сутність педагогічної діагностики розкривають К. Інгенкамп, І. Є. Булах, В. М. Галузяк, І. Я. Лернер, Л. Ортинський, І.Підласий; формування та розвиток діагностичної компетентності фахівців вивчали Г. Гац, О. Застело, О. Лагодинський, І. Плохута, О. Дубровська, А. Келава, С. Брудера, Ю. Клюг, Б. Шмітц, С. Мартиненко, К. Спіел, A. Оле, Н. Макевані; статистичні методи машинного навчання у своїх наукових розвідках вивчали такі українські вчені, як-от: О. Власенко, Є Гришкун, С. Кравченко, а також зарубіжні наковці серед яких Й. Байєр (J. Bayer), Г. Вароксо (G. Varoquaux), Д. Віерстра (D. Wierstra), А. Грамфорт (A. Gramfort), Ф. Джером (F. Jerome), Е. Егер (E. Eger), Ф. Зенке (F. Sehnke), С. Керібін (C. Keribin), В. Мішель (V. Michel), Ф. Педрегоса (F. Pedregosa), Т. Роберт (T. Robert), А. В. Рохлін (A, V. Rokhlin), Т. Рукстісс (t. RuckstieB), А. Слам (A. Szlam), Й. Сун (Y. Sun), М. Тайгерт (M. Tygert), Б. Тіріон (B. Thirion), Г. Тревор (H. Trevor), М. Фелдер (M. Felder), Т. Шауль (T. Schaul).
Метою даного дослідження є перевірка статистичної значущості результатів педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ. Завдання дослідження: 1. Підбір необхідного статистичного методу опрацювання отриманих експериментальних даних. 2. Статистичне опрацювання експериментальних даних з метою доведення значущості результатів розвиненості діагностичної компетентності викладачів іноземних мов ВВНЗ.
Виклад основного матеріалу
Відповідно до мети дослідження для оцінки статистичної значущості педагогічного експерименту необхідно було за допомогою методів машинного навчання розділити учасників експерименту (КГ та ЕГ) на дві групи, а потім порівняти такий розподіл зі складом КГ та ЕГ. Дана задача стосується класу завдань кластерізації, що дозволяє отримати групи об'єктів з подібними характеристиками (кластери). Різні методи кластеризації, згадані в нашій статті (Agglomerative Clustering, DBSCAN, Gaussian Mixture Model, та K-Means) (Таблиця 1) [3; 4; 8;], можуть бути застосовані до результатів експерименту. Якщо використання методів кластеризації допоможе здійснити розділення учасників на кластери, які будуть максимально наближені до складу КГ та ЕГ різні групи згідно з їхніми характеристиками, можна буде стверджувати про відмінність результатів експерименту для кожної з цих груп та відповідно статистичну значущість цих результатів. Варто зазначити, що кластерний (англ. cluster - нагромадження) аналіз (кластеризація) - це такий метод класифікації, який передбачає поділ вихідної сукупності об'єктів на класи з подібними властивостями - кластери - група об'єктів, яка характеризується загальною властивістю (щільністю, дисперсією, розміром тощо) [11].
Метою педагогічного експерименту було підтвердження ефективності педагогічної моделі розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ. Варто зазначити, що діагностичну компетентність викладачів іноземних мов ВВНЗ розглядаємо як “професійно важливе утворення, яке є сукупністю знань, вмінь, навичок, ціннісних орієнтацій, мотивів, способів діяльності у сфері діагностування розвитку іншомовної професійної компетентності військовослужбовців (офіцерів, курсантів) і містить професійно важливі якості педагога-діагноста, що відображають його практичну здатність і психологічну готовність до діагностичної діяльності” [7 c.].
Компонентами діагностичної компетентності викладачів іноземних мов ВВНЗ є: ціннісно-мотиваційний, когнітивний, діяльнісний, суб'єктний, індивідуально-психічний. На основі обґрунтування здійснених досліджень та вивчення літературних джерел, були визначені наступні критерії вимірювання розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ: ціннісно-мотиваційний, інтелектуальний, праксеологічний, рефлексивний, психологічний.
З огляду на зазначені критерії розвитку діагностичної компетентності критерію, виокремлено та запропоновано систему конкретних показників, які допомагають краще розуміти та оцінити необхідні властивості досліджуваного об'єкта, його компонентного складу та, відповідно, рівень розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ: (1) цінності щодо діагностичної діяльності, (2) мотивація щодо діагностичної дільності (ціннісно-мотиваційний критерій); (3) фахові діагностичні знання, (4) практичні знання щодо діагностування рівня розвниненості ІПК військовослужбовців (офіцерів, курсантів), (5) методичні знання методів, прийомів, методик, засобів діагностування (знаннєвий); (6) вміння та навички діагностувати рівень ІПК військовослужбовців (офіцерів, курсантів), (7) вміння та навички щодо застосування методів, методичних прийомів, діагностичних методик, (8) методичні навички та вміння застосовувати діагностичні засоби (праксеологічний критерій); (9) професійна суб'єктність, (10) рефлексивність (рефлексивний критерій), (11) критичне мислення, (12) об'єктивність, (13) комунікабельність, (14) толерантність, (15) організованість (психологічний критерій).
Підготовка до кластеризації полягала у створенні загального набору данихрезультатів оцінювання усіх учасників педагогічного експерименту, а саме - 25 викладачів іноземних мов ВВНЗ із КГ та 24 - з ЕГ з визначеними показниками на початку та наприкінці педагогічного експерименту. У зв'язку з невеликою кількістю учасників, необхідно було зменшити кількість змінних кластеризації. Для цього, по-перше, було визначено відносний приріст кожного показника (відношення значення приросту показника до його початкового значення) після формувального етапу педагогічного експерименту КГ (Таблиця 2) та ЕГ (Таблиця 3) та знайдено сумарний відносний приріст. Подруге, знайдено значення відносного прогресу учасників, як відношення сумарного відносного приросту до початкових результатів учасників педагогічного експерименту. Отримані два значення були використані для створення набору даних для проведення кластерного аналізу (Таблиця 4).
Таблиця 1
Алгоритми кластеризації
|
№ з/п |
Алгоритми кластеризації |
Переваги |
Недоліки |
|
|
і. |
Agglomerative Clustering (Агломеративна кластеризація) - ієрархічний метод кластеризації, де кожен об'єкт спочатку розглядається як окремий кластер, а потім об'єднується поступово в більші кластери на основі схожості. На кожному кроці об'єкти або кластери, що мають найбільшу схожість, зливаються у новий кластер. Процес продовжується до тих пір, поки всі об'єкти не знаходяться в одному кластері або до досягнення певного порогового значення. |
• Не потребує заздалегідь встановленої кількості кластерів. • Надає ієрархічну структуру кластерів, що дозволяє аналізувати дані на різних рівнях деталізації. • Можливість використання різних метрик відстані для виявлення схожості між об'єктами. |
• Висока обчислювальна складність, особливо для великих наборів даних. • Отримані кластери можуть бути залежні від використаних метрик відстані та порогового значення, що може впливати на якість результатів. • Може приводити до створення кластерів з різною кількістю об'єктів, що ускладнює їх інтерпретацію. |
|
|
2. |
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - це метод кластеризації, який визначає кластери на основі щільності об'єктів у просторі. Він припускає, що об'єкти, які знаходяться близько один до одного та мають достатньо велику кількість сусідів (щільність), належать до одного кластера, тоді як об'єкти з меншою кількістю сусідів вважаються шумом. |
• Не потребує встановлення кількості кластерів перед початком аналізу. • Дозволяє виявляти кластери складної форми та розділяти їх у випадках, коли між ними є області шуму або непросторів. • Стійкий до шуму та може ігнорувати окремі викиди (outliers). |
• Ефективність DBSCAN може залежати від вибору параметрів, таких як радіус сусідства та мінімальна кількість сусідів, і вони можуть бути проблематичними для визначення в деяких випадках. • Може мати складнощі в роботі з даними високої розмірності, оскільки відстань між об'єктами може стати менш значущою. |
|
|
3. |
Gaussian Mixture Model (GMM) -статистичний метод кластеризації, який моделює кожен кластер як набір гаусіан (нормальних) розподілів. Кожен кластер вважається гаусіаною з власними параметрами (середнє та дисперсія). Об'єкт призначається до кластеру згідно ймовірності належності до відповідної гаусіани |
• Здатний працювати з даними, які мають складні форми кластерів із перекриваючимися областями. • Надає ймовірнісний підхід до кластеризації, що дозволяє оцінити ступінь впевненості у приналежності об'єктів до кластерів. |
• Чутливий до початкових значень параметрів, і невідповідний вибір може привести до некоректної кластеризації. • Обчислювально вимогливий, особливо при великій кількості даних та високих розмірностях. • Може впливати на кількість кластерів, які були заздалегідь визначені, що обмежує його гнучкість порівняно з іншими методами. |
|
|
4. |
K-Means - це ітеративний алгоритм кластеризації, який спробує розділити набір даних на заздалегідь визначену кількість (K) кластерів. Він працює, мінімізуючи внурішньокластерні розбіжності і знаходячи центроїди (середні) для кожного кластеру. Кожен об'єкт призначається до кластеру згідно його відстані до центроїду. |
• Швидкий та простий у реалізації. • Єфективний для великих наборів даних та низьких розмірностей. • Зазвичай добре працює, коли кластери мають сферичні форми та розділені значимими відстанями. |
• Чутливий до початкових значень центроїдів, що може призвести до різних результатів кластеризації при різних запусках алгоритму. • Не дуже ефективний для даних зі складними формами кластерів, розташованими неправильно або з перекриваючимися областями. • Вимагає заздалегідь встановленої кількості кластерів, що може бути проблематичним у деяких випадках, коли ця інформація не відома. |
Таблиця 2
Приріст показників після формувальног етапу педагогічного експерименту КГ
Набір даних для проведення кластерного аналізу
|
№ з/п |
КГ |
№ з/п |
ЕГ |
|||
|
Сумарний відносний приріст учасників |
Значення відносного прогресу учасників |
Сумарний відносний приріст учасників |
Значення відносного прогресу учасників |
|||
|
1 |
0,210539 |
0,229179 |
1 |
0,407993 |
0,448673 |
|
|
2 |
0,189440 |
0,211586 |
2 |
0,312479 |
0,341632 |
|
|
3 |
0,274687 |
0,310030 |
3 |
0,842731 |
0,949734 |
|
|
4 |
0,474553 |
0,561379 |
4 |
1,466429 |
1,732003 |
|
|
5 |
0,289438 |
0,359997 |
5 |
1,567885 |
1,847469 |
|
|
6 |
0,159990 |
0,198007 |
6 |
1,902973 |
2,311304 |
|
|
7 |
0,431809 |
0,559821 |
7 |
2,061011 |
2,584880 |
|
|
8 |
0,504828 |
0,648323 |
8 |
2,761411 |
3,543299 |
|
|
9 |
1,170083 |
1,554583 |
9 |
2,863230 |
3,744416 |
|
|
10 |
0,998965 |
1,335514 |
10 |
2,902909 |
3,822971 |
|
|
11 |
0,890772 |
1,212485 |
11 |
4,463468 |
6,419177 |
|
|
12 |
0,573527 |
0,840128 |
12 |
4,462041 |
6,460484 |
|
|
13 |
0,892820 |
1,348671 |
13 |
4,580152 |
6,762035 |
|
|
14 |
0,632439 |
1,009210 |
14 |
4,827150 |
7,566065 |
|
|
15 |
0,496948 |
0,802392 |
15 |
4,989821 |
7,945575 |
|
|
16 |
0,547174 |
0,872223 |
16 |
3,488625 |
5,479516 |
|
|
17 |
1,042987 |
1,696833 |
17 |
4,281438 |
7,011088 |
|
|
18 |
0,404620 |
0,628292 |
18 |
3,459390 |
5,526182 |
|
|
19 |
0,360729 |
0,573192 |
19 |
3,634344 |
5,251942 |
|
|
20 |
1,392469 |
2,212609 |
20 |
4,001271 |
5,936604 |
|
|
21 |
0,530531 |
0,874502 |
21 |
4,725501 |
7,849669 |
|
|
22 |
1,229189 |
2,099980 |
22 |
3,403754 |
5,841683 |
|
|
23 |
0,650234 |
1,083724 |
23 |
3,672449 |
6,141220 |
|
|
24 |
1,499759 |
2,413776 |
24 |
2,946723 |
4,825420 |
|
|
25 |
0,470992 |
0,769594 |
Таблиця 3
Приріст показників після формувального етапу педагогічного експерименту ЕГ
|
0,92 |
0,02 |
0,01 |
0 |
0 |
0 |
-0,01 |
0 |
-0,03 |
0 |
0,13 |
0,05 |
0 |
-0,01 |
0,02 |
0,03 |
|
|
0,90 |
0,01 |
0 |
0 |
0,01 |
0 |
0,02 |
0,04 |
0 |
0,01 |
0,01 |
0,07 |
0,01 |
0 |
0,01 |
-0,01 |
|
|
0,89 |
0 |
0 |
0,03 |
0 |
0,04 |
0,08 |
0,04 |
0 |
0,05 |
0 |
0 |
0,01 |
0 |
0 |
0,02 |
|
|
0,85 |
0 |
0,02 |
0 |
0 |
0,01 |
0,02 |
0,06 |
0,10 |
0,01 |
0,03 |
0,01 |
0,13 |
0,02 |
0 |
0,06 |
|
|
0,80 |
0,08 |
0,03 |
0 |
0,03 |
0 |
0,05 |
0,01 |
0,01 |
0,01 |
0,03 |
0,04 |
0 |
0,01 |
-0,01 |
0 |
|
|
0,81 |
0,02 |
0,03 |
0,04 |
-0,01 |
0 |
0 |
0,02 |
0,04 |
0,03 |
0,02 |
0 |
0 |
0 |
-0,01 |
0 |
|
|
0,77 |
0,03 |
0,01 |
0,06 |
0 |
0 |
0,02 |
0,05 |
0,01 |
0 |
0,02 |
0,03 |
0 |
-0,03 |
0,13 |
0,10 |
|
|
0,78 |
0,03 |
0,06 |
-0,01 |
0,01 |
0 |
0 |
0,01 |
0 |
0,20 |
0,05 |
0,10 |
0,01 |
0,01 |
0,03 |
0 |
|
|
0,75 |
0,30 |
0,32 |
0,10 |
0,05 |
0 |
0,01 |
0 |
0,05 |
0,09 |
0,09 |
0,15 |
0 |
0 |
0 |
0 |
|
|
0,75 |
0,29 |
0,26 |
0,06 |
0 |
0,02 |
0,08 |
0 |
0 |
0,09 |
0,03 |
0 |
0,09 |
0 |
0,07 |
0 |
|
|
0,73 |
0,29 |
-0,01 |
0,09 |
0 |
0,04 |
0,02 |
0 |
0,11 |
0,13 |
0 |
0 |
0,23 |
0 |
0 |
0 |
|
|
0,68 |
0,08 |
-0,02 |
0,04 |
0,06 |
0,09 |
0,07 |
0 |
0,09 |
0,03 |
0,03 |
0,03 |
0 |
0,04 |
0,03 |
0 |
|
|
0,66 |
0,24 |
0,05 |
0 |
0,05 |
0,01 |
0,16 |
0 |
0,08 |
0 |
0,07 |
0,02 |
0,20 |
0,01 |
0,01 |
0 |
|
|
0,63 |
0,10 |
0,20 |
0,07 |
0 |
0 |
0,02 |
0 |
0 |
0 |
0,17 |
0 |
0 |
0,01 |
0,06 |
0 |
|
|
0,62 |
0,08 |
0,12 |
0,08 |
0,02 |
0 |
0 |
0 |
0 |
0,02 |
0,10 |
0,07 |
0 |
0,03 |
0 |
0 |
|
|
0,63 |
0,06 |
0,16 |
0 |
0 |
0 |
0,03 |
0 |
0 |
0,09 |
0,11 |
0,05 |
0 |
0,01 |
0 |
0,03 |
|
|
0,61 |
0,25 |
0,27 |
0,02 |
0 |
0 |
0,05 |
0,02 |
0 |
0,15 |
0,23 |
0 |
0,02 |
0,01 |
0,03 |
0 |
|
|
0,64 |
0,08 |
0,10 |
0,02 |
0 |
0 |
0 |
0 |
0 |
0 |
0,05 |
0 |
0 |
0,02 |
0,12 |
0,02 |
|
|
0,63 |
0,10 |
0,08 |
0 |
0 |
0,02 |
0 |
0 |
0,07 |
0 |
0,07 |
0 |
0 |
0,03 |
0 |
0 |
|
|
0,63 |
0,06 |
0,03 |
0,09 |
0 |
0,19 |
0,09 |
0,05 |
0,17 |
0,11 |
0,16 |
0,08 |
0,24 |
0 |
0 |
0,11 |
|
|
0,61 |
0,12 |
0,13 |
0 |
0,02 |
0,02 |
0 |
0 |
0 |
0,09 |
0,13 |
0 |
0,03 |
0 |
0 |
0 |
|
|
0,59 |
0,22 |
0,42 |
0 |
0 |
0 |
0,02 |
0 |
0 |
0,23 |
0,34 |
0 |
0 |
0 |
0 |
0 |
|
|
0,60 |
0,10 |
0,20 |
0,02 |
0,02 |
0 |
0 |
0 |
0 |
0,19 |
0,12 |
0 |
0 |
0,02 |
0 |
0 |
|
|
0,62 |
0,08 |
0,08 |
0,06 |
0 |
0,20 |
0,16 |
0 |
0,03 |
0,14 |
0,09 |
0,13 |
0,28 |
0,02 |
0,05 |
0,17 |
|
|
0,61 |
0,07 |
0,13 |
0 |
0 |
0 |
0 |
0 |
0 |
0,05 |
0,15 |
0,03 |
0,02 |
0 |
0 |
0,03 |
|
|
0,91 |
0,06 |
0,01 |
0,04 |
0,07 |
-0,01 |
0,04 |
0,01 |
0 |
-0,02 |
0,07 |
0,05 |
0,04 |
0 |
0,04 |
0 |
|
|
0,91 |
0 |
0,02 |
0,01 |
0,06 |
0 |
0,08 |
0,06 |
0 |
0,01 |
0 |
0,02 |
0,06 |
0 |
0 |
0 |
|
|
0,89 |
0,07 |
0,04 |
0,03 |
0,26 |
0 |
0,01 |
0,16 |
0,04 |
0,03 |
0,11 |
0,02 |
0,01 |
0,04 |
0 |
0 |
|
|
0,85 |
0,02 |
0,22 |
0,18 |
0,21 |
0,01 |
0,08 |
0,12 |
0,06 |
0,10 |
0,23 |
0,12 |
0,08 |
0 |
0,02 |
0,01 |
|
|
0,85 |
0,23 |
0,02 |
0,20 |
0,30 |
0,05 |
0,10 |
0,19 |
0,06 |
0,01 |
0,20 |
0,09 |
0,07 |
0 |
0,04 |
0 |
|
|
0,82 |
0,42 |
0,33 |
0,21 |
0,22 |
0,06 |
0,06 |
0,09 |
0,07 |
0,02 |
0,21 |
0,10 |
0,02 |
0 |
0,04 |
0,05 |
|
|
0,80 |
0,33 |
0,38 |
0,08 |
0,15 |
0,02 |
0,10 |
0,11 |
0,06 |
-0,03 |
0,14 |
0,07 |
0,18 |
0 |
0,31 |
0,14 |
|
|
0,78 |
0,45 |
0,46 |
0,13 |
0,17 |
0,06 |
0,07 |
0,16 |
0,06 |
0,28 |
0,34 |
0,27 |
0,18 |
0 |
0,13 |
0,01 |
|
|
0,76 |
0,23 |
0,34 |
0,12 |
0,25 |
0,06 |
0,15 |
0,46 |
0,02 |
0,41 |
0,38 |
0,15 |
0,16 |
0 |
0 |
0,15 |
|
|
0,76 |
0,39 |
0,30 |
0,14 |
0,54 |
0,07 |
0,06 |
0,15 |
0,17 |
0,28 |
0,19 |
0,21 |
0,14 |
0,03 |
0,15 |
0,07 |
|
|
0,70 |
0,20 |
0,33 |
0,37 |
0,75 |
0,14 |
0,13 |
0,44 |
0,38 |
0,40 |
0,56 |
0,04 |
0,36 |
0,10 |
0,01 |
0,25 |
|
|
0,69 |
0,25 |
0,36 |
0,10 |
0,53 |
0,14 |
0,28 |
0,45 |
0,52 |
0,26 |
0,31 |
0,18 |
0,42 |
0,13 |
0,34 |
0,18 |
|
|
0,68 |
0,48 |
0,21 |
0,21 |
0,52 |
0,28 |
0,48 |
0,49 |
0,41 |
0,27 |
0,28 |
0,12 |
0,39 |
0,08 |
0,13 |
0,23 |
|
|
0,64 |
0,27 |
0,30 |
0,42 |
0,32 |
0,27 |
0,52 |
0,48 |
0,43 |
0,21 |
0,32 |
0,14 |
0,38 |
0,13 |
0,29 |
0,35 |
|
|
0,63 |
0,48 |
0,35 |
0,25 |
0,42 |
0,20 |
0,44 |
0,39 |
0,43 |
0,37 |
0,24 |
0,17 |
0,56 |
0,09 |
0,29 |
0,31 |
|
|
0,64 |
0,16 |
0,27 |
0,34 |
0,47 |
0,33 |
0,42 |
0,43 |
0,47 |
0,11 |
0,05 |
0,22 |
0,05 |
0,07 |
0,05 |
0,03 |
|
|
0,61 |
0,33 |
0,53 |
0,21 |
0,29 |
0,16 |
0,47 |
0,25 |
0,35 |
0,43 |
0,15 |
0,24 |
0,25 |
0,20 |
0,17 |
0,23 |
|
|
0,63 |
0,28 |
0,39 |
0,22 |
0,15 |
0,14 |
0,33 |
0,25 |
0,25 |
0,05 |
0,12 |
0,30 |
0,41 |
0,41 |
0,13 |
0,03 |
|
|
0,69 |
0,40 |
0,36 |
0,43 |
0,58 |
0,19 |
0,16 |
0,44 |
0,12 |
0,22 |
0,03 |
0 |
0,17 |
0,25 |
0,04 |
0,23 |
|
|
0,67 |
0,38 |
0,36 |
0,41 |
0,47 |
0,08 |
0,20 |
0,37 |
0,44 |
0,11 |
0,05 |
0,25 |
0,17 |
0,36 |
0,14 |
0,22 |
|
|
0,60 |
0,71 |
0,58 |
0,48 |
0,03 |
0,30 |
0,54 |
0,41 |
0,22 |
0,09 |
0,40 |
0,08 |
0 |
0,39 |
0,13 |
0,34 |
|
|
0,58 |
0,42 |
0,40 |
0,02 |
0,02 |
0 |
0,37 |
0,42 |
0,27 |
0,28 |
0,29 |
0,16 |
0,23 |
0,38 |
0,03 |
0,11 |
|
|
0,60 |
0,54 |
0,44 |
0,27 |
0,23 |
0,30 |
0,34 |
0,09 |
0,16 |
0,21 |
0,25 |
0,17 |
0,23 |
0,33 |
0,07 |
0,03 |
|
|
0,61 |
0,32 |
0,21 |
0 |
0,32 |
0,28 |
0,30 |
0,15 |
0,41 |
0 |
0,07 |
0,15 |
0,30 |
0,25 |
0,07 |
0,14 |
|
|
0,02 |
0,01 |
0 |
0 |
0 |
-0,01 |
0 |
-0,03 |
0 |
0,13 |
0,05 |
0 |
-0,01 |
0,02 |
0,03 |
||
|
0,01 |
0 |
0 |
0,01 |
0 |
0,02 |
0,04 |
0 |
0,01 |
0,01 |
0,07 |
0,01 |
0 |
0,01 |
-0,01 |
||
|
0 |
0 |
0,03 |
0 |
0,04 |
0,08 |
0,04 |
0 |
0,05 |
0 |
0 |
0,01 |
0 |
0 |
0,02 |
||
|
0 |
0,02 |
0 |
0 |
0,01 |
0,02 |
0,06 |
0,10 |
0,01 |
0,03 |
0,01 |
0,13 |
0,02 |
0 |
0,06 |
||
|
0,08 |
0,03 |
0 |
0,03 |
0 |
0,05 |
0,01 |
0,01 |
0,01 |
0,03 |
0,04 |
0 |
0,01 |
-0,01 |
0 |
||
|
0,02 |
0,03 |
0,04 |
-0,01 |
0 |
0 |
0,02 |
0,04 |
0,03 |
0,02 |
0 |
0 |
0 |
-0,01 |
0 |
||
|
0,03 |
0,01 |
0,06 |
0 |
0 |
0,02 |
0,05 |
0,01 |
0 |
0,02 |
0,03 |
0 |
-0,03 |
0,13 |
0,10 |
||
|
0,03 |
0,06 |
-0,01 |
0,01 |
0 |
0 |
0,01 |
0 |
0,20 |
0,05 |
0,10 |
0,01 |
0,01 |
0,03 |
0 |
||
|
0,30 |
0,32 |
0,10 |
0,05 |
0 |
0,01 |
0 |
0,05 |
0,09 |
0,09 |
0,15 |
0 |
0 |
0 |
0 |
||
|
0,29 |
0,26 |
0,06 |
0 |
0,02 |
0,08 |
0 |
0 |
0,09 |
0,03 |
0 |
0,09 |
0 |
0,07 |
0 |
||
|
0,29 |
-0,01 |
0,09 |
0 |
0,04 |
0,02 |
0 |
0,11 |
0,13 |
0 |
0 |
0,23 |
0 |
0 |
0 |
||
|
0,08 |
-0,02 |
0,04 |
0,06 |
0,09 |
0,07 |
0 |
0,09 |
0,03 |
0,03 |
0,03 |
0 |
0,04 |
0,03 |
0 |
||
|
0,24 |
0,05 |
0 |
0,05 |
0,01 |
0,16 |
0 |
0,08 |
0 |
0,07 |
0,02 |
0,20 |
0,01 |
0,01 |
0 |
||
|
0,10 |
0,20 |
0,07 |
0 |
0 |
0,02 |
0 |
0 |
0 |
0,17 |
0 |
0 |
0,01 |
0,06 |
0 |
||
|
0,08 |
0,12 |
0,08 |
0,02 |
0 |
0 |
0 |
0 |
0,02 |
0,10 |
0,07 |
0 |
0,03 |
0 |
0 |
||
|
0,06 |
0,16 |
0 |
0 |
0 |
0,03 |
0 |
0 |
0,09 |
0,11 |
0,05 |
0 |
0,01 |
0 |
0,03 |
||
|
0,25 |
0,27 |
0,02 |
0 |
0 |
0,05 |
0,02 |
0 |
0,15 |
0,23 |
0 |
0,02 |
0,01 |
0,03 |
0 |
||
|
0,08 |
0,10 |
0,02 |
0 |
0 |
0 |
0 |
0 |
0 |
0,05 |
0 |
0 |
0,02 |
0,12 |
0,02 |
||
|
0,10 |
0,08 |
0 |
0 |
0,02 |
0 |
0 |
0,07 |
0 |
0,07 |
0 |
0 |
0,03 |
0 |
0 |
||
|
0,06 |
0,03 |
0,09 |
0 |
0,19 |
0,09 |
0,05 |
0,17 |
0,11 |
0,16 |
0,08 |
0,24 |
0 |
0 |
0,11 |
||
|
0,12 |
0,13 |
0 |
0,02 |
0,02 |
0 |
0 |
0 |
0,09 |
0,13 |
0 |
0,03 |
0 |
0 |
0 |
||
|
0,22 |
0,42 |
0 |
0 |
0 |
0,02 |
0 |
0 |
0,23 |
0,34 |
0 |
0 |
0 |
0 |
0 |
||
|
0,10 |
0,20 |
0,02 |
0,02 |
0 |
0 |
0 |
0 |
0,19 |
0,12 |
0 |
0 |
0,02 |
0 |
0 |
||
|
0,08 |
0,08 |
0,06 |
0 |
0,20 |
0,16 |
0 |
0,03 |
0,14 |
0,09 |
0,13 |
0,28 |
0,02 |
0,05 |
0,17 |
||
|
0,07 |
0,13 |
0 |
0 |
0 |
0 |
0 |
0 |
0,05 |
0,15 |
0,03 |
0,02 |
0 |
0 |
0,03 |
||
|
0,06 |
0,01 |
0,04 |
0,07 |
-0,01 |
0,04 |
0,01 |
0 |
-0,02 |
0,07 |
0,05 |
0,04 |
0 |
0,04 |
0 |
||
|
0 |
0,02 |
0,01 |
0,06 |
0 |
0,08 |
0,06 |
0 |
0,01 |
0 |
0,02 |
0,06 |
0 |
0 |
0 |
||
|
0,07 |
0,04 |
0,03 |
0,26 |
0 |
0,01 |
0,16 |
0,04 |
0,03 |
0,11 |
0,02 |
0,01 |
0,04 |
0 |
0 |
||
|
0,02 |
0,22 |
0,18 |
0,21 |
0,01 |
0,08 |
0,12 |
0,06 |
0,10 |
0,23 |
0,12 |
0,08 |
0 |
0,02 |
0,01 |
||
|
0,23 |
0,02 |
0,20 |
0,30 |
0,05 |
0,10 |
0,19 |
0,06 |
0,01 |
0,20 |
0,09 |
0,07 |
0 |
0,04 |
0 |
||
|
0,42 |
0,33 |
0,21 |
0,22 |
0,06 |
0,06 |
0,09 |
0,07 |
0,02 |
0,21 |
0,10 |
0,02 |
0 |
0,04 |
0,05 |
||
|
0,33 |
0,38 |
0,08 |
0,15 |
0,02 |
0,10 |
0,11 |
0,06 |
-0,03 |
0,14 |
0,07 |
0,18 |
0 |
0,31 |
0,14 |
||
|
0,45 |
0,46 |
0,13 |
0,17 |
0,06 |
0,07 |
0,16 |
0,06 |
0,28 |
0,34 |
0,27 |
0,18 |
0 |
0,13 |
0,01 |
||
|
0,23 |
0,34 |
0,12 |
0,25 |
0,06 |
0,15 |
0,46 |
0,02 |
0,41 |
0,38 |
0,15 |
0,16 |
0 |
0 |
0,15 |
||
|
0,39 |
0,30 |
0,14 |
0,54 |
0,07 |
0,06 |
0,15 |
0,17 |
0,28 |
0,19 |
0,21 |
0,14 |
0,03 |
0,15 |
0,07 |
||
|
0,20 |
0,33 |
0,37 |
0,75 |
0,14 |
0,13 |
0,44 |
0,38 |
0,40 |
0,56 |
0,04 |
0,36 |
0,10 |
0,01 |
0,25 |
||
|
0,25 |
0,36 |
0,10 |
0,53 |
0,14 |
0,28 |
0,45 |
0,52 |
0,26 |
0,31 |
0,18 |
0,42 |
0,13 |
0,34 |
0,18 |
||
|
0,48 |
0,21 |
0,21 |
0,52 |
0,28 |
0,48 |
0,49 |
0,41 |
0,27 |
0,28 |
0,12 |
0,39 |
0,08 |
0,13 |
0,23 |
||
|
0,27 |
0,30 |
0,42 |
0,32 |
0,27 |
0,52 |
0,48 |
0,43 |
0,21 |
0,32 |
0,14 |
0,38 |
0,13 |
0,29 |
0,35 |
||
|
0,48 |
0,35 |
0,25 |
0,42 |
0,20 |
0,44 |
0,39 |
0,43 |
0,37 |
0,24 |
0,17 |
0,56 |
0,09 |
0,29 |
0,31 |
||
|
0,16 |
0,27 |
0,34 |
0,47 |
0,33 |
0,42 |
0,43 |
0,47 |
0,11 |
0,05 |
0,22 |
0,05 |
0,07 |
0,05 |
0,03 |
||
|
0,33 |
0,53 |
0,21 |
0,29 |
0,16 |
0,47 |
0,25 |
0,35 |
0,43 |
0,15 |
0,24 |
0,25 |
0,20 |
0,17 |
0,23 |
||
|
0,28 |
0,39 |
0,22 |
0,15 |
0,14 |
0,33 |
0,25 |
0,25 |
0,05 |
0,12 |
0,30 |
0,41 |
0,41 |
0,13 |
0,03 |
||
|
0,40 |
0,36 |
0,43 |
0,58 |
0,19 |
0,16 |
0,44 |
0,12 |
0,22 |
0,03 |
0 |
0,17 |
0,25 |
0,04 |
0,23 |
||
|
0,38 |
0,36 |
0,41 |
0,47 |
0,08 |
0,20 |
0,37 |
0,44 |
0,11 |
0,05 |
0,25 |
0,17 |
0,36 |
0,14 |
0,22 |
||
|
0,71 |
0,58 |
0,48 |
0,03 |
0,30 |
0,54 |
0,41 |
0,22 |
0,09 |
0,40 |
0,08 |
0 |
0,39 |
0,13 |
0,34 |
||
|
0,42 |
0,40 |
0,02 |
0,02 |
0 |
0,37 |
0,42 |
0,27 |
0,28 |
0,29 |
0,16 |
0,23 |
0,38 |
0,03 |
0,11 |
||
|
0,54 |
0,44 |
0,27 |
0,23 |
0,30 |
0,34 |
0,09 |
0,16 |
0,21 |
0,25 |
0,17 |
0,23 |
0,33 |
0,07 |
0,03 |
||
|
0,32 |
0,21 |
0 |
0,32 |
0,28 |
0,30 |
0,15 |
0,41 |
0 |
0,07 |
0,15 |
0,30 |
0,25 |
0,07 |
0,14 |
Після проведення кластеризації було оцінено її якість. Існує багато метрик, які використовуються для оцінки якості кластеризації. Найпоширенішими метриками є [8]:
1. Adjusted Rand Index (ARI): Вимірює подібність між кластеризацією та істинними мітками класів, коригуванням випадковості.
2. Mutual Information (MI): Вимірює взаємну інформацію між кластерами та істинними мітками класів.
3. Fowlkes-Mallows Index (FMI): Вимірює схожість між кластеризацією та істинними мітками класів, зважаючи на точність та повноту.
4. Homogeneity, Completeness та V-measure: Три окремі метрики, які оцінюють якість кластеризації з різних аспектів.
5. Davies-Bouldin Index: Вимірює компактність та роздільність кластерів.
6. Dunn Index: Вимірює відстань між кластерами та розмірність внутрішнього кластера.
7. Silhouette Coefficient: індекс силуету, який вимірює компактність та роздільність кластерів.
8. Calinski-HarabaszIndex (Variance Ratio Criterion): Вимірює внутрішню збалансованість та зовнішню роздільність кластерів.
Проаналізувавши наявні метрики, можна зробити висновок, що кожна з них має свої переваги та обмеження, і їх використання може допомогти зрозуміти різні аспекти якості кластеризації. Для більш точної оцінки кластеризації рекомендується використовувати декілька метрик, щоб отримати комплексне розуміння результатів.
В нашому дослідженні обрано метрики за номерами 1,3 та 7, що уможливлює оцінювання якості проведеної кластеризації з різних сторін та забезпечення об'єктивності даного оцінювання
Після проведення кластеризації необхідно було обрати статистичний підхід для оцінювання статистичної значущості педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ з використанням кластерів. Розповсюдженими підходами є [1; 6]:
1. ANOVA (Analysis of Variance) на кластерах, який передбачає аналіз дисперсії до показників, що вивчаються, у кожному кластері окремо, що, своєю чергою, слугує виявленню статистично значущої різниці між кластерами.
2. t-тест, який застосовується для кожної пари кластерів щоб перевірити, чи є статистично значущі відмінності між середніми значеннями показників у цих кластерах.
3. Додаткові статистичні тести, які в залежності від характеру даних та дослідницьких питань, також можуть бути застосовані: аналіз кореляцій, Uкритерій Манна-Уітні, критерій Вілкоксона T, критерій знаків G і т.д.
4. Порівняння розподілів у кластерах передбачає застосування методів машинного навчання, зокрема GMM, що дозволяє отримати модель для кожного кластера, яка описує його розподіл. За допомогою порівняння цих розподілів можна оцінити статистичну значущість відмінностей між кластерами.
5. При використанні методів машинного навчання, можна також використовувати кросс-валідацію, щоб перевірити стабільність та точність отриманих результатів
Серед наведених варіантів ми обрли t-тест, як найбільш поширений метод перевірки гіпотез щодо статистичної значущості.
Таким чином, визначено методику проведення досліджень, що полягає у підготовці даних до кластеризації, вибору найкращого методу кластеризації за критерієм точності, оцінці якості кластеризації за допомогою критеріїв ARI, FMI та індексу силуету, із подальшою перевіркою гіпотези щодо статистичної значущості педагогічного експерименту за допомогою t-тесту.
Дослідження проводились за допомогою об'єктно-орієнтованої, високорівневої мови програмування Python та інтерактивного середовище Jupyter Notebook для запису, передачі й запуску коду, які були використані для кластеризації даних і оцінки точності з використанням методів кластеризації [2]. Опис процесу досліджень можна подати у наступних кроках:
1. Підготовка даних: Вихідний набір даних був завантажений з використанням бібліотеки Pandas у середовищі Jupyter Notebook. З нього були вилучені назви стовпців, так як вони не були необхідні для аналізу.
2. Вибір методу кластеризації: Відповідно даних таблиці 1 для кластеризації даних була обрано Gaussian Mixture Model (GMM). Даний метод дозволяє визначити оптимальну кількість кластерів для набору даних, але в нашому випадку було обрано фіксоване значення двох кластерів.
Таблиця 5.
Порівняння результатів використання різних методів кластеризації
|
№ з/п |
Назва методу |
Точність |
||
|
Абсолютна |
Відсоток |
|||
|
1. |
DBSCAN |
40 |
82 |
|
|
2. |
Agglomerative Clustering |
42 |
86 |
|
|
3. |
K-MEANS |
42 |
86 |
|
|
4. |
GMM |
46 |
94 |
1. Використання GMM: Метод GMM був використаний для кластеризації даних на два кластери. Застосування алгоритму GMM було здійснено за допомогою бібліотеки Scikit-learn [9].
2. Оцінка точності кластеризації: Для оцінки точності кластеризації були використані декілька метрик, що є стандартними для таких випадків. Були обрані наступні метрики:
Cepedniu індекс силуету: Використовується для вимірювання якості кластеризації на основі компактності та роздільності кластерів. Високий індекс силуету (наприклад, 0.63) вказує на добре визначені та компактні кластери.
Індекс силуету приймає значення в діапазоні від - 1 до 1. Значення індексу силуету близьке до 1 означає, що кластери добре розділені та компактні, тобто кожен зразок знаходиться ближче до свого власного кластера, ніж до будь-якого іншого кластера. Значення індексу силуету близьке до 0 вказує на те, що кластери можуть бути перекриваються, або їхні форми неоднорідні. Значення індексу силуету близьке до - 1 означає, що зразки були призначені неправильним кластерам.
Adjusted Rand Index (ARI): Вимірює подібність між результатами кластеризації та істинними мітками класів. Значення близько до 1 (наприклад, 0.77) вказує на добру згоду між кластеризацією та істинними мітками класів.
Fowlkes-Mallows Index (FMI): Вимірює схожість між результатами кластеризації та істинними мітками класів з урахуванням точності та повноти. Значення близько до 1 (наприклад, 0.88) свідчить про високу схожість між кластеризацією та істинними класами.
На основі результатів оцінки метрик точності кластеризації ми зробили висновок, що метод GMM дав добрі результати для даного набору даних, а саме, результатів оцінювання КГ та ЕГ на початку та наприкінці формувального етапу педагогічного експерименту щодо розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ розділяючи його на два чітких кластери. Значення метрик підтверджують, що кластери є добре визначеними та мають високу схожість з істинними мітками класів. Для більш детальної аналізу ми використали ґ-тест, щоб порівняти значення характеристик між кластерами. Значення p-value були дуже маленькими, що дозволило відхилити нульову гіпотезу і стверджувати, що різниця між кластерами є статистично значущою. Таким чином, описаний процес розрахунків за допомогою Python та Jupyter Notebook з використанням GMM та метрик оцінки точності кластеризації дозволяє зробити обґрунтований висновок про якість кластеризації даних у вибраному методі.
Оцінка результатів досліджень. Інтерпретація результатів метрик залежить від їх значень і контексту задачі. Нижче наведено загальні пояснення для кожної метрики:
1. Середній індекс силуету (Silhouette Score): Значення 0.6319 означає, що кластеризація має досить хорошу якість. Середній індекс силуету наближається до 1, що вказує на добру роздільність та компактність кластерів. Це досить високий показник, що свідчить про те, що кластери добре відокремлені та компактні.
2. Adjusted Rand Index (ARI): Значення 0.7653 означає, що кластеризація досить добре збігається з істинними мітками класів. ARI наближається до 1, коли кластеризація і істинні мітки класів повністю збігаються. Значення 0.7653 показує, що результати кластеризації мають високу подібність до правильного розподілу.
3. Fowlkes-Mallows Index (FMI): Значення 0.8815 означає, що кластеризація має високу схожість з істинним розподілом класів. Чим ближче FMI до 1, тим більше схожість між кластеризацією і правильним розподілом класів. Значення 0.8815 свідчить про добру схожість між результатами кластеризації та істинними класами.
Загалом, значення всіх трьох метрик (Silhouette Score, ARI та FMI) близькі до 1, що свідчить про високу якість кластеризації в цьому конкретному випадку.
В процесі оцінки статистичної значущості розподілу на кластери для обох параметрів кластеризації за допомогою t-тесту, були отримані наближені до нуля значення p-value. Значення p-value наближене до нуля вказує на ймовірність отримати спостережувану різницю (або ще більшу) між двома групами (кластерами), якщо нульова гіпотеза про рівність середніх значень обох груп є правдивою. У нашому випадку, дуже маленьке значення p-value свідчить про те, що ймовірність отримати таку велику різницю в середніх значеннях між кластерами за умови, що нульова гіпотеза є правдивою, дуже мала. Отже, ми можемо відхилити нульову гіпотезу і зробити висновок, що є статистично значуща різниця між кластерами для результатів педагогічного експерименту.
Висновки
Аналізуючи наявні статистичні методи машинного навчання, було обрано метод кластерного аналізу для опрацювання експериментальних даних педагогічного експерименту, що стосувався розвитку діагностичної компетентності викладачів іноземних мов у ВВНЗ. Для проведення кластерного аналізу використовувався метод Gaussian Mixture Model (GMM), який було визначено як найкращий за критерієм точності. У дослідженні використовувалися об'єктно-орієнтована, високорівнева мова програмування Python та інтерактивне середовище Jupyter Notebook для запису, передачі й запуску коду. Для проведення кластеризації був створений загальний набір даних, що включав результати оцінювання 25 викладачів іноземних мов з КГ та 24 з ЕГ на початку та наприкінці педагогічного експерименту. Кожен учасник експерименту мав певні показники, і було визначено відносний приріст кожного показника, а також сумарний відносний приріст. За допомогою цих даних також було знайдено значення відносного прогресу учасника, що представляє собою відношення сумарного відносного приросту до початкових результатів учасників експерименту. Для проведення кластерного аналізу було використано декілька методів, включаючи Agglomerative Clustering, DBSCAN, Gaussian Mixture Model та K-Means. З метою оцінки якості кластерного аналізу були використані метрики, такі як Adjusted Rand Index (ARI), Fowlkes-Mallows Index (FMI) і Silhouette Coefficient (індекс силуету). Для перевірки гіпотези щодо статистичної значущості педагогічного експерименту був використаний t-тест, який показав наближені до нуля значення p-value. Це свідчить про те, що ймовірність отримати таку велику різницю в середніх значеннях між кластерами за умови, що нульова гіпотеза є правдивою, є дуже мала, і, отже, різниця між кластерами є статистично значущою. Таким чином, статистичне опрацювання експериментальних даних підтвердило значущість результатів розвитку діагностичної компетентності викладачів іноземних мов ВВНЗ.
Література
1. Michel V, Gramfort A., Varoquaux G., Eger E., Keribin C., and Thirion B. A supervised clustering approach for fMRI-based inference of brain states. Patt Rec, page epub ahead of print. 2011. doi: 10.1016/j.patcog.2011.04.006.
2. Pedregosa F., Varoquaux G., Gramfort A., Michel, V. Thirion, B. Grisel, O. Blondel, M. Prettenhofer, P. Weiss, R. Dubourg, V. Vanderplas, J., Passos A., Cournapeau D., Brucher M., Perrot M. and. Duchesnay E. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011. 122825-2830.
3. Rao C., Govindaraju V. Handbook of Statistics: Machine Learning: Theory and Applications. 2013. 552 p.
4. Rokhlin V., Szlam A. and Tygert M. A randomized algorithm for principal component analysis. SIAM Journal on Matrix Analysis and Ap^pl^catio^s. 2009. 31(3):1100-1124.
5. Schaul T., Bayer J., Wierstra D., Sun Y., Felder M., Sehnke F., RuckstieB T. and Schmidhuber J. PyBrain. The Journal o;f Machine Learning Research. 2010.11:743-746.
6. Trevor H.Ј¬Robert T.Ј¬Jerome F. The Elements of Statistical Learning. Data Mining, Inference, and Prediction. 2009. New York: Springer. 745 p.
7. Грищук Ю. В. Критерії, показники, рівні розвиненості діагностичної компетентності викладачів іноземних мов ВВНЗ у системі післядипломної освіти. Актуальні питання гуманітарних наук. Дрогобицький державний педагогічний університет імені Івана Франка. 2023. Вип. 61 (1). https://doi.org/10.24919/2308-4863/61-1-42.
8. Кононова К. Ю. Машинне навчання: методи та моделі: підручник для бакалаврів, магістрів та докторів філософії спеціальності 051 «Економіка» / К. Ю. Кононова. Харків, 2020: ХНУ імені В. Н. Каразіна. 301 с
9. Кравченко С. М., Гришкун Є. О., Власенко О. В. Методи класифікації машинного навчання з використанням бібліотеки scikit-learn. Вчені записки ТНУ імені В.І. Вернадського. 2020. 31 (70) Ч. 1. № 3. https://doi.org/10.32838/TNU-2663-5941/2020.3-1/19.
10. Кузьменко, О. В., Миненко, С. В, Гриценко, К.Г., Яценко B. В. Застосування методів машинного навчання для статистичного аналізу та прогнозування кіберспортивної галузі. Measuring And Computing Devices In Technological Processes. 2021. (1), 126-132. https://doi.org/10.31891/2219-9365-2021-67-1-18.
11. Руденко В. М., Руденко Н. М. Математичні методи в психології: Підручник. Київ, 2009: «Академвидав». 384 c.
References
1. Michel V., Gramfort A., Varoquaux G., Eger E., Keribin C., and Thirion B. A supervised clustering approach for fMRI-based inference of brain states. PattRec, page epub ahead ofprint. 2011. doi: 10.1016/j.patcog.2011.04.006 [in English].
2. Pedregosa F., Varoquaux G., Gramfort A., Michel, V. Thirion, B. Grisel, O. Blondel, M. Prettenhofer, P. Weiss, R. Dubourg, V. Vanderplas, J., Passos A., Cournapeau D., Brucher M., Perrot M. and. Duchesnay E. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011. 122825-2830 [in English].
3. Rao C., Govindaraju V. Handbook of Statistics: Machine Learning: Theory and Applications. 2013. 552 p. [in English].
4. Rokhlin V., Szlam A. and Tygert M. A randomized algorithm for principal component analysis. SIAM Journal on Matrix Analysis and Applications. 2009. 31(3): 1100-1124. [in English].
5. Schaul T., Bayer J., Wierstra D., Sun Y., Felder M., Sehnke F., RuckstieB T. and Schmidhuber J. PyBrain. T^e Journal of Machine Learning Research. 2010.11:743-746. [in English].
6. Trevor H., Robert T., Jerome F. The Elements of Statistical Learning. Data Mining, Inference, and Prediction. 2009. New York: Springer. 745 p. [in English].
7. Hryshchuk Yu. V. Kryterii, pokaznyky, rivni rozvynenosti diahnostychnoi kompetentnosti vykladachiv inozemnykh mov VVNZ u systemi pisliadyplomnoi osvity [Criteria, indicators, levels of development of diagnostic competence of teachers of foreign languages in the post-graduate education system]. Aktualni pytannia humanitarnykh nauk. Drohobytskyi derzhavnyi pedahohichnyi universytet imeni Ivana Fira^ka. 2023. Vyp. 61 (1). https://doi.org/ 10.24919/2308-4863/61-1-42. [in Ukrainian].
8. Kononova K. Yu. Mashynne navchannia: metody ta modeli: pidruchnyk dlia bakalavriv, mahistriv ta doktoriv filosofii spetsialnosti 051 «Ekonomika» / K. Yu. Kononova. [Machine Learning: Methods and Models: A Textbook for Bachelor's, Master's, and Doctoral Students in the Field of Economics (Specialization 051) »/ K. Yu. Kononova] Kharkiv, 2020: KhNU imeni V. N. Karazina. 301 p. [in Ukrainian].
9. Kravchenko S. M., Hryshkun Ye. O., Vlasenko O. V. Metody klasyfikatsii mashynnoho navchannia z vykorystanniam biblioteky scikit-learn [Machine Learning Classification Methods Using the scikit-learn Library]. Vcheni zapysky TNUi^e^i V.I. Ve^^nadskoho. 2020. 31 (70) Ch. 1. № 3. https://doi.org/10.32838/TNU-2663-5941/2020.3-1/19. [in Ukrainian].
10. Kuzmenko, O. V., Mynenko, S. V, Hrytsenko, K.H., Yatsenko B. V. Zastosuvannia metodiv mashynnoho navchannia dlia statystychnoho analizu ta prohnozuvannia kibersportyvnoi haluzi [Application of Machine Learning Methods for Statistical Analysis and Forecasting in the Esports Industry]. Measuring And Computing De^vices In Technological Processes. 2021. (1), 126-132. https://doi.org/10.31891/2219-9365-2021-67-1-18. [in Ukrainian].
11. Rudenko V. M., Rudenko N. M. Matematychni metody v psykholohii: Pidruchnyk Mathematical Methods in Psychology: A Textbook Kyiv, 2009: «Akademvydav». [Matematychni metody v psykholohii: Pidruchnyk]. 384 c. [in Ukrainian].
Размещено на Allbest.ru
Подобные документы
Мета формувального етапу педагогічного експерименту щодо визначення сформованості фахової комунікативної компетентності у майбутніх провізорів під час вивчення дисциплін гуманітарного циклу. Критерії, рівні та показники сформованості компетентності.
статья [591,7 K], добавлен 19.09.2017Сутність педагогічного експерименту як методу емпіричного пізнання. Послідовність пізнавальних дій при організації і проведенні експериментальної роботи. Методичний інструментарій дослідження та шкала розрахунку рівня мовленнєвої компетентності студентів.
статья [97,1 K], добавлен 24.11.2017Аналіз різних методів навчання. Методи активізацйії навчально-пізнавальної діяльності. Загальні питання організації та проведення експерименту, аналіз результатів. Хід практичного заняття "Загальна характеристика країн: Україна, Великобританія, США".
дипломная работа [69,9 K], добавлен 15.01.2011Мета та завдання формувального етапу педагогічного експерименту щодо визначення сформованості фахової комунікативної компетентності (ФКК) у майбутніх провізорів під час вивчення дисциплін гуманітарного циклу. Критерії, рівні і показники сформованості ФКК.
статья [506,9 K], добавлен 21.09.2017Основні структурні компоненти мовленнєвого розвитку дошкільнят, поняття мовленнєвої компетентності та її складових. Аналіз результатів експериментальної роботи, що спрямована на перевірку ефективності розвитку мовленнєвої компетентності дошкільників.
курсовая работа [75,4 K], добавлен 06.10.2016- Виховання естетичного смаку в студентів вищих навчальних закладів МВС України засобами іноземних мов
Методики виховання естетичного смаку засобами іноземних мов з використанням оригінальних літературних текстів. Педагогічні умови виховання естетичного смаку у студентів вищих навчальних закладів МВС України. Інтеграції в навчально-виховний процес.
автореферат [47,8 K], добавлен 27.04.2009 Розкриття ключових компонентів полікультурної компетентності педагога. Опис шляхів та засобів її формування у вчителя іноземних мов. Багатоаспектність підходів науковців до висвітлення проблеми підготовки вчителів іноземних мов до професійної діяльності.
статья [20,9 K], добавлен 27.08.2017Проблема професійної компетентності вчителя в психолого-педагогічній літературі. Компонентно-структурний аналіз професійної компетентності вчителя іноземних мов та модель процесу формування. Методики діагностики сформованості професійної компетентності.
учебное пособие [200,3 K], добавлен 03.01.2009Особливості впливу активних методів навчання на формування позитивної мотивації студентів вищих навчальних закладів. Характеристика місця і сутності змагальних методів навчання у системі активних методів навчання при вивченні курсу "Політична економія".
курсовая работа [42,1 K], добавлен 30.01.2010Формування мовленнєвої компетентності дошкільника, розвиток дитини в контексті нової редакції Базового Компонента. Вимірювання показників сформованості мовленнєвої компетентності у дітей старшого дошкільного віку на констатувальному етапі експерименту.
курсовая работа [61,4 K], добавлен 09.10.2014
