Модель експертної системи для медичного скринінгу на основі методів кластерного аналізу
Застосування алгоритмів та методів для медичного скринінгу з метою виявлення факторів ризику, генетичних схильностей і ранніх проявів захворювання. Функціональні можливості сучасних медичних інформаційних систем. Вимоги до експертних систем у медицині.
Рубрика | Медицина |
Вид | статья |
Язык | украинский |
Дата добавления | 07.06.2024 |
Размер файла | 691,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Київський університет імені Бориса Грінченка
Державний університет телекомунікацій
МОДЕЛЬ ЕКСПЕРТНОЇ СИСТЕМИ ДЛЯ МЕДИЧНОГО СКРИНІНГУ НА ОСНОВІ МЕТОДІВ КЛАСТЕРНОГО АНАЛІЗУ
Шевченко С.М.,, Жданова Ю.Д.,
Негоденко О.В., Куцук В.А.
Вступ
Штучний інтелект стрімко входить у всі сфери та галузі нашого буття. Обробка великої бази даних, оптимізація процесів, покращення і швидкодія послуг, навчання та прийняття рішення - ці та багато інших функцій та можливостей належить машинному навчанню. Такий стан розвитку інформаційних технологій дозволяє застосувати алгоритми та методи, які притаманні людському розуму, у медичній сфері, зокрема для медичного скринінгу, з метою виявлення факторів ризику, генетичних схильностей і ранніх проявів захворювання. Актуальність даного дослідження також підтверджується зростанням кількості різних захворювань, що вимагає постійного оновлення лікарської інформації та її опанування. Тому ефективним рішенням для реалізації задач автоматизації в медицині на допомогу медичним працівникам є створення та впровадження експертних систем - інтелектуальних комп'ютерних програм, які можуть консультувати, проводити аналіз, ставити діагноз на рівні фахівців-експертів у деякій вузькій предметній області. Дане дослідження присвячене аналізу експертних систем, їх класифікацій та структури, зокрема у медичній сфері. Зроблена спроба змоделювати систему на основі кластерного аналізу.
Виклад основного матеріалу
Штучний інтелект у медицині
Штучний інтелект науковцями описується як наука та інженерія створення розумних машин. Його впровадження у медичну галузь має широкі діапазони: починаючи від організації і управління лікарською установою та закінчуючи медичною робототехнікою у хірургії. Аналіз наукової літератури дозволив встановити, що теоретичні дослідники і практики у даній сфері шукають різні підходи для підвищення медичного обслуговування пацієнтів. Так, наукове дослідження [1] присвячено проблемі діагностики раку молочної залози на основі трьох прогностичних моделей: регуляризована загальна лінійна модель, опорні векторні машини (SVM) і штучна нейронна мережа.
Розробки науковців [2] висвітлюють питання можливості машинного навчання спостерігати за здоров'ям людини. У статті [3] досліджено питання впровадження факторного аналізу у медичну галузь та створення відповідних класів захворювань та їх взаємозв'язків. Наукові наробки [4, 5, 6] присвячені аналізу штучних нейронних мереж, обґрунтовується їх здатність класифікувати та інтерпретувати різноманітні форми медичних даних, що допомагає у прийнятті клінічних рішень як у діагностиці, так і в лікуванні.
Слід також підкреслити, що на сучасному етапі існує достатня кількість компаній, які використовують штучний інтелект у медицині. Серед них:
1. Doc.ua (Україна) - розробляє штучний інтелект на базі медичного помічника, який допомагає визначити хворобу, запропонувавши відповідні дослідження.
2. Fitbit (США), Apple (США), Samsung (Корея), Xiaomi (Китай) досліджують штучний інтелект для уникнення помилок при діагностуванні хвороби та хронічних захворювань.
3. Bayer (Німеччина) та Exscientia (Шотландія) анонсували майбутню розробку пошуку ліків для онкології та серцево-судинних захворювань за допомогою штучного інтелекту.
4. Intel Corporation (США) та Elite Care (США) проектують систему штучного інтелекту, яка піклується про стан пацієнтів із хворобою Альцгеймера.
5. IBM (США), Johnson & Johnson (США), Sanofi (Франція) оголосили про співпрацю у клінічних випробуваннях ліків з впровадженням штучного інтелекту.
6. Medtronic (США) - додаток, що передбачає критичне зниження цукру за три години до події.
7. IBM (США) та Pathway Genomics (Бразилія) - перша частина програми допомагає користувачам індивідуальні поради для якості життя, тобто, вправи, дієти, спорт; друга частина базується на інформації електронних медичних карток, страховок.
Згідно дослідження міжнародного аналітичного агентства Global Market Insights, по 2024 р. очікується щорічне зростання використання штучного інтелекту у сфері охорони здоров'я аж 40%. За прогнозами консалтингової компанії Precedence Research, розмір світового ринку штучного інтелекту в ультразвуковій візуалізації оцінювався в 863,59 мільйонів доларів США в 2022 році та, за прогнозами, сягне приблизно 1691,2 мільйонів доларів США до 2030 року, зростаючи на 8,76% протягом прогнозованого періоду з 2022 по 2030 рік [7].
Підсумовуючи викладене, можемо визначити, що функціональна можливість сучасних медичних інформаційних систем дозволяє [8]:
- упорядковувати інформацію (медичні картки, кадрова політика, управління медперсоналом, звіти, матеріальне забезпечення та інше);
- обробляти інформацію на етапі діагностики і у лабораторних дослідженнях (є очевидним, що остаточне рішення приймає лікар);
- об'єктивно трактувати результати дослідження;
- накопичувати базу відомостей про хвору людину для подальшого аналізу матеріалу та призначення лікування;
- накопичувати базу знань медичних експертів для створення інформаційної системи.
На практиці такі системи називаються експертними. Ця назва пояснюється історичним розвитком цього напряму. У період 60-70 років фахівці інформаційних технологій визначилися з розробкою спеціалізованих програмних систем, кожна з яких володіла базою знань і могла ефективно розв'язувати відповідні задачі, тобто були «експертом» у деякій предметній області. Дослідники починають будувати програму, яка використовує правила коду для представлення знань для вирішення проблеми введення [9].
Експертні системи: суть, класифікація, структура
Сутність експертної системи (від лат. Expertus -- досвідчений) важко пояснити одним визначенням, оскільки точного єдиного у наукових колах не існує. Тому розглянемо різні підходи до визначення дефініції «експертні системи» в залежності, де і в якій галузі досліджується (таблиця 1).
Таблиця 1
Підходи до визначення поняття «експертна система»
Фахівці, галузь |
Визначення |
|
Інженерія знань |
1. Інтелектуальна система, орієнтована на тиражування досвіду висококваліфікованих спеціалістів в областях, де якість прийняття рішень традиційно залежить від рівня експертизи. 2. Система обробки даних і знань, яка забезпечує експертне рішення проблем в заданій області. 3. Інтелектуальна система, призначена для надання консультативної допомоги спеціалістам, які працюють в деякій предметній області [10]. |
|
Програмування |
Комплекс комп'ютерного програмного забезпечення, що допомагає людині приймати обґрунтовані рішення. Використовує інформацію, отриману заздалегідь від експертів - людей, які в якій-небудь області є найкращими фахівцями. Зберігає знання про певну предметну область. Має комплекс логічних засобів для виведення нових знань, виявлення закономірностей, виявлення протиріч і ін. [11]. |
|
Розробник медичної експертної системи MYCIN Е. Фейгенбаум |
Інтелектуальна комп'ютерна програма, у якій використовуються знання і процедури логічного виводу для вирішення завдань, досить важких для того, щоб вимагати для свого вирішення значного обсягу експертних знань людини [12]. |
|
Фармацевтика |
Пакет прикладних програм довідкового характеру, що дозволяє користувачу приймати кваліфіковане рішення в процесі його основної діяльності. В основі створення експертної системи лежить емпіричний принцип розв'язання задач шляхом розслідування [13]. |
|
Економіка |
Інтелектуальна комп'ютерна програма, здатна робити логічні висновки на основі знань у конкретній проблемній галузі і забезпечувати вирішення специфічних завдань (консультування, навчання, діагностика, тестування, проектування тощо) без присутності експерта (спеціаліста в конкретній галузі) [14]. |
На сучасному етапі існують аргументи для того, щоб називати будь-яку систему підтримки прийняття рішень експертною системою, якщо вона призначена для надання проблем експертного рівня специфічні поради, навіть якщо методи програмування та аналізу, що лежать в основі, відрізняються від методів, заснованих на знаннях, розроблених дослідниками штучного інтелекту [15].
Дана трактовка підтверджується у роботі [10]. На думку авторів розрізняють два типи експертних систем. Системи першого типу призначені для спеціалістів, чий професійний рівень не дуже високий. В базах знань таких систем зберігаються знання, отримані від висококваліфікованих спеціалістів. Системи другого типу покликані допомогти спеціалістам високої кваліфікації, виконуючи для них значну частину рутинних операцій і перегляд великих масивів інформації. Особливістю експертних систем є наявність в них системи пояснень, яка підвищує їх консультативну силу.
Дані підходи щодо поняття «експертна система» не суперечать один одному, бо розглядаються в тісному зв'язку і доповнюють суттєві якості цього поняття. Фахівці у роботі [16] пропонують вкладати у процесі визначення експертної системи саме її предметну область.
Рис. 1 Класифікація експертних систем на основі предметної області
У дослідженні [9] класифікація експертної системи здійснена відповідно до принципу роботи: експертна система на основі правил; експертна система на основі фреймів; експертна система на основі нечіткої логіки; експертна система на основі нейронної мережі.
Базова структура експертної системи складається з наступних частин: база знань, робоча пам'ять, логічна машина, інтерпретатор та інтерфейс взаємодії людина-комп'ютер [9, 16, 17]. База знань використовується для зберігання досвіду експертної системи, включаючи факти та правила. У процесі побудови бази знань, база знань повинна мати можливість отримувати нові знання, виражаючи та зберігаючи знання у спосіб, який може зробити комп'ютер. Робоча пам'ять відповідає за збереження введеного факту. Машина міркування зіставляє факти в робочій пам'яті зі знаннями та отримує нову інформацію. Проміжна інформація, отримана під час обробки, також повинна зберігатися в накопичувачі. Інтерпретатор відповідає за інтерпретацію результатів виводу механізму логічного висновку, включаючи пояснення правильності та причини висновку. На сьогодні існує достатня кількість розробок експертних систем, удосконалюючи процес для ефективного рішення у медичній галузі (рис. 2, рис. 3)
Рис. 2 Базова структура експертної системи
Рис. 3 Удосконалена структура експертної системи
експертний система медицина скринінг
На основі огляду наукової літератури були виділені основні вимоги до експертної системи у медицині:
1. Копіювати поведінку лікаря для пошуку клінічного діагнозу.
2. Швидко та структуровано адаптуватись до переіначення старих чи нових висновків для медичних знань.
3. Представляти розв'язки у такому вигляді, щоб вони були зрозумілі лікарю та пацієнту.
Розробка експертної системи є нелегкою працею. Для цього потрібно мати великі людські і матеріальні ресурси, що під силу великим компаніям. Впровадження готових експертних систем теж вимагає, по-перше, інженерів, які будуть підтримувати роботу експертних систем, по-друге, навчених медичних працівників, які б могли застосовувати їх у своїй діяльності.
У зв'язку з цим, ми здійснили спробу використати методи кластерного аналізу для медичного скринінгу. Обґрунтовується це тим, що кластерний аналіз не вимагає окремого програмного забезпечення, його можна здійснити за допомогою пакету Statistica, а також його досить простим виконанням. Все це дозволить діагностувати початок хвороби у пацієнта.
Кластерний аналіз
Кластерний аналіз є видом статистичного групування для того, щоб зробити дані у кожному кластері максимально схожими один на одного та різними по відношенню до інших кластерів. Цей метод дає можливість відносити об'єкти до однієї групи не за одним показником, а за декількома водночас. Також допомагає віднайти структуру даних, що неможливо зробити з боку експерта чи зовнішньому аналізі [18, 19].
Нехай множина А= {а 1,а. а] - множина об'єктів, В - множина номерів кластерів. Вибирається метрика (найчастіше формула відстані) d-i\x-k,Xi^. Необхідно розбити множину А на підмножини (кластери), які не перетинаються, і кожен кластер містив об'єкти близькі за метрикою ds), а об'єкти різних класів істотно відрізнялися. Кожному об'єкту Пприписується номер кластера В;-.
Множина А може складатися із об'єктів, які мають різні одиниці вимірювання або різний діапазон представлених значень, тому потрібно здійснити нормування вхідних даних.
При кластерному аналізі є два основні способи нормалізації даних: MinMax-нормалізація та Z-нормалізація.
Важливим етапом кластерного аналізу є обчислення міри подібності між об'єктами, оскільки у ході здійснення кластеризації у кожен кластер повинні потрапити об'єкти з подібними характеристиками. У кластерному аналізі можуть використовуватися міри подібності: коефіцієнти кореляції, міри відстані, коефіцієнти асоціативності, ймовірнісні коефіцієнти подібності.
У нашому дослідження ми застосуємо міри відстані, які представлені у таблиці 2
Таблиця 2
Відстані
Отже, основними кроками кластерного аналізу є наступні 5 кроків.
Крок 0. Відбір емпіричної інформації (об'єктів) для кластеризації.
Крок 1. Визначення множини змінних-ознак, які описують дані об'єкти і за якими будуть оцінюватися ці об'єкти.
Крок 2. Вибір міри подібності між об'єктами відповідно до обраної метрики (відстані) і обчислення цієї відстані.
Крок 3. Вибір алгоритму кластерного аналізу і його застосування для групування об'єктів у кластери.
Крок 4. Перевірка достовірності результатів кластерного аналізу.
Наше дослідження ґрунтується на застосуванні алгоритму найближчого сусіда. Метод найближчого сусіда має наступний алгоритм:
1. Відбір даних.
2. Нормування даних.
3. Побудова матриці відстаней.
4. Вибір початкової пари, найближчої одна до одної, їх об'єднання в один кластер і побудова нової матриці відстаней.
5. Повторюємо дану операцію до тих пір, поки не будуть задіяні всі об'єкти. При цьому кожний вибір залишених елементів має здійснюватися за принципом найменшої відстані.
6. Побудова дендрограми (рис. 4).
Рис. 4 Горизонтальна дендрограма
У дослідженні ми зосередились на евклідовій відстані.
Узагальнюючи всю інформацію щодо методу найближчого сусіда, можна виділити наступні переваги та недоліки.
Таблиця 3
Переваги і недоліки методу найближчого сусіда
Переваги |
Недоліки |
|
Алгоритм простий та легко реалізується |
Алгоритм працює значно повільніше зі збільшенням обсягу вибірки, предикторов чи незалежних змінних |
|
Не чутливий до викидів. |
З аргументу вище випливають громіздкі обчислювальні дії під час виконання |
|
Немає необхідності будувати модель, налаштовувати кілька параметрів або робити додаткові припущення |
Даний метод не створює жодних моделей або правил, які узагальнюють попередній досвід |
|
Алгоритм універсальний. Його можна використовувати для обох типів завдань: класифікації та регресії |
У процесі розв'язання задачі за допомогою кластерного аналізу потрібно пам'ятати декілька правил:
1) не існує однозначно найкращого алгоритму кластерного аналізу;
2) різні алгоритми можуть давати відповіді, які істотно відрізняються одна від одної;
3) застосування різних метрик (відстаней) впливає на результат - при використанні одного алгоритму, але з різними метриками, можуть бути різні відповіді;
4) кількість кластерів заздалегідь не відома, тому вибір є суб'єктивним і визначається експертом;
5) провести алгоритм кластеризації можливо завжди, але змістовний результат можна не отримати.
Результати дослідження
У нашому дослідженні пропонуємо застосувати метод ближнього сусіда для визначення кластерів у медичному скринінгу раку шийки матки. Кожні дві хвилини у світі від раку шийки матки помирає одна жінка. В Україні рівень захворюваності на цей вид раку є одним із найвищих серед європейських країн. Проте, виявлення хвороби на ранній стадії становить виліковність 95-100 %.
Приклад тестових даних представлено на рис. 5
Рис. 5 Приклад тестових даних для експертної системи медичного скринінгу
Тестові дані включають багато індивідуальних характеристик, які вказують на можливість захворювання раку шийки матки (рис. 6).
Рис. 6 Приклад класифікації даних
Результати представлено у вигляді дендрограми на рис. 7.
Рис. 7 Дендрограма для кластерного аналізу
Отримаємо чотири кластери (провели горизонтальну пряму для розбиття на кластери у межах від 20 до 40). Надалі - консультація лікаря.
Також кожна жінка може для себе провести таке дослідження, відповівши на питання, які задають лікарі, коли проводять первинний огляд, визначивши, наприклад, рівні відповідей від 1 до 5. Наступне наше дослідження буде напрямлене на визначення цих питань за допомогою експертів.
Висновки
У зв'язку із розвитком інформаційних технологій дослідження у сфері штучного інтелекту завжди будуть актуальними та важливими. Сучасний інструментарій дозволяє обробляти медичні дані та надавати медичним працівникам важливу інформацію, покращуючи результати здоров'я пацієнтів. Представлена модель для медичного скринінгу на основі кластерного аналізу є одним із варіантів, які дозволяють за допомогою готових математичних пакетів отримувати найперші результати діагностики. Очевидно, що наше дослідження є пробним і потребує подальшої обробки та вдосконалення.
Список використаних джерел
1. Sidey-Gibbons J., Sidey-Gibbons C. Machine learning in medicine: a practical introduction. // BMC Med Res Methodol 2019, 19, 64. URL: https://bmcmedresmethodol.biomedcentral.com/articles/ 10.1186/s12874-019-0681-4#citeas
2. May M. Eight ways machine learning is assisting medicine. // Nat Med, 2021, 27, 2-3. URL: https://www.nature.com/ articles/s41591 -020-01197-2
3. Skerman HM, Yates PM, Battistutta D. Multivariate methods to identify cancer-related symptom clusters. // Res Nurs Health. 2009, Jun; 32(3). P. 345-360. URL: https://pubmed.ncbi.nlm.nih.gov/19274688/
4. Khan ZH, Mohapatra SK, Khodiar PK, Ragu Kumar SN. Artificial neural network and medicine. // Indian Journal of Physiology and Pharmacology, 1998, 42(3), Р. 321-342. URL: https://europepmc.org/article/med/9741647
5. Sarvamangala, D.R., Kulkarni, R.V. Convolutional neural networks in medical image understanding: a survey. // Evol. Intel. 2022. 15. Р. 1-22. URL: https://link.springer.com/article/10.1007/ S12065-020-00540-3
6. Lisboa P.J.G. A review of evidence of health benefit from artificial neural networks in medical intervention. // Neural Networks, 2002. Vol. 15, No 1,, P. 11-39. URL: https://www.sciencedirect.com/ science/article/abs/pii/S0893608001001113
7. https://www.precedenceresearch.com/
8. Експертні системи в медицині: Навчальний посібник / Продеус А.М., Синєкоп Ю.С., Швець Є.Я., Кісельов Є.М., Баран М.М. Запоріжжя, Видавництво ЗДІА, 2014. 332 с.
9. Haocheng Tan. A brief history and technical review of the expert system research // IOP Conf. Ser.: Mater. Sci. Eng. 2017. Vol. 242 012111. URL: https://iopscience.iop.org/article/10.1088/1757-899X/242/1/012111
10. Палагін О.В., Петренко М.Г. Тлумачний онтографічний словник з інженерії знань. Київ: ТОВ «НВП Інтерсервіс», 2017. 478 с.
11. Шевчук І.Б. Тлумачний словник основних понять і термінів програмування / І. Б. Шевчук. - ЛДФА, Львів: Видавництво ВТЗНВ, 2013. 45 с. URL: https://financial.lnu.edu.ua/ wp-ntent/uploads/2015
12. Jarratano D., Riley G. Expert systems. Principles of programming development, Ed. Williams. 2006. P. 2104.
13. Жук В.А. Експертна система. Фармацевтична енциклопедія. URL: https://www.pharmencyclopedia.com.ua/ article/2318/ekspertna-sistema
14. Експертна система. Економічна енциклопедія URL: http://slovopedia.org.ua/38/53397/379216.html
15. Shortliffe E.H. Medical expert systems-knowledge tools for physicians. // West J Med. 1986.145(6):830-839. URL: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1307157/
16. Експертні системи в медицині: Навчальний посібник/ Продеус А.М., Синєкоп Ю.С., Швець Є.Я., Кісельов Є.М., Баран М.М. Запоріжжя: Видавництво ЗДІА, 2014. 332 с.
17. Вступ до експертних систем: Навч. посіб. / Кравець В.О., Хавіна І.П. та ін. Харків: НТУ “ХПІ”, 2006. 232 с.
18. Jain A. K., Dubes R. C. (1988). Algorithms for Clustering Data. Upper Saddle River, NJ: Prentice-Hall, Inc. URL: http://dl.acm.org/citation.cfm?id=SERIES10022.42779
19. Jain А.К, Murty M.N., Flynn P.J. Data Clustering: A Review. // ACM Computing Surveys, 1999. Vol. 31, No. 3. Р. 264-323. URL: http://www.eecs.northwestern.edu/~yingliu/datamining_ papers/survey.pdf
Размещено на Allbest.ru
Подобные документы
Розробка та впровадження в експертну практику уніфікованого алгоритму проведення судово-медичної експертизи речових доказів у вигляді плям сечі за допомогою молекулярно-генетичних методів з метою ідентифікації особи. Використання методів ДНК-аналізу.
статья [29,7 K], добавлен 11.09.2017Експертні системи стеження за післяопераційними хворими, аналізу причин гіпертонії, визначення терміну нанесення ушкоджень, іридодіагностики. Клієнт-серверна експертна система для телемедицини, клінічної епілептології, розпізнавання образів у медицині.
курсовая работа [2,6 M], добавлен 20.06.2010Здатність окремих органів тіла відновлюватися при різних травмах, пораненнях. Полімери медичного призначення. Класифікація і вимоги до медичних полімерів та сфери їх використання. Механізми використання медичних матеріалів в біологічних системах.
курсовая работа [79,2 K], добавлен 24.06.2008Фізіотерапія як наука про лікувальне використання самої природи. Метод використання фізичних факторів з метою підвищення імунобіологічних властивостей (фізіопрофілактика). Види фізіотерапевтичних методів, правила застосування та лікувальний ефект.
реферат [22,6 K], добавлен 12.09.2009Вивчення основних розділів внутрішніх захворювань. Характеристика етапів медсестринського процесу в терапії. Сестринське обстеження пацієнта. Пальпація як метод медичного обстеження хворого. Перкусія та аускультація. Опис лабораторних методів дослідження.
презентация [4,3 M], добавлен 15.06.2015Комбіноване лікування хворих з гліомами лобово-кальозної локалізації шляхом застосування сучасних методів діагностики та диференційованого використання хірургічних та нехірургічних методів лікування на основі даних клініко-статистичного прогнозування.
автореферат [96,3 K], добавлен 21.03.2009Аналіз застосування методів логістики в організації забезпечення військовослужбовців в Україні, обґрунтування методичних підходів. Розробка медичних підходів до проектування розподільної підсистеми системи медикаментозного забезпечення військових.
автореферат [34,1 K], добавлен 04.04.2009Розвиток дисрегенерації кісткової тканини після діафізарних переломів довгих кісток. Застосування методів непараметричної статистики для обробки результатів проведеного аналізу. Аналіз результатів лікування з використанням бальної системи оцінки Маттіса.
автореферат [87,2 K], добавлен 26.01.2009Туберкульоз як інфекційна і соціальна проблема. Чинники поширення інфекції та інфікованість мікобактеріями туберкульозу. Особливості групи ризику та методи профілактики захворювання. Перебіг туберкульозу на ранніх стадіях, клінічні прояви захворювання.
реферат [30,6 K], добавлен 05.04.2014Аналіз критеріїв ефективності використання фізіотерапевтичних методів лікування у стоматологічній практиці, їх систематизація та оцінка можливості уніфікації підходу їх застосування у різних клінічних ситуаціях. Реабілітація стоматологічних пацієнтів.
статья [25,9 K], добавлен 22.02.2018