Статистичне оброблення медичної інформації
Використання прикладних програм Microsoft Office та медичних документів. Етапи розв'язання статистичної задачі та елементарні статистичні характеристики. Виконання розрахунків та аналіз статистичних даних за допомогою діаграм і графіків в ЕТ Excel.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | лекция |
Язык | украинский |
Дата добавления | 04.11.2016 |
Размер файла | 36,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Фондова лекція з предмету
«Основи медичної інформатики»
Тема: «Статистичне оброблення медичної інформації»
Спеціальність: Лікувальна справа
Викладач: Плоткіна Л.П.
Житомир 2013
Вступ
статистичний програма excel програма
Мета: Ознайомити студентів з прикладними програмами Microsoft Office, з медичними документами, їх створенням та засобами редагування.
Матеріальне забезпечення: дошка, мультимедійна система, презентація лекції.
Студент повинен ознайомитись:
§ З призначенням і функціями електронної таблиці (ЕТ).
§ Введенням, редагуванням, зберіганням даних.
§ Виконанням розрахунків засобами ЕТ Excel.
§ Аналізом статистичних даних за допомогою діаграм і графіків в ЕТ Excel.
План заняття:
Етапи розв'язання статистичної задачі
Елементарні статистичні характеристики
Методи аналізу даних
Визначення Mіcrosoft Excel
Функціональні можливості.
Структура ЕТ.
Вивчення нового матеріалу
Етапи розв'язання статистичної задачі
Імовірнісно-статистичні методи в експериментальних дослідженнях, тобто дослідницькій роботі лікарів займають окреме місце. Згідно з даними світової медстатистики щороку публікуються результати понад 30 тис. клінічних випробувань, які надалі докорінно змінюють ставлення лікарів до вже добре відомих лікувальних заходів. З кожним роком обсяг надійно перевіреної інформації стрімко збільшується. При проведенні медичними працівниками наукового експерименту (наприклад, у галузі доказової медицини) і обробки початкових даних використовують імовірнісно-статистичні методи зі спеціальними технологіями проведення досліджень, складним аналізом медичних даних та інтерпретацією результатів. Раніше імовірнісно-статистичні методи нерідко відлякували дослідників своїми складними підрахунками вручну, у яких використовувалися громіздкі формули. Саме ці фактори робили аналіз даних нелегким та малодоступним процесом. Сьогодні комп'ютерні технології із сучасними статистичними пакетами надали можливість проводити багато дослідницьких робіт. Якщо лікарі повинні правильно вибирати потрібний метод аналізу даних, добре при цьому уявляючи, для чого і як вони використовуються, а також володіти їх комп'ютерною обробкою, то середньому медичному працівнику достатньо мати загальні поняття про ці методи та уміти працювати з пакетом для обробки даних.
Будь-яка імовірнісно-статистична задача включає п'ять самостійних, проте взаємопов'язаних етапів:
-- постановка задачі, її мета, розробка плану дослідження (робота лікаря);
-- збирання матеріалу: вибір облікового документа з переліком питань, на які потрібно отримати відповіді. Це може бути як спеціально складений дослідником опитувальний лист, анкета, карта, так і офіційний обліковий документ-талон амбулаторного пацієнта, лікарське свідоцтво про смерть тощо (робота лікаря та середнього медпрацівника);
-- вибір методу вирішення та первинна статистична обробка даних. Цей пункт включає обчислення показників (абсолютних, відносних та середніх величин), їх порівняння (робота лікаря та середнього медпрацівника);
-- аналіз даних;
-- інтерпретація результатів (робота лікаря).
Вимога правильно застосовувати методи при обробці наукового матеріалу визначається особливостями медицини -- предметної сфери з нечіткою системологією. Наприклад, відомо, що коронарна хвороба переважно уражує осіб віком 40 років, майже завжди проявляється больовим синдромом, змінами на ЕКГ -- досить часто, шумами в серці -- дуже рідко. Тобто дані «переважно, майже завжди, досить часто, дуже рідко» позбавлені конкретики, вони не математичні. У медицині такі описи мають імовірнісний характер. Статистика вимагає чіткого кількісного вираження випадків при дослідженні якого-небудь параметра. По суті, лікар постійно має справу з імовірнісним матеріалом. Методи теорії імовірності дають можливість проводити розрахунки, що дають змогу робити практичні висновки щодо випадкових явищ.
Елементарні статистичні характеристики
Імовірність -- кількісна міра об'єктивної можливості появи події при реалізації певного комплексу умов. Імовірність події А позначається як Р(А) та виражається в частках одиниці або у відсотках. Міра ймовірності -- діапазон її числових значень від 0 до 1 або від 0 до 100%.
Частота появи події (статистична ймовірність) -- це відношення кількості випадків, у яких реалізувався певний комплекс умов (т), до загальної кількості випадків (п): р(А)=т/п.
Випадкова подія -- подія, яка при реалізації визначеного комплексу умов, може відбутися або не відбутися, її імовірність перебуває в межах 0<Р(А)<1 або 0<Р(А)<100 %.
Достовірна подія -- подія, яка при реалізації визначеного комплексу умов відбудеться неодмінно, її імовірність становитиме 1 або 100 %.
Неможлива подія -- подія, яка при реалізації визначеного комплексу умов не відбудеться ніколи, її імовірність становитиме 0.
У медичних дослідженнях достатньою вважається ймовірність появи події не менше 0,95 або 95 %. При вивченні захворювань або ситуацій, що мають найважливіші медико-соціальні наслідки або високі показники летальності та інвалідності, а також при фармакологічних дослідженнях імовірність появи події має становити не менше 0,99 (99 %).
Закон великої кількості: при достатньо великій кількості спостережень випадкові відхилення взаємно погашаються та виявляється стійкість деяких параметрів, яка виражається в основній закономірності. Отже, що більше проведено досліджень, тим результат точніший.
Звичайно в медичних дослідженнях використовують вибірки з не менше ніж ЗО спостереженнями.
Нормальний (гаусовий, симетричний) розподіл імовірності є законом, найпоширенішим у практичних завданнях. Нормальний закон характеризує розподіл безперервних випадкових величин, якщо вони є результатом дії різних причин. Характерним прикладом нормального розподілу величин можуть бути численні відхилення (похибки) вимірювання маси якої-небудь речовини на аналітичних терезах. Кожне вимірювання відрізнятиметься на якусь величину з різних причин, знати які ми не можемо. Ця низка похибок і формує нормальний закон.
Статистична сукупність -- це група однорідних елементів (одиниць спостереження), узятих разом у конкретних умовах часу та простору. Оскільки дослідження генеральної сукупності або неможливе, або вимагає невиправдано великої роботи, краще обійтися більш обмеженим матеріалом, який і називають вибіркою.
Вибірка -- група елементів, вибрана для дослідження з усієї сукупності. Завдання вибіркового методу полягає в тому, щоб зробити правильні висновки щодо генеральної сукупності. Наприклад, лікар робить висновок про склад крові пацієнта на основі аналізу її кількох крапель.
Варіаційний ряд -- це ряд числових значень якоїсь певної ознаки, відмінних одне від одного за своєю величиною та розташованих у ранговому порядку (табл. 1).
Таблиця 1
Варіаційний ряд
Х |
Х1 |
Х2 |
Хі |
Xk |
|
М |
m1 |
m2 |
mi |
mk |
|
Р=m/n |
p1 |
p2 |
pi |
pk |
Характеристики варіаційного ряду:
-- X1,Х2,.... Хk-- варіанти (числове вираження ознаки, що вивчається);
-- m1, m2,... mk -- частоти варіант (числа, що вказують, скільки разів зустрічається ця варіанта у варіаційному ряду);
-- p1, р2,... рk -- відносні частоти (Р=т/п);
-- n -- загальна кількість спостережень (сума варіант, з яких складається варіаційний ряд).
Змінні -- величини, які можна виміряти в дослідженнях та контролювати. Для статистичного аналізу використовують абсолютні, відносні та середні величини.
Абсолютні величини застосовують при наданні характеристики загальної чисельності сукупності (чисельність населення, загальна кількість лікарів у країні та ін.), а також при оцінці рідкісних явищ (кількість особливо небезпечних інфекцій, кількість осіб з аномаліями розвитку і т. д.).
Серед відносних величин можна виділити екстенсивні та інтенсивні показники.
Екстенсивні показники характеризують розподіл цілого на складники. Звичайно екстенсивні показники виражаються у відсотках. Ключові слова - частка, частина від цілого.
Інтенсивні показники використовують при вивченні поширеності явища в тому чи іншому середовищі. Ключові слова -- частота виявлення, поширеність. Для їх обчислення недостатньо знати лише величину явища, що цікавить нас, слід знати ще величину того середовища, у якому це явище спостерігається.
Деякі середні характеристики вибірки:
-- середнє значення (Хс, М) -- центр вибірки, навколо якого групуються елементи вибірки;
-- середнє квадратичне або стандартне відхилення (а) -- міра відхилення елементів вибірки щодо середнього значення;
-- дисперсія -- параметр, що характеризує ступінь відхилення елементів вибірки щодо середнього значення. Чим більша дисперсія, тим більші відхилення значень елементів вибірки від середнього значення;
-- мода -- елемент вибірки з найпоширенішим значенням;
-- медіана -- середня величина ознаки, що змінюється, перебуває в середині ряду, розташованого в порядку зростання або зменшення значень ознаки. Медіана -- значення ознаки, що змінюється, ділячи безліч даних навпіл так, що одна половина більша за медіану, а інша -- менша.
Методи аналізу даних у медицині та охороні здоров'я:
графічний метод (для візуального подання даних та результатів аналізу);
метод визначення взаємозв'язку між вибірками -- знаходження коефіцієнта кореляції (г), що визначає ступінь лінійного взаємозв'язку. Значення коефіцієнта кореляції не залежить від масштабу вимірювання. Наприклад, кореляція між зростом та масою тіла буде однаковою, незалежно від того, проводилися вимірювання в дюймах і фунтах чи в сантиметрах та кілограмах. Пропорційність означає просто лінійну залежність.
Емпіричні знання для інтерпретації результатів
Коефіцієнт кореляції змінюється від -1 (сувора зворотна лінійна залежність) до +1 (сувора пряма пропорційна залежність). При значенні г = 0 залежності між вибірками немає.
Більш детально: на практиці коефіцієнт кореляції набуває деяких проміжних значень:
-- якщо г > 0,95 за абсолютною величиною (без урахування знака), то між параметрами існує практично лінійна залежність (пряма при позитивному знаку, зворотна - при негативному);
-- при 0,8 < г < 0,95 між параметрами існує сильний ступінь лінійного зв'язку;
-- при 0,6 < г < 0,8 між параметрами існує певна міра лінійного зв'язку;
-- при г < 0,4 між параметрами лінійна залежність відсутня.
Метод визначення значущості результату застосовують для порівняння та визначення достовірності відмінності двох та більше вибірок. Для оцінки достовірності використовують критерій відмінності Ст'юдента (і). Критерій порівнює середні величини досліджуваної та контрольної груп і може довести, що вони не тільки різні, а і що відмінності достовірні. У разі кількості спостережень понад ЗО можна користуватися наступною закономірністю: якщо критерій <= 2, то він достовірний, оскільки відповідає р < 0,95 або р = 0,05. При цьому його слід порівнювати з рівнем значущості.
Рівень значущості (р) -- максимальне значення імовірності появи події, при якому подія вважається практично неможливою. У медицині найбільшого поширення набув рівень значущості 0,05. Тому якщо імовірність, з якою подія, що нас цікавить, може статися випадковим чином, р <0,05, то прийнято вважати цю подію малоймовірною, а якщо вона відбулася, то це не було випадковістю.
Емпіричні знання для інтерпретації результатів
Імовірність достовірності виражається не критерієм і, а рівнем значущості (Р), який є доповненням імовірності до 100 % і або до 1,0). Так, імовірності 95 % (0,95) відповідає рівень значущості 0,05 (1,0-0,95 = 0,05), імовірності 99 % -- 0,01 (1,0-0,99 = 0,01), імовірності 99,9 % --0,001(1,0-0,999 =0,001).
Для порівняння проводять перевірку нульової гіпотези Но: середні двох вибірок належать до однієї і тієї самої сукупності. Тобто згідно з цією гіпотезою відмінності, отримані в результаті дослідження, випадкові (не достовірні), тобто обидві групи становлять один і той самий однорідний матеріал, одну сукупність. Статистичний аналіз має привести або до заперечення Но-гіпотези, якщо доведено достовірність отриманих відмінностей, або до її підтвердження, якщо достовірність відмінностей не доведено, тобто відмінності визнано випадковими. Оскільки відмінності завжди характеризуються певним рівнем значущості, то ухвалення рішення щодо заперечення чи підтвердження Но-гіпотези пов'язане з оцінкою рівня значущості, отже:
-- якщо при порівнянні сукупностей рівень значущості, отриманий у ході дослідження, нижчий ніж 0,05 (р < 0,05), то Но-гіпотеза відкидається і відмінності в сукупностях визнаються достовірними, події не випадковими, вибірки належать до двох різних сукупностей;
-- якщо при порівнянні сукупностей рівень значущості, отриманий у ході дослідження, перевищує 0,05 (р > 0,05), то Но-гіпотеза визнається правильною (підтверджується), тоді події випадкові, вибірки належать до однієї сукупності.
Запропонований опис методів аналізу даних та основних статистичних характеристик є надзвичайно коротким і не охоплює всебічно об'єкт обговорення.
Усі вищеперераховані характеристики та методи аналізу реалізуються за допомогою пакету Excel.
Mіcrosoft Excel є однією з найпопулярніших програм обробки інформації, що може бути представлена у вигляді таблиць.
Технологія електронних таблиць (ЕТ) знаходить широке застосування у різноманітних сферах діяльності людини: бухгалтерський та банківський облік; планування та розподіл ресурсів; інженерно-технічні розрахунки; обробка великих масивів інформації; дослідження динамічних процесів. Електронні таблиці є незамінними при складанні усіх видів звітів або оцінки ефективності роботи. Їх було винайдено для людей, які оперують громіздкими формулами і великою кількістю цифр.
Концепція ЕТ вперше з'явилася у системі VіsіCalc на початку 80-х років. Подальший розвиток родини ЕТ - пакети SuperCalc, Multіplan. ЕТ є одним з основних компонентів інтегрованих пакетів Sumphony, Framework, Open Access, Works, Lotus-1-2-3.
Основні поняття
ЕТ являє собою звичайну таблицю. Її стовпчики (columns) позначаються літерами A,..., Z, AA,..., AZ,..., ZA,..., ZZ. Звичайно у ЕТ загальна кількість стовпчиків - 255. Рядки (rows) позначаються цифрами. У різних ЕТ може бути різна кількість рядків. Комірка або клітинка (“ячейка”) таблиці (cell) може бути задана літерою стовпчика та цифрою рядка, наприклад A1, F20, ІV9999.
Об'єктами дії команд ЕТ можуть бути комірка, стовпчик, рядок, діапазон рядків, діапазон стовпчиків, блок клітинок. Блок клітинок позначається двома клітинками - лівою верхньою та правою нижньою.
Основний елемент зберігання даних - комірка - характеризується:
- адресою (ім'ям);
- вмістом (може бути порожньою або містити дані у вигляді рядка тексту, числа або формули);
- значенням, яке визначається вмістом даної клітинки, а також клітинок, на які у формулі є посилання;
- форматом відображення на екрані вмісту або значення клітинки; можна задавати довільну ширину відображення стовпчика клітинок, розташування даних у клітинках, змінювати кількість знаків у числах, а також здійснювати їх масштабування, доповнювати числа спеціальними знаками;
- статусом (клітинка може бути захищеною і незахищеною від модифікації даних).
Структура ЕТ
Незалежно від типу інформації, яку містить таблиця, у неї можна виділити 4 поля.
1) Поле опису задачі, що складається з клітинок з текстовою інформацією, яка відображає назву й призначення ЕТ.
2) Поле початкових даних, що містить "незалежні" клітинки з числовою інформацією. Уведення початкових даних здійснюється в ручному режимі.
3) Поле розрахункових формул, що містить "залежні" клітинки з формулами, в яких операндами є назви клітинок з початковими даними та параметрами. Заповнення поля формул здійснюється автоматично. Поле формул може бути захищено як і поле опису задачі.
4) Поле форматування результатів розрахунків ЕТ, містить клітинки з формулами кінцевих результатів.
Програму Excel під MS Wіndows характеризує зручний інтерфейс користувача, розвинена система підказок та універсальність використовування. Крім того Excel має багато додаткових засобів роботи з електронними таблицями, наприклад побудова різноманітних графіків та діаграм по даним таблиці. Excel дозволяє підключати окремі бібліотеки, розроблені у будь-якій системі програмування.
Список рекомендованої літератури
1. Гельман В.Я. Медицинская информатика. СПб.: Питер, 2002. 468 с.
2. Добрін Б.Ю., Каширін В.Г. Основи медичної інформатики. Луганськ: Луган. ун-т, 2003. 512 с.
3. Зарецкая И.Т., Колодяжный Б.Г., Гуржий А.Н., Соколов А.Ю. Информатика: учеб. пособие для 10--11 кл. К.: Форум, 2001. 494 с.
4. Інформаційні технології в охороні здоров'я і практичній медицині: У 10 кн. Кн. 3 Інформаційні технології в хірургії: навч. посібн. / Мінцер О.П., Москаленко В.З., Веселий С.В. К.: Вища шк., 2004. 423 с.
5. Інформаційні технології в охороні здоров'я і практичній медицині: У 10 кн. Кн. 5. Оброблення клінічних і експериментальних даних у медицині: навч. посібн. / Мінцер О.П., Вороненко Ю.В., Власов В.В. К.: Вища шк., 2004. 423 с.
6. Леонтьев В.П. Новейшая энциклопедия персонального компьютера-2002. М.: Олма-Пресс, 2002. 920 с.
7. Основи медичної інформатики: підручник / Момоток Л.О., Юшина Л.В., Рожнова О.В. К.: Медицина, 2008. 232 с.
8. Руденко В.Д. Практичний курс інформатики / 3а ред. Мадзігона В.М. К.: Фенікс, 2000. 304 с.
9. Симонович С.В. Информатика. Базовый курс. СПб.: Питер, 2003. 630 с.
10. Брайан Фафенбергер, Дэвид Уолл. Толковый словарь по компьютерным технологиям и Internet. К.: Діалектика, 1996. 479 с.
11. Інформаційні технології в охороні здоров'я і практичній медицині: У 10 кн. Кн.5 Оброблення клінічних і експериментальних даних у медицині: навч. посібн. / Мінцер О.П., Вороненко Ю.В., Власов В.В. К.: Вища шк., 2004. 423 с.
12. Http://uacm.kharkov.ua/rus/ Материалы сайта “Украинская ассоциация Компьютерная медицина”.
13. Http://www/telemed.org.ua/News/news.html/ Материалы сайта “Телемедицина в Украине”.
Размещено на Allbest.ru
Подобные документы
Призначення табличного процесора Excel, можливість подавати табличні дані та інформацію в більш наочній та зручній для сприйняття формі, записаній за допомогою діаграм і графіків. Автоматизація процесу побудови діаграм за допомогою "Майстра діаграм".
аттестационная работа [2,3 M], добавлен 15.05.2010Знайомство з особливостями оформлення текстових документів за допомогою текстового процесора Microsoft Word. Загальна характеристика системи управління базами даних Microsoft Access, розгляд проблем. Аналіз головних сфер використання Windows Script Host.
отчет по практике [3,2 M], добавлен 15.06.2014Визначення засобами Excel та MathCAD дальності польоту каменя і його найбільшої висоти піднімання над схилом. Математична модель задачі та алгоритм її розв’язання. Перевірка даних на якість обробки заданої інформації при автоматизованому проектуванні.
курсовая работа [905,0 K], добавлен 03.11.2013Поняття та функції операційної системи. Види операційних систем та їх характеристика. Напрямки розвитку операційних систем. Розробка алгоритму розв’язку економічної задачі розподілу продукції пекарні та реалізація його за допомогою Microsoft Excel.
курсовая работа [1,2 M], добавлен 15.06.2016Використання мови програмуванння Java при виконанні "задачі лінійного програмування": її лексична структура і типи даних. Методи розв’язання задачі. Особливості логічної структури програми, побудова її зручного інтерфейсу за допомогою симплекс методу.
курсовая работа [437,9 K], добавлен 24.01.2011Обробка інформації нетекстового характеру. Електронні редактори для опрацювання даних. Пошук даних у діапазоні клітинок або в таблиці. Фільтрування даних в Microsoft Excel. Вимоги до апаратного забезпечення. Мотивація вибору програми Microsoft Excel.
реферат [2,9 M], добавлен 18.03.2013Ознайомлення з інтерфейсом програми MS Excel та методом створення і заповнення таблиць різного роду даними. Виконання обчислень даних по загальній вартості товарів і по їх середньому значенні. Створення діаграм по даних таблицях та побудова графіків.
лабораторная работа [95,0 K], добавлен 15.09.2010Алгоритми розв’язання задач у вигляді блок–схем. Використання мови програмування MS VisualBasic for Application для написання програм у ході вирішення задач на одномірний, двовимірний масив, порядок розв’язання задачі на використання символьних величин.
контрольная работа [742,9 K], добавлен 27.04.2010Використання полів в Microsoft Office Word і функції "Слияние" для злиття двох документів Word i Excel. Створення списку запрошених із зазначенням їх статі. Складання тексту запрошення, налаштування полів програми і запуск функції з'єднання даних.
лабораторная работа [74,2 K], добавлен 15.09.2010Створення табличних документів і їх опис. Побудова графіків та діаграм. Робота з базами даних в табличному процесорі Excel. Створення екранних форм, таблиці бази даних, звітних форм, запитів, макросів та головної кнопочної форми. Проектування презентації.
курсовая работа [1,9 M], добавлен 10.04.2015