Основы статистических методов обработки результатов медико-биологических исследований

Применение статистики в здравоохранении. Процесс сбора клинических данных и их статистический анализ. Обобщение характеристик в группе больных или популяционной группе. Серия наблюдений артериального систолического давления и определение корреляции.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 21.11.2010
Размер файла 44,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

17

Размещено на http://www.allbest.ru/

Основы статистических методов обработки результатов медико-биологических исследований

1. Медико-биологические параметры

В медицине проведение клинических исследований напрямую связано со всесторонним анализом полученных данных. Поэтому изучение прикладной статистики является неотъемлемой частью обучения персонала, принимающего участие не только в статистическом анализе результатов, но и в процессе сбора клинических данных. Этические и экономические соображения диктуют необходимость внимательного отношения к планированию клинических следований. Кроме того, владение методиками обработки информации позволяет персоналу более эффективно организовать процедуру сбора исходных данных.

В здравоохранении и клинической медицине часто используются, сознательно или неосознанно, различные статистические концепции при принятии решений по таким вопросам, как клинический диагноз, прогнозирование возможных результатов осуществления тех или иных программ в данной группе населения, прогнозирование течения заболевания у отдельного больного, выбор лечения для конкретного больного и т.п. Статистика находит повседневное применение в лабораторной практике. Знание статистики стало важным для понимания и критической оценки сообщений в медицинских журналах. Таким образом, знание принципов статистики абсолютно необходимо для планирования, проведения и анализа исследований, посвященных оценке различных ситуаций и тенденций в здравоохранении, а также для выполнения научных исследований в области медицинской биологии, клиники и здравоохранения.

Термин «Статистика» имеет два смысла. Во-первых, он относится к повседневному использованию данных, численных наблюдений и количественной информации.

Примеры:

Масса тела новорожденных

Возраст (полных лет) больных, обследованных в амбулатории за некоторый период времени

Количество креатинина (мг/л) в суточной пробе мочи.

Во-вторых, термин «статистика» также означает дисциплину, охватывающую статистические методы, изучение научных методов сбора, обработки, представления, анализа и интерпретации данных, а также формулирования статистических выводов и заключений на основании количественных данных.

Статистика - наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественными особенностями.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по множеству характеристик, таких как масса тела, возраст, рост, артериальное давление, уровень холестерина, иммуноглобулинов и т.д. Значения показателей, на основании которых человека можно считать здоровым, варьируются от одного индивидуума к другому. Нет двух совершенно одинаковых пациентов, или двух групп индивидуумов, однако решения, касающиеся отдельных больных или групп населения, приходится принимать, исходя из опыта, накопленного в отношении других больных или популяционных групп со сходными биологическими и социальными характеристиками. Ввиду существующих различий эти решения не могут быть абсолютно точными - они всегда сопряжены с некоторой неопределенностью. В этом и заключается вероятностная природа медицины.

Вариация признака (или фактора, или результатов измерения) возникает, если их значения меняются от индивидуума к индивидууму или для одного индивидуума во времени. Едва ли не всем характеристикам организма человека, будь то физиологические, биохимические или иммунологические, свойственна вариабельность.

Сложности возникают при попытках обобщить характеристики в группе больных или популяционной группе; решить какое значение той или иной характеристики будет идеальным, нормальным, средним и т.п.; сопоставить две группы больных или две популяционных группы по конкретной характеристике.

Состояние человеческого организма как кибернетической системы, определяется совокупностью свойств (температура, артериальное давление, число клеток крови и т.д.). Свойства, которые поддаются оценке в любой форме (качественной или количественной) называются параметрами. Величина каждого из этих параметров находится в процессе постоянного изменения, как у больного, так и у здорового организма.

Если у любой группы здоровых лиц определить значение любого медико-биологического параметра, например, измерить величину артериального давления (АД), то мы получим совокупность различных значений, величина которых лежит в определенном интервале.

Если значения не выходят за границы нормы для данного параметра, этот интервал называется зоной здоровья. Например, зоной здоровья для измеренной температуры тела будет 36,5-37,0оС.

2. Совокупность наблюдений. Генеральная совокупность, выборочная совокупность

Статистическая совокупность - группа, состоящая из большого числа относительно однородных элементов (объектов), взятых вместе в известных границах времени или пространства.

Элементы, из которых состоит совокупность, имеют различные по величине значения изучаемого признака и каждое из этих значений встречается в группе с неодинаковой частотой.

Генеральная совокупность состоит из всех единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования. Например, если бы можно было изучить всех больных туберкулезом в мире, то такая группа больных составила бы генеральную совокупность. Естественно, практически это невозможно, поэтому при изучении здоровья населения генеральная совокупность рассматривается в пределах конкретных границ, очерченных территориальным или производственным признаком, и поэтому включает в себя определенное число наблюдений.

Выборочная совокупность (выборка) - часть генеральной совокупности, по свойствам которой судят о генеральной совокупности. На основе анализа выборочной совокупности можно получить достаточно полное представление о закономерностях, присущих всей генеральной совокупности. Выборочная совокупность должна быть репрезентативной, т.е. в отобранной части должны быть представлены все элементы в том соотношении, как и в генеральной совокупности. Выборочная совокупность должна отражать свойства генеральной совокупности, т.е. правильно ее представлять.

3. Вариационный ряд и его характеристики

Совокупность значений изученного в данном эксперименте или наблюдении параметра, проранжированных по величине (возрастания или убывания) называется вариационным рядом.

Предположим, что мы измерили артериальное давление у десяти пациентов с целью получить верхний порог АД: систолическое давление, т.е. только одно число.

Представим, что серия наблюдений (статистическая совокупность) артериального систолического давления в 10-ти наблюдениях имеет следующий вид (табл. 1):

Таблица 1

120

115

120

125

120

115

120

115

120

120

Чтобы получить вариационный ряд артериального давления, следует расположить данную статистическая совокупность в порядке возрастания или убывания значений (табл. 2).

Таблица 2

115

115

115

120

120

120

120

120

120

125

Составляющие вариационного ряда называются вариантами. Варианты представляют собой числовое значение изучаемого признака.

Построение из статистической совокупности наблюдений вариационного ряда - только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (средний уровень белка крови, средний вес пациентов, среднее время наступления наркоза и т.д.)

Средний уровень измеряют с помощью критериев, которые носят название средних величин. Средняя величина - обобщающая числовая характеристика качественно однородных величин, характеризующая одним числом всю статистическую совокупность по одному признаку. Средняя величина выражает то общее, что характерно для признака в данной совокупности наблюдений.

Общеупотребительными являются три вида средних величин: мода (), медиана () и среднеарифметическая величина ().

Для определения любой средней величины необходимо использовать результаты индивидуальных наблюдений, записав их в виде вариационного ряда (табл. 2).

Мода - значение, наиболее часто встречающееся в серии наблюдений. В нашем примере мода = 120. Если в вариационном ряду нет повторяющихся значений, то говорят, что мода отсутствует. Если несколько значений повторяются одинаковое количество раз, то в качестве моды берут наименьшее из них.

Медиана - значение, делящее распределение на две равные части, центральное или срединное значение серии наблюдений, упорядоченных по возрастанию или убыванию. Так, если в вариационном ряду 5 значений, то его медиана равна третьему члену вариационного ряда, если в ряду четное количество членов, то медиана представляет собой среднее арифметическое двух его центральных наблюдений, т.е. если в ряду 10 наблюдений, то медиана равна среднему арифметическому 5 и 6 наблюдения. В нашем примере .

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Средняя арифметическая величина рассчитывается по формуле:

где - наблюденная величина в -том наблюдении, а - число наблюдений. Для нашего случая .

Средняя арифметическая величина обладает тремя свойствами:

Средняя занимает серединное положение в вариационном ряду. В строго симметричном ряду .

Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

Сумма отклонений всех вариант от средней равна нулю: . Отклонение вариант от средней обозначается .

Вариационный ряд состоит из вариант и соответствующих им частот. Из десяти полученных значений цифра 120 встретилась 6 раз, 115 - 3 раза, 125 - 1 раз. Частота () - абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.

Вариационный ряд может быть простым (частоты = 1) или сгруппированным укороченным, по 3-5 вариант. Простой ряд используется при малом числе наблюдений (), сгруппированный - при большом числе наблюдений ().

4. Среднее квадратическое отклонение

Величина одного и того же признака неодинакова у всех членов совокупности. Например, в группе студентов рост каждого учащегося отличается от роста сверстников. В этом проявляется разнообразие изучаемого параметра. Если взять 3 группы студентов, измерить их рост и вычислить среднюю арифметическую величину, то для каждой группы студентов получится свое разнообразие признака. Статистика позволяет это охарактеризовать специальным критерием, определяющим уровень разнообразия каждого признака в той или иной группе.

Наиболее полную характеристику разнообразию признака в совокупности дает так называемое среднее квадратическое отклонение, обозначаемое греческой буквой «сигма» - .

Используют 2 способа расчета среднего квадратического отклонения:

; где (1)

Формула (1) используется при небольшом числе наблюдений (), когда в вариационном ряду все частоты .

При используют формулу 2:

(2)

Среднее квадратическое отклонение характеризует степень рассеивания вариационного ряда вокруг средней. Чем меньше , тем более типична, точна средняя.

На практике часто приходится сравнивать изменчивость признаков, выраженных разными единицами. В этих случаях используют относительные показатели вариации, например, коэффициент вариации . Этот показатель представляет собой среднее квадратическое отклонение, выраженное в процентах от величины среднего арифметического.

Зная сигму (), можно рассчитать коэффициент вариации , необходимого для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.)

(3)

При наблюдается слабое разнообразие признака, при - среднее разнообразие признака, при - сильное разнообразие признака.

5. Ошибки величин

Для оценки достоверности результатов исследования используется важнейшая статистическая величина - ошибка репрезентативности . Ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Генеральная совокупность может быть охарактеризована по выборке только с некоторой погрешностью, измеряемой ошибкой репрезентативности. По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли быть получены при проведении исследования всех без исключения элементов генеральной совокупности. Это единственный вид ошибок, который не может быть устранен без перехода на сплошное изучение генеральной совокупности. Для того чтобы свести ошибки репрезентативности к достаточно малой величине, в выборке используется большое количество наблюдений ().

Каждая средняя величина должна быть представлена со своей средней ошибкой. Средняя ошибка средней арифметической (ошибка репрезентативности) вычисляется по формуле (4):

при (4)

при

Конечный результат любого исследования представляется в виде .

Величину отклонения выборочного показателя (статистики) от генерального параметра называют статистической ошибкой. Для измерения этой ошибки некоторой статистики служит квадратичная (стандартная) ошибка статистики.

6. Вероятность

Вероятность того или иного события при числе наблюдений оценивается по простой формуле. Если число наблюдаемых конкретных событий при числе наблюдений равно , то вероятность равна отношению числа наблюдений, в которых было обнаружено событие к общему числу наблюдений:

.

Вероятность можно оценить в непрерывной шкале от 0 до 1 включительно. Событие, которое невозможно, имеет вероятность 0, а событие, которое произойдет обязательно, имеет вероятность 1.

Два события называются взаимоисключающими, если они не могут произойти вместе или существовать одновременно. Два события называются независимыми в том случае, если наличие или отсутствие одного не изменяет вероятность появления другого или если появление одного не влияет на вероятность появления другого.

Если событие состоит в появлении какого-нибудь из группы взаимоисключающих исходов, то вероятность такого события представляет собой сумму вероятностей исходов в данной группе (правило сложения), т.е.

В серии независимых испытаний вероятность того, что произойдет некоторая конкретная последовательность событий, - есть произведение вероятностей отдельных событий (правило умножения), т.е.

Пример: Пусть мы изучили 2000 историй болезни больных туберкулезом. В этом случае число наблюдений . Среди просмотренных историй болезни у 100 пациентов было обнаружено снижение количества тромбоцитов (тромбоцитопения) (). В этом случае вероятность тромбоцитопении равна: .

Представим, что имеется несколько последовательных событий, вероятность каждого из которых определена (например, они равны ). Суммарная (общая) вероятность некоторого события, слагающегося из суммы элементарных, равна произведению вероятностей элементарных событий друг на друга: .

7. Математическое ожидание

здравоохранение статистический больной анализ

Пусть определена совокупность измерений систолического давления у некоторой группы обследуемых (табл. 1).

Что можно сказать о величине АД в следующем, одиннадцатом наблюдении, которое мы не проводили? В полной мере оценить эту величину мы не можем, а лишь дать вероятностную оценку, т.е. предсказать значение с той или иной долей вероятности.

Любое измеренное нами значение АД является случайной величиной. Если имеется какая-либо зависимость, описывающая эту случайную величину, то принято говорить, что случайная величина характеризуется функцией вероятности. В этом случае, основываясь на полученных результатах, можно прогнозировать ту величину, которая будет получена в следующих измерениях. Такая прогнозируемая величина называется математическим ожиданием. Попытаемся определить величину математического ожидания для нашего случая.

Для этого вначале сгруппируем одинаковые результаты и оценим вероятность (в долях единицы) их появления в нашем наблюдении (табл. 3):

Таблица 3

Систолическое АД (Х)

число пациентов

вероятность (Р)

1) 115

3

0,3

2) 120

6

0,6

3) 125

1

0,1

Так как общее число наблюдений составило десять (цифра 10 взята для наглядности математических манипуляций), то каждое появление того или иного результата представляет собой вероятность, равную 0,1 (одну десятую). Для трех появлений цифры - и т.д.

Очевидно, что любой эмпирический опыт дает возможность с той или иной степенью правильности предсказывать или прогнозировать будущее. В теории статистики бытовое понимание феномена предсказания приобретает более очерченное звучание в форме понятия математического ожидания.

Математическое ожидание () вычисляется по следующей формуле:

.

Математическое ожидание - это сумма попарных произведений наблюдаемой величины на вероятность ее появления в данном наблюдении.

В рассмотренном нами случае вариационного ряда систолического давления математическое ожидание исследуемой величины составляет:

.

Таким образом, наиболее вероятным (при точном измерении) является величина, составляющая 119 мм. рт. ст.

8. Корреляция

Все явления в окружающей природе находятся в определенной связи друг с другом. Формы этой связи различны. Различают альтернативную, функциональную и корреляционную связи.

Альтернативная связь характеризует наличие или отсутствие качественного признака (например, пациент заболел - не заболел).

Функциональная и корреляционная связи относятся к количественным связям между явлениями или процессами.

Под функциональной понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого. Для достаточно простых систем возможно создание математических моделей функционального характера. Такими моделями, например, могут быть законы физических явлений.

Однако в случаях, когда две и более величины зависят не только друг от друга, но и от ряда других условий, не поддающихся точному учету, функциональные зависимости принципиально не применимы для описания взаимосвязи этих величин. В таких случаях описать взаимосвязь можно лишь с помощью статистических или вероятностных закономерностей.

Корреляция - один из видов статистических или вероятностных закономерностей, описывающих взаимосвязь между двумя величинами и , из которых одна () зависит не только от другой (), но и от совокупности неучтенных факторов, в результате чего каждому значению соответствует не одно значение , а ряд этих значений.

Корреляционная связь проявляется лишь в массе наблюдений, т.е. совокупности.

Величина корреляционной взаимосвязи определяется коэффициентом корреляции. Общепринято обозначать его символом . Коэффициент корреляции одним числом измеряет силу связи между изучаемыми явлениями и дает представление о ее направленности. По направлению связь может быть прямой и обратной. По силе связи коэффициенты корреляции колеблются от 1 (полная связь) до 0 (отсутствие связи). Коэффициент корреляции может иметь значение от -1 до +1, т.е. иметь отрицательное и положительное значение. В этих случаях говорят об отрицательной или положительной корреляционной взаимосвязи. Величина коэффициента характеризует силу корреляционной взаимосвязи.

Чем ближе модуль r к единице, тем сильнее или глубже корреляционная взаимосвязь между двумя вариационными рядами. Модульное значение выше 0,8 характеризуют сильную взаимосвязь, в интервале 0,8-0,5 - выраженную взаимосвязь, 0,5-0,2 - слабую взаимосвязь, менее 0,2 (0,2 - 0) - отсутствие взаимосвязи.

Коэффициент корреляции для небольшого числа наблюдений () рассчитывается по формуле (5):

(5)

где и - варианты сопоставляемых вариационных рядов, и - отклонение каждой варианты от своей средней арифметической (и ).

Положительная корреляционная взаимосвязь () между двумя вариационными рядами и свидетельствует о том, что величина прямо зависит от величины , отрицательная говорит об обратной зависимости. Необходимо помнить, что в данном случае речь принципиально не идет о функциональной взаимосвязи. Предположим, например, что между двумя вариационными рядами, в которых представлены концентрация сахара в крови и «стаж» заболевания сахарным диабетом у некоторого контингента больных выявлен коэффициент корреляции . Величина обнаруженного коэффициента положительная, т.е. эти параметры прямо взаимосвязаны между собой. В общем случае, чем выше концентрация сахара, тем большую длительность болезни необходимо предполагать у данного пациента. Вновь отметим, что у этого правила могут быть исключения. Действительно, по концентрации сахара в крови принципиально невозможно с точностью до месяца или дня вычислить длительность болезни. Это очевидный абсурд. Однако коэффициент корреляции дает куда более важное знание: существуют механизмы, связывающие изучаемые параметры вполне определенным, предсказуемым способом.

Представим другой пример: два вариационных ряда, описывающих общую длительность дней, которые человек проболел ОРВИ в течение года и общую длительность времени, потраченную на закаливающие процедуры. Коэффициент корреляции в данном случае составляет -0,6, т.е. имеет отрицательное значение. Такая величина свидетельствует о наличии механизмов обратной связи между наблюдаемыми явлениями: меньшая длительность закаливающих процедур в общем случае сопровождается увеличением длительности периодов болезни и наоборот.

Коэффициенты корреляции имеют большое значение в медицине. Они применяются для выявления разнообразных связей между явлениями и процессами, необходимы при оценке физического состояния индивидуума и коллектива, для определения влияния на отдельные группы населения как благоприятных так и неблагоприятных факторов окружающей среды.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.