Основы дисперсионного анализа
Изучение понятия, методов, условий и принципов применения дисперсионного анализа. Основные этапы классического дисперсионного анализа. Алгоритм проведения дисперсионного анализа по упрощенному типу. Суть метода по Фишеру. Метод "общей линейной модели".
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 13.12.2013 |
Размер файла | 20,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
Учреждение образования «Гомельский государственный университет имени Франциска Скорины»
Кафедра зоологии и охраны природы
РЕФЕРАТ
по учебной дисциплине «Биометрия»
на тему
«Основы дисперсионного анализа»
Студентки 3 курса
биологического факультета
группы БИ - 32
Сизиковой М.О
Гомель, 2012
Содержание
1. Методы дисперсионного анализа
2. Условия применения дисперсионного анализа
3. Принцип применения метода дисперсионного анализа
4. Этапы классического дисперсионного анализа
5. Алгоритм проведения дисперсионного анализа по упрощённому типу
Литература
1. Методы дисперсионного анализа
Метод по Фишеру (Fisher) -- критерий F (значения F см. в приложении N 1);
Метод применяется в однофакторном дисперсионном анализе, когда совокупная дисперсия всех наблюдаемых значений раскладывается на дисперсию внутри отдельных групп и дисперсию между группами.
Метод "общей линейной модели".
В его основе лежит корреляционный или регрессионный анализ, применяемый в многофакторном анализе.
Обычно в медико-биологических исследованиях используются только однофакторные, максимум двухфакторные дисперсионные комплексы. Многофакторные комплексы можно исследовать, последовательно анализируя одно- или двухфакторные комплексы, выделяемые из всей наблюдаемой совокупности.
2. Условия применения дисперсионного анализа
дисперсионный анализ линейный фишер
Задачей исследования является определение силы влияния одного (до 3) факторов на результат или определение силы совместного влияния различных факторов (пол и возраст, физическая активность и питание и т.д.).
Изучаемые факторы должны быть независимые (несвязанные) между собой. Например, нельзя изучать совместное влияние стажа работы и возраста, роста и веса детей и т.д. на заболеваемость населения.
Подбор групп для исследования проводится рандомизированно (случайный отбор). Организация дисперсионного комплекса с выполнением принципа случайности отбора вариантов называется рандомизацией (перев. с англ. -- random), т.е. выбранные наугад.
Можно применять как количественные, так и качественные (атрибутивные) признаки.
При проведении однофакторного дисперсионного анализа рекомендуется (необходимое условие применения):
Нормальность распределения анализируемых групп или соответствие выборочных групп генеральным совокупностям с нормальным распределением. Независимость (не связанность) распределения наблюдений в группах. Наличие частоты (повторность) наблюдений.
Нормальность распределения определяется кривой Гаусса (Де Мавура), которую можно описать функцией у = f(х), так как она относится к числу законов распределения, используемых для приближенного описания явлений, которые носят случайный, вероятностный характер. Предмет медико-биологических исследований -- явления вероятностного характера, нормальное распределение в таких исследованиях встречается весьма часто.
3. Принцип применения метода дисперсионного анализа
Сначала формулируется нулевая гипотеза, то есть предполагается, что исследуемые факторы не оказывают никакого влияния на значения результативного признака и полученные различия случайны.
Затем определяем, какова вероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы.
Если эта вероятность мала, то мы отвергаем нулевую гипотезу и заключаем, что результаты исследования статистически значимы. Это еще не означает, что доказано действие именно изучаемых факторов (это вопрос, прежде всего, планирования исследования), но все же маловероятно, что результат обусловлен случайностью.
Максимальную приемлемую вероятность отвергнуть верную нулевую гипотезу называют уровнем значимости и обозначают б = 0,05.
При выполнении всех условий применения дисперсионного анализа, разложение общей дисперсии математически выглядит следующим образом:
Doбщ. = Dфакт + D ост.,
Doбщ. - общая дисперсия наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего. Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Общее разнообразие складывается из межгруппового и внутригруппового;
Dфакт - факторная (межгрупповая) дисперсия, характеризуется различием средних в каждой группе и зависит от влияния исследуемого фактора, по которому дифференцируется каждая группа. Например, в группах различных по этиологическому фактору клинического течения пневмонии средний уровень проведенного койко-дня неодинаков -- наблюдается межгрупповое разнообразие.
D ост. - остаточная (внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неуточненных факторов и не зависящую от признака -- фактора, положенного в основание группировки. Вариация изучаемого признака зависит от силы влияния каких-то неучтенных случайных факторов, как от организованных (заданных исследователем), так и от случайных (неизвестных) факторов.
Поэтому общая вариация (дисперсия) слагается из вариации, вызванной организованными (заданными) факторами, называемыми факториальной вариацией и неорганизованными факторами, т.е. остаточной вариацией (случайной, неизвестной).
4. Классический дисперсионный анализ проводится по следующим этапам
Построение дисперсионного комплекса.
Вычисление средних квадратов отклонений.
Вычисление дисперсии.
Сравнение факторной и остаточной дисперсий.
Оценка результатов с помощью теоретических значений распределения Фишера-Снедекора (приложение N 1).
5. Алгоритм проведения дисперсионного анализа по упрощённому типу
Алгоритм проведения дисперсионного анализа по упрощенному способу позволяет получить те же результаты, но расчеты выполняются значительно проще:
I этап. Построение дисперсионного комплекса
Построение дисперсионного комплекса означает построение таблицы, в которой были бы четко разграничены факторы, результативный признак и подбор наблюдений (больных) в каждую группу.
Однофакторный комплекс состоит из нескольких градаций одного фактора (А). Градации -- это выборки из разных генеральных совокупностей (А1, А2, АЗ).
Результативный признак (количество койко-дней в среднем)Этиологические факторы развития пневмоний
А1 А2 А3
М = 14 дней
Двухфакторный комплекс -- состоит из нескольких градаций двух факторов в комбинации между собой. Этиологические факторы заболеваемостью пневмонией те же (А1, А2, АЗ) в сочетании с разными формами клинического течения пневмонии (Н1 -- острое, Н2 -- хроническое).
Результативный признак (количество койко-дней в среднем)
Этиологические факторы развития пневмоний
А1 А2 А3
Н1 Н2 Н1 Н2 Н1 Н2
М = 14 дней
II этап. Вычисление общей средней (Мобш)
Вычисление суммы вариант по каждой градации факторов:
У Vj = V1 + V2 + V3
Вычисление общей суммы вариант (У Vобщ) по всем градациям факторного признака:
У Vобщ = У Vj1 + У Vj2 + У Vj3
Вычисление средней групповой (Мгр.) факторного признака:
Мгр. = У Vj / N,
где N -- сумма числа наблюдений по всем градациям факторного I признака (Уn по группам).
III этап. Расчет дисперсий:
При соблюдении всех условий применения дисперсионного анализа математическая формула выглядит следующим образом:
Doбщ. = Dфакт + D ост.
Doбщ. - общая дисперсия, характеризуется разбросом вариант (наблюдаемых значений) от общего среднего;
Dфакт. - факторная (межгрупповая) дисперсия, характеризует разброс групповых средних от общего среднего;
Dост. - остаточная (внутригрупповая) дисперсия, характеризует рассеяние вариант внутри групп.
Вычисление факториальной дисперсии (Dфакт.):
Dфакт. = У h - H
Вычисление h проводится по формуле:
h = (У Vj) / N
Вычисление Н проводится по формуле:
H = (У V)2 / N
Вычисление остаточной дисперсии:
Dост. = (У V)2 - У h
Вычисление общей дисперсии:
Doбщ. = (У V)2 - У H
IV этап. Расчет основного показателя силы влияния изучаемого фактора Показатель силы влияния (з2) факторного признака на результат определяется долей факториальной дисперсии (Dфакт.) в общей дисперсии (Doбщ.), з2(эта) -- показывает какую долю занимает влияние изучаемого фактора среди всех других факторов и определяется по формуле:
Сравнение критерия Фишера (F) со стандартным (табличным) F проводят по графам таблицы с учетом степеней свободы:
v1 = n -- 1
v2 = N -- 1
По горизонтали определяют v1 по вертикали -- v2, на их пересечении определяют табличное значение F, где верхнее табличное значение р ? 0,05, а нижнее соответствует р > 0,01, и сравнивают с вычисленным критерием F. Если значение вычисленного критерия F равно или больше табличного, то результаты достоверны и Н0 не отвергается.
В практической деятельности врачей при проведении медико-биологических, социологических и экспериментальных исследований возникает необходимость установить влияние факторов на результаты изучения состояния здоровья населения, при оценке профессиональной деятельности, эффективности нововведений.
Существует ряд статистических методов, позволяющих определить силу, направление, закономерности влияния факторов на результат в генеральной или выборочной совокупностях (расчет критерия I, корреляционный анализ, регрессия, Ч2 -- (критерий согласия Пирсона и др.). Дисперсионный анализ был разработан и предложен английским ученым, математиком и генетиком Рональдом Фишером в 20-х годах XX века.
Дисперсионный анализ чаще используют в научно-практических исследованиях общественного здоровья и здравоохранения для изучения влияния одного или нескольких факторов на результативный признак. Он основан на принципе "отражения разнообразий значений факторного(ых) на разнообразии значений результативного признака" и устанавливает силу влияния фактора(ов) в выборочных совокупностях.
Сущность метода дисперсионного анализа заключается в измерении отдельных дисперсий (общая, факториальная, остаточная), и дальнейшем определении силы (доли) влияния изучаемых факторов (оценки роли каждого из факторов, либо их совместного влияния) на результативный(е) признак(и).
Дисперсионный анализ -- это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия (В)-- средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.
Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным (одномерный анализ). При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ (многомерный анализ).
Факторные признаки -- это те признаки, которые влияют на изучаемое явление.
Результативные признаки -- это те признаки, которые изменяются под влиянием факторных признаков.
Литература
1.Применение методов статистического анализа для изучения общественного здоровья и здравоохранения. Под ред. чл.-корр. РАМН, проф. В.З.Кучеренко. М., "Гэотар-Медиа", 2007, учебное пособие для вузов
2.Власов В.В. Эпидемиология. - М.: ГЭОТАР-МЕД, 2004. 464 с.
3.Архипова ГЛ., Лаврова И.Г., Трошина И.М. Некоторые современные методы статистического анализа в медицине. -- М.: Метроснаб, 1971. -- 75 с.
4.Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. -- СПб.: ООО "Издательство ФОЛИАНТ", 2003. - 432 с.
5.Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. -- М.: Издательство РАМН, 2000. - 52 с.
6.Плохинский Н.А. Биометрия. -- Издательство Сибирского отделения АН СССР Новосибирск. -- 1961. -- 364 с.
Размещено на Allbest.ru
Подобные документы
Основные положения факторного анализа. Принципы и модели дисперсионного анализа, его роль и место в статистических исследованиях. Особенности применения дисперсионного анализа при исследовании социально-экономических показателей по Республике Беларусь.
курсовая работа [762,4 K], добавлен 01.07.2014Применение дисперсионного анализа для исследования влияния качественных переменных на зависимую количественную переменную. Регрессионный анализ со статистической значимостью. Процесс проведения дисперсионного, кластерного, регрессионного анализов.
курсовая работа [498,5 K], добавлен 11.05.2022Расчет матрицы выборочных парных коэффициентов корреляции при помощи пакета анализа программы Excel. Однофакторный и двухфакторный дисперсионный анализ. Построение регрессионной модели. Модальный интервал по значению числа видов производимой продукции.
контрольная работа [281,7 K], добавлен 29.03.2010Понятие и основные этапы реализации дисперсионного анализа как статистического метода, позволяющего анализировать влияние различных факторов на исследуемую переменную. История его разработки и использование. Статистика Фишера и принципы F-распределения.
презентация [2,1 M], добавлен 23.02.2017Метод двухфакторного дисперсионного анализа. Оценка степени влияния изучаемых факторов на результирующий экономический показатель. Расчет в системе minitab. Первоначальная оценка модели взаимодействия и без взаимодействия факторов, сравнение результов.
контрольная работа [23,1 K], добавлен 17.11.2010Обработка данных лесной промышленности: получение распределения случайной величины, проверка гипотезы, проведение дисперсионного, корреляционного и регрессивного анализа. Сущность и содержание, особенности применения теории принятия решений, ее принципы.
контрольная работа [314,2 K], добавлен 12.02.2013Проверка гипотез о равенстве систематических погрешностей. Минимизация издержек исследований. Определение максимального значения выходной величины исследуемого процесса. Определение наиболее оптимального выбора стратегии проведения исследований.
курсовая работа [736,3 K], добавлен 31.01.2015Методика расчета показателей вариации по средней арифметической взвешенной. Произведение расчетов по данным интервального вариационного ряда. Построение полигона и гистограммы. Элементы и проведение дисперсионного анализа. Правило сложения дисперсий.
лабораторная работа [67,2 K], добавлен 21.06.2009Формирование выборочной совокупности на примере ранжирования субъектов по размеру заработной платы в порядке возрастания значений. Анализ уровней рядов динамики цен на недвижимость. Индексный анализ данных о продаже товаров. Метод дисперсионного анализа.
контрольная работа [108,5 K], добавлен 17.06.2011Сущность и основные функции группировки статистических показателей. Понятие и виды дисперсионного анализа. Показатели экономической активности, занятости и безработицы населения. Качественные показатели работы порта. Индивидуальный индекс себестоимости.
контрольная работа [107,3 K], добавлен 14.10.2010