Проверка статистической гипотезы однородности математических ожиданий двух независимых выборок: критерий Крамера-Уэлча вместо критерия Стьюдента
Традиционный метод проверки однородности. Классические условия применимости критерия Стьюдента. Область применимости традиционного метода проверки однородности с помощью критерия Стьюдента. Критерий Крамера-Уэлча равенства математических ожиданий.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 20.05.2017 |
Размер файла | 77,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1
Научный журнал КубГАУ, №110(06), 2015 года
Московский государственный технический университет им. Н.Э. Баумана
ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ ОДНОРОДНОСТИ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК: КРИТЕРИЙ КРАМЕРА-УЭЛЧА ВМЕСТО КРИТЕРИЯ СТЬЮДЕНТА
Орлов Александр Иванович
д.э.н., д.т.н., к.ф.-м.н., профессор
Москва
В настоящее время в большинстве научных, технических и экономических исследований используются статистические методы, разработанные в основном в первой трети XX века. Они составляют содержание распространенных учебников. Однако, математическая статистика бурно развивалась и в последующие 60 с лишним лет. В ряде ситуаций назрела необходимость перехода от классических методов к современным. В качестве примера разобрана задача проверки однородности двух независимых выборок. Рассмотрены условия применимости традиционного метода проверки однородности, основанного на использовании статистики t Стьюдента, а также указаны более современные методы. Описана вероятностная модель порождения данных в задаче проверки однородности двух независимых выборок. В терминах этой модели понятие «однородности», т. е. «отсутствие различия», может быть формализовано различными способами. Наивысшая степень однородности достигается, если обе выборки взяты из одной и той же генеральной совокупности (абсолютная однородность). В некоторых случаях целесообразно проверять совпадение некоторых характеристик элементов выборок - математических ожиданий, медиан, дисперсий, коэффициентов вариации и др. (проверка однородности характеристик). Для проверки однородности математических ожиданий часто рекомендуют классический критерий Стьюдента. Предполагают, что выборки взяты из нормальных распределений с одинаковыми дисперсиями. Показано, что для научных технических и экономических данных предпосылки двухвыборочного критерия Стьюдента, как правило, не выполняются. Для проверки однородности математических ожиданий вместо критерия Стьюдента предлагается использовать критерий Крамера-Уэлча. Рассмотрены состоятельные непараметрические критерии Смирнова и Лемана-Розенблатта для проверки абсолютной однородности
Ключевые слова: МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ПРИКЛАДНАЯ СТАТИСТИКА, СТАТИСТИЧЕСКИЕ МЕТОДЫ, НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА, ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ, ДВЕ НЕЗАВИСИМЫЕ ВЫБОРКИ, ПРОВЕРКА ОДНОРОДНОСТИ, ОДНОРОДНОСТЬ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ, КРИТЕРИЙ СТЬЮДЕНТА, КРИТЕРИЙ КРАМЕРА-УЭЛЧА, СОСТОЯТЕЛЬНЫЕ КРИТЕРИИ ОДНОРОДНОСТИ, КРИТЕРИЙ СМИРНОВА, КРИТЕРИЙ ЛЕМАНА-РОЗЕНБЛАТТА
Статистические методы применяются в большинстве научных и прикладных работ в области техники и технологии. Среди наиболее популярных - методы проверки однородности двух независимых выборок.
Началом современного этапа теории статистических методов - математической статистики - можно считать основание К. Пирсоном (К. Pearson) в 1900 г. журнала «Biometrika» [1]. В настоящее время в большинстве научных, технических и экономических исследований используются статистические методы, разработанные в основном в первой трети XX века. Объяснение простое - именно они составляют содержание распространенных учебников. Однако математическая статистика бурно развивалась и в последующие 60 с лишним лет [2, 3]. Кроме решения новых задач, изучались свойства традиционных статистических методов, предлагались новые методы для применения в классических постановках. В ряде ситуаций назрела необходимость перехода от классических методов к современным. В качестве примера, разбор которого составляет основное содержание настоящей статьи, рассмотрим задачу проверки однородности двух независимых выборок.
В математико-статистических терминах постановка задачи такова: имеются две независимые выборки x1, x2,...,xm и y1, y2,...,yn (т. е. наборы из m и п действительных чисел), требуется проверить их однородность. Термин «однородность» уточняется ниже.
Противоположным понятием для «однородности» является «различие». Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения выборки часто объединяют.
Традиционный метод проверки однородности (критерий Стьюдента)
Для дальнейшего критического разбора опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке
,
затем выборочные дисперсии
,
и статистику Стьюдента t, на основе которой принимают решение,
. (1)
По заданному уровню значимости и числу степеней свободы (m + n - 2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t| > tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t| < tкр, то принимают. (При односторонних альтернативных гипотезах вместо условия |t| > tкр проверяют, что t > tкр; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой нами.)
Рассмотрим условия применимости традиционного метода проверки однородности, основанного на использовании статистики t Стьюдента, а также укажем более современные методы.
Вероятностная модель порождения данных
Для обоснованного применения математико-статистических методов необходимо, прежде всего, построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x1, x2,...,xm рассматриваются как результаты m независимых наблюдений некоторой случайной величины Х с функцией распределения F(x), неизвестной статистику, а y1, y2,...,yn - как результаты п независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(x), также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми.
Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев [4, 5].
Если проведено (т + п) измерений линейных размеров деталей, то описанную выше модель, как правило, можно применять. Если же, например, xi и yi - результаты наблюдения одного и того же образца до и после определенного технологического воздействия, то рассматриваемую модель применять нельзя. (В этом случае используют модель т.н. связанных выборок, в которой обычно строят новую выборку zi = xi - yi и используют статистические методы анализа одной выборки, а не двух [6].)
При дальнейшем изложении принимаем описанную выше вероятностную модель двух независимых выборок.
Уточнения понятия однородности
Понятие «однородность», т. е. «отсутствие различия», может быть формализовано в терминах вероятностной модели различными способами.
Наивысшая степень однородности достигается, если обе выборки взяты из одной и той же генеральной совокупности, т. е. справедлива нулевая гипотеза
H0: F(x) = G(x) при всех х.
Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой
H1: F(x0) G(x0)
хотя бы при одном значении аргумента x0. Если гипотеза H0 принята, то выборки можно объединить в одну, если нет - то нельзя. Описанная задача проверки статистических гипотез называется задачей проверки абсолютной однородности.
В некоторых случаях целесообразно проверять не совпадение функций распределения, а совпадение некоторых характеристик случайных величин Х и Y - математических ожиданий, медиан, дисперсий, коэффициентов вариации и др. В таких случаях говорят о проверке однородности соответствующих характеристик. Например, однородность математических ожиданий означает, что справедлива гипотеза
H'0: М(X) = М(Y),
где М(X) и М(Y) - математические ожидания случайных величин Х и Y, результаты наблюдений над которыми составляют первую и вторую выборки соответственно. Различие между выборками в рассматриваемом случае - это справедливость альтернативной гипотезы
H'1: М(X) М(Y).
Если гипотеза H0 верна, то и гипотеза H'0 верна, но из справедливости H'0 не следует справедливость H0. В частности, если в результате обработки выборочных данных принята гипотеза H'0, то отсюда не следует, что две выборки можно объединить в одну. Однако в ряде ситуаций целесообразна проверка именно гипотезы H'0. Например, пусть концентрация SiO2 в мартеновском шлаке определяется весовым (первая выборка) или фотоколориметрическим (вторая выборка) методами. Тогда важно проверить гипотезу об отсутствии систематических расхождений результатов весового и фотоколориметрического методов [4], т.е. гипотезу о равенстве математических ожиданий. Другой пример - из медицины труда. Пусть изучается эффективность лечения определенного профессионального заболевания двумя препаратами; результаты наблюдения - число дней нетрудоспособности, а показатель эффективности лечения - среднее число дней нетрудоспособности на одного больного. Тогда для сравнения эффективности препаратов достаточно проверить гипотезу H'0.
Классические условия применимости критерия Стьюдента
Пусть выполнены два классических условия применимости критерия Стьюдента, основанного на использовании статистики t, заданной формулой (1):
а) результаты наблюдений имеют нормальные распределения:
F(x) = N(x; m1, 12) и G(x) = N(x; m2, 22)
с математическими ожиданиями m1 и m2 и дисперсиями 12 и 22 в первой и во второй выборках соответственно;
б) дисперсии результатов наблюдений в первой и второй выборках совпадают:
D(X) = 12 = D(Y)=22.
Если условия а) и б) выполнены, то нормальные распределения F(x) и G(x) отличаются только математическими ожиданиями, а поэтому обе гипотезы H0 и H'0 сводятся к гипотезе
H"0: m1 = m2,
а обе альтернативные гипотезы H1 и H'1 сводятся к гипотезе
H"1: m1 m2.
Если условия а) и б) выполнены, то статистика t при справедливости H"0 имеет распределение Стьюдента с (т + п - 2) степенями свободы. Только в этом случае описанный выше традиционный метод обоснован безупречно. Если хотя бы одно из условий а) и б) не выполнено, то нет оснований считать, что статистика t имеет распределение Стьюдента, поэтому применение традиционного метода, строго говоря, не обосновано. Обсудим возможность проверки этих условий и последствия их нарушений.
О проверке условия нормальности
Априори нет оснований предполагать нормальность распределения результатов научных, технических или экономических наблюдений. Следовательно, нормальность надо проверять. Разработано много статистических критериев для проверки нормальности распределения результатов наблюдений [4]. Однако проверка нормальности - более сложная и трудоемкая статистическая процедура, чем проверка однородности (как с помощью статистики t Стьюдента, так и с использованием непараметрических критериев, рассматриваемых ниже).
Для достаточно надежного установления нормальности требуется весьма большое число наблюдений. Так, чтобы гарантировать, что функция распределения результатов наблюдений отличается от некоторой нормальной не более чем на 0,01 (при любом значении аргумента), требуется порядка 2500 наблюдений [7]. В большинстве научных, технических или экономических исследований число наблюдений существенно меньше.
Есть и одна общая (для всех видов измерений) причина отклонений от нормальности: любой результат наблюдения записывается конечным (обычно не более 2 - 5) количеством цифр, а с математической точки зрения вероятность такого события равна 0 для любой непрерывной функции распределения [8].
Из сказанного выше следует, что распределение результатов научных, технических или экономических наблюдений практически всегда более или менее отличается от нормального. Более подробно это утверждение обосновано в [9].
Последствия нарушения условия нормальности
Если условие а) не выполнено, то распределение статистики t не является распределением Стьюдента. Однако при справедливости гипотезы H'0 и условия б) распределение t при росте объемов выборок приближается к стандартному нормальному распределению Ф(х)=N(x; 0, 1). К этому же распределению приближается распределение Стьюдента при возрастании числа степеней свободы. Другими словами, несмотря на нарушение условия нормальности традиционный метод (критерий Стьюдента) можно использовать для проверки гипотезы H'0 при больших объемах выборок. При этом вместо таблиц распределения Стьюдента достаточно пользоваться таблицами стандартного нормального распределения Ф(х).
Сформулированное в предыдущем абзаце утверждение справедливо для любых функций распределения F(x) и G(x) таких, что М(X) = М(Y), D(X) = D(Y) и выполнены некоторые внутриматематические условия, обычно считающиеся справедливыми в реальных задачах [10 - 12]. Если же М(X) М(Y), то при больших объемах выборок
P(t < x) Ф(x - amn), (2)
Где
. (3)
Формулы (2) - (3) позволяют приближенно вычислять мощность t-критерия (точность возрастает при увеличении т и п).
О проверке условия равенства дисперсий
Иногда условие б) вытекает из методики получения результатов наблюдений, например, когда с помощью одного и того же прибора m раз измеряют характеристику первого объекта и п раз - второго, а параметры распределения погрешностей измерения при этом не меняются. Однако ясно, что в постановках большинства исследовательских и практических задач нет основании априори предполагать равенство дисперсий.
Целесообразно ли проверять равенство дисперсий статистическими методами, например, как это иногда предлагают, с помощью F-критерия Фишера? Этот критерий основан на нормальности распределений результатов наблюдений, от которой неизбежны отклонения (см. выше), причем в отличие от t-критерия его распределение сильно меняется при малых отклонениях от нормальности [10, 13]. Кроме того, F-критерий отвергает гипотезу D(X) = D(Y) лишь при большом различии выборочных дисперсий. Так, для данных [4] о двух группах результатов химических анализов отношение выборочных дисперсий равно 1,95, т.е. существенно отличается от 1. Тем не менее гипотеза о равенстве теоретических дисперсий принимается на 1% уровне значимости. Следовательно, при проверке однородности применение F-критерия для предварительной проверки равенства дисперсий нецелесообразно.
К такому же выводу с точки зрения теории математической статистики пришли авторы статьи [14].
Итак, в большинстве научных, технических и экономических задач условие б) нельзя считать выполненным, а проверять его нецелесообразно.
Последствия нарушения условия равенства дисперсий
Если объемы выборок т и п велики, то распределение статистики t описывается с помощью только математических ожиданий М(X) и М(Y), дисперсий D(X), D(Y) и отношения объемов выборок:
P(t < x) Ф(bmnx - amn), (4)
где amn определено формулой (3),
. (5)
Если bmn 1, то распределение статистики t отличается от распределения, заданного формулой (2), полученной в предположении равенства дисперсий. Когда bmn=1? В двух случаях - при m = n и при D(X) = D(Y). Таким образом, при больших и равных объемах выборок требовать выполнения условия б) нет необходимости. Если объемы выборок мало различаются, то bmn близко к 1.
Так, для данных [4] имеем b*mn= 0,987, где b*mn - оценка bmn, полученная заменой в формуле (5) теоретических дисперсий на выборочные.
Область применимости традиционного метода проверки однородности с помощью критерия Стьюдента
Подведем итоги рассмотрения t-критерия. Он позволяет проверять гипотезу H'0 о равенстве математических ожиданий, но не гипотезу H0 о том, что обе выборки взяты из одной и той же генеральной совокупности. Классические условия применимости критерия Стьюдента в подавляющем большинстве научных, технических и экономических задач не выполнены. Тем не менее при больших и примерно равных объемах выборок его можно применять.
При конечных объемах выборок традиционный метод носит неустранимо приближенный характер. При значительном различии объемов и дисперсий выборок распределение статистики Стьюдента значительно отличается от распределения Стьюдента. Вместе с тем влияние отклонений распределений элементов выборок от нормальности при росте объемов выборок уменьшается и в асимптотике исчезает.
В соответствии с выводами методологии статистических методов [8] предполагаем, что элементы выборок имеют математические ожидания и дисперсии. По нашей экспертной оценке, выход за пределы этого предположения имеет лишь внутриматематический интерес.
Критерий Крамера - Уэлча равенства математических ожиданий
Вместо критерия Стьюдента предлагаем для проверки H'0 использовать критерий Крамера - Уэлча, основанный на статистике
. (6)
математический ожидание крамер стьюдент
Критерий Крамера-Уэлча имеет прозрачный смысл - разность выборочных средних арифметических для двух выборок делится на естественную оценку среднего квадратического отклонения этой разности. Естественность указанной оценки состоит в том, что неизвестные статистику дисперсии заменены их выборочными оценками. Из многомерной центральной предельной теоремы и из теорем о наследовании сходимости [12, 15] вытекает, что при росте объемов выборок распределение статистики Т сходится к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Итак, при справедливости H'0 и больших объемах выборок распределение статистики Т приближается с помощью стандартного нормального распределения Ф(х), из таблиц которого предлагаем брать критические значения.
Критерий на основе статистики (6) извлечен нами из классической монографии Г. Крамера [16], признанной отечественной вероятностно-статистической научной школой базовым учебником по математической статистике. Критерием Крамера - Уэлча он назван нами в статьях [17, 18], в честь шведа Г. Крамера и англичанина Б.Л. Уэлча, который изучал распределение статистики T для выборок из нормальных распределений [19, 20]. Работы Уэлча продолжила В.И. Пагурова [21].
При т = п, как следует из формул (1) и (6), статистики критериев Стьюдента и Крамера - Уэлча совпадают, t = T. При т п этого равенства нет, статистики критериев Стьюдента и Крамера - Уэлча различны. В частности, под корнем в знаменателе перед выборочной дисперсией sx2 в (1) стоит множитель (m - 1), а в (6)- множитель п.
Если М(X) М(Y), то при больших объемах выборок
P(T < X) Ф(x - cmn), (7)
Где
. (8)
При т = п или D(X) = D(Y), согласно формулам (3) и (8), amn=cmn, в остальных случаях равенства нет.
Из сказанного выше следует, что применение критерия Крамера - Уэлча не менее обосновано, чем применение критерия Стьюдента. Дополнительное преимущество - не требуется равенства дисперсий D(X) = D(Y). Распределение статистики Т не является распределением Стьюдента, однако и распределение статистики t, как показано выше, не является таковым в реальных ситуациях.
Распределение статистики Т при объемах выборок т = п = 6, 8, 10, 12 и различных функциях распределений выборок F(x) и G(x) изучено нами совместно с Ю.Э. Камнем и Я.Э. Камнем методом статистических испытаний (Монте-Карло). Рассмотрены различные варианты функций распределения F(x) и G(x). Результаты показывают, что даже при таких небольших объемах выборок точность аппроксимации предельным стандартным нормальным распределением вполне удовлетворительна. Подробные результаты этого исследования будут опубликованы в одной из дальнейших статей.
Исходя из сказанного выше, представляется целесообразным во всех тех случаях, когда в настоящее время используется критерий Стьюдента, заменить его на критерий Крамера - Уэлча. Конечно, такая замена потребует переделки ряда нормативно-технических и методических документов, исправления учебников и учебных пособий для вузов.
Непараметрические методы проверки однородности
В большинстве научных, технических и экономических задач представляет интерес не проверка равенства математических ожиданий, а обнаружение различия генеральных совокупностей, из которых извлечены выборки, т.е. проверка гипотезы H0. Методы проверки гипотезы H0 позволяют обнаружить не только изменение математического ожидания, но и любые иные изменения функции распределения результатов наблюдений при переходе от одной выборки к другой (увеличение разброса, появление асимметрии и т. д.). Как установлено выше, методы, основанные на использовании статистик t Стьюдента и Т Крамера - Уэлча, не позволяют проверять гипотезу H0. Априорное предположение о принадлежности функций распределения F(x) и G(x) к какому-либо определенному параметрическому семейству (например, семействам нормальных, логарифмически нормальных, распределений Вейбулла-Гнеденко, гамма-распределений и др.) обычно нельзя достаточно надежно обосновать. Поэтому для проверки H0 следует использовать методы, пригодные при любом виде F(x) и G(x), т.е. непараметрические методы [22]. (Термин «непараметрический метод» означает, что при использовании этого метода нет необходимости предполагать, что функции распределения результатов наблюдений принадлежат какому-либо определенному параметрическому семейству.)
Для проверки гипотезы H0 разработано много непараметрических методов - критерии Смирнова, типа омега-квадрат (Лемана-Розенблатта), Вилкоксона (Манна-Уитни), Ван-дер-Вардена, Сэвиджа, хи-квадрат и др. [4, 5, 23]. Распределения статистик всех этих критериев при справедливости H0 не зависят от конкретного вида совпадающих функций распределения F(x) G(x). Следовательно, таблицами точных и предельных (при больших объемах выборок) распределений статистик этих критериев и их процентных точек [4, 23] можно пользоваться при любых непрерывных функциях распределения результатов наблюдений.
Каким из непараметрических критериев пользоваться
Как известно [13], для выбора одного из нескольких критериев необходимо сравнить их мощности, определяемые видом альтернативных гипотез. Сравнению мощностей критериев посвящена обширная литература [24].
Хорошо изучены свойства критериев при альтернативной гипотезе сдвига
H1c: G(x) = F(x - d), d 0.
Критерии Вилкоксона, Ван-дер-Вардена и ряд других ориентированы для применения именно в этой ситуации. Если m раз измеряют характеристику одного объекта и п раз - другого, а функция распределения погрешностей измерения произвольна, но не меняется при переходе от объекта к объекту (это более жесткое требование, чем условие равенства дисперсий), то рассмотрение гипотезы H1c оправдано. Однако в большинстве научных, технических и экономических исследований, в частности при анализе данных об измерениях концентрация SiO2 в мартеновском шлаке весовым или фотоколориметрическим методами, нет оснований считать, что функции распределения, соответствующие выборкам, различаются только сдвигом.
В соответствии с теорией математической статистики естественно потребовать, чтобы рекомендуемый для массового использования в технических и технико-экономических исследованиях критерий однородности был состоятельным [13]. Это значит, что для любых отличных друг от друга функций распределения F(x) и G(x) (другими словами, при справедливости H1) вероятность отклонения гипотезы H0 должна стремиться стремилась к 1 при увеличении объемов выборок т и п. Из перечисленных выше критериев состоятельными являются только критерии Смирнова и омега-квадрат. В частности, критерий Вилкоксона не позволяет отвергнуть гипотезу H0 для таких функций распределения F(x) и G(x), что
. (9)
Если F(x) и G(x) не совпадают, но удовлетворяют соотношению (9), то при больших т и п гипотеза H0 принимается столь же часто, как и в случае совпадающих F(x) G(x). Подробнее это свойство критерия Вилкоксона разобрано в статьях [25, 26].
Проведенное нами совместно с Ю.Э.Камнем и Я.Э.Камнем исследование мощности (методом статистических испытаний) первых четырех из перечисленных выше критериев (при различных вариантах функций распределения F(x) и G(x) подтвердило преимущество критериев Смирнова и омега-квадрат и при объемах выборок 6 - 12.
Критерий Смирнова однородности двух выборок
Он предложен членом-корреспондентом АН СССР Н.В. Смирновым в 1939 г. [27]. Единственное ограничение - функции распределения F(x) и G(x) должны быть непрерывными. Напомним, что согласно Л.Н. Большеву и Н.В. Смирнову [4] значение эмпирической функции распределения в точке х равно доле результатов наблюдений в выборке, меньших х. Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно. Значение статистики Смирнова
сравнивают с соответствующим критическим значением [4] и по результатам сравнения принимают или отклоняют гипотезу Н0. Практически значение статистики Dm,п рекомендуется [4] вычислять по формулам
,
,
,
где x'1<x'2<…x'm - элементы первой выборки x1, x2, …, xm, переставленные в порядке возрастания, а y'1<y'2<…y'n - элементы второй выборки y1, y2, …, yn, также переставленные в порядке возрастания (вероятность совпадения каких-либо элементов выборок равна 0 в силу непрерывности функция распределения F(x) и G(x)).
Разработаны алгоритмы и программы для ЭВМ, позволяющие рассчитывать точные распределения, процентные точки и достигаемый уровень значимости для статистики Смирнова [4, 28, 29], разработаны подробные таблицы [30].
Однако у критерия Смирнова есть и недостатки. Его распределение сосредоточено в сравнительно небольшом числе точек, поэтому функция распределения растет большими скачками. В результате не удается выдержать заданный уровень значимости, реальный уровень значимости может в несколько раз отличаться от номинального [31].
Критерий типа омега-квадрат (Лемана - Розенблатта)
Статистика критерия типа омега-квадрат (о термине см. [32]) для проверки однородности двух независимых выборок имеет вид:
A = Fm(x) - Gn(x))2 dHm+n(x),
где Hm+n(x) - эмпирическая функция распределения, построенная по объединенной выборке,
Hm+n(x) = Fm(x) + Gn(x).
Статистика A типа омега-квадрат была предложена Э. Леманом в 1951 г. [33], изучена М. Розенблаттом в 1952 г. [34] и другими исследователями. Поэтому мы называем основанный на ней критерий однородности двух независимых выборок критерием Лемана - Розенблатта. Статистика А является непараметрической и ранговой [22], поскольку она зависит лишь от рангов элементов двух выборок в объединенной выборке:
где ri - ранг x'i и sj - ранг y'j в общем вариационном ряду, построенном по объединенной выборке [4].
Рекомендации по выбору критерия однородности
Состоятельные критерии Смирнова и Лемана - Розенблатта для проверки абсолютной однородности двух независимых выборок, включая алгоритмы расчетов, рассмотрены в [35].
В отличие от критерия Смирнова, для критерия типа омега-квадрат Лемана - Розенблатта нет выраженного эффекта различия между номинальными и реальными уровнями значимости [31]. Поэтому мы рекомендуем для проверки однородности функций распределения (гипотеза H0) применять статистику А типа омега-квадрат. Если методическое, табличное или программное обеспечение для статистики Лемана-Розенблатта отсутствует, рекомендуем использовать критерий Смирнова. Для проверки однородности математических ожиданий (гипотеза H'0) целесообразно применять критерий Крамера-Уэлча. По нашему мнению, статистики Стьюдента, Вилкоксона и др. допустимо использовать лишь в отдельных частных случаях, рассмотренных выше.
О внедрении современных методов прикладной статистики в практику технических и технико-экономических исследований
Даже из проведенного выше разбора лишь одной из типичных статистических задач - задачи проверки однородности двух независимых выборок - можно сделать вывод о целесообразности организации работ по критическому анализу сложившейся в научных, технических и экономических исследованиях практики статистической обработки данных и по внедрению накопленного арсенала современных методов прикладной статистики [7]. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и подразделениями [36, 37]. Целесообразно создание службы статистических консультаций в системе научно-исследовательских учреждений и вузов технического и организационно-экономического профиля, идею которой в свое время пропагандировал В.В. Налимов [38].
Литература
1. Орлов А.И. Основные этапы становления статистических методов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 97. С. 73-85.
2. Орлов А.И. Современная прикладная статистика // Заводская лаборатория. Диагностика материалов. 1998. Т.64. № 3. С. 52-60.
3. Орлов А.И. Основные черты новой парадигмы математической статистики // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2013. № 90. С. 45-71.
4. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики / 3-е изд. М.: Наука, 1983. 474 с.
5. Гаек Я., Шидак 3. Теория ранговых критериев / Пер. с англ. М.: Наука, 1971. 376 с.
6. Орлов А.И. Методы проверки однородности связанных выборок // Заводская лаборатория. Диагностика материалов. 2004. Т. 70. № 7. С. 57-61.
7. Орлов А.И. Прикладная статистика. М.: Экзамен, 2006. 671 с.
8. Орлов А.И. О методологии статистических методов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 104. С. 53-80.
9. Орлов А.И. Часто ли распределение результатов наблюдений является нормальным? // Заводская лаборатория. Диагностика материалов. 1991. Т.57. № 7. С. 64-66.
10. Шеффе Г. Дисперсионный анализ / Пер. с англ. / 2-е изд. М.: Наука, 1980. 512 с.
11. Елисеев В.Г. Асимптотическое разложение для распределения статистики критерия проверки гипотезы о равенстве средних // Прикладная статистика. Ученые записки по статистике, т.45. М.: Наука, 1983. С. 265-267.
12. Орлов А.И. Теоретические инструменты статистических методов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 101. С. 253 - 274.
13. Боровков А.А. Математическая статистика. М.: Наука, 1984. 472 с.
14. Славова В.В., Чибисов Д.М. О предварительном тестировании в задаче Беренса-Фишера // Обозрение прикладной и промышленной математики. 2007. Т.16. Вып.2. С. 210-225.
15. Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979, - 296 с.
16. Крамер Г. Математические методы статистики / Пер. с англ. / 2-е изд. М.: Мир, 1975. 648 с.
17. Орлов А.И. О применении статистических методов в медико-биологических исследованиях // Вестник Академии медицинских наук СССР. 1987. № 2. С. 88-94.
18. Орлов А.И. О проверке однородности двух независимых выборок // Заводская лаборатория. Диагностика материалов. 2003. Т.69. № 1. С. 55-60.
19. Wеlсh В.L. The significance of the difference between two means when the population variances are unequal // Biometrika. 1938. V.29. Pp. 350-362.
20. Wеlсh В.L. The generalization of Student's problem when several different population variances are involved // Biometrika. 1947. V.34. Pp. 28-35.
21. Пагурова В.И. О сравнении средних значений в двух нормальных выборках // Теория вероятностей и ее применения. 1968. Т.13. № 3. С. 561-568.
22. Орлов А.И. Современное состояние непараметрической статистики // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2015. № 106. С. 239-269.
23. Холлендер М., Вулф Д.А. Методы непараметрической статистики / Пер. с англ. М.: Финансы и статистика, 1983. 518 с.
24. Никитин Я.Ю. Асимптотическая эффективность непараметрических критериев. М.: Наука, 1995. 238 с.
25. Орлов А.И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? // Заводская лаборатория. Диагностика материалов. 1999. Т.65. № 1. С. 51-55.
26. Орлов А.И. Двухвыборочный критерий Вилкоксона - анализ двух мифов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 104. С. 91 - 111.
27. Смирнов Н.В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках // Бюллетень МГУ. 1939. Т. 2. № 2. С.3-14.
28. Орлов А.И., Орловский И.В. Оценка остаточного члена порядка n-2 для функции распределения двухвыборочной статистики Смирнова // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1978. С.100-109.
29. Орлов А.И. Методы оценки близости допредельных и предельных распределений статистик // Заводская лаборатория. Диагностика материалов. 1998. Т.64. №5. С. 64-67.
30. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества / Орлов А.И., Фомин В.Н., Черномордик О.М. и др. М.: ВНИИСтандартизации, 1987. 116 с.
31. Камень Ю.Э., Камень Я.Э., Орлов А.И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез // Заводская лаборатория. Диагностика материалов. 1986. Т. 52. № 12. С. 55-57.
32. Орлов А.И. Непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат и ошибки при их применении // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 97. С. 31-45.
33. Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests / Annals of Mathematical Statistics. 1951. V.22. № 1. Pp.165-179.
34. Rosenblatt M. Limit theorems associated with variants of the von Mises statistic // Annals of Mathematical Statistics. 1952. V.23. № 4. Pp. 617-623.
35. Орлов А.И. Состоятельные критерии проверки абсолютной однородности независимых выборок // Заводская лаборатория. Диагностика материалов. 2012. Т.78. №11. С. 66-70.
36. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов. // Заводская лаборатория. Диагностика материалов. 1992. Т.58. №1. С. 67-74.
37. Орлов А.И. Проблемы внедрения математических и инструментальных методов контроллинга // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2015. № 107. С. 1017 - 1048.
38. Налимов В.В. Теория эксперимента. М.: Наука, 1971. 208 с.
Размещено на Allbest.ru
Подобные документы
Критерий согласия – критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности. Критерий Колмогорова-Смирнова и его практическое применение. Критические значения статистик Стефенса. Критерии Пирсона и Смирнова-Крамера.
курсовая работа [629,9 K], добавлен 26.08.2012Исследование популярности и количества просмотренных фильмов отечественных и зарубежных кинокомпаний сайта megogo.net. Определение частоты встречаемости "отечественных" фильмов. Применение критерия Стьюдента и теста экстремальных реакций Мозеса.
курсовая работа [126,3 K], добавлен 18.12.2015Статистическая гипотеза о независимости логарифмической доходности за различные интервалы времени при различных объемах торгов. Сущность критерия Колмогорова. Проверка гипотез для модельных данных. Выбор альтернативной гипотезы и оценка мощности критерия.
курсовая работа [511,2 K], добавлен 03.03.2015Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Определение среднего квадратичного отклонения. Расчет значения критерия Стьюдента, значения доверительных границ с его учетом. Обоснование выбора математической модели прогнозирования. Параметры по методу наименьших квадратов, наработка до отказа.
контрольная работа [394,1 K], добавлен 18.06.2014- Закон больших чисел. Проверка статистических гипотез (критерий согласия w2 Мизеса: простая гипотеза)
Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).
курсовая работа [1,0 M], добавлен 27.01.2012 Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Проверка выполнимости теоремы Бернулли на примере вероятности прохождения тока по цепи. Моделирование дискретной случайной величины, имеющей закон распределения Пуассона. Подтверждение гипотезы данного закона распределения с помощью критерия Колмогорова.
курсовая работа [134,2 K], добавлен 31.05.2010Преподавательская работа швейцарского математика Габриэля Крамера, введение в анализ алгебраических кривых. Система произвольного количества линейных уравнений с квадратной матрицей Крамера. Классификация и порядок математических и алгебраических кривых.
реферат [47,6 K], добавлен 17.05.2011