Методы оценивания параметра. Метод моментов и метод максимального правдоподобия. Свойства оценок
Понятие оценивания и доверительной области, определение параметра генеральной совокупности. Использование метода выборочных моментов в прикладной статистике, применение системы уравнений максимального правдоподобия. Оценка параметров гамма-распределения.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 26.01.2011 |
Размер файла | 201,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
Новосибирский государственный технический Университет
Кафедра прикладной математики
Курсовая работа
по дисциплине «Математическая статистика»
на тему: «Методы оценивания параметра. Метод моментов и метод максимального правдоподобия. Свойства оценок»
Выполнила
Преподаватель:
Новосибирск 2010
Содержание
Введение
1. Методы оценивания параметров
1.1 Метод моментов
1.2 Метод максимального правдоподобия
Заключение
Список литературы
Приложение
Введение
Оценивание - это определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального (экономического, технического и др.) явления или процесса по результатам наблюдений. Иногда формулируют более коротко: оценивание - это определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений. При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределенных согласно биномиальному закону, оценивают число - параметр р (вероятность успеха). По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трех чисел - параметры формы а, масштаба b и сдвига с. Способ оценивания функции распределения дается теоремами В.И. Гливенко и А.Н. Колмогорова. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и т.д. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий (объектов) по качеству, формулировка правил технической или медицинской диагностики и т.д. (Упорядочения в математической статистике называют также ранжировками. Это один из видов объектов нечисловой природы).
Оценивание проводят с помощью оценок - статистик, являющихся основой для оценивания неизвестного параметра распределения. В ряде литературных источников термин «оценка» встречается в качестве синонима термина «оценивание». Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: оценивание - это действие, а оценка - статистика (функция от результатов наблюдений), используемая в процессе указанного действия или являющаяся его результатом. Иными словами статистикой называется всякая случайная величина, являющаяся функцией от выборки Х.
Оценивание бывает двух видов - точечное оценивание и оценивание с помощью доверительной области. Точечное оценивание - способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.
Пример 2. Пусть результаты наблюдений x1, x2,…, xn рассматривают в вероятностной модели как случайную выборку из нормального распределения N(m,у). Т.е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N(m,у) с некоторыми математическим ожиданием m и средним квадратическим отклонением у, неизвестными статистику. Требуется оценить параметры m и у (или у2) по результатам наблюдений. Оценки обозначим m* и (у2)* соответственно. Обычно в качестве оценки m* математического ожидания m используют выборочное среднее арифметическое , а в качестве оценки (у2)* дисперсии у2 используют выборочную дисперсию s2, т.е.
m* = , (у2)* = s2.
Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана , полусумма минимального и максимального членов вариационного ряда
m** = [x(1)+x(n)]/2
и др. Для оценивания дисперсии у2 также имеется ряд оценок, в частности, (см. выше) и оценка, основанная на размахе R, имеющая вид
(у2)** = [a(n)R]2,
где коэффициенты a(n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения
M[a(n)R] = у.
Если речь идет об оценивании нескольких числовых параметров, или же функции, упорядочения и т.п., то говорят об оценивании с помощью доверительной области.
Доверительная область - это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. «Заданная вероятность» называется доверительной вероятностью и обычно обозначается г. Пусть И - пространство параметров. Рассмотрим статистику И1 = И1(x1, x2,…, xn) - функцию от результатов наблюдений x1, x2,…, xn, значениями которой являются подмножества пространства параметров И. Так как результаты наблюдений - случайные величины, то И1 - также случайная величина, значения которой - подмножества множества И, т.е. И1 - случайное множество. Напомним, что множество - один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы.
Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки (упорядочения) - это отдельные виды случайных величин.
И1 называется доверительной областью, соответствующей доверительной вероятности г, если
Доверительный интервал - это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Доверительная вероятность г - вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным.
Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.
Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.
1. Методы оценивания параметров
В прикладной статистике используются разнообразные параметрические модели. Термин «параметрический» означает, что вероятностно-статистическая модель полностью описывается конечномерным вектором фиксированной размерности. Причем эта размерность не зависит от объема выборки.
Рассмотрим выборку x1, x2,…, xn из распределения с плотностью f(x;и0), где f(x;и0) - элемент параметрического семейства плотностей распределения вероятностей {f(x;и), иєИ}. Здесь И - заранее известное k-мерное пространство параметров, являющееся подмножеством евклидова пространства Rk, а конкретное значение параметра и0 статистику неизвестно. Обычно в прикладной статистике применяются параметрические семейства с k = 1,2,3 (см. главу 1.2). В статистике нечисловых данных вместо плотности часто рассматриваются вероятности попадания в точки. Напомним, что в параметрических задачах оценивания принимают вероятностную модель, согласно которой результаты наблюдений x1, x2,…, xn рассматривают как реализации n независимых случайных величин.
Задача оценивания состоит в том, чтобы оценить неизвестное статистику значение параметра и0 наилучшим (в каком-либо смысле) образом.
1.1 Метод моментов
С какой оценки начинать? Одним из наиболее известных и простых в употреблении методов является метод моментов. Название связано с тем, что этот метод опирается на использование выборочных моментов
где x1, x2,…, xn - выборка, т.е. набор независимых одинаково распределенных случайных величин с числовыми значениями.
В прикладной статистике метод анализа данных называется методом моментов, если он использует статистику
(1)
где g: Rq > Rk - некоторая функция (здесь k - число неизвестных числовых параметров). Чаще всего термин «метод моментов» используют, когда речь идет об оценивании параметров. В этом случае обычно предполагают, что плотность вероятности распределения элементов выборки f(x) входит в заранее известное статистику параметрическое семейство {f(x;и), иєИ}, т.е. f(x) = f(x;и0) при некотором и0. Здесь И - заранее заданное k-мерное пространство параметров, являющееся подмножеством евклидова пространства Rk, а конкретное значение параметра и0 статистику неизвестно, его и следует оценить. Известно также, что неизвестный параметр определяется с помощью известной статистику функции через начальные моменты элементов выборки:
(2)
В методе моментов в качестве оценки и0 используют статистику Yn вида (1), которая отличается от формулы (1) тем, что теоретические моменты заменены выборочными.
Статистики Yn вида (1) применяются не только для оценивания параметров, но и для непараметрического оценивания характеристик случайной величины, таких, как коэффициент вариации, и для проверки гипотез. Во всех случаях применения статистики Yn вида (1) говорят о методе моментов.
Распределение вектора Yn во всех практически важных случаях является асимптотически нормальным. Это утверждение опирается на следующий общий факт.
Пусть случайный вектор Zn є Rq асимптотически нормален с математическим ожиданием z? и ковариационной матрицей ||cij||/n, а функция h: Rq > R1 достаточно гладкая. Тогда случайная величина h(Zn) асимптотически нормальна с математическим ожиданием h(z?) и дисперсией
(3)
Для получения асимптотического распределения статистики Yn вида (1) можно применить метод линеаризации к асимптотически нормальному вектору выборочных моментов (Mn1, Mn2, …, Mnq) и функции g из формулы (1).
Для применения формулы (3) необходимо использовать асимптотические дисперсии и ковариации выборочных моментов, т.е. величины, обозначенные в формуле (3) как crs. Эти величины имеют вид:
(4)
Здесь мr - теоретический центральный момент порядка r, т.е.
Таким образом, для получения асимптотического распределения случайной величины Yn вида (1) достаточно знать теоретические центральные моменты результатов наблюдений и вид функции g.
Однако моменты неизвестны. Их приходится оценивать. В соответствии с теоремами о наследовании сходимости для нахождения асимптотического распределения функции от выборочных моментов можно воспользоваться не теоретическими моментами, а их состоятельными оценками. Эти оценки можно получить разными способами. Можно непосредственно применить формулы (4), заменив теоретические моменты выборочными. Можно выразить моменты через параметры рассматриваемого распределения.
Для оценивания параметров гамма-распределения воспользуемся известной формулой, согласно которой для случайной величины Х, имеющей гамма-распределение с параметрами формы а, масштаба b =1 и сдвига c=0,
(5)
Следовательно, M(X) = a, M(X2) = a(a+1), D(X) = M(X2) - (M(X))2 = a(a+1) - a2 = a. Найдем третий центральный момент M(X - M(X))3. Справедливо равенство
M(X - M(X))3 = M(X3) - 3 M(X2) M(X) + 3 M(X) (M(X))2 - (M(X))3
Из равенства (6) вытекает, что
M(X - M(X))3 = a(a+1)(a+2) - 3 a (a+1) a + 3 a a2 - a3 = 2a.
Если Y - случайная величина, имеющая гамма-распределение с произвольными параметрами формы a, масштаба b и сдвига c, то Y = bX + c. Следовательно, M(Y) = ab+c, D(Y) = ab2, M(Y - M(Y))3 = 2 a b3.
Метод моментов является универсальным. Однако получаемые с его помощью оценки лишь в редких случаях обладают оптимальными свойствами. Поэтому в прикладной статистике применяют и другие виды оценок.
1.2 Метод максимального правдоподобия
В работах, предназначенных для первоначального знакомства с математической статистикой, обычно рассматривают оценки максимального правдоподобия (сокращенно ОМП):
(6)
Таким образом, сначала строится плотность распределения вероятностей, соответствующая выборке. Поскольку элементы выборки независимы, то эта плотность представляется в виде произведения плотностей для отдельных элементов выборки. Совместная плотность рассматривается в точке, соответствующей наблюденным значениям. Это выражение как функция от параметра (при заданных элементах выборки) называется функцией правдоподобия. Затем тем или иным способом ищется значение параметра, при котором значение совместной плотности максимально. Это и есть оценка максимального правдоподобия.
Хорошо известно, что оценки максимального правдоподобия входят в класс наилучших асимптотически нормальных оценок. Однако при конечных объемах выборки в ряде задач ОМП недопустимы, т.к. они хуже (дисперсия и средний квадрат ошибки больше), чем другие оценки, в частности, несмещенные. Именно поэтому в ГОСТ 11.010-81 для оценивания параметров отрицательного биномиального распределения используются несмещенные оценки, а не ОМП. Из сказанного следует априорно предпочитать ОМП другим видам оценок можно - если можно - лишь на этапе изучения асимптотического поведения оценок.
В отдельных случаях ОМП находятся явно, в виде конкретных формул, пригодных для вычисления.
В большинстве случаев аналитических решений не существует, для нахождения ОМП необходимо применять численные методы. Так обстоит дело, например, с выборками из гамма-распределения или распределения Вейбулла-Гнеденко. Во многих работах каким-либо итерационным методом решают систему уравнений максимального правдоподобия или впрямую максимизируют функцию правдоподобия.
Однако применение численных методов порождает многочисленные проблемы. Сходимость итерационных методов требует обоснования. В ряде примеров функция правдоподобия имеет много локальных максимумов, а потому естественные итерационные процедуры не сходятся. Для данных ВНИИ железнодорожного транспорта по усталостным испытаниям стали уравнение максимального правдоподобия имеет 11 корней. Какой из одиннадцати использовать в качестве оценки параметра?
Как следствие осознания указанных трудностей, стали появляться работы по доказательству сходимости алгоритмов нахождения оценок максимального правдоподобия для конкретных вероятностных моделей и конкретных алгоритмов.
Однако теоретическое доказательство сходимости итерационного алгоритма - это еще не всё. Возникает вопрос об обоснованном выборе момента прекращения вычислений в связи с достижением требуемой точности. В большинстве случаев он не решен.
Но и это не все. Точность вычислений необходимо увязывать с объемом выборки - чем он больше, тем точнее надо находить оценки параметров, в противном случае нельзя говорить о состоятельности метода оценивания. Более того, при увеличении объема выборки необходимо увеличивать и количество используемых в компьютере разрядов, переходить от одинарной точности расчетов к двойной и далее - опять-таки ради достижения состоятельности оценок.
Таким образом, при отсутствии явных формул для оценок максимального правдоподобия нахождение ОМП натыкается на ряд проблем вычислительного характера. Специалисты по математической статистике позволяют себе игнорировать все эти проблемы, рассуждая об ОМП в теоретическом плане. Однако прикладная статистика не может их игнорировать. Отмеченные проблемы ставят под вопрос целесообразность практического использования ОМП.
Пример 1. В статистических задачах стандартизации и управления качеством используют семейство гамма-распределений. Плотность гамма-распределения имеет вид
(7)
Плотность вероятности в формуле (7) определяется тремя параметрами a, b, c, где a>2, b>0. При этом a является параметром формы, b - параметром масштаба и с - параметром сдвига. Множитель 1/Г(а) является нормировочным, он введен, чтобы
Здесь Г(а) - одна из используемых в математике специальных функций, так называемая "гамма-функция", по которой названо и распределение, задаваемое формулой (7),
Подробные решения задач оценивания параметров для гамма-распределения содержатся в разработанном нами государственном стандарте ГОСТ 11,011-83 «Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения». В настоящее время эта публикация используется в качестве методического материала для инженерно-технических работников промышленных предприятий и прикладных научно-исследовательских институтов.
Поскольку гамма-распределение зависит от трех параметров, то имеется 23 - 1 = 7 вариантов постановок задач оценивания. Они описаны в табл. 1. В табл. 2 приведены реальные данные о наработке резцов до предельного состояния, в часах. Упорядоченная выборка (вариационный ряд) объема n = 50 взята из государственного стандарта. Именно эти данные будут служить исходным материалом для демонстрации тех или иных методов оценивания параметров.
Выбор «наилучших» оценок в определенной параметрической модели прикладной статистики - научно-исследовательская работа, растянутая во времени. Выделим два этапа. Этап асимптотики: оценки строятся и сравниваются по их свойствам при безграничном росте объема выборки. На этом этапе рассматривают такие характеристики оценок, как состоятельность, асимптотическая эффективность и др. Этап конечных объемов выборки: оценки сравниваются, скажем, при n = 10. Ясно, что исследование начинается с этапа асимптотики: чтобы сравнивать оценки, надо сначала их построить и быть уверенными, что они не являются абсурдными (такую уверенность дает доказательство состоятельности).
Пример 2. Оценивание методом моментов параметров гамма-распределения в случае трех неизвестных параметров (строка 7 таблицы 1).
В соответствии с проведенными выше рассуждениями для оценивания трех параметров достаточно использовать три выборочных момента - выборочное среднее арифметическое:
выборочную дисперсию
и выборочный третий центральный момент
Приравнивая теоретические моменты, выраженные через параметры распределения, и выборочные моменты, получаем систему уравнений метода моментов:
Решая эту систему, находим оценки метода моментов. Подставляя второе уравнение в третье, получаем оценку метода моментов для параметра сдвига:
Подставляя эту оценку во второе уравнение, находим оценку метода моментов для параметра формы:
Наконец, из первого уравнения находим оценку для параметра сдвига:
Для реальных данных, приведенных выше в табл. 2, выборочное среднее арифметическое = 57,88, выборочная дисперсия s2 = 663,00, выборочный третий центральный момент m3 = 14927,91. Согласно только что полученным формулам оценки метода моментов таковы: a* = 5,23; b* = 11,26, c* = - 1,01.
Оценки параметров гамма-распределения, полученные методом моментов, являются функциями от выборочных моментов. В соответствии со сказанным выше они являются асимптотически нормальными случайными величинами. В табл. 3 приведены оценки метода моментов и их асимптотические дисперсии при различных вариантах сочетания известных и неизвестных параметров гамма-распределения.
Все оценки метода моментов, приведенные в табл. 3, включены в государственный стандарт. Они охватывают все постановки задач оценивания параметров гамма-распределения (см. табл. 1), кроме тех, когда неизвестен только один параметр - a или b. Для этих исключительных случаев разработаны специальные методы оценивания.
Поскольку асимптотическое распределение оценок метода моментов известно, то не представляет труда формулировка правил проверки статистических гипотез относительно значений параметров распределений, а также построение доверительных границ для параметров. Например, в вероятностной модели, когда все три параметра неизвестны, в соответствии с третьей строкой таблицы 3 нижняя доверительная граница для параметра а, соответствующая доверительной вероятности г = 0,95, в асимптотике имеет вид
а верхняя доверительная граница для той же доверительной вероятности такова
где а* - оценка метода моментов параметра формы (табл. 3).
Пример 3. Найдем ОМП для выборки из нормального распределения, каждый элемент которой имеет плотность
Таким образом, надо оценить двумерный параметр (m, у2).
Произведение плотностей вероятностей для элементов выборки, т.е. функция правдоподобия, имеет вид
(8)
Требуется решить задачу оптимизации
Как и во многих иных случаях, задача оптимизации проще решается, если прологарифмировать функцию правдоподобия, т.е. перейти к функции
,
называемой логарифмической функцией правдоподобия. Для выборки из нормального распределения
(9)
Необходимым условием максимума является равенство 0 частных производных от логарифмической функции правдоподобия по параметрам, т.е.
(10)
Система (10) называется системой уравнений максимального правдоподобия. В общем случае число уравнений равно числу неизвестных параметров, а каждое из уравнений выписывается путем приравнивания 0 частной производной логарифмической функции правдоподобия по тому или иному параметру.
При дифференцировании по m первые два слагаемых в правой части формулы (9) обращаются в 0, а последнее слагаемое дает уравнение
.
Следовательно, оценкой m* максимального правдоподобия параметра m является выборочное среднее арифметическое,
.
Для нахождения оценки дисперсии необходимо решить уравнение
Легко видеть, что
Следовательно, оценкой (у2)* максимального правдоподобия для дисперсии у2 с учетом найденной ранее оценки для параметра m является выборочная дисперсия,
Итак, система уравнений максимального правдоподобия решена аналитически, ОМП для математического ожидания и дисперсии нормального распределения - это выборочное среднее арифметическое и выборочная дисперсия. Отметим, что последняя оценка является смещенной.
Отметим, что в условиях примера 3 оценки метода максимального правдоподобия совпадают с оценками метода моментов. Причем вид оценок метода моментов очевиден и не требует проведения каких-либо рассуждений.
Пример 4. Попытаемся проникнуть в тайный смысл следующей фразы основателя современной статистики Рональда Фишера: “нет ничего проще, чем придумать оценку параметра”. Классик иронизировал: он имел в виду, что легко придумать плохую оценку. Хорошую оценку не надо придумывать (!) - ее надо получать стандартным образом, используя принцип максимального правдоподобия.
Задача. Согласно H0 математические ожидания трех независимых пуассоновских случайных величин связаны линейной зависимостью: .
Даны реализации этих величин . Требуется оценить два параметра линейной зависимости и проверить H0.
Для наглядности можно представить линейную регрессию , которая в точках принимает средние значения . Пусть получены значения . Что можно сказать о величине и справедливости H0?
Наивный подход
Казалось бы, оценить параметры можно из элементарного здравого смысла. Оценку наклона прямой регрессии получим, поделив приращение при переходе от x1 =-1 к x3=+1 на , а оценку значения найдем как среднее арифметическое:
Легко проверить, что математические ожидания оценок равны (оценки несмещенные).
После того как оценки получены, H0 проверяют как обычно с помощью хи-квадрат критерия Пирсона:
Оценки ожидаемых частот можно получить, исходя из оценок :
При этом, если наши оценки ”правильные”, то расстояние Пирсона будет распределено как случайная величина хи-квадрат с одной степенью свободы: 3-2=1. Напомним, что мы оцениваем два параметра, подгоняя данные под нашу модель. При этом сумма не фиксирована, поэтому дополнительную единицу вычитать не нужно.
Однако, подставив , получим странный результат:
С одной стороны ясно, что для данных частот нет оснований отвергать H0, но мы не в состоянии это проверить с помощью хи-квадрат критерия, так как оценка ожидаемой частоты в первой точке оказывается отрицательной. Итак, найденные из “здравого смысла” оценки не позволяют решить задачу в общем случае.
Метод максимального правдоподобия
Случайные величины независимы и имеют пуассоновское распределение. Вероятность получить значения равна:
Согласно принципу максимального правдоподобия значения неизвестных параметров надо искать, требуя, чтобы вероятность получить значения была максимальной:
Если постоянны, то мы имеем дело с обычной вероятностью. Фишер предложил новый термин “правдоподобие” для случая, когда постоянны , а переменными считаются . Если правдоподобие оказывается произведением вероятностей независимых событий, то естественно превратить произведение в сумму и дальше иметь дело с логарифмом правдоподобия:
Здесь все слагаемые, которые не зависят от , обозначены и в окончательном выражении отброшены. Чтобы найти максимум логарифма правдоподобия, приравняем производные по к нулю:
Решая эти уравнения, получим:
Таковы “правильные” выражения для оценок. Оценка среднего значения совпадает с тем, что предлагал здравый смысл , однако оценки для наклона различаются: . Что можно сказать по поводу формулы для ?
1) Кажется странным, что ответ зависит от частоты в средней точке , так как величина определяет угол наклона прямой.
2) Тем не менее, если справедлива H0 (линия регрессии - прямая), то при больших значениях наблюдаемых частот, они становятся близки к своим математическим ожиданием. Поэтому: , и оценка максимального правдоподобия становится близка к результату, полученному из здравого смысла .
3) Преимущества оценки начинают ощущаться, когда мы замечаем, что все ожидаемые частоты теперь оказываются всегда положительными:
Это было не так для “наивных” оценок, поэтому применить хи-квадрат критерий можно было не всегда (попытка заменить отрицательную или равную нулю ожидаемую частоту на единицу не спасает положения).
4) Численные расчеты показывают, что наивными оценками можно пользоваться только, если ожидаемые частоты достаточно велики. Если использовать их при малых значениях, то вычисленное расстояние Пирсона часто будет оказываться чрезмерно большим.
Вывод: Правильный выбор оценки важен, так как в противном случае проверить гипотезу с помощью критерия хи-квадрат не удастся. Оценка, казалось бы, очевидная может оказаться непригодной!
Заключение
генеральный совокупность статистика гамма распределение
Среди математических дисциплин теория вероятностей и математическая статистика занимают особое место. С одной стороны, благодаря достижениям ряда математиков, в том числе Бореля, Лебега, Бернштейна и Колмогорова, теория вероятностей относится к так называемой чистой математике. С другой стороны, благодаря интенсивному использованию теории вероятностей и математической статистики в приложениях эти дисциплины принадлежат к области прикладной математики. Широкое применение теории вероятностей и особенно математической статистики приводит к вопросу о том, оказывается ли эффективным использование вероятностных подходов при решении проблем, возникающих в практике научных исследований, или оно является лишь свидетельством моды на математизацию.
Применение этих подходов обусловлено в большей степени внешними причинами, в том числе требованиями, согласно которым в публикациях должны использоваться методы статистического анализа. Так, например анализ примерно двухсот кандидатских и докторских диссертаций в области медицины и биологии, проведенный В.П. Леоновым и П.В. Ижевским, показал, что в подавляющем числе работ статистические методы использовались неоптимальным образом или просто неправильно, без учета границ применимости соответствующих методов. Авторы полагают, что это связано с недостатками в обучении студентов методам теории вероятностей.
Кроме медицины и биологии наименее обоснованной областью применения математической статистики является область стандартизации. Многие ГОСТы в технике, разработанные с использованием статистических методов, содержат грубые ошибки. Несмотря на острую и справедливую критику, эти ГОСТы остаются без изменений.
Проблема оценки параметров может трактоваться как самостоятельная проблема или как часть общей проблемы проверки гипотез. В общем случае кроме задачи оценивания параметров решается задача проверки соответствия распределения с найденными параметрами имеющимся данным. Проблема проверки гипотез, несомненно, заслуживает самостоятельного анализа, и в настоящей работе она не рассматривается. Проблема оценки параметров является классическим направлением статистики, и, я считаю, необходим критический анализ этого раздела статистики с точки зрения современных требований к эффективности математики.
Список литературы
1. Гмурман В.Е. Теория вероятностей и математическая статистика. ? 2003.
2. Гнеденко Б.В. Курс теории вероятностей: Учебник. 7-е изд., исправл. - М.: Эдиториал УРСС, 2001.
3. Ивченко Г.И., Медведев Ю.И. Математическая статистика: Учеб. Пособие для вузов. - М.: Высш. шк., 1999.
4. Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. - М.: Наука, 1990.
5. Крамер Г. Математические методы статистики. - М.: Мир, 1975.
6. Орлов А.И. Прикладная статистика. ? М.: Экзамен, 2004.
7. Рао С.Р. Линейные статистические методы и их применения. - М.: Наука, 1997.
8. Волковец А.И. Теория вероятностей и математическая статистика: конспект лекций. ? 2003.
9. Пучков Н.П., Ткач Л.И. Математика случайного. Методические рекомендации. - Тамбов: Издательство ТГТУ, 2005.
Приложение
Таблица 1. ? Постановки задач оценивания для параметров гамма-
распределения
№ п/п |
Параметр формы |
Параметр масштаба |
Параметр сдвига |
|
1 |
Известен |
Оценивается |
Известен |
|
2 |
Оценивается |
Известен |
Известен |
|
3 |
Известен |
Известен |
Оценивается |
|
4 |
Оценивается |
Оценивается |
Известен |
|
5 |
Известен |
Оценивается |
Оценивается |
|
6 |
Оценивается |
Известен |
Оценивается |
|
7 |
Оценивается |
Оценивается |
Оценивается |
Таблица 2. ? Наработка резцов до предельного состояния, ч
№ п/п |
Наработка, ч |
№ п/п |
Наработка, ч |
№ п/п |
Наработка, ч |
|
1 |
9 |
18 |
47,5 |
35 |
63 |
|
2 |
17,5 |
19 |
48 |
36 |
64,5 |
|
3 |
21 |
20 |
50 |
37 |
65 |
|
4 |
26,5 |
21 |
51 |
38 |
67,5 |
|
5 |
27,5 |
22 |
53,5 |
39 |
68,5 |
|
6 |
31 |
23 |
55 |
40 |
70 |
|
7 |
32,5 |
24 |
56 |
41 |
72,5 |
|
8 |
34 |
25 |
56 |
42 |
77,5 |
|
9 |
36 |
26 |
56,5 |
43 |
81 |
|
10 |
36,5 |
27 |
57,5 |
44 |
82,5 |
|
11 |
39 |
28 |
58 |
45 |
90 |
|
12 |
40 |
29 |
59 |
46 |
96 |
|
13 |
41 |
30 |
59 |
47 |
101,5 |
|
14 |
42,5 |
31 |
60 |
48 |
117,5 |
|
15 |
43 |
32 |
61 |
49 |
127,5 |
|
16 |
45 |
33 |
61,5 |
50 |
130 |
|
17 |
46 |
34 |
62 |
Таблица 3. ? Оценки метода моментов и их асимптотические
дисперсии
№ п/п |
Описание вероятностной модели |
Оцениваемый параметр |
Вид оценки |
Асимптотическая дисперсия оценки |
|||
A |
b |
c |
|||||
1 |
- |
- |
+ |
a |
|
|
|
2 |
- |
- |
+ |
b |
|
|
|
3 |
- |
- |
- |
a |
|
|
|
4 |
- |
- |
- |
b |
|
|
|
5 |
- |
- |
- |
c |
|
|
|
6 |
+ |
- |
- |
b |
|
|
|
7 |
+ |
- |
- |
c |
|
|
|
8 |
- |
+ |
- |
A |
|
|
|
9 |
- |
+ |
- |
c |
|
|
|
10 |
+ |
+ |
- |
c |
|
|
Примечание. При описании вероятностной модели известные статистику параметры отмечены плюсами, оцениваемые - минусами.
Размещено на Allbest.ru
Подобные документы
Цель и задачи статистического анализа. Методы получения оценок: максимального правдоподобия, моментов. Доверительный интервал. Точечная оценка параметров распределения. Генеральная и выборочная дисперсии. Интервальное оценивание математического ожидания.
презентация [395,9 K], добавлен 19.07.2015Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.
контрольная работа [62,6 K], добавлен 20.02.2011Распределение случайной величины c помощью закона Пуассона. Вычисления математического ожидания и дисперсии. Метод наибольшего правдоподобия. Асимметрия распределения Пуассона, его дополнительные характеристики, точечная и интервальная оценка параметра.
презентация [710,3 K], добавлен 01.11.2013Класс функций, представимых в виде собственного либо несобственного интеграла, зависящего не только от формальной переменной, а и от параметра. Эти функции называются интегралами зависящими от параметра. К ним относятся гамма и бета функции Эйлера.
курсовая работа [851,0 K], добавлен 03.07.2008Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов. Интервальный статистический ряд. Оценивание параметров распределения. Статистическая проверка гипотез. Гипотеза о нормальном распределении случайной величины.
контрольная работа [391,1 K], добавлен 23.06.2012Метод последовательного исключения неизвестных (метод Гаусса) при решении задач аппроксимации функции в прикладной математике. Метод Гаусса с выбором главного элемента и оценка погрешности при решении системы линейных уравнений, итерационные методы.
контрольная работа [94,4 K], добавлен 04.09.2010Основные виды линейных интегральных уравнений. Метод последовательных приближений, моментов, наименьших квадратов и коллокации. Решение интегральное уравнение методом конечных сумм и методом моментов. Ненулевые решения однородной линейной системы.
контрольная работа [288,4 K], добавлен 23.10.2013Алгоритм построения ранговой оценки неизвестных параметров регрессии. Моделирование регрессионных зависимостей с погрешностями, имеющими распределения с "тяжёлыми" хвостами. Вычисление асимптотической относительной эффективности рангового метода.
курсовая работа [1,2 M], добавлен 05.01.2015Определение линейного оператора. Норма линейного оператора. Обратные операторы. Абстрактные функции. Аналитические абстрактные функции и ряды Тейлора. Метод малого параметра в простейшем случае. Метод малого параметра в общем случае.
дипломная работа [206,5 K], добавлен 08.08.2007