Асимптотическое поведение биномиального распределения

Определение сущности семиинвариантов (кумулянт), которые представляют собой коэффициенты разложения в ряд Тейлора логарифма характеристической функции. Характеристика особенностей биномиальной модели. Рассмотрение свойств ортогональных многочленов.

Рубрика Математика
Вид дипломная работа
Язык русский
Дата добавления 21.06.2016
Размер файла 253,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

1. Основные понятия и теоретические сведения

2. Биномиальная модель. Определение и вероятностные свойства

3. Асимптотические результаты и приближения

4. Исторические ремарки и история происхождения

5. Обобщённое биномиальное распределение

6. Статистические выводы

7. Моделирование

Заключение

Литература

1. Основные понятия и теоретические сведения

Вероятностно-статистические модели. Математические модели случайных явлений, изучаемых в теории вероятностей и математической статистике, основываются на понятии вероятностного пространства , где - непустое множество, называемое пространством элементарных событий (множество всех возможных исходов изучаемого случайного явления), -алгебра его подмножеств и вероятностная мера на ней. Случайная же величина - это функция, отображающая пространство элементарных событий в множество действительных чисел (её можно понимать как некоторую числовую характеристику эксперимента (опыта) со случайным исходом). Случайную величину мы будем обозначать символом Х = Х (это может быть число или вектор некоторой размерности), а её реализацию - соответствующей строчной буквой х (используются также и другие символы: , и т.д.). Совокупность всех возможных реализаций случайной величины обозначается ={х} и называется её областью значений. В данном пособии мы ограничиваемся рассмотрением случайных величин лишь дискретного типа, когда состоит из конечного или счётного числа точек (без точек накопления); в этом случае распределение случайной величины Х, обозначаемое символом (Х) (-law (закон)), задаётся вероятностями отдельных её реализаций

Функцию мы будем называть (для краткости) плотностью; в дальнейшем для неё используются и другие обозначения, связанные со спецификой конкретных распределений и традиционно используемые в математической литературе.

Частным случаем дискретных распределений являются решётчатые распределения и, в частности, распределения, сосредоточенные на множестве целых чисел или его подмножествах.

Если плотность из каких-то соображений задана, то говорят, что задана вероятностная модель эксперимента. В вероятностных задачах плотность наблюдаемой (изучаемой) случайной величины полностью известна, в статистических же - она известна лишь с той или иной степенью неопределённости. Часто при этом предполагается, что плотность задана с точностью до значений тех или иных параметров, от которых зависит функция , - в таких случаях говорят о параметрических статистических моделях. В теории вероятностей наиболее часто встречающиеся распределения (модели) имеют общепринятое наименование и обозначение - этот «язык» переносится и на соответствующие статистические модели. Вместе с тем в статистике используется и специфическая терминология: наблюдаемая в эксперименте случайная величина Х называется выборкой (синоним термина статистические данные), а множество её возможных реализаций ={х} - выборочным пространством. семиинвариант логарифм биномиальный многочлен

На практике часто встречаются ситуации, когда эксперимент состоит в проведении серии повторных независимых наблюдений над некоторой случайной величиной . Если проводится n наблюдений, то выборка Х =

(Х1,…,Хn) представляет собой n независимых копий величины , т. е. является n-мерным случайным вектором с независимыми и одинаково распределёнными компонентами. В этом случае плотность выборки Х=(Х1,…,Хn) имеет вид , т. е. полностью определяется плотностью наблюдаемой случайной величиной , и говорят, что Х=(Х1,…, Хn) есть случайная выборка объёма n из распределения (). Случайная выборка является математической моделью независимых измерений, проводимых в одинаковых условиях, и именно такие модели чаще всего применяются на практике и будут в основном рассматриваться в последующем. В общем случае параметрическая статистическая модель случайной выборки задаётся классом допустимых плотностей наблюдаемой случайной величиной (индекс случайной величины у плотности обычно опускается, если это не приводит к недоразумениям), т. е. плотность задаётся с точностью до значений некоторого параметра с областью возможных значений . Говорят, что в этом случае известен тип распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого зависит распределение. Параметр может быть как скалярным, так и векторным, область (множество) его допустимых значений называется параметрическим множеством модели.

Для удобства дальнейшего изложения напомним также определения моментов случайных величин и основные соотношения между моментами различных видов.

Если для случайной величиной существует абсолютный момент порядка , то существуют и все обычные моменты , а также центральные моменты , при ; при этом первый момент называется математическим ожиданием или средним значением случайной величины , а второй центральный момент - её дисперсией.

Обычные и центральные моменты связаны соотношениями

где , - биномиальный коэффициент, для которого используется также обозначение

Факториальные и биномиальные моменты определяются соответственно равенствами

где .

Имеют место следующие соотношения:

где и есть числа Стирлинга первого и второго рода соответственно, определяемые как коэффициенты разложений

.

Пусть - целочисленная неотрицательная случайная величина и

есть её производящая и характеристическая функции.

Введём также производящие функции моментов:

Тогда имеют место соотношения

.

Используются также семиинварианты, или кумулянты, представляющие собой коэффициенты разложения в ряд Тейлора логарифма характеристической функции:

,

в частности, .

Важную роль играют также следующие моментные характеристики случайной величины : коэффициенты вариации , асимметрии , эксцесса и среднее отклонение .

Одной из важных характеристик распределения (случайной величины) является интенсивность отказов (failure rate)

.

Для многомерных случайных величин определяются также смешанные моменты и кумулянты. В частности, смешанный центральный момент второго порядка двух случайных величин и называется их ковариацией: , а величина - коэффициентом корреляции.

Оценивание

В статистических задачах рассматриваются различные функции от выборки Х=(Х1,…,Хn), сами являющиеся случайными величинами (т. е. для которых при всех t определены вероятности (функция распределения) ). Если при этом функция не зависит от неизвестного параметра модели, то её принято называть статистикой. В статистических задачах речь идёт либо об оценивании по наблюдениям Х=(Х1,…,Хn) той или иной характеристики наблюдаемой случайной величиной , которая в параметрической модели всегда является некоторой функцией от неизвестного параметра (такие функции называются параметрическими), либо о проверке тех или иных статистических гипотез о законе распределения (о параметре - в случае параметрической модели).

Если для оценивания параметрической функции используется некоторая статистика , то она называется оценкой (для ). Обычно в качестве меры точности оценки используют среднеквадратическую ошибку , и среди всех возможных оценок ищут такую, для которой среднеквадратическая ошибка минимальна. При этом часто ограничиваются лишь несмещёнными оценками, т. е. такими оценками, для которых выполняется условие несмещённости:

.

Функция , для которой это уравнение имеет решение, называется оцениваемой. Для несмещённой оценки среднеквадратическая ошибка совпадает с её дисперсией, следовательно, оптимальной оценкой является оценка с минимальной дисперсией, для неё используется обозначение . Оптимальная оценка (в заданной модели и для заданной параметрической функции ) существует не всегда, но в тех случаях, когда она существует, она единственна.

Обязательным для любого правила оценивания является свойство состоятельности, означающее сходимость по вероятности оценки к оцениваемой характеристике при неограниченном возрастании объёма выборки n.

Для удобства дальнейшего изложения напомним кратко некоторые дополнительные факты из теории статистического вывода.

Если в параметрической модели наблюдается случайная выборка Х=(Х1,…,Хn), то функцией правдоподобия данных называется . Если при этом плотность при всех х и , дважды дифференцируема по , и существует второй момент

называемый функцией информации, то модель называется регулярной (большинство рассматриваемых ниже моделей являются таковыми).

Для регулярной модели любая несмещённая оценка дифференцируемой функции удовлетворяет неравенству Рао-Крамера

.

Оценка , для которой эта нижняя граница достигается, называется эффективной (она и является оптимальной оценкой ).

Пусть модель обладает полной достаточной статистикой , т. е. имеет место факторизация

где множитель может зависеть от а от зависит лишь через а множитель от параметра не зависит, и при этом уравнение

имеет единственное решение . Тогда всякая функция от является оптимальной оценкой своего среднего - этот факт во многих случаях даёт эффективный способ отыскания оптимальных оценок.

Одним из наиболее универсальных методов оценивания неизвестных параметров распределений является метод максимального правдоподобия. По этому методу оценкой максимального правдоподобия (далее кратко - ОМП) по выборке Х=(Х1,…,Хn) является такая точка параметрического множества , в которой функция правдоподобия достигает максимума.

Для произвольной параметрической функции её ОМП находится по правилу .

Для регулярных моделей оценки максимального правдоподобия обладают свойствами состоятельности, асимптотической нормальности и асимптотической эффективности. Это даёт возможность строить приближённые доверительные интервалы как для самого параметра : такой интервал (при больших значениях объёма выборки n и доверительном уровне ) имеет вид

,

так и для любой непрерывно дифференцируемой параметрической функции : соответствующий доверительный интервал имеет вид

,

где и - стандартная нормальная функция распределения.

4. При байесовском подходе предполагается, что параметр - это случайная величина с некоторым (априорным) распределением (), а о качестве оценки судят обычно по величине квадратичной функции риска

:

статистика , минимизирующая байесовский риск , называется байесовской оценкой, а минимизирующая максимальный риск - минимаксной оценкой. В ряде случаев при отыскании таких оценок можно руководствоваться следующим принципом: находится такое априорное распределение (), для которого соответствующая байесовская оценка имеет постоянный риск: (его называют наименее благоприятным априорным распределением), тогда является также и минимаксной оценкой.

При построении байесовских оценок важную роль играют сопряжённые априорные распределения, т.е. такие, для которых апостериорное распределение () принадлежит тому же семейству, что и априорное распределение (), - обычно наименее благоприятное априорное распределение находится в этом семействе.

Проверка статистических гипотез

Напомним кратко общую схему постановки задач и принципов их решения в теории проверки статистических гипотез. В случае параметрической модели статистические гипотезы формулируются в терминах параметра , и в общем случае основная (нулевая) гипотеза имеет вид утверждения : при задании соответствующего подмножества , альтернатива же в этом случае имеет вид . При заданном уровне значимости (вероятности ошибочно отвергнуть гипотезу , когда она верна, или, что то же, вероятности ошибки первого рода) соответствующий тест имеет вид

отвергается ,

где критическое множество выбирается так, чтобы вероятность указанного события при гипотезе не превосходила :

.

Такой тест кратко называют критерием и его качество оценивают величиной его мощности

среди всех критериев с уровнем значимости наилучшим считается такой, для которого мощность максимальна. Если такой критерий существует (тогда он обозначается символом ), то он называется оптимальным или равномерно наиболее мощным (сокращённо - р.н.м.).

В основе большинства способов построения оптимальных критериев лежит фундаментальный результат (Ю.Нейман и Э.Пирсон) о существовании наиболее мощного критерия в задаче проверки простой гипотезы : при простой же альтернативе : такой критерий всегда существует и задаётся критическим множеством

.

Такой же вид имеет оптимальный критерий и при сложных односторонних альтернативах или (здесь - скалярный параметр), если модель обладает свойством монотонности отношения правдоподобия, т. е. когда имеется достаточная статистика и функция в монотонно зависит от . Таким свойством обладают, в частности, экспоненциальные модели, т. е. когда плотность имеет вид

и при этом функция строго монотонна (большинство рассматриваемых ниже моделей этим свойством обладают).

Более того, для таких моделей наиболее мощный критерий в задаче (: , ) является одновременно наиболее мощным критерием и в задаче (: , ) при том же уровне значимости (аналогичное утверждение справедливо и для двойственной проблемы проверки гипотезы : против альтернативы ).

При проверке простой гипотезы : против двусторонней альтернативы используется приём объединения двух односторонних критических областей соответственно для альтернатив и , т. е. используют критерий

при .

Одним из наиболее универсальных методов построения критериев проверки сложных параметрических гипотез является метод отношения правдоподобия. Общий вид критерия отношения правдоподобия (кратко - КОП) для проверки гипотезы : таков:

,

где граница выбирается из условия

.

Во многих случаях такой подход приводит к удовлетворительным решениям. Кроме того, при соответствующих условиях КОП обладает свойством асимптотической оптимальности для больших выборок (т. е. при ). В последнем случае для регулярных моделей типичный вид асимптотического варианта КОП таков:

2. Биномиальная модель. Определение и вероятностные свойства

1. Случайная величина (с. в.) X (иногда пишут или ) имеет биномиальное распределение с параметрами n и p (0< p <1), что кратко обозначается так: (X) =, если её плотность имеет вид:

Для функции распределения используется обозначение

где - целая часть .

Термин «биномиальное распределение» связан с тем, что эти вероятности являются членами знаменитого «бинома Ньютона»:

В частном случае распределение называется бернуллиевским в честь выдающегося швейцарского математика Якоба Бернулли (1654 -1705), впервые изучавшего эту модель. В этом случае с. в. X принимает лишь два значения 0 и 1, интерпретируемые обычно как «успех» (1) и «неуспех» (0). Бернуллиевская модель является подходящей математической моделью для любого эксперимента с двумя взаимоисключающими исходами, т.е. простейшего статистического эксперимента, - в этом её фундаментальная роль в теории вероятностей и математической статистике. Если все случайные величины последовательности (конечной или бесконечной) независимы и имеют одно и то же распределение Бернулли , то мы имеем последовательность испытаний Бернулли, или, кратко, бернуллиевскую последовательность. В этом случае сумма - «число успехов в испытаниях Бернулли» - имеет биномиальное распределение .

Для плотности имеют место соотношение симметрии:

и рекуррентные соотношения: прямое (рекомендуется использовать для )

и обратное (рекомендуется использовать для )

.

При значениях p, близких к , удобно использовать следующее разложение по степеням «малого параметра» :

,

где - известные в анализе многочлены Кравчука:

.

Значения же функции распределения выражаются через неполную бета-функцию:

,

и удовлетворяют рекуррентным соотношениям

Также имеет место представление (Bahadur, 1960)

Где

есть гипергеометрическая функция.

Биномиальное распределение обладает важным свойством воспроизводимости по параметру : если с. в. независимы и

L(X j) =

L.

Интенсивность отказов (failure rate) является здесь возрастающей функцией и удовлетворяет соотношению

,

при условии, что (Diaconis and Zabell, 1991).

Если L(X) =, то производящая и характеристическая функции с. в. X имеют вид соответственно

,

а факториальные моменты равны

В частности, первые четыре момента и некоторые, связанные с ними характеристики, имеют вид:

,

а коэффициенты вариации , асимметрии и эксцесса равны

.

Центральные моменты можно вычислять здесь по рекуррентной формуле

,

в частности,

.

Среднее отклонение с. в. X есть (Diaconis and Zabell, 1991)

и при

3. Биномиальные вероятности при изменении х от 0 до сначала монотонно возрастают, затем монотонно убывают, достигая своего наибольшего значения при , где (мода распределения) определяется неравенствами ; при этом, если - целое число, то наибольшее значение достигается дважды: = . Если , то мода находится в нуле.

4. Неравенства для . Пусть и Тогда

,

,

,

,

5. Неравенства для .

6. Свёртка по модулю. Для любого целого и справедлива следующая формула «свёртки по модулю»:

где - характеристическая функция. В частности, при

7. Симметризация. Пусть обозначают независимые случайные величины, имеющие одно и то же распределение . Тогда их сумма имеет распределение . Распределение же их разности называется симметризованным биномиальным распределением и обозначается символом ( Ивченко Г.И., Медведев Ю.И., 2011). Это распределение симметрично, имеет среднее 0 и дисперсию . Соответствующие же вероятности имеют вид

Если , то .

8. Рандомизация параметра. Пусть параметр p является случайной величиной, имеющей бета-распределение с плотностью

где - бета-функция. Тогда составное или биномиальное-бета распределение (смесь биномиальных распределений) имеет плотность

9. Характеризация. Пусть случайные величины и независимы и имеют биномиальные распределения с параметрами и соответственно. Тогда условное распределение при заданном значении суммы является гипергеометрическим с параметрами (см. гл. 4):

.

Верно и обратное: если условное распределение при заданном значении является гипергеометрическим с параметрами , то и имеют биномиальные распределения с параметрами и соответственно.

10. Ортогональные многочлены. Систему многочленов, ортогональных относительно биномиального распределения (X) =, образуют (нормированные) многочлены Кравчука

:

,

где - символ Кронекера ( Хохлов В.И., 2001).

Биномиальное распределение относится к нескольким классам распределений и, следовательно, имеет свойства каждого из классов. Далее поподробнее рассмотрим классы, к которым оно относится.

Оно является распределением с конечной поддержкой. Вероятность происхождения поделена на равновероятных событий, соответствующих значениям: .

Соотношение

показывает, что возрастает по до тех пор, пока и уменьшается при случае, когда больше этого выражения. Распределение унимодально при где от выражения в квадратных скобках берётся только целая часть. Если - целое число, то имеем одну и ту же ситуацию при разных значениях: Когда то процесс начинается в начале координат.

Для медианы, построенной по минимальным значениям , для которых

Позднее было показано, что

Известна также более грубая оценка этого выражения цифрой . Это было доказано в двух случаях: когда или .

Также биномиальное распределение является членом семейства экспоненциальных распределений с показателем следовательно

Известно, что биномиальное распределение относится к одному из 6 подклассов натуральной экспоненциальной семьи у которой вариация в большинстве своём является квадратичной функцией. В отличие от других 5 подклассов оно не является бесконечно делимым (ни одно распределение с конечной поддержкой не является бесконечно делимым).

Потому что является одной из форм

Позже была показана справедливость следующего соотношения для биномиального распределения

где

Берг (Berg) в статье 1983 исследовал свойства семейства распределений факториальных серий с

к которым можно отнести биномиальное распределение при

Трипати и Гурланд(Tripathi and Gurland) (1977) протестировали методы отбора из тех распределений, имеющих

как частный случай биномиальное распределение.

Кемп (Kemp,1968) показал, что биномиальное распределение является обобщённым гипергеометрическим с п.ф.

Также, т.к. соотношение последовательных факториальных моментов является распределением факториальных моментов, то оно будет также обобщённым гипергеометрическим с х.ф. (Kemp, 1968). Этот факт позволил ему получить дифференциальные уравнения и связанные с ними дифференциальные уравнения для п.ф. и для вариации производящей функции моментов (п.ф.м.), включающую производящие функции неполных и абсолютных моментов.

Также биномиальное распределение является монотонным распределением соотношения правдоподобия. Асимметрия распределения положительна при и негативна при При оно симметрично.

Обозначая как Ульманн(Uhlmann) (1966) показал, что в случае

3. Асимптотические результаты и приближения

1. Теорема Муавра-Лапласа. Если , а параметр p фиксирован, 0< p <1, то нормированная с. в. имеет асимптотически нормальное распределение с параметрами 0 и 1, т. е. равномерно по

,

где - функция стандартного нормального распределения.

Справедлив также локальный вариант нормальной сходимости:

,

при этом последнее соотношение выполняется равномерно по - эта область значений называется (узкой) зоной нормальной сходимости.

Скорость сходимости к нормальному закону определяется соотношением (теорема Берри-Эссеена)

,

где - абсолютная постоянная.

Для практических применений нормальной аппроксимацией можно пользоваться при ; при условии же - независимо от значения .

Теперь рассмотрим более подробно композицию из с.в. распределённых по биномиальному закону. Если независимы и параметры их биномиальных распределений и соответственно, то п.ф. имеет вид и эта с.в. распределена по биномиальному закону с параметрами

Условное распределение при условии имеет вид

где Это гипергеометрическое распределение.

Распределение разницы тех же с.в.:

где

Когда

так что разница двух биномиально-распределённых с.в. имеет более общую форму нежели просто с.в. распределённая по тому же закону.

Из теоремы Муавра-Лапласа и факта независимости пары с.в. следует, что распределение стандартизированной разницы

стремится к стандартному нормальному распределению при (в отличие от ).Аналогичные факты справедливы и в случае если не только количество испытаний у с.в. разное но и когда вероятность успеха в двух испытаниях разная. Но условное распределение при условии уже не будет гипергеометрическим. Этот факт был исследован в работе Ханнана и Харкнесса(Hannan and Harkness)(1963). Они же открыли асимптотику нормальных аппроксимаций.

2. Теорема Пуассона. Если , а параметр так, что то

Сходимость к закону Пуассона остаётся справедливой и при , но не очень быстро, именно, если , то область пуассоновского приближения имеет вид

,

если же , то

.

Имеют место также различные уточнения этих классических утверждений (см. ниже).

3. Большие уклонения. Пусть , а изменяется так, что , но . Тогда

,

где .

Это представление, полученное А.Я. Хинчиным, позволяет также выделять зоны изменения , в которых следует учитывать лишь конечное число слагаемых в разложении функции . Так, если , то

,

если , то

и т. д.

Аналогичная формула (при тех же условиях) справедлива и для локальных вероятностей:

.

Для области сверхбольших уклонений: так, что при некоторых выполняется условие

, (*)

для «правого хвоста» имеет место соотношение (А.Н. Тимашев, 2011)

Где ,

а также

.

Для «левого хвоста» , при замене условия (*) на симметричное условие , выполняются аналогичные соотношения при замене на и на .

Имеются также результаты, связывающие значения интегральных и локальных вероятностей в области больших уклонений. Один из них формулируется следующим образом.

Пусть , . Тогда

где .

4. Расстояние по вариации до предельных распределений. Пусть , , , .

Положим

Имеют место следующие соотношения (Ю.В. Прохоров, 1953 ):

;

существует такое постоянное число , что

при

;

если то

если то

если то

при любых целых имеют место также оценки

Пусть . Тогда

.

Пусть . Тогда

.

Законы больших чисел и повторного логарифма. Для с. в. при

и фиксированном отношение сходится по вероятности и с вероятностью 1 к , т.е. к применим как закон больших чисел, так и усиленный его вариант. На этом основан метод интерполяции произвольной непрерывной функции полиномами Бернштейна

:

при равномерно по

Для с. в. выполняется и закон повторного логарифма: при с вероятностью единица справедливо соотношение (теорема Хинчина)

,

а также

.

Теорема Хинчина означает, что при с вероятностью единица происходит лишь конечное число событий

,

а при с вероятностью единица это неравенство выполняется для бесконечного числа значений .

6. Асимптотическое поведение квантилей.

Пусть

есть обратная (квантильная) функция к функции распределения (её значение в заданной точке называют также - квантилью или квантилью уровня ). Поведение квантилей в «крайних» зонах: близко к 0 или 1, описывается следующим образом (Г.И. Ивченко, 1974).

Если , так, что и при этом функция такова, что , то для квантилей уровней и при любом фиксированном справедливы представления:

где - стремящиеся к нулю при решения уравнения

.

7. Преобразования. Распределение с. в. при

хорошо аппроксимируется нормальным распределением со средним и дисперсией ; при умеренно больших более подходящим является преобразование

,

удовлетворительно аппроксимирующееся нормальным распределением со средним и дисперсией .

4. Исторические ремарки и история происхождения

Если в n независимых испытаниях вероятность исхода Е будет равна р, то число испытаний Х будет распределено по биномиальному закону с параметрами n и p.

Такая ситуация возникает когда из бесконечного набора, у которого все элементы независимы и имеют равную вероятность р принять своё значение, выбирают конечную выборку размера n. Такая ситуация также возникает при выборке из конечного набора большего размера, у которого элементы независимы и отбираются последовательно с заменой.

Биномиальное распределение одно из самых старых. Случай когда был рассмотрен Паскалем, а случай когда где был рассмотрен Джеймсом Бернулли в далёком 1713 году.

5. Обобщённое биномиальное распределение

1. Определение и моменты. Если последовательность состоит из независимых случайных величин и имеет распределение Бернулли , то мы имеем неоднородную последовательность Бернулли, и в этом случае сумма будет иметь обобщённое биномиальное распределение . Это распределение может быть задано производящей либо характеристической функцией

,

а его среднее и дисперсия имеют вид

2. Предельные теоремы и аппроксимация.

1) Если , а параметры таковы, что , то нормированная с. в. имеет асимптотически нормальное распределение с параметрами 0 и 1.

2) Если , а параметры меняются так, что , то с. в. имеет в пределе распределение Пуассона с параметром .

Обозначим дополнительно

,

=.

Имеют место следующие оценки расстояний до пуассоновского и биномиального распределений:

.

Пусть выполняются условия

и меняется так, что

.

Тогда (А.Н. Тимашев, 2011)

где ,

при , а - единственный положительный корень уравнения

.

В частности, если, дополнительно, все , то

Где

при , а также

.

Структура центральных же моментов(ц.м.) более сложна, это видно по ц.м. низших порядков представленных ниже:

Коэффициенты моментов ищутся по следующим формулам: Также было выведено соотношение коэффициентов для фиксированных Заметно, что при точки приближаются к пределам: Также интересно, что это соотношение при изменении местами не меняется. Два распределения, являющиеся зеркальными отражениями друг друга, имеют одинаковое значение второго коэффициента и одинаковое абсолютное значение корня из первого. Также видно что значение дроби всегда меньше 1. Предел отношения достигается(и он равен 1) при принятии р значений 0 или 1. При биномиальное распределение симметрично и . Когда ложится на прямую (это выражение всегда неотрицательно, кстати). Имеется также рекурсивная формула для центральных моментов: .

Аналогичным методом получается и выражение для центральных моментов около нуля:

Возможно использование дифференциации центральных моментов для вывода соотношений:

Есть и более простая рекурсивная форма, содержащая кумулянты

В первоначальной формуле для вычисления ц.м. есть и неполные моменты, определяемые как

Главное значение находится по следующей формуле

6. Статистические выводы

1. Модель и её характеристики. Пусть Х=(Х1,…, Хn) есть случайная выборка объёма n из распределения () =.

Для этой модели функция информации имеет вид

,

а полная достаточная статистика есть

при этом

() =.

2. Оценивание. Оцениваемыми параметрическими функциями являются лишь полиномы вида

Для любого такого полинома оптимальная несмещённая оценка есть

.

В частности, для функций вида при целых оптимальная оценка имеет вид

.

Отсюда следует, что вероятность , где любое подмножество целых чисел оптимальным образом оценивается статистикой

.

Эффективная оценка (она же является и оценкой максимального правдоподобия ) существует для функции : она имеет вид

и её дисперсия равна .

Преобразование параметра, стабилизирующее дисперсию, имеет вид : асимптотическая дисперсия ОМП не зависит от параметра и равна .

3. Доверительное оценивание. Доверительный интервал для параметра в модели по соответствующей выборке Х=(Х1,…, Хn) и при доверительном уровне определяется условиями

при этом где есть - квантиль бета-распределения .

Если велико, то приближённый -доверительный интервал для имеет вид (напомним, что )

.

Асимптотический -доверительный интервал для произвольной непрерывно дифференцируемой функции имеет вид

а для функции - вид

().

4. Байесовское и минимаксное оценивание параметра бернуллиевской модели. Пусть параметр случаен и его априорное распределение есть бета-распределения (оно является сопряжённым распределением для биномиального распределения). По выборке Х=(Х1,…, Хn) из распределения требуется построить оценку , минимизирующую среднеквадратическую ошибку . Такая (байесовская) оценка существует и имеет вид

,

и её функция риска есть

.

При функция , это означает, что соответствующая байесовская оценка является также и минимаксной - она имеет вид

и её риск

.

Для несмещённой оценки риск

при , и длина этого интервала (где более точной является оценка ) стремится к нулю при ; при всех же остальных значениях параметра более точной является оценка , но по принципу минимакса оценка точнее, нежели .

5. Проверка гипотез. а) Критерий Неймана-Пирсона. Чтобы построить критерий в задаче с простыми гипотезами (), где, для определённости, , определим целое число (- заданный уровень значимости) из условия

. (*)

Если здесь имеет место знак равенства , то критерий Неймана-Пирсона задаётся критической областью

и его мощность есть

Если же , то можно использовать критерии

(с уровнем значимости )

(с уровнем значимости ).

Эти же критерии являются оптимальными и в задач со сложными односторонними гипотезами.

Для больших выборок асимптотический вариант критерия Неймана-Пирсона принимает вид

и его мощность при «близкой» альтернативе вида

удовлетворяет предельному (при ) соотношению

.

б) Задача . В этой задаче с двусторонней альтернативой асимптотический вариант критерия отношения правдоподобия при уровне значимости имеет вид

и его мощность при «близкой» альтернативе вида

удовлетворяет предельному (при ) соотношению

.

в) Гипотеза однородности.

Вариант 1. Пусть - выборочные средние для независимых выборок объёмов соответственно из распределений . Для проверки гипотезы однородности в случае больших выборок можно использовать асимптотический вариант критерия отношения правдоподобия

либо асимптотически эквивалентный ему критерий однородности хи-квадрат:

(здесь ).

Вариант 2. Пусть - независимые наблюдения из распределений соответственно. Другими словами, имеется выборка из неоднородной последовательности Бернулли (см. § 3). Для проверки гипотезы однородности (и равновероятности) в случае больших выборок можно использовать критерий

,

который обладает свойством состоятельности против любой неоднородной альтернативы при выполнении условия

.

6. Оценивание для биномиального-бета распределения (см. п. 8 в § 1). Если и есть выборочные среднее и дисперсия выборки из этого распределения, то оценками по методу моментов параметров и являются статистики соответственно

.

При больших объёмах выборки эти оценки обладают свойствами асимптотической несмещённости, асимптотической нормальности и состоятельности.

7. Оценивание для усечённого распределения. Усечённое биномиальное распределение возникает, когда некоторые значения случайной величины X «запрещены». В простейшем варианте «запрещённым» является нулевое значение: в этом случае получается положительное биномиальное распределение (оно используется в демографических исследованиях), задаваемое вероятностями

.

Среднее и дисперсия такого распределения равны соответственно и , а для отрицательных моментов справедлива аппроксимация (Mendenhall and Lehman, 1960):

,

.

Оценка максимального правдоподобия параметра такого распределения по независимым наблюдениям из него удовлетворяет уравнению метода моментов

.

Простая альтернативная оценка имеет вид (Mantel, 1951)

,

где есть наблюдаемое число единиц в выборке.

Для больших выборок

и асимптотическая эффективность второй оценки равна примерно 95% (Gart, 1970).

7. Моделирование

Если - случайная величина, равномерно распределённая на отрезке , и - индикатор события (=1, если имеет место, и =0 в противном случае), то случайная величина имеет распределение Бернулли . Поэтому, чтобы смоделировать выборку Х=(Х1,…, Хn) из распределения , надо положить

Где

- последовательность независимых и равномерно распределённых на отрезке случайных величин.

Далее, согласно свойству воспроизводимости биномиального распределения сумма имеет распределение . Поэтому, чтобы смоделировать выборку объёма из распределения , надо взять непересекающихся участков длины последовательности (*) и из каждого участка построить биномиальную случайную величину указанного вида. Формально это можно записать так:

Заключение

Результатом выполнения дипломной работы является создание справочного руководства по биномиальной модели и ее статистическим применениям.

Литература

1. Ивченко Г.И., Медведев Ю.И. (2011). Спектр случайной булевой функции и его производящая функция. - Математические вопросы криптографии, т. 2. №2, с. 41-54.

2. Хохлов В.И. (2001). Многочлены, ортогональные относительно полиномиального распределения, и факториально-степенной формализм. - Теория вероятн. и её примен., т. 46, в. 3, с. 585-592.

3. Прохоров Ю.В. (1953). Асимптотическое поведение биномиального распределения. - Успехи матем. наук, т. 8, № 3, с. 135-142.

4. Тимашев А.Н. (2011). Большие уклонения в вероятностной комбинаторике. - М.: Издательский дом "Академия".

5. Bahadur R. R. (1960). Some approximations to the binomial distribution function, Ann. Math. Statist., 31, № 1, 43-54.

6. Berg, S. (1983a). Factorial series distributions, Encyclopedia of Statistical Sciences, Vol. 3, S.

7. Diaconis, P., and Zarbell, S. (1991). Closed form summation for classical distributions: Variations on a theme of De Moivre, Statistical Science, 6, 284-302.

8. Gart, J. J. (1970). Some simple graphically oriented statistical methods for discrete data, Random Counts in Scientific Work, Vol. 1: Random Counts in Models and Structures, G. P. Patil (editor), 171-191. University Park: Pennsylvania State University Press.

9. Hannan, J., and Harkness, W. (1963). Normal approximation to the distribution of two independent binomials, conditional on a fixed sum, Annals of Mathematical Statistics, 34, 1593-1595.

10. Kemp, A. W. (1968a). Studies in Univariate Discrete Distribution Theory Based on the Generalized Hypergeometric Function and Associated Differential Equations, PhD Thesis, Belfast: The Queen's University of Belfast.

11. Mendenhall, W., and Lehman, E. H. (1960). An approximation to the negative moments of the positive binomial useful in life testing, Technometrics, 2, 233-239.

12. Mantel, N. (1951). Evaluation of a class of diagnostic tests, Biometrics, 3, 240-246.

13. Peizer, D. B., and Pratt, J. W. (1968). A normal approximation for binomial, F, beta and other common related tail probabilities, I, Journal of the American Statistical Association, 63, 1416-1456.

14. Tripathi, R. C., and Gurland, J. (1977). A general family of discrete distributions with hypergeometric probabilities, Journal of the Royal Statistical Society, Series B, 39, 349-356.

15. Uhlmann, W. (1966). Vergleich der Hypergeometrischen mit der Binomial-Verteilung, Metrika, 10, 145-158.

Размещено на Allbest.ru


Подобные документы

  • Общая терминология и история изобретения логарифма. Характеристики натурального и обычного логарифма, определение дробного числа и мантиссы. Таблицы и свойства натуральных логарифмов. Логарифмическая и экспоненциальная кривая, понятие функции логарифма.

    реферат [211,2 K], добавлен 05.12.2011

  • Определение и общие свойства ортогональных функций (многочленов). Рекуррентная формула и формула Кристоффеля-Дарбу. Элементарные свойства нулей, их плотность. Сущность первого и второго рода многочленов Чебышева. Нули многочленов и отклонение от них.

    курсовая работа [2,5 M], добавлен 30.06.2011

  • Теория высшей алгебры в решении задач элементарной математики. Программы для нахождения частного и остатка при делении многочленов, наибольшего общего делителя двух многочленов, производной многочлена; разложения многочленов на кратные множители.

    дипломная работа [462,8 K], добавлен 09.01.2009

  • Рекурсивное, тригонометрическое определение и свойства многочленов Чебышёва. Сущность теоремы Е.И. Золотарёва-А.Н. Коркина. Применение ортогональных полиномов Чебышева при нахождении кривых распределения вероятностей. Обобщение метода Грамма-Шарлье.

    курсовая работа [1,1 M], добавлен 11.01.2011

  • Математический анализ и операционное исчисление. Обращение преобразования с помощью многочленов, ортогональных на промежутке. Интегральное преобразования Лапласа с помощью смещенных многочленов Лежандра и многочленов Чебышева первого рода.

    реферат [503,6 K], добавлен 10.02.2011

  • Исторические аналоги современных определений логарифма как средства вычислений. Интегральные методы XVII века, нахождение площади под гиперболой. Современное интегральное определение логарифма. Определение элементарных функций с помощью интеграла.

    курсовая работа [255,2 K], добавлен 04.09.2014

  • Использование формулы Тейлора для разложения основных элементарных функций в степенной ряд. Сущность форм Лагранжа и Пеано, примеры вычисление пределов функций. Особенности использования принципа разложения в ряд на ЭВМ в режиме реального времени.

    курсовая работа [107,1 K], добавлен 29.04.2011

  • Основные формулы и алгебраические свойства. Применение многочленов Чебышева-Эрмита в квантовой механике. Определение потенциальной энергии. Ортонормированный многочлен Чебышева-Эрмита. Уравнение Шрёдингера в одномерном случае. Коэффициенты разложения.

    курсовая работа [459,1 K], добавлен 21.11.2014

  • Уравнение, содержащее неизвестное под знаком логарифма или в его основании, называется логарифмическим уравнением. Свойства логарифмической функции, методы решения уравнений и неравенств. Использование свойств логарифма. Решение показательных уравнений.

    курсовая работа [265,0 K], добавлен 12.10.2010

  • Асимптотическое решение трансцендентных уравнений действительного переменного. Асимптотическое решение интегралов. Асимптотическое вычисление суммы ряда. Приложения символа "О". Основные определения, примеры.

    дипломная работа [151,2 K], добавлен 13.06.2007

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.