Закон больших чисел. Критерий Пирсона: простая гипотеза

Ознакомление с методами решения основных задач математической статистики с использованием критерия согласия Пирсона. Изучение характеристических функций, которые используются в дальнейшем в теории математической статистики и теории вероятностей.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 21.04.2015
Размер файла 185,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Реферат

Целью курсовой работы является постановка и решение следующих задач:

1. изучение понятий, связанных со сходимостью последовательностей случайных величин и вероятностных распределений, характеристическими функциями, которые используются в дальнейшем в теории математической статистики и теории вероятностей;

2. решение основных задач математической статистики, с использованием критерия согласия Пирсона.

Результатом работы является закрепление знаний по таким разделам курса, как «Критерий согласия Пирсона», «Функции случайных величин» и «Предельные теоремы теории вероятностей».

Сходимость по распределению, характеристическая функция, закон больших чисел, случайная выборка, нулевая гипотеза, критерий Пирсона: простая гипотеза.

Содержание

Введение

1. Теоретическая часть

1.1 Предельные теоремы теории вероятностей

1.1.1 Сходимость последовательностей случайных величин и вероятностных распределений

1.1.2 Метод характеристических функций

1.1.3 Законы больших чисел

1.1.4 Усиленные законы больших чисел

1.1.5 Центральная предельная теорема для независимых одинаково распределенных случайных величин

1.1.6 Теоремы Ляпунова и Линдеберга

1.2 Проверка статистических гипотез

1.2.1 Основные задачи математической статистики и их краткая характеристика

1.2.2 Проверка статистических гипотез: основные понятия

1.2.3 Критерий согласия Пирсона

2. Практическая часть

2.1 Решение задач на тему «Функции случайных величин»

2.2 Решение задач на тему «Предельные теоремы теории вероятностей»

2.3 Решение задач на тему «Проверка статистических гипотез критерием согласия Пирсона: простая гипотеза»

Заключение

Список используемой литературы

Введение

Курс «Теория вероятностей и математическая статистика» занимает важное место в системе математических дисциплин, которые изучаются студентами специальностей ПМ, СА, ІНФ. Изучение курса необходимо для понимания основных понятий, методов, принципов и специфики решения конкретных задач теории вероятности и математической статистики на практике.

Целью курсовой работы является качественное увеличение теоретических знаний по курсу «Теория вероятностей и математическая статистика», развитие практических навыков применения данного курса при решении прикладных задач.

Данная работа состоит из двух частей - теоретической и практической. Теоретическая часть представляет собой базовую теорию по всем изученным нами раздела теории вероятности и математической статистики, а так же более углубленное изучение закона больших чисел в различных формах представления, а также критерия согласия Пирсона. В практической части были решены задачи на следующие темы:

1. Функции случайных величин;

2. Предельные теоремы теории вероятностей (законы больших чисел);

3. Задача на проверку статистических гипотез критерием согласия Пирсона: простая гипотеза.

1. Теоретическая часть

1.1 Предельные теоремы теории вероятностей

1.1.1 Сходимость последовательностей случайных величин и вероятностных распределений

Пусть - случайные величины, заданные на некотором вероятностном пространстве (P).

Последовательность случайных величин называется сходящейся по вероятности к случайной величине (обозначение: или ), если для , , , либо

.

Последовательность случайных величин называется сходящейся с вероятностью единица (почти наверное) к случайной величине , если

,

т.е. если множество исходов , для которых не сходятся к , имеет нулевую вероятность; либо

,

т.е. , кроме, быть может, , .

Этот вид сходимости обозначают следующим образом: (-п.н.), или , или , или п.н..

Теорема: а) Для того чтобы (-п.н.), необходимо и достаточно, чтобы для любого

, .

Лемма. Из сходимости почти наверное следует сходимость по вероятности:

.

Замечание: В случае, если последовательность - монотонна, то

.

Последовательность случайных величин называется сходящейся в среднем порядка , , к случайной величине , если

, . (1.2)

Теорема. Из сходимости в среднем порядка следует сходимость по вероятности. Обратное, вообще говоря, неверно.

Теорема. Если для последовательности случайных величин существует действительное число такое, что

?,

и при имеет место сходимость по вероятности , то

и .

Теорема. Если при

,

то для любого

.

Иными словами, из сходимости следует сходимость , если .

Последовательность случайных величин фундаментальна по вероятности (с вероятностью единица; в среднем порядка , ), если выполнены соответственно следующие условия:

, ;

(последовательность фундаментальна для почти всех ; последовательность функций фундаментальна в смысле , т.е. , ). математический статистика пирсон

1.1.2 Метод характеристических функций

Характеристической функцией вещественной случайной величины называется комплекснозначная функция

,

где - действительное число.

Если случайная величина дискретна, то:

.

Характеристическая функция для абсолютно непрерывной случайной величины определяется как

.

Из этого уравнения можно выразить плотность распределения случайной величины :

.

В таком случае характеристическая функция есть просто преобразование Фурье функции . В общем случае характеристическая функция есть преобразование Фурье - Стильтьеса над функцией .

Характеристическая функция существует для любой случайной величины . Это следует из того, что

.

Основные свойства характеристических функций формулируют следующим образом:

1. Для любой случайной величины и для всех .

2. .

Действительно,

.

3. Если - независимые случайные величины, то

.

4. Если существует -й момент , , то существует непрерывная -я производная функции причем:

.

Если , то в окрестности точки справедливо разложение характеристической функции в ряд:

, .

В обратную сторону это свойство верно лишь частично: если производные четного порядка характеристической функции существуют, то начальные моменты тоже существуют.

Если для функции не выполняется одно из вышеперечисленных свойств, то это означает, что рассматриваемая функция не является характеристической.

Теорема единственности. Характеристическая функция случайной величины однозначно определяет ее функцию распределения.

Теорема (теорема непрерывности). Если при для любого и непрерывна при , то

1) есть характеристическая функция некоторой функции распределения :

2) .

Обратно, если и есть функция распределения, то , при этом - характеристическая функция функции распределения .

Предельная функция в соотношении всегда будет неубывающей ограниченной функцией, но не обязательно функцией распределения. Ее вариация может оказаться меньше единицы.

1.1.3 Законы больших чисел

Рассмотрим последовательность случайных величин , для которых , . Последовательность такая что величина

,

сходится к нулю по вероятности, т. е.

.

Теоремы, формулирующие условия сходимости по вероятности для последовательности случайных величин , называются законами больших чисел.

Теорема (законы больших чисел в форме Чебышева). Пусть -последовательность независимых случайных величин, имеющих конечные математические ожидания и дисперсии, ограниченные в совокупности . Тогда:

Доказательство: Нужно доказать, что . Для доказательства воспользуемся неравенством Чебышева.

Составим неравенство Чебышева

Теорема доказана, и из нее следует, что .

Следствие. Пусть - это последовательность независимых одинаково распределенных случайных величин , , тогда для любого - правило среднего арифметического.

Пусть производиться измерение физической величины . Повторив измерения n раз в одинаковых условиях, наблюдатель получает результаты измерений . Тогда в качестве приближенного значения принимается среднее арифметическое результатов измерений .

Если систематическая ошибка отсутствует, т. е. , то согласно сформулированному выше следствию,

.

Теорема (законы больших чисел в форме Хинчина). Пусть случайные величины независимы и одинаково распределенные, имеющие конечные математические ожидания , . Тогда для любого

.

Теорема (законы больших чисел для схемы Бернулли). Пусть последовательность независимых одинаково распределенных испытаний, в каждом из которых может быть два исхода -- успех У (с вероятностью р) или неудача Н (с вероятностью ) независимо от исходов других испытаний. Образуем последовательность случайных величин следующим образом.

Пусть , если в i-м испытании произошел успех, и , если в i-м испытании произошла неудача. Тогда есть последовательность независимых одинаково распределенных случайных величин, ,

Теорема Бернулли. Для любого , при , где - частота появления успеха в первых испы-таниях.

Смысл этого утверждения состоит в том, что введенное нами определение вероятности соответствует интуитивному пониманию вероятности как предела частоты.

Теорема (законы больших чисел в форме Маркова). Пусть случайные величины как угодно зависимы и имеют моменты второго порядка. Для выполнения закона больших чисел достаточно чтобы

1.1.4 Усиленные законы больших чисел

Теорема (усиленный закон больших чисел Колмогорова). Пусть случайные величины имеют конечные математические ожидания и дисперсии: , , . Пусть положительные числа таковы, что и сходится (в частности, , ). Тогда имеет место сходимость с вероятностью 1:

.

В том случае, когда величины не только независимы, но и к тому же одинаково распределены, для справедливости усиленного закона больших чисел нет надобности требовать существования второго момента, а достаточно лишь существования первого абсолютного момента.

Теорема (усиленный закон больших чисел Колмогорова для одинаково распределенных случайных величин). Пусть - последовательность независимых одинаково распределенных случайных величин с , , . Тогда

.

Рассмотрим последовательность случайных величин с конечными математическими ожиданиями. Теоремы, утверждающие, что разность

сходится с вероятностью 1 к нулю, называется усиленным законом больших чисел (сравним с законом больших чисел, утверждающим, что указанная разность сходится к нулю лишь по вероятности). Ниже приведены две теоремы об усиленном законе больших чисел, обе они доказаны А.Н. Колмогоровым.

Теорема. Пусть - последовательность независимых случайных величин, для которой и определены. Если

1.1.5 Центральная предельная теорема для независимых одинаково распределенных случайных величин

Центральная предельная теорема представляет собой группу теорем, посвященных установлению условий, при которых возникает нормальный закон распределения, и нарушение которых ведет к распределению, отличному от нормального. Различные формы центральной предельной теоремы различаются между собой условиями, накладываемыми на распределения образующих сумму случайных слагаемых . Докажем одну из самых простых форм этой теоремы, а именно, центральную предельную теорему для независимых одинаково распределенных слагаемых.

Рассмотрим последовательность независимых одинаково распределенных случайных величин , имеющих математическое ожидание . Предположим также, что существует дисперсия . Введем обозначение . Закон больших чисел для этой последовательности можно представить в следующей форме:

,

где сходимость можно понимать, как в смысле сходимости по вероятности (слабый закон больших чисел), так и в смысле сходимости с вероятностью, равной единице (усиленный закон больших чисел).

Теорема (центральная предельная теорема для независимых одинаково распределенных случайных величин). Пусть - последовательность независимых одинаково распределенных случайных величин, , , . Тогда имеет место равномерная относительно () сходимость

,

где - функция стандартного нормального распределения (с параметрами ):

.

При выполнении условия такой сходимости последовательность называется асимптотически нормальной.

1.1.6 Теоремы Ляпунова и Линдеберга

Рассмотрим случай когда случайные величины имеют разные распределения, - независимы с разными распределениями.

,

,

,

.

Теорема (Линдеберга). Пусть - последовательность независимых случайных величин с конечными дисперсиями. Если для этой последовательности выполняется условие Линдеберга:

где , то для нее выполнена центральная предельная теорема.

Поскольку непосредственно проверка условия Линдеберга затруднительна, то рассматривается некоторое другое условие при котором имеет место центральная предельная теорема, а именно условие теоремы Ляпунова.

Теорема (Ляпунова). Если для последовательности случайных величин выполняется условие Ляпунова:

,

то последовательность является асимптотически нормальной, т.е. имеет место центральная предельная теорема.

Из выполнения условия Ляпунова следует выполнение условия Линдеберга, а из него следует центральная предельная теорема.

1.2 Проверка статистических гипотез

1.2.1 Основные задачи математической статистики и их краткая характеристика

Математическая статистика занимается количественным и качественным анализом закономерностей случайных массовых явлений.

Математическая статистика разрабатывает методы математической обработки результатов испытания с целью получения сведений о вероятностях наступления отдельных событий, о законах распределения случайных величин или параметрах этих законов.

При обработке результатов эксперимента статистическими методами основные понятия теории вероятностей - вероятность наступления случайного события, законы распределения случайных величин, параметры законов распределения случайных величин и т.д. выступают как некоторые математические модели реальных закономерностей. Таким образом, теория вероятностей разрабатывает математические модели для описания реальных закономерностей случайных массовых явлений, формирует систему взглядов на статистическую обработку результатов эксперимента.

Основой статистических методов являются экспериментальные данные, часто называемые статистическими данными.

Статистическими данными называют сведения о числе объектов, обладающих теми или иными признаками. Поэтому предметом математической статистики являются случайные явления, а ее основной задачей - количественный и качественный анализы этих явлений.

Первая задача математической статистики - указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.

Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:

1. оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких независимых случайных величин и др.;

2. проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.

В наше время математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования, в ходе исследования и решает многие другие задачи. Современную математическую статистику определяют, как науку о принятии решений в условиях неопределенности.

Тогда из вышеизложенного можно сделать вывод, что задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

1.2.2 Проверка статистических гипотез: основные понятия

Если закон распределения генеральной совокупности неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его ), выдвигают гипотезу: генеральная совокупность распределена по закону . Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.

Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.

Пусть имеется выборка , являющаяся реализацией случайной выборки из генеральной совокупности , плотность распределения которой зависит от неизвестного параметра .

Статистическая гипотеза - произвольное предположение про распределение случайной выборки, наблюдаемой в стохастическом эксперименте. Такая гипотеза может быть о виде неизвестного распределения, или о параметрах неизвестных распределений.

Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать.

Нулевой (основной) называют выдвинутую гипотезу .

Альтернативной, или конкурирующей, называют гипотезу , которая противоречит нулевой.

По данным выборки необходимо принять решение о справедливости одной из указанных гипотез.

Статистические гипотезы относительно неизвестного параметра называют параметрическими гипотезами. Если при этом - скаляр, то речь идет об однопараметрических гипотезах, а если вектор, - то о многопараметрических гипотезах.

Статистическую гипотезу называют простой, если она имеет вид

,

где - некоторое заданное значение параметра.

Статистическую гипотезу называют сложной, если она имеет вид

,

где - некоторое множество значений параметра , состоящее более чем из одного элемента. В случае простой гипотезы множество является одноэлементным.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное значение которой известно.

Критерий для проверки гипотезы против гипотезы абстрактно можно определить как функцию вида

.

Это означает, что по каждой выборке принимается решение в пользу одной из гипотез.

На практике статистический вывод совершается на основании рассмотрения некоторой измеримой функции от случайной выборки, называемой статистикой критерия:

.

Будем считать, что условное распределение полностью известно, т.е. не содержит неизвестных параметров.

Статистический критерий проверки гипотезы - правило, в соответствии с которым на основании наблюдаемого значения статистики критерия

,

гипотеза принимается либо отклоняется.

Критической областью называют область реализаций статистики критерия , при попадании в которую гипотеза отклоняется.

Доверительная область - область значений статистики критерия, при попадании в которую гипотеза принимается. При этом

, .

Основной принцип проверки статистических гипотез: если наблюдаемое значение статистики критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит доверительной области - гипотезу принимают.

Поскольку статистика критерия является одномерной случайной величиной, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством

,

где - положительное число.

Левосторонней называют критическую область, определяемую неравенством

,

где - отрицательное число.

Двусторонней называют критическую область, определяемую неравенствами

, ,

где .

В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что ):

, ,

или равносильным неравенством

.

Таким образом, статистический критерий задается парой .

С критической областью можно связать критическую область выборки:

.

Доверительная область выборки определяется как

.

Таким образом, вычислив , мы принимаем следующее статистическое решение:

1. если (), то гипотеза отвергается в пользу как противоречащая результатам наблюдений;

2. если (), то гипотеза принимается как не противоречащая результатам наблюдений.

Ошибкой первого рода статистического критерия называется событие, состоящее в том, что отклоняется нулевая гипотеза при условии, что она верна.

Ошибка второго рода статистического критерия - принятие нулевой гипотезы, когда верна альтернатива.

Вероятности соответствующих событий называются вероятностями ошибок первого и второго родов.

Пусть - параметрическое множество,

, ,

, ().

Уровень значимости (доверительный уровень, критический уровень) статистического критерия - функция от параметра , задающая вероятность ошибок первого рода:

, .

Мощность критерия - вероятность отсутствия ошибки второго рода (вероятность принятия альтернативы, когда она верна):

1-, .

Если - простая гипотеза, то уровень значимости - число

.

Вероятность , где , называют оперативной характеристикой критерия.

Говорят, что критерий имеет уровень значимости (доверительный уровень) , если вероятность ошибки первого рода не превосходит :

,

причем , при котором выполняется равенство

.

Если нулевая гипотеза является простой (), то всегда

.

Критерий - несмещенный, если его мощность не меньше его уровня значимости:

, .

Критерий уровня значимости - состоятельный (консистентный), если с увеличением объема выборки его мощность стремится к единице:

, .

Этапы проверки статистической гипотезы:

1. сформулировать проверяемую гипотезу и альтернативную к ней гипотезу ;

2. выбрать уровень значимости ;

3. выбрать статистику для проверки гипотезы ;

4. найти распределение статистики при условии, что верна гипотеза ;

5. в зависимости от гипотезы построить критическую область ;

6. получить выборку наблюдений и вычислить выборочное значение статистики критерия;

7. сделать статистический вывод на уровне доверия следующим образом:

а) если , то гипотеза отвергается в пользу как противоречащая результатам наблюдений;

б) если , то гипотеза принимается как не противоречащая результатам наблюдений.

1.2.3 Критерий Пирсона: простая гипотеза

Определение. Критерием согласия называют статистические критерии предназначенные для нахождения различий между статистической моделью и реальными данными, которые эта модель должна описывать, соответственно основная гипотеза называется гипотезой согласованности.

Критерий Пирсона применяется не только для непрерывных генеральных совокупностей, но и также для дискретных. Сформулируем простую гипотезу:

Для применения критерия Пирсона данные группируют, т.е. переходят или к интервальному или к статистическому ряду.

- вектор эмпирических частот попадания выборочных значений в соответствующие интервалы группировки .

.

Вводят обозначение - вектор вероятностей.

,

,

- теоретические вероятности для выбранного распределения. Тогда гипотеза может быть переписана в следующем виде:

где - неизвестная вероятностная генеральная совокупность попадающая в интервал.

.

Статистика критерия имеет вид:

.

Если верна гипотеза , т.е. распределение подобрано верно, то числитель статистики стремится к нулю при большие значения статистики противоречат гипотезе .

Теорема (Пирсона об асимптотике статистики ). Если , то при распределение статистики

,

то распределение статистики слабо сходится к распределению с - степенями свободы, где - это число интегралов группировки.

Вывод. Пусть и ,где - число элементов попавших в каждый интервал, тогда гипотеза отвергается на уровне значимости , если

где -квантиль распределения уровня с числом степеней свободы , в противном случае статистические данные не противоречат гипотезе .

Замечания.

1. Уровень значимости приближенно равен .

2. Критерием нельзя пользоваться для малых выборок.

3. Малочисленные интервалы объединяют.

В отличие от критериев Колмогорова и критерием при небольших объемах выборки пользоваться нельзя. Более того, для удовлетворительной аппроксимации распределения случайной величины распределением необходимо, чтобы не только n было велико, но и все величины , также были немалыми. На практике при небольших необходимо, чтобы выполнялись условия . а если велико, достаточно, чтобы было . Поскольку теорема Пирсона носит асимптотический характер, то критерий является асимптотически непараметрическим.

Критерий можно использовать и тогда, когда случайная величина непрерывна или дискретна, но принимает счетное множество значений с положительными вероятностями.

Недостатком использования критерия для случайных величин, принимающих бесконечное множество значений, является в некоторая потеря информации при переходе от к случайной величине с конечным числом значений.

2. Практическая часть

2.1 Решение задач на тему «Функции случайных величин»

Задача 1. Случайная величина имеет плотность распределения . Найти плотность распределения вероятностей случайной величины .

Решение. Поскольку случайная величина имеет абсолютно непрерывное распределение , а - непрерывная вместе со своей первой производной в интервале возможных значений функция, то случайная величина также имеет плотность . Функция имеет два интервала монотонности, поэтому справедлива следующая формула

Случайная величина имеет равномерное на распределение.

Находим производные от и

,

Тогда по формуле получаем следующее

, .

Задача 2. По заданной плотности распределения

,

двумерной случайной величины найти плотность распределения двумерной случайной величины связанной с соотношениями , .

Решение. Пусть и - двумерные непрерывные случайные величины, причем , . Если обратное преобразование , имеет непрерывные частные производные по и , то плотности распределения векторов и связаны соотношением

,

где - якобиан преобразования и .

Преобразование , осуществляет взаимно-однозначное преобразование плоскости (множества возможных значений ) в область , определяемую неравенствами и . Обратное преобразование, определенное на , имеет вид

, ,

причем якобиан в .

Тогда по формуле

Ответ: Плотность распределения случайной величины

2.2 Решение задач на тему «Предельные теоремы теории вероятностей»

Задача 1. Интеграл вычислен методом Монте-Карло на основании 1300 независимых опытов. Найти вероятность того, что абсолютная погрешность в определении величины не превосходит 0,005.

Решение. Значение интеграла можно рассматривать как математическое ожидание квадрата случайной величины, распределенной равномерно на . Пусть - независимые равномерные на случайные числа. Тогда можно рассматривать как приближенное значение интеграла значение случайной величины

.

Вычислим

,

.

Так как все - независимые и одинаково распределенные случайные величины, имеющие конечные дисперсии , то к этим случайным величинам применима ЦПТ:

Введем . При больших ()

.

Из условия задачи: , , следовательно

.

Ответ: искомая вероятность равна 0,0064.

Задача 2. Интеграл вычислен методом Монте-Карло. Сколько опытов нужно произвести, чтобы с вероятностью большей 0,99, можно было считать абсолютную погрешность вычисления значения интеграла не превосходящей 0,25% от ?

Решение. Значение интеграла можно рассматривать как математическое ожидание функции от случайной величины , где - случайная величина, равномерно распределенная на с плотностью .

Пусть - независимые равномерные на случайные числа. Тогда можно рассматривать как приближенное значение интеграла значение случайной величины

.

Вычислим

;

.

На основании ЦПТ при больших

.

Из условия задачи , вероятность такой погрешности больше 0,9:

, , ,

, .

Ответ: необходимо произвести не менее опытов.

2.3 Решение задач на тему «Проверка статистических гипотез критерием согласия Пирсона: простая гипотеза»

Задача 1. С помощью функции RandomReal пакета Mathematica получена выборка из 100 случайных чисел, имеющих показательный закон распределения с параметром :

0,596; 0,352; 3,601; 0,838; 0,772; 0,393; 0,291; 0,544; 3,751; 0,719; 0,546; 0,431; 2,301; 1,093; 0,072; 0,445; 1,551; 0,033; 0,638; 3,642; 0,343; 0,023; 0,605; 0,054; 0,436; 0,556; 0,596; 1,971; 0,276; 0,004; 0,066; 0,152; 0,084; 0,265; 0,761; 0,052; 0,546; 0,442; 1,301; 1,101; 0,582; 0,323; 1,731; 0,508; 1,112; 0,198; 0,022; 0,041; 0,568; 0,148; 0,052; 0,344; 5,142; 0,877; 0,025; 1,031; 0,143; 2,313; 0,114; 0,069; 1,193; 2,892; 1,331; 0,540; 1,505; 1,501; 0,816; 0,152; 0,079; 0,479; 0,689; 1,861; 0,629; 0,296; 0,138; 0,154; 4,291; 1,471; 0,077; 0,796; 0,279; 0,430; 0,543; 0,317; 1,501; 0,189; 1,511; 2,611; 0,179; 0,433; 0,943; 3,174.

С помощью критерия согласия Пирсона на уровнях значимости проверить гипотезу о том, что выборка получена из показательного закона с параметром .

Решение. Выдвинем гипотезу о том, что рассматриваемая выборка сделана из генеральной совокупности , распределенной по показательному закону с параметром . Тогда основную гипотезу формируем в виде

распределена по показательному закону.

не распределена по показательному закону.

Для проверки нулевой (основной) гипотезы воспользуемся критерием для простой гипотезы. Изначально следует сгруппировать выборочные данные, перейдя к статистическому ряду или интервальному статистическому ряду.

Пусть - вектор эмпирических частот попадания выборочных значений в соответствующие интервалы группировки . Тут - число элементов выборки, которые попали в интервал группировки . Отметим, что , то есть случайные величины являются зависимыми.

Вариационный ряд данной выборки имеет следующий вид

0,004; 0,022; 0,023; 0,024; 0,025; 0,031; 0,033; 0,041; 0,052; 0,052; 0,052; 0,054; 0,066; 0,069; 0,072; 0,077; 0,079; 0,084; 0,114; 0,138; 0,143; 0,148; 0,152; 0,152; 0,154; 0,179; 0,189; 0,198; 0,265; 0,276; 0,279; 0,291; 0,296; 0,317; 0,323; 0,343; 0,344; 0,352; 0,393; 0,43; 0,431; 0,433; 0,436; 0,442; 0,445; 0,479; 0,508; 0,54; 0,543; 0,544; 0,546; 0,546; 0,556; 0,568; 0,582; 0,596; 0,596; 0,605; 0,629; 0,638; 0,689; 0,719; 0,761; 0,772; 0,796; 0,816; 0,827; 0,838; 0,877; 0,941; 0,943; 1,031; 1,083; 1,093; 1,101; 1,112; 1,193; 1,222; 1,301; 1,331; 1,341; 1,471; 1,501; 1,501; 1,505; 1,511; 1,551; 1,731; 1,861; 1,971; 2,301; 2,313; 2,611; 2,892; 3,174; 3,601; 3,642; 3,751; 4,291; 5,142.

Для того чтобы составить интервальный статистический ряд, для начала используем формулу Старджесса для вычисления количества промежутков.

.

Возьмем . Находим . Тогда отрезок разобьем на 8 промежутков

.

Длина каждого промежутка . Результаты подсчета частот попадания в интервал приведены в таблице 1.

Таблица 1 - Группированный статистический ряд выборки

Номер промежутка

Границы промежутков

1

0,004

0,646

60

2

0,646

1,289

18

3

1,289

1,931

11

4

1,931

2,573

3

5

2,573

3,215

3

6

3,215

3,858

3

7

3,858

4,499

1

8

4,499

5,142

1

100

Таблица 2 - Вычисления при проверке гипотезы о показательном распределении генеральной совокупности

1

60

0,4759

47,59

12,41

3,2361

2

18

0,2486

24,86

-6,86

1,8930

3

11

0,1305

13,05

-2,05

0,3220

4

3

6

3

0,0687

10,49

-4,49

1,9218

5

0,0362

6

3

1 5

1

0,0190

4,01

0,99

0,2444

7

0,0144

8

0,0067

Сумма

100

Как видно из таблицы 2, малочисленные интервалы были объединены в один промежуток. Наблюдаемое значение статистики критерия хи-квадрат равно .

Поскольку после группировки значений с малыми частотами осталось промежутков , то число степеней свободы равно .

Из таблицы квантилей распределения хи-квадрат для уровня значимости находим критическое значение . Тогда критическая область будет иметь вид

.

Поскольку , то делаем вывод, что нулевая гипотеза о показательном законе распределения генеральной совокупности не противоречит выборочным данным. Значит, на уровне значимости гипотезу принимаем.

Аналогично для уровней значимости и . Находим и . Тогда критический области соответственно будут иметь вид

: ;

: .

Поскольку и для этих уровней значимости наблюдаемое значение статистики критерия хи-квадрат не принадлежит к соответствующим критическим областям, то гипотеза принимается также и на уровнях значимости и .

Заключение

В ходе выполнения курсовой работы были изучены и закреплены понятия, связанные со сходимостью последовательностей случайных величин и вероятностных распределений, характеристическими функциями, которые используются в дальнейшем в теории математической статистики и теории вероятностей. Развили навыки решения задач на следующие темы:

1. Функции случайных величин.

2. Предельные теоремы теории вероятностей.

3. Проверка статистических гипотез.

Так же в ходе проделанной работы я убедилась в том, что в отличие от критериев согласия Колмогорова и омега-квадрат Мизеса критерий хи-квадрат Пирсона нельзя использовать для выборок с небольшим объемом. Кроме этого, перед применением критерия необходимо объединять малочисленные интервалы, но у него есть и не малая привилегия среди других критериев согласия, поскольку его можно использовать как для непрерывных, так и для дискретных генеральных совокупностей.

Тщательно подбирая необходимую теорию и используя ее на практике, была получена и исследована полноценная информация поставленных задач.

Список используемой литературы

1. Боровков А.А. Теория вероятностей. - 2-е изд., перераб. и доп. - М.: Наука, 1986. - 432 с.

2. Гнеденко Б.В. Курс теории вероятностей. - 9-е изд., испр. - М.: Изд-во ЛКИ, 2007. - 448 с.

3. Математическая статистика / В.Б. Горяинов, И.В. Павлов, Г. М. Цветкова и др.; под ред. В.С. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. - 424 с.

Размещено на Allbest.ru


Подобные документы

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Критерий согласия – критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности. Критерий Колмогорова-Смирнова и его практическое применение. Критические значения статистик Стефенса. Критерии Пирсона и Смирнова-Крамера.

    курсовая работа [629,9 K], добавлен 26.08.2012

  • Теория вероятности, понятие вероятности события и её классификация. Понятие комбинаторики и её основные правила. Теоремы умножения вероятностей. Понятие и виды случайных величин. Задачи математической статистики. Расчёт коэффициента корреляции.

    шпаргалка [945,2 K], добавлен 18.06.2012

  • Суть понятия "критерии согласия". Критерии согласия Колмогорова и омега-квадрат в случае простой гипотезы. Критерии согласия Пирсона для простой гипотезы, Фишера для сложной гипотезы. Теоретическое обоснование и практическое применение критерия согласия.

    курсовая работа [3,6 M], добавлен 18.11.2010

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.

    курсовая работа [726,2 K], добавлен 26.02.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.