Методы анализа и задачи теории вероятностей и математической статистики

3адача определения закона распределения случайной величины или системы случайных величин по статистическим данным. Статистическое описание и выборочные характеристики двумерного случайного вектора. Применение однофакторного дисперсионного анализа.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 21.10.2017
Размер файла 73,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский Институт Электронной Техники

(Технический Университет)

Курсовая работа по теории вероятностей и математической статистике
Выполнил: Панов Сергей.
Проверила: Бардушкина И. В.

Москва 2001

Теоретическая часть

1. Основные задачи математической статистики

Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания; они представляют собой математическое выражение реальных закономерностей, фактически существующих в массовых случайных явлениях природы.

До сих пор, говоря о законах распределения случайных величин, мы не затрагивали вопроса о том, откуда берутся, на каком основании устанавливаются эти законы распределения. Ответ на вопрос вполне определенен - в основе всех этих характеристик лежит опыт; каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Оперируя такими понятиями, как события и их вероятности, случайные величины, их законы распределения и числовые характеристики, теория вероятностей дает возможность теоретическим путем определять вероятности одних событий через вероятности других, законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характеристики других. Такие косвенные методы позволяют значительно экономить время и средства, затрачиваемые на эксперимент, но отнюдь не исключают самого эксперимента. Каждое исследование в области случайных явлений, как бы отвлеченно оно ни было, корнями своими всегда уходит в эксперимент, в опытные данные, в систему наблюдений.

Разработка методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений, составляет предмет специальной науки- математической статистики.

Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму.

Охарактеризуем вкратце некоторые типичные задачи математической статистики, часто встречаемые на практике.

1.1 3адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным

Что закономерности, наблюдаемые в массовых случайных явлениях, проявляются тем точнее и отчетливее, чем больше объем статистического материала. При обработке обширных по своему объему статистических данных часто возникает вопрос об определении законов распределения тех или иных случайных величин. Теоретически при достаточном количестве опытов свойственные этим случайным величинам закономерности будут осуществляться сколь угодно точно. На практике нам всегда приходится иметь дело с ограниченным количеством экспериментальных данных; в связи с этим результаты наших наблюдений и их обработки всегда содержат больший или меньший элемент случайности. Возникает вопрос о том, какие черты наблюдаемого явления относятся к постоянным, устойчивым и действительно присущи ему, а какие являются случайными и проявляются в данной серии наблюдений только за счет ограниченного объема экспериментальных данных. Естественно, к методике обработки экспериментальных данных следует предъявить такие требования, чтобы она, по возможности, сохраняла типичные, характерные черты наблюдаемого явления и отбрасывала все несущественное, второстепенное, связанное с недостаточным объемом опытного материала. В связи с этим возникает характерная для математической статистики задача сглаживания или выравнивания статистических данных, представления их в наиболее компактном виде с помощью простых аналитических зависимостей.

1.2 Задача проверки правдоподобия гипотез

Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.

1.3 Задача нахождения неизвестных параметров распределения

Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений -- определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.

2. Статистическое описание и выборочные характеристики двумерного случайного вектора

Пусть,i=1,2,…, n, - выборка объема n из наблюдений случайного двумерного вектора . Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , i=1,2,…,n, с вероятностями, равными 1/n. Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Вычисление указанных выборочных характеристик удобно вычислять в следующей последовательности. Сначала вычисляют суммы

,,,,,.

Для контроля правильности вычислений используется тождество

.

Выборочные средние находятся по формулам

.

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних

= ,

,

.

Дисперсия находится по формулам: ,; коэффициент корреляции считается как

.

Выборочная линейная регрессия Y на X по выборке, i=1,2,…,n, определяется уравнением

Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам: ,

.

Аналогично определяются выборочная линейная регрессия X на Y

.

Коэффициенты и находятся по формулам:

, .

Для контроля правильности расчетов используется соотношение: .

Прямые , пересекаются в точке с координатами .

Для нахождения оценок параметров регрессии по результатам наблюдений используется метод наименьших квадратов. По этому методу в качестве оценок параметров выбирают такие значения и , которые миними-зируют сумму квадратов отклонений наблюдаемых значений случайных величин , i=1,2,…,n, от их математических ожиданий, т.е. сумму .

Оценки параметров линейной регрессии, получаемые по методу наименьших квадратов, при любом законе распределения ошибок наблюдений , i=1,2,….n, имеют следующие свойства:

1. Они являются линейными функциями результатов наблюдений , i=1,2,…,n, и несмещенными оценками параметров, т.е. , j=0,1.

2. Они имеют минимальные дисперсии в классе не смещенных оценок, являющихся линейными функциями результатов наблюдений. Если ошибки наблюдений не коррелированны и имеют нормальное распределение, т.е. , то в дополнение к свойствам 1,2 выполняется свойство:

3. МНК - оценки совпадают с оценками, вычисляемыми по методу максимального подобия.

Функция определяет выборочную регрессию Y на X. Последняя является оценкой предполагаемой линейной регрессией по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при , i=1,2,…,n, и расчетными значениями называются остатками и обозначаются : .

Качество аппроксимации результатов наблюдений , i=1,2,…,n, определяются величиной остаточной дисперсии, вычисляемой по формуле

.

Величина , определяемая выражением , называется остаточной суммой квадратов.

Остаточную сумму квадратов получают из тождества

,

которое записывается в виде:

где ,

.

Величина называется суммой квадратов, обусловленной регрессией. Полезной характеристикой линейной регрессии является коэффициент детерминации R2, вычисляемый по формуле: .

Коэффициент детерминации R2 равен той доле разброса результатов наблюдений, i=1,2,…,n, относительно горизонтальной прямой , которая объясняется выборочной регрессией. Величина R является оценкой коэффициента корреляции между результатами наблюдений и вычисленными значениями, предсказываемыми регрессией. В случае линейной регрессии Y на X (одной независимой переменой X) между коэффициентом R и выборочным коэффициентом корреляции имеется следующее соотношение:

.

Доверительным интервалом для параметра называется интервал , содержащий истинное значение с заданной вероятностью , т.е. . Число называется доверительной вероятностью, а значение - уровнем значимости. Статистики , определяемые по выборке из генеральной совокупности с неизвестным параметром , называются нижней и верхней границами доверительного интервала.

Границы доверительных интервалов для параметров линейной регрессии имеют вид:

,

, где - квантиль распределения Стьюдента с n-2 степенями свободы.

Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой: .

Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятности имеет вид , где - квантиль распределения с n-2 степенями свободы.

3. Однофакторный дисперсионный анализ

дисперсионный распределение статистический вектор

Пусть результаты наблюдений составляют l независимых выборок, полученных из l нормально распределенных генеральных совокупностей, которые имеют различные средние , ,…, и равные дисперсии . Проверяется гипотеза о равенстве средних. На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора (прибор ) на результат измерений. При l=2 для проверки гипотезы используются известные критерии значимости. Если l>2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.

Пусть обозначает i-й элемент k-й выборки, i=1,2,…,n, k=1,2,…,L; -выборочное среднее k-й выборки т.е.

;

- общее выборочное среднее т.е. , где n - число наблюдений.

Общая сумма квадратов отклонений наблюдений от общего среднего может быть представлено так:

.

Это основное тождество дисперсионного анализа. Запишем его в виде , где - общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних X k от общего среднего X (между группами), - сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).

Если верна гипотеза , то статистики и независимы и имеют распределение с l-1 и n-l степенями свободы. Следовательно, статистики и являются несмещенными оценками неизвестной дисперсии . Оценка характеризует рассеяние групповых средних, а - рассеяние внутри групп, которое обусловлено случайными вариациями результатов наблюдений. Значительное превышение величины над значением можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера т.е. .

Статистика используется для проверки гипотезы. Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если , то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.

Практическая часть

Все вычисленные данные представлены в таблице ниже. Для пояснения здесь приведены только некоторые из них.

Выборочная линейная регрессия Y на X: 0,5841+2,1605x

Выборочная линейная регрессия X на Y: -0,0674+0,4347y

Доверительные интервалы:

- для : 0.5841 0.3985

- для : 2.1605 0.682

- для среднего значения при заданном значении :

- для дисперсии ошибок наблюдений :

Распределение Фишера в однофакторном дисперсионном анализе: 167,30.

Из таблицы распределения находим . Так как , то гипотеза о равенстве средних не выполняется.

Размещено на Allbest.ru


Подобные документы

  • Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.

    реферат [174,7 K], добавлен 25.10.2015

  • Функция распределения вероятностей двух случайных величин. Функция и плотность распределения вероятностей случайного вектора. Многомерное нормальное распределение. Коэффициент корреляции. Распределение вероятностей функции одной случайной величины.

    реферат [241,8 K], добавлен 03.12.2007

  • Классическое, статистическое и геометрическое определения вероятности. Дискретные случайные величины и законы их распределения. Числовые характеристики системы случайных величин. Законы равномерного и нормального распределения систем случайных величин.

    дипломная работа [797,0 K], добавлен 25.02.2011

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.

    контрольная работа [165,5 K], добавлен 03.01.2012

  • Область определения функции, которая содержит множество возможных значений. Нахождение закона распределения и характеристик функции случайной величины, если известен закон распределения ее аргумента. Примеры определения дискретных случайных величин.

    презентация [68,7 K], добавлен 01.11.2013

  • Дискретные системы двух случайных величин. Композиция законов распределения, входящих в систему. Определение вероятности попадания случайной величины в интервал; числовые характеристики функции; математическое ожидание и дисперсия случайной величины.

    контрольная работа [705,1 K], добавлен 22.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.