Случайные величины

Случайная величина, которая в зависимости от исхода испытания случайно принимает одно из множества возможных значений. Непрерывные и дискретные случайные величины. Основные свойства функции распределения, математического ожидания, коэффициента корреляции.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 25.02.2011
Размер файла 195,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Линейная регрессия. Метод наименьших квадратов

Начальным пунктом эконометрического анализа зависимостей обычно является оценка линейной зависимости переменных. Если имеется некоторое множество точек наблюдений, через него всегда можно попытаться провести такую прямую линию, которая является наилучшей в определенном смысле среди всех прямых линий, то есть «ближайшей» к точкам наблюдений по их совокупности. Для этого нужно вначале определить понятие близости прямой к некоторому множеству точек на плоскости. Меры такой близости могут быть различными. Однако любая разумная мера должна быть, очевидно, связана с расстояниями от точек наблюдений до рассматриваемой прямой линии.

Рассмотрим двумерную случайную величину . Предположим, что некоторая величина приближенно представляет величину и может быть записана как функция от в виде линейной зависимости , где и - неизвестные параметры.

Требуется так подобрать параметры и , чтобы функция была наилучшим приближением к случайным значениям .

В качестве меры отклонения величины от значений можно взять математическое ожидание квадрата разности (-), т.е. .

Минимизация этого выражения позволяет получить соотношения для определения параметров и . Полученную таким образом функцию называют наилучшим приближением по методу наименьших квадратов, а функцию называют линейной средней квадратической регрессией на .

Теорема. Линейная средняя квадратическая регрессия на имеет вид:

где , , , , .

Доказательство: Пусть . Рассмотрим функцию .

Поскольку:

, ,

тогда, раскрывая квадрат разности, получим:

Так как , то , а из равенства следует .

Кроме того, .

Откуда следует, что .

Подставив полученные выражения, получим:

.

На основании необходимого условия экстремума функции двух переменных ее частные производные по соответствующим переменным должны быть равны нулю:

или ;

, или .

Таким образом, получаем систему двух уравнений:

Из этой системы находим параметры и . Для этого умножим второе уравнение системы на и сложим с первым. Получим , . Подставив полученное выражение для во второе уравнение системы, найдем .

После подстановки и в выражение функции , получим:

.

Условное математическое ожидание этого выражения при запишется в виде , что и требовалось доказать.

Метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции, называется методом наименьших квадратов.

Распределение 2

Пусть имеется n независимых случайных величин 1, 2, ..., n, распределенных по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Тогда случайная величина распределена по закону, который называется «распределение или «распределение Пирсона». Очевидно, что она может принимать лишь неотрицательные значения. Число n называется числом степеней свободы.

При n>1 график плотности распределения случайной величины 2 представляет собой кривую, изображенную на рисунке 1.

Для того, чтобы определить вероятность попадания случайной величины 2 в какой-либо промежуток из множества положительных чисел, пользуются таблицей распределения 2.

Таблица 1

q

n

0,99

0,975

0,95

...

0,1

0,05

0,01

1

0,0315

0,0398

0,0239

...

2,71

3,84

6,63

...

...

...

...

...

...

...

...

10

2,56

3,25

3,94

...

16,0

18,3

23,2

...

...

...

...

...

...

...

...

Обычно такая таблица позволяет по вероятности q и по числу степеней свободы n определить так называемый квантиль q2, если q и q2 связаны соотношением:

P(2 > q2) = q.

Эта формула означает вероятность того, что случайная величина 2 примет значение, большее, чем определенное значение q2, равна q.

Таблица 1 представляет собой фрагмент таблицы распределения 2. Из него видно, что случайная величина 2 с 10-ю степенями свободы с вероятностью q=0,95 принимает значение, большее 3,94, а та же величина с одной степенью свободы с вероятностью q=0,975 превышает 0,00098.

Задача. Найти интервал (12, 22), в который случайная величина 2 с 10-ю степенями свободы попадает с вероятностью, равной 0,9.

Решение. График плотности распределения 2 с 10-ю степенями свободы схематично изображен на рисунке 2. Будем считать, что площади заштрихованных областей (правая область не ограничена справа) равны между собой. Примем условия:

P(2 < 12) = P(2 > 22) = (1 - 0,9)/2 = 0,05, (1)

тогда P(12 < 2 < 22) = 0,9.

Равенства (1) сразу позволяют по таблице определить: 22 = 18,3. Для определения левой границы интересующего нас интервала придется воспользоваться очевидным равенством P(2>12)=0,95. Из таблицы 1. определяем: 12=3,94 , и теперь можно сформулировать ответ задачи: значение случайной величины 2 с вероятностью 0,9 принадлежит интервалу (3,94; 18,3).

Распределение Стьюдента

Многие задачи статистики приводят к случайной величине вида , где и - независимые случайные величины, причем - нормально распределенная случайная величина с параметрами M = 0 и D = 1, а распределена по закону 2 c k степенями свободы.

Закон распределения случайной величины t называется законом распределения Стьюдента с k степенями свободы.

График плотности распределения для закона Стьюдента схематически изображен на рисунке 3. Кривая плотности распределения схожа с аналогичной кривой для нормального распределения.

Таблицы распределения Стьюдента позволяют при данном числе степеней свободы k по вероятности q определить значение tq, для которого выполняется соотношение P(t > tq)=q. Фрагмент такой таблицы представляет собой таблица 2.

Таблица 2

q

k

0,1

0,05

...

0,01

0,005

...

1

6,314

12,71

...

63,57

318

...

...

...

...

...

...

...

...

12

1,782

2,179

...

3,055

3,428

...

...

...

...

...

...

...

...

Задача. Найти симметричный интервал, в который случайная величина, распределенная по закону Стьюдента с 12-ю степенями свободы, попадает вероятностью 0,9.

Решение. Очевидны соотношения:

P(-x < t < x) = P(t < x) = 1 - P(t x) = 0,9.

Из последнего равенства следует:

P(t x) = 0,1, (n = 12).

Определяем из таблицы: x=1,782. Нестрогое неравенство в скобках в левой части последней формулы нас не должно смущать, так как мы имеем дело с непрерывной случайной величиной, и вероятность того, что она примет конкретное значение, равна нулю.

Задача. Найти значение x из условия P(t > x) = 0,995 , где t - случайная величина, распределенная по закону Стьюдента с 12-ю степенями свободы.

Решение. На рисунке 4 изображен график плотности распределения Стьюдента с 12-ю степенями свободы. Вероятность того, что случайная величина примет значение из области справа от точки x1 равна 0,995 , следовательно, в область левее этой точки случайная величина попадает с вероятностью 0,005. Чтобы найти x1, рассмотрим две симметричные области, изображенные на рисунке 5. Допустим, что в каждой из этих областей значение случайной величины оказывается с вероятностью 0,005. Тогда получаем: x1= -x, x2=x, причем x определяется из условия P(t>x)=0,01. Из таблицы 2 находим: x=3,055. Теперь можно выписать ответ задачи:

P(t > -3,055) = 0,995.

Распределение Фишера

Важные приложения имеет в статистике случайная величина:

,

где - случайная величина, распределенная по закону 2 с k1 степенями свободы, а - случайная величина, распределенная по закону 2 с k2 степенями свободы.

Случайная величина F распределена по закону, называемому законом распределения Фишера с k1 и k2 степенями свободы. При заданных числах k1 и k2 и по вероятности q по таблице определяется значение Fq такое, что:

P(F > Fq) = q.

Обычно таблицы составляются для значений q, равных 0,05 или 0,01, а иногда для обоих этих значений. Фрагмент такой таблицы представляет собой таблица 3.

В этой таблице в верхней части каждой клетки дается значение Fq при q = 0,05, а в нижней части - при q = 0,01.

Таблица 3

k1

k2

1

...

10

...

20

...

1

161,4

647,8

...

241,9

6056

...

248

6209

...

...

...

...

...

...

...

...

10

4,96

10,04

...

2,97

4,85

...

2,77

4,41

...

...

...

...

...

...

...

...

Предельные теоремы теории вероятностей

Закон больших чисел. Неравенство Чебышева. Теорема Чебышева

Под законом больших чисел в теории вероятностей понимается ряд теорем, в каждой из которых устанавливается факт асимптотического приближения среднего значения большого числа опытных данных к математическому ожиданию случайной величины. В основе доказательств этих теорем лежит неравенство Чебышева. Это неравенство можно получить, рассматривая дискретную случайную величину, имеющую возможных значений .

Дисперсия такой величины .

Пусть - любое положительное число. Исключим из суммы все члены, для которых .

В этом случае сумма уменьшится: , где .

Если теперь в правой части этого неравенства все значения заменить на меньшее значение , то неравенство усилится: .

В этом неравенстве - это вероятности таких значений , для которых , а вся сумма представляет собой вероятность того, что случайная величина , т.е.:

Отсюда следует неравенство Чебышева:

,

которое позволяет оценить вероятность того, что .

Замечание. Если рассмотреть противоположное событие , то вероятность такого события .

Это неравенство используется, в частности, для доказательства теоремы Чебышева.

Теорема. Пусть имеется конечная последовательность независимых случайных величин, с одним и тем же математическим ожиданием и дисперсиями, ограниченными одной и той же постоянной :

.

Тогда, каково бы ни было число , вероятность события

стремится к единице при .

Доказательство. Положим .

Эта величина является случайным числом. Найдем ее математическое ожидание и дисперсию:

.

Так как независимы, то дисперсия суммы случайных величин равна сумме дисперсий слагаемых:

.

Из неравенства Чебышева с учетом сделанных обозначений, т.е. , получаем .

Отсюда следует, что с ростом вероятность события стремится к единице.

Теорема Чебышева устанавливает связь между теорией вероятностей, которая рассматривает средние характеристики всего множества значений случайной величины, и математической статистикой, оперирующей ограниченным множеством значений этой величины. Она показывает, что при достаточно большом числе измерений некоторой случайной величины среднее арифметическое значений этих измерений приближается к математическому ожиданию.

Размещено на Allbest.ru


Подобные документы

  • Равномерное распределение случайной величины. График плотности вероятности. Сущность вычисления математического ожидания и дисперсии. Случайная величина, которая в зависимости от исхода испытания случайно принимает одно из множества возможных значений.

    презентация [160,4 K], добавлен 01.11.2013

  • Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.

    контрольная работа [33,8 K], добавлен 13.12.2010

  • Случайные величины. Функция и плотность распределения вероятностей дискретной случайной величины. Сингулярные случайные величины. Математическое ожидание случайной величины. Неравенство Чебышева. Моменты, кумулянты и характеристическая функция.

    реферат [244,6 K], добавлен 03.12.2007

  • Определение вероятности появления события в каждом из независимых испытаний. Случайные величины, заданные функцией распределения (интегральной функцией), нахождение дифференциальной функции (плотности вероятности), математического ожидания и дисперсии.

    контрольная работа [59,7 K], добавлен 26.07.2010

  • Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.

    контрольная работа [165,5 K], добавлен 03.01.2012

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.

    контрольная работа [97,1 K], добавлен 26.02.2012

  • Понятие случайной величины, а также ее основные числовые характеристики. Случайная величина, подчиняющаяся нормальному закону распределения. Кривые плотности вероятности. Использование генератора случайных чисел. Изображение векторов в виде графика.

    лабораторная работа [301,4 K], добавлен 27.05.2015

  • Понятие и направления исследования случайных величин в математике, их классификация и типы: дискретные и непрерывные. Их основные числовые характеристики, отличительные признаки и свойства. Законы распределения случайных величин, их содержание и роль.

    презентация [1,4 M], добавлен 19.07.2015

  • Математическое ожидание случайной величины. Свойства математического ожидания, дисперсия случайной величины, их суммы. Функция от случайных величин, ее математическое ожидание. Коэффициент корреляции, виды сходимости последовательности случайных величин.

    лекция [285,3 K], добавлен 17.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.