Проверка гипотез о виде распределения
Критерий согласия Пирсона, проверка гипотезы о виде распределения статистического ряда. Определение границы критической области. Проверка гипотезы о распределении генеральной совокупности. Построение нормированной гистограммы относительных частот.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 23.03.2017 |
Размер файла | 166,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
1. Дан статистический ряд
-3 |
-1 |
1 |
3 |
5 |
||
10 |
16 |
21 |
15 |
8 |
Выдвинуть гипотезу о виде распределения изучаемого признака Х.
Используя критерий согласия Пирсона, выяснить, не противоречит ли принятая гипотеза о виде распределения опытным данным с уровнем значимости
статистический ряд граница критический критерий согласие
Решение
По внешнему виду полигона можно предположить, что данные выборки будут распределены по нормальному закону распределения.
Для оценки ряда распределения найдем следующие показатели:
Средняя взвешенная
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 0.86 в среднем на 2.42
Оценка среднеквадратического отклонения.
Проверка гипотез о виде распределения
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
где n*i - теоретические частоты:
Вычислим теоретические частоты, учитывая, что:
n = 70, h=2 (ширина интервала), у = 2.42, xср = 0.86
i |
xi |
ui |
цi |
n*i |
|
1 |
-3 |
-1.59 |
0,1109 |
6.41 |
|
2 |
-1 |
-0.77 |
0,2966 |
17.15 |
|
3 |
1 |
0.059 |
0,3982 |
23.02 |
|
4 |
3 |
0.88 |
0,2685 |
15.52 |
|
5 |
5 |
1.71 |
0,0909 |
5.25 |
Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия:
i |
ni |
n*i |
ni-n*i |
(ni-n*i)2 |
(ni-n*i)2/n*i |
|
1 |
10 |
6.41 |
-3.59 |
12.88 |
2.01 |
|
2 |
16 |
17.15 |
1.15 |
1.31 |
0.0766 |
|
3 |
21 |
23.02 |
2.02 |
4.08 |
0.18 |
|
4 |
15 |
15.52 |
0.52 |
0.27 |
0.0175 |
|
5 |
8 |
5.25 |
-2.75 |
7.54 |
1.43 |
|
? |
70 |
70 |
3.71 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям у, k = 5, r=2 (параметры xcp и у оценены по выборке).
Kkp(0;2) = 7.37776; Kнабл = 3.71
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.
2. Проверим гипотезу о том, что Х распределено по закону Пуассона.
где pi -- вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону.
а) Находим по заданному эмпирическому распределению выборочную среднюю (xВ = 0.857).
б) Принимаем в качестве оценки параметра л распределения Пуассона выборочную среднюю xср = 0.857. Следовательно, предполагаемый закон Пуассона имеет вид:
в) Найдем по формуле Пуассона вероятности Pi, появления ровно i событий в n испытаниях. Находим теоретические частоты по формуле npi
i = 0: p0 = 0.42, np0 = 29.71
i = 1: p1 = 0.36, np1 = 25.46
i = 2: p2 = 0.16, np2 = 10.91
i = 3: p3 = 0.0445, np3 = 3.12
i = 4: p4 = 0.00954, np4 = 0.67
в) Вычисляем слагаемые статистики Пирсона по формуле (5 столбец таблицы):
i |
Наблюдаемая частота ni |
pi |
Ожидаемая частота npi |
Слагаемые статистики Пирсона Ki |
|
0 |
10 |
0.42 |
29.71 |
13.07 |
|
1 |
16 |
0.36 |
25.46 |
3.52 |
|
2 |
21 |
0.16 |
10.91 |
9.33 |
|
3 |
15 |
0.0445 |
3.12 |
45.28 |
|
4 |
8 |
0.00954 |
0.67 |
80.46 |
|
70 |
151.66 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения г2 и заданным значениям s, k (число интервалов), r=1 (параметр л).
Kkp(0;3) = 9.34840; Kнабл = 151.66
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.
4. Проверка гипотезы о равномерном распределении генеральной совокупности.
Для того чтобы проверить гипотезу о равномерном распределении X,т.е. по закону: f(x) = 1/(b-a) в интервале (a,b) надо:
1. Оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через знак * обозначены оценки параметров):
2. Найти плотность вероятности предполагаемого распределения f(x) = 1/(b* - a*)
3. Найти теоретические частоты:
n1 = nP1 = n[f(x)*(x1 - a*)] = n*1/(b* - a*)*(x1 - a*)
n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)
ns = n*1/(b* - a*)*(b* - xs-1)
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-3, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.
Решение:
1. Найдем оценки параметров a* и b* равномерного распределения по формулам:
2. Найдем плотность предполагаемого равномерного распределения:
f(x) = 1/(b* - a*) = 1/(5.05 - (-3.34)) = 0.119
3. Найдем теоретические частоты:
n1 = n*f(x)(x1 - a*) = 70 * 0.119(-3-(-3.34)) = 2.82
n5 = n*f(x)(b* - x4) = 70 * 0.119(5.05-5) = 0.43
Остальные ns будут равны:
ns = n*f(x)(xi - xi-1)
i |
ni |
n*i |
ni - n*i |
(ni - n*i)2 |
(ni - n*i)2/n*i |
|
1 |
10 |
2.82 |
7.18 |
51.6 |
18.32 |
|
2 |
16 |
16.69 |
-0.69 |
0.47 |
0.0283 |
|
3 |
21 |
16.69 |
4.31 |
18.6 |
1.11 |
|
4 |
15 |
16.69 |
-1.69 |
2.85 |
0.17 |
|
5 |
8 |
0.43 |
7.57 |
57.26 |
132.25 |
|
Итого |
70 |
151.88 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям s, k (число интервалов), r=2 (параметры a и b).
Kkp(2,0) = 7.37776; Kнабл = 151.88
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по равномерному закону.
2. Дан интервальный ряд. Здесь - частота попадания в промежуток .
i |
|||
1 |
[12,16) |
7 |
|
2 |
[16,20) |
15 |
|
3 |
[20,24) |
23 |
|
4 |
[24,28) |
9 |
|
5 |
[28,32) |
6 |
Построить гистограмму нормированных относительных частот и выдвинуть гипотезу о виде распределения изучаемого признака Х.
Используя критерий согласия Пирсона, выяснить, не противоречит ли принятая гипотеза о виде распределения опытным данным с уровнем значимости
Решение
Теперь построим нормированну гистограмму относительных частот:
Объем выборки:
n=7+15+23+9+6=60
Длина промежутков равна 4
Относительные частоты:
Проверим нормированность, сумма относительных частот должна равняться 1:
0,12 + 0,25 + 0,38 + 0,15 + 0,1 = 1
По внешнему виду гистограмм можно предположить, что данные выборки будут распределены по нормальному закону распределения.
Полигон эмпирических частот.
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 32 - 12 = 20
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 21.47 в среднем на 4.47
Оценка среднеквадратического отклонения.
Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
где pi -- вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
где
s = 4.47, xср = 21.47
Теоретическая (ожидаемая) частота равна ni = npi, где n = 60
Интервалы группировки |
Наблюдаемая частота ni |
x1 = (xi - xср)/s |
x2 = (xi+1 - xср)/s |
Ф(x1) |
Ф(x2) |
Вероятность попадания в i-й интервал, pi = Ф(x2) - Ф(x1) |
Ожидаемая частота, 60pi |
Слагаемые статистики Пирсона, Ki |
|
12 - 16 |
7 |
-2.1 |
-1.21 |
-0.48 |
-0.39 |
0.0947 |
5.68 |
0.31 |
|
16 - 20 |
15 |
-1.21 |
-0.33 |
-0.39 |
-0.13 |
0.26 |
15.54 |
0.0187 |
|
20 - 24 |
23 |
-0.33 |
0.56 |
-0.13 |
0.22 |
0.35 |
20.7 |
0.26 |
|
24 - 28 |
9 |
0.56 |
1.45 |
0.22 |
0.43 |
0.21 |
12.65 |
1.05 |
|
28 - 32 |
6 |
1.45 |
2.34 |
0.43 |
0.49 |
0.0639 |
3.83 |
1.22 |
|
60 |
2.86 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = ч2(5-2-1;0) = 7.37776; Kнабл = 2.86
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.
2. Проверим гипотезу о том, что Х распределено по закону Пуассона.
где pi -- вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону.
а) Находим по заданному эмпирическому распределению выборочную среднюю (xВ = 21.467).
б) Принимаем в качестве оценки параметра л распределения Пуассона выборочную среднюю xср = 21.467. Следовательно, предполагаемый закон Пуассона имеет вид:
в) Найдем по формуле Пуассона вероятности Pi, появления ровно i событий в n испытаниях. Находим теоретические частоты по формуле npi
i = 0: p0 = 0, np0 = 0
i = 1: p1 = 0, np1 = 1.0E-6
i = 2: p2 = 0, np2 = 6.0E-6
i = 3: p3 = 1.0E-6, np3 = 4.7E-5
i = 4: p4 = 4.0E-6, np4 = 0.000252
в) Вычисляем слагаемые статистики Пирсона по формуле (5 столбец таблицы):
i |
Наблюдаемая частота ni |
pi |
Ожидаемая частота npi |
Слагаемые статистики Пирсона Ki |
|
0 |
7 |
0 |
0 |
0 |
|
1 |
15 |
0 |
1.0E-6 |
374999970 |
|
2 |
23 |
0 |
6.0E-6 |
88166620.67 |
|
3 |
9 |
1.0E-6 |
4.7E-5 |
1730751.23 |
|
4 |
6 |
4.0E-6 |
0.000252 |
142845.14 |
|
60 |
465040187.04 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения г2 и заданным значениям s, k (число интервалов), r=1 (параметр л).
Kkp(0;3) = 9.34840; Kнабл = 465040187.04
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.
3. Проверка гипотезы о показательном распределении генеральной совокупности.
Для того чтобы при уровне значимости а проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
1. Найти по заданному эмпирическому распределению выборочную среднюю хcp. Для этого находят середину i-го интервала xcpi = (xi+xi+1)/2, составляют последовательность равноотстоящих вариант и соответствующих им частот.
2. Принять в качестве оценки параметра Х показательного распределения величину, обратную выборочной средней:
3. Найти вероятности попадания X в частичные интервалы (xi,xi+1) по формуле:
Pi = P(xi < X < xi+1) = e-лxi - e-лxi+1
4. Вычислить теоретические частоты:
ni = n * Pi
5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-2, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.
Среднее значение равно 21.47. Следовательно, параметр л = 1 / 21.47 = 0.0466
Таким образом, плотность предполагаемого показательного распределения имеет вид:
f(x) = 0.0466e-0.0466x, x > 0
Найдем вероятности попадания X в каждый из интервалов по формуле:
Pi = P(xi < X < xi+1) = e-лxi - e-лxi+1
P1 = (12 < X < 16) = 0.5718 - 0.4746 = 0.0972, ni = 60 * 0.0972 = 5.83
P2 = (16 < X < 20) = 0.4746 - 0.3939 = 0.08068, ni = 60 * 0.08068 = 4.84
P3 = (20 < X < 24) = 0.3939 - 0.3269 = 0.06696, ni = 60 * 0.06696 = 4.02
P4 = (24 < X < 28) = 0.3269 - 0.2713 = 0.05558, ni = 60 * 0.05558 = 3.33
P5 = (28 < X < 32) = 0.2713 - 0.2252 = 0.04613, ni = 60 * 0.04613 = 2.77
i |
ni |
n*i |
ni - n*i |
(ni - n*i)2 |
(ni - n*i)2/n*i |
|
1 |
7 |
5.83 |
1.17 |
1.36 |
0.23 |
|
2 |
15 |
4.84 |
10.16 |
103.21 |
21.32 |
|
3 |
23 |
4.02 |
18.98 |
360.32 |
89.68 |
|
4 |
9 |
3.33 |
5.67 |
32.09 |
9.62 |
|
5 |
6 |
2.77 |
3.23 |
10.45 |
3.77 |
|
Итого |
0 |
124.63 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям s, k (число интервалов), r=1 (параметр л).
Kkp(3,0) = 9.34840; Kнабл = 124.63
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по показательному закону.
Размещено на Allbest.ru
Подобные документы
Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".
курсовая работа [104,4 K], добавлен 20.03.2011Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.
курсовая работа [674,3 K], добавлен 03.05.2011Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.
лекция [290,6 K], добавлен 30.07.2013Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Случайная выборка объема как совокупность независимых случайных величин. Математическая модель в одинаковых условиях независимых измерений. Определение длины интервала по формуле Стерджесса. Плотность относительных частот, критерий согласия Пирсона.
контрольная работа [90,4 K], добавлен 17.10.2009Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.
курсовая работа [79,0 K], добавлен 23.01.2012Критерий согласия – критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности. Критерий Колмогорова-Смирнова и его практическое применение. Критические значения статистик Стефенса. Критерии Пирсона и Смирнова-Крамера.
курсовая работа [629,9 K], добавлен 26.08.2012Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов. Интервальный статистический ряд. Оценивание параметров распределения. Статистическая проверка гипотез. Гипотеза о нормальном распределении случайной величины.
контрольная работа [391,1 K], добавлен 23.06.2012