Построение вариационного ряда

Таблица нумерованных денормализованных чисел с четырьмя верными знаками у наибольшего по модулю числа. Построение нумерованного вариационного ряда. Оценка математического ожидания, дисперсии, медианы. Построение полигона, гистограммы, ступенчатой кривой.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 02.05.2012
Размер файла 236,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

1. Выборка. Вариационный ряд. Оценка параметров по всей выборке

Рассматриваем случайную величину, определенную на некоторой генеральной совокупности, вид распределения которой неизвестен. По выборке из этой генеральной совокупности необходимо сделать заключение относительно свойств закона распределения этой случайной величины. В данной курсовой работе будут рассмотрены наиболее часто встречающиеся задачи математической статистики такие, как задача построения оценок параметров распределения, построения доверительных интервалов для этих параметров, проверка гипотезы о принадлежности распределения случайной величины к тому или иному классу и др.

Из некоторой генеральной совокупности произведена выборка объемом 100 элементов. Нас будет интересовать только один качественный признак элементов, попавших в выборку. Данные выборки представлены в табл. 1.

Табл. 1. Таблица нумерованных денормализованных чисел

xi

xi

xi

xi

xi

1

0,6651

21

1,8457

41

-0,4692

61

0,3336

81

0,0962

2

0,6580

22

-1,0784

42

1,0037

62

-1,7251

82

0,4900

3

-0,8756

23

0,6042

43

-0,3717

63

0,2155

83

-1,3309

4

-0,9608

24

-0,2606

44

-0,0846

64

-0,4276

84

-0,8346

5

-0,8011

25

-1,4051

45

2,7783

65

1,2564

85

1,4345

6

0,9035

26

1,5529

46

-0,0553

66

-1,3470

86

-0,0749

7

1,0438

27

0,4995

47

0,3645

67

-0,5551

87

-0,3202

8

0,0695

28

-0,1259

48

-0,0004

68

-1,5139

88

-0,9161

9

-1,0066

29

0,0601

49

-0,0029

69

0,5182

89

-0,4128

10

-0,7016

30

0,1875

50

-1,0033

70

1,2895

90

-1,3041

11

-0,0530

31

-0,2316

51

2,0325

71

-0,2736

91

-0,6175

12

0,2502

32

-0,4140

52

0,3678

72

0,2683

92

-2,1372

13

-0,1297

33

1,2534

53

-0,9871

73

-0,5026

93

0,9104

14

-0,3666

34

-0,4099

54

-1,5151

74

1,9664

94

-0,1616

15

0,1807

35

0,5031

55

1,0652

75

0,3214

95

0,0245

16

-1,6464

36

2,0602

56

0,8077

76

1,1852

96

0,9177

17

-0,0034

37

-1,7713

57

-0,5921

77

-0,2945

97

-1,1162

18

0,7800

38

0,4693

58

-0,5994

78

-0,6606

98

-1,2239

19

-0,2145

39

-0,3675

59

-0,4684

79

-0,2728

99

0,0088

20

1,8001

40

0,7668

60

-1,3123

80

0,0561

100

1,2809

а) Вариационный ряд. Вариационным рядом (упорядоченной выборкой) называют совокупность значений признака, записанных в порядке их возрастания, а сам признак называется вариантой (случайной величиной).

Вариационный ряд, построенный по данным табл. 1, приведен в табл. 2.

денормализованный вариационный дисперсия полигон

Табл. 2. Нумерованный вариационный ряд

xi

x2i

xi

x2i

xi

x2i

xi

x2i

xi

x2i

1

-2,1372

4,5676

21

-0,8346

0,6966

41

-0,2736

0,0749

61

0,0962

0,0093

81

0,8077

0,6524

2

-1,7713

3,1375

22

-0,8011

0,6418

42

-0,2728

0,0744

62

0,1807

0,0327

82

0,9035

0,8163

3

-1,7251

2,9760

23

-0,7016

0,4922

43

-0,2606

0,0679

63

0,1875

0,0352

83

0,9104

0,8288

4

-1,6464

2,7106

24

-0,6606

0,4364

44

-0,2316

0,0536

64

0,2155

0,0464

84

0,9177

0,8422

5

-1,5151

2,2955

25

-0,6175

0,3813

45

-0,2145

0,0460

65

0,2502

0,0626

85

1,0037

1,0074

6

-1,5139

2,2919

26

-0,5994

0,3593

46

-0,1616

0,0261

66

0,2683

0,0720

86

1,0438

1,0895

7

-1,4051

1,9743

27

-0,5921

0,3506

47

-0,1297

0,0168

67

0,3214

0,1033

87

1,0652

1,1347

8

-1,3470

1,8144

28

-0,5551

0,3081

48

-0,1259

0,0159

68

0,3336

0,1113

88

1,1852

1,4047

9

-1,3309

1,7713

29

-0,5026

0,2526

49

-0,0846

0,0072

69

0,3645

0,1329

89

1,2534

1,5710

10

-1,3123

1,7221

30

-0,4692

0,2201

50

-0,0749

0,0056

70

0,3678

0,1353

90

1,2564

1,5785

11

-1,3041

1,7007

31

-0,4684

0,2194

51

-0,0553

0,0031

71

0,4693

0,2202

91

1,2809

1,6407

12

-1,2239

1,4979

32

-0,4276

0,1828

52

-0,0530

0,0028

72

0,4900

0,2401

92

1,2895

1,6628

13

-1,1162

1,2459

33

-0,4140

0,1714

53

-0,0034

0,0000

73

0,4995

0,2495

93

1,4345

2,0578

14

-1,0784

1,1629

34

-0,4128

0,1704

54

-0,0029

0,0000

74

0,5031

0,2531

94

1,5529

2,4115

15

-1,0066

1,0132

35

-0,4099

0,1680

55

-0,0004

0,0000

75

0,5182

0,2685

95

1,8001

3,2404

16

-1,0033

1,0066

36

-0,3717

0,1382

56

0,0088

0,0001

76

0,6042

0,3651

96

1,8457

3,4066

17

-0,9871

0,9744

37

-0,3675

0,1351

57

0,0245

0,0006

77

0,6580

0,4330

97

1,9664

3,8667

18

-0,9608

0,9231

38

-0,3666

0,1344

58

0,0561

0,0031

78

0,6651

0,4424

98

2,0325

4,1311

19

-0,9161

0,8392

39

-0,3202

0,1025

59

0,0601

0,0036

79

0,7668

0,5880

99

2,0602

4,2444

20

-0,8756

0,7667

40

-0,2945

0,0867

60

0,0695

0,0048

80

0,7800

0,6084

100

2,7783

7,7190

б) Оценка параметров распределения по всей выборке. Оценка математического ожидания - среднее арифметическое - вычисляется по формуле:

= - 0,0116

Смещенную оценку дисперсии по всей выборке вычисляем по сокращенной формуле:

1/100*92,1485=0,9214

=0,9599

Несмещенную оценку дисперсии вычисляют то формуле:

100*0,9214/99=0,9308

0,9648

Оценка медианы - значение варианты, которое делит вариационный ряд на две равные по числу членов части. При четном числе членов (n=2k) в качестве медианы принимают:

В нашем случае:

-0,0651

в) Размах варьирования. Размахом варьирования R (широтой распределения) называют разность между наибольшим и наименьшим значениями варианты:

2,7783+2,1372=4,9155

2. Группирование, графики статистических распределений

При большом объеме выборки для удобства вычислений прибегают к группированию данных в интервалы. Число таких интервалов при объеме выборки, превышающем 100 - 300 элементов, рекомендуется брать в пределах от 10 до 20. Возьмем число интервалов l=12. Тогда ширина интервала (шаг разбиения) будет равна:

=4,9155/12=0,4096

Таблица подсчета. Таблицу подсчета частот и частотностей по интервалам вариационного ряда удобно представить в виде табл. 3

Табл. 3. Таблица подсчета

Границы интервала

Частота

Частотность

Середина интервала

1

-2,1372

2

0,02

-1,9323

-1,7275

2

-1,7275

7

0,07

-1,5227

-1,3179

3

-1,3179

10

0,1

-1,1131

-0,9083

4

-0,9083

10

0,1

-0,7035

-0,4987

5

-0,4987

19

0,19

-0,2938

-0,0890

6

-0,0890

18

0,18

0,1157

0,3205

7

0,3205

12

0,12

0,5253

0,7301

8

0,7301

9

0,09

0,9349

1,1398

9

1,1398

6

0,06

1,3446

1,5494

10

1,5494

3

0,03

1,7542

1,9590

11

1,9590

3

0,03

2,1638

2,3686

12

2,3686

1

0,01

2,5735

2,7783

Графики статистических распределений. Для наглядности выборочное распределение изображают графически несколькими способами. Наиболее распространенными являются полигон, гистограмма и ступенчатая кривая. Они строятся следующим образом:

Полигон. На оси абсцисс откладываются интервалы значений величины х, в серединах интервалов строятся ординаты, пропорциональные частостям (или частотам), и концы ординат соединяются отрезками прямых линий. На рис. 1 показан полигон распределения, построенный по данным табл. 3.

Рис. 1. Полигон распределения

Гистограмма. Над. каждым отрезком оси абсцисс, изображающим интервал значений х, строится прямоугольник, площадь которого пропорциональна частости (или частоте) в данном интервале. На рис. 2 показана гистограмма распределения, построенная по данным табл. 3.

Рис. 2. Гистограмма распределения

Ступенчатая кривая. Над каждым отрезком оси абсцисс, изображающим расстояние между серединами интервалов значений х, проводится отрезок горизонтальной прямой на высоте, пропорциональной накопленной частости (или накопленной частоте) в данном интервале. Концы отрезков соединяются. Накопленной частостью в данном интервале называется сумма всех частостеи, начиная с первого интервала до данного интервала включительно. На рис. 3 показана ступенчатая кривая распределения, построенная по данным табл. 3.

Рис. 3. Ступенчатая кривая распределения

3. Точечная оценка характеристик распределения
по сгруппированным данным

Среднее арифметическое. Для нахождения среднего арифметического значения выборки воспользуемся формулой:

где xi - середина интервала;

l - число интервалов;

- частота в интервале;

n - число элементов в выборке.

Мода. Оценкой моды является середина самого многочисленного интервала:

-0,294

Эмпирическая дисперсия s2 и среднее квадратическое отклонение s вычисляются по формулам:

В нашем случае:

1/100*94,85-0,00922=0,9484

0,9738

Коэффициент вариации считается по формуле:

(при )

0,9738/0,0092=105,4547

Оценка дисперсии, полученная по группированным данным, оказывается смещенной. Исправляют это смещение введением поправки Шеппарда. Тогда

=0,9484

Вычисление математического ожидания и дисперсии по табл. 3 достаточно сложно. Громоздких вычислений, особенно при вычислении моментов более высокого порядка, можно избежать, используя «ложный нуль». Вычислим оценки математического ожидания, дисперсии, асимметрии и эксцесса, пользуясь этим приемом.

При большом числе интервалов с нецелочисленными границами целесообразно за начало отсчета («ложный нуль») принять значение, отвечающее наиболее многочисленному интервалу, и одновременно выразить значение всех интервалов в долях ширины интервала . В результате середине каждого интервала будет отвечать простое целое число, с которым можно просто оперировать. Проведя все операции, предусмотренные табл. 4, каждый результат умножают на в соответствующей степени, а для получения еще прибавляют «ложный нуль». Вычисления удобно представить в виде табл. 4.

Табл. 4

№ инт.

середины
инт. x
i

yi

yi2

yi3

yi4

?

?*yi

?*yi2

?*yi3

?*yi4

1

-1,9324

-4

16

-64

256

2

-8

32

-128

512

2

-1,5228

-3

9

-27

81

7

-21

63

-189

567

3

-1,1131

-2

4

-8

16

10

-20

40

-80

160

4

-0,7035

-1

1

-1

1

10

-10

10

-10

10

5

-0,2939

0

0

0

0

19

0

0

0

0

6

0,1157

1

1

1

1

18

18

18

18

18

7

0,5254

2

4

8

16

12

24

48

96

192

8

0,9350

3

9

27

81

9

27

81

243

729

9

1,3446

4

16

64

256

6

24

96

384

1536

10

1,7542

5

25

125

625

3

15

75

375

1875

11

2,1639

6

36

216

1296

3

18

108

648

3888

12

2,5735

7

49

343

2401

1

7

49

343

2401

Суммы

1

100

74

620

1700

11888

Обозначение сумм

У0

У1

У2

У3

У4

Нач. моменты в относительном выражении

0,74

6,20

17,00

118,88

Обозначения относительных нач. моментов

h1

h2

h3

h4

В табл. 4 относительные середины интервалов, приведенные в третьей графе, получены по формуле:

,

где с - «ложный нуль» (с=-0,2939), а -ширина интервала (=0,4096).

Относительные начальные моменты рассчитываются по формуле:

Среднее арифметическое и центральные эмпирические моменты m2, m3 и m4 определим по формулам:

Проведя вычисления, получим:

0,0092

0,9484

0,2781

2,4785

Далее вычислим оценки асимметрии и эксцесса по формулам:

= 0,3474

=0,3344

4. Оценка параметров распределения методом квантилей

Предположим, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Определим оценки пара метров этого закона математического ожидания m и среднего квадратического отклонения у, используя метод квантилей. Квантилем, отвечающим заданному уровню вероятности р, называют такое значение варианты x=xp, при котором функция распределения принимает значение, равное р, т.е.:

F(xp)=p

Для определения оценок двух неизвестных параметров m и у составим, два уравнения, используя формулу:

Из вариационного ряда возьмем два любых значения варианты хр' и хр» с соответствующими им вероятностями р' и р». Вероятности р' и р» соответствуют порядковому номеру выбранных вариант, деленному на 100. Подставляя эти величины в формулу функции Лапласа, получим уравнения:

Решение системы дает в результате:

=-0,1125; =0,728

5. Построение доверительных интервалов

Для того чтобы иметь представление о точности и надежности полученной в § 5 оценки некоторого параметра распределения, необходимо построить для данного параметра доверительный интервал.

Доверительный интервал для математического ожидания. Рассмотрим выборку малого объема из первых двадцати значений табл. 1.

Построим таблицу, вариационный ряд (табл. 5 и 6). Найдем оценки математического ожидания и дисперсии (смещенную и несмещенную) как в § 3, б.

Табл .5 Табл. 6

xi

xi

xi2

xi2-x2ср

1

0,6651

1

-1,6464

2,710633

2,710216

2

0,6580

2

-1,0066

1,013244

1,012827

3

-0,8756

3

-0,9608

0,923137

0,922720

4

-0,9608

4

-0,8756

0,766675

0,766258

5

-0,8011

5

-0,8011

0,641761

0,641344

6

0,9035

6

-0,7016

0,492243

0,491826

7

1,0438

7

-0,3666

0,134396

0,133979

8

0,0695

8

-0,2145

0,046010

0,045593

9

-1,0066

9

-0,1297

0,016822

0,016405

10

-0,7016

10

-0,0530

0,002809

0,002392

11

-0,0530

11

-0,0034

1,16E-05

-0,00041

12

0,2502

12

0,0695

0,004830

0,004413

13

-0,1297

13

0,1807

0,032652

0,032236

14

-0,3666

14

0,2502

0,062600

0,062183

15

0,1807

15

0,6580

0,432964

0,432547

16

-1,6464

16

0,6651

0,442358

0,441941

17

-0,0034

17

0,7800

0,608400

0,607983

18

0,7800

18

0,9035

0,816312

0,815895

19

-0,2145

19

1,0438

1,089518

1,089101

20

1,8001

20

1,8001

3,240360

3,239943

В предположении нормального распределения отклонения случайной величины от среднего построим доверительный интервал для математического ожидания при неизвестном у по значениям данной выборки по формуле:

где

В нашем примере после вычислений получим:

-0,0204

0,6735, 0,8206

0,7089, 0,8419

Определим доверительные интервалы для математического ожидания mx, задаваясь различными уровнями значимости q (т.е. при разных значениях доверительной вероятности p). Значения квантилей берутся из таблиц распределения Стьюдента по двум входам: по числу степеней свободы (n-1) и уровнями значимости q. Уровень значимости q здесь и в дальнейшем предполагается заданным. Число степеней свободы (n-1)=19.

· 1%; р=1-q/100=1-1/100=0,99; 2,8615

Доверительный интервал: -0,5592<mx<0,5183

· 5%; р=1-q/100=1-5/100=0,95; 2,093

Доверительный интервал: -0,4145<mx<0,3736

· 10%; р=1-q/100=1-10/100=0,90; 1,7295

Доверительный интервал: -0,346<mx<0,3052

Доверительный интервал для дисперсии ух2 и среднего квадратического отклонения ух. Доверительный интервал для параметров ух2 и ух строятся также по первым двадцати значениям выборки по формулам:

,

где пределы и берутся из таблиц распределения хи-квадрат по двум входам: по числу степеней свободы (n-1) и вероятностям р1=1-1/2*q/100 для и р2=1/2*q/100 для .

· 1%

р1=1-1/2*q/100=1-1/2*1/100=0,995 => =6,84

р2=1/2*q/100=1/2*1/100=0,005 => =38,58

Доверительные интервалы: 0,3491< ух2 <1,9692

0,5908< ух< 1,4032

4%

р1=1-1/2*q/100=1-1/2*4/100=0,98 => =8,57

р2=1/2*q/100=1/2*4/100=0,02 => =33,69

Доверительные интервалы: 0,3997< ух2 <1,5722

0,6322< ух< 1,2538

· 5%

р1=1-1/2*q/100=1-1/2*5/100=0,975 => =8,91

р2=1/2*q/100=1/2*5/100=0,025 => =32,85

Доверительные интервалы: 0,4100< ух2 <1,5117

0,6403< ух< 1,2295

10%;

р1=1-1/2*q/100=1-1/2*10/100=0,95 => =10,12

р2=1/2*q/100=1/2*10/100=0,05 => =30,14

Доверительные интервалы: 0,4468< ух2 <1,3309

0,6685< ух< 1,1536

Такие методы построения доверительных интервалов для m и у оправданы лишь в случае нормального распределения отклонений. Следовательно, пользоваться ими можно только после проверки гипотезы о нормальном распределении случайной величины X с помощью некоторого критерия (например, как в § 8, 9).

6. Приближенный метод проверки гипотезы о нормальном распределении

Примем гипотезу о том, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Для приближенной проверки этой гипотезы могут быть использованы эмпирические асимметрия и эксцесс .

Для нормального распределения, как известно=0 и =0. Поэтому показатели асимметрии и эксцесса, отличные от нуля, указывают на отклонение рассматриваемого распределения от нормального.

Выборочные асимметрия и эксцесс, как и все оценки, являются случайными величинами и могут не совпадать с теоретическими. Можно показать, что при данном объеме выборки применить здесь общие методы критериев значимости трудно, так как распределения оценок асимметрии и эксцесса очень сложны. Однако среднеквадратические отклонения этих характеристик при заданном объеме выборки n вычисляются по достаточно простым формулам:

В нашем случае будет:

Зная эти величины, можно оценить, существенно ли отличаются оценки от оцениваемых асимметрии и эксцесса , т.е. от нуля. Критические области для асимметрии и для эксцесса получены на основании неравенства Чебышева.

=0,3474 => =0,72

=0,3344 => =2,3

Видим, что и , не попадают в критическую область, т.о. гипотеза нормальности не противоречит данным табл. 1.

7. Критерий хи-квадрат для проверки статистических гипотез

Примем гипотезу о том, что выборка, данная в табл. 1, подчиняется нормальному закону распределения. Для проверки этой гипотезы воспользуемся критерием

Значение критерия определяется по данным выборки. Если это значение попадет в область допустимых значений , то следует признать, что данные выборки не противоречат гипотезе о нормальности распределения.

Если же численное значение критерия попадает в критическую область , то гипотеза отвергается. Вычисления критерия удобно свести в табл. 7.

Сумма, называемая критерием , асимптотически распределена как хи-квадрат. При практических расчетах для нахождения критического значения этой суммы можно пользоваться таблицами распределения хи-квадрат только в том случае, если для всех интервалов > 5 (более строгое требование > 10). Поэтому в табл. 7 интервалы 2, 3; 8 и 9 объединены.

Оценку вероятности попадания в интервал находим по формуле:

,

где и - границы интервалов, и вычислены в § 5 по данной выборке, а значения функции Лапласа берутся из таблицы.

Табл. 7

№ инт

Границы интервалов

Ф(Zi)

Ф(Zi)

Pi

npi

??

?i-npi

(?i-npi)2/

истинные

в долях ско

npi

1

-?

-1,728

-?

-1,87

-0,5000

-0,4693

0,0307

7,6360

9

1,364

0,2436

2

-1,728

-1,318

-1,87

-1,43

-0,4693

-0,4236

0,0456

3

-1,318

-0,908

-1,43

-0,99

-0,4236

-0,3389

0,0847

8,4730

10

1,527

0,2752

4

-0,908

-0,499

-0,99

-0,55

-0,3389

-0,2088

0,1301

13,007

10

-3,007

0,6952

5

-0,499

-0,089

-0,55

-0,11

-0,2088

-0,0438

0,1650

16,504

19

2,496

0,3775

6

-0,089

0,3206

-0,11

0,34

-0,0438

0,1331

0,1769

17,687

18

0,313

0,0055

7

0,3206

0,7302

0,34

0,78

0,1331

0,2823

0,1492

14,923

12

-2,923

0,5725

8

0,7302

1,1398

0,78

1,22

0,2823

0,3888

0,1065

10,647

9

-1,647

0,2548

9

1,1398

1,5494

1,22

1,66

0,3888

0,4515

0,0628

11,123

13

1,877

0,3167

10

1,5494

1,9591

1,66

2,10

0,4515

0,4812

0,0297

11

1,9591

2,3687

2,10

2,54

0,4812

0,4945

0,0132

12

2,3687

+?

2,54

+?

0,4945

0,500

0,0055

Суммы

1,0000

100

100

2,7411

Крайние границы самого левого и самого правого интервалов, расширены до -? и +? соответственно.

Так как по данным выборки мы оценили два параметра mx и ух нормального закона (т.е. с=2), то в нашем случае число степеней свободы будет равно k=l' - c-1=8-2-1=5, где l'=8 - число интервалов, получившихся после объединения интервалов 1,2 и 9,10,11 и 12.

По таблице распределения хи-квадрат найдем значения для числа степеней свободы k=5 и уровней значимости q, равным 1%, 5% и 10%:

· 1%, тогда=15,086

Поскольку (2,7411<15,086), то гипотеза о нормальности выборки не противоречит данным измерений.

· 5%, тогда =11,07.

Поскольку (2,7411<11,07), то гипотеза о нормальности выборки не противоречит данным измерений.

10%, тогда =9,236

Поскольку (2,7411<9,236), то гипотеза о нормальности выборки не противоречит данным измерений.

8. Проверка гипотезы об однородности выборки
с помощью критерия знаков и критерия Вилкоксона

Введем нулевую гипотезу Н0 о том, что выборка, данная в табл. 1, является однородной. Для проверки этой гипотезы возьмем две выборки из двадцати первых и двадцати последних значений табл. 1 и представим данные в табл. 8. Воспользуемся непараметрическими (независимыми от формы распределения) критериями: критерием знаков и критерием Вилкоксона.

Критерий знаков. Составим разность zi=xi - yi, где i= 1, 2., 20 - порядковые номера первых xi и последних yi двадцати значений выборки. Подсчитаем число положительных kn(+) и отрицательных kn (-) знаков разностей zi (n=20). Затем, выбрав уровень значимости q, находим по q и n в соответствующей таблице критическое значение меньшего из чисел положительных и отрицательных знаков zi. Если теперь меньшее из чисел знаков разностей окажется меньше , то гипотеза об однородности выборки отвергается, а если меньшее из чисел знаков разностей окажется больше , то следует признать, что гипотеза не противоречит данным выборки.

Табл. 8

xi

yi

zi=xi-yi

0,6651

0,0962

0,5689

0,6580

0,4900

0,1680

-0,8756

-1,3309

0,4553

-0,9608

-0,8346

-0,1262

-0,8011

1,4345

-2,2356

0,9035

-0,0749

0,9784

1,0438

-0,3202

1,3640

0,0695

-0,9161

0,9856

-1,0066

-0,4128

-0,5938

-0,7016

-1,3041

0,6025

-0,0530

-0,6175

0,5645

0,2502

-2,1372

2,3874

-0,1297

0,9104

-1,0401

-0,3666

-0,1616

-0,2050

0,1807

0,0245

0,1562

-1,6464

0,9177

-2,5641

-0,0034

-1,1162

1,1128

0,7800

-1,2239

2,0039

-0,2145

0,0088

-0,2233

1,8001

1,2809

0,5192

Для данных табл. 1 имеем: k20(+)=13 и k20(-)=7.

Из таблицы для n=20 и уровней значимости q, равным 1%, 5% и 10% находим:

· 1%; =3

· 5%; =5

· 10%; =5

Т.к. меньшее из чисел знаков разностей k20(-)=7 при всех рассмотренных уровнях значимости оказалось больше значения , то нулевая гипотеза Н0 об однородности выборки не противоречит данным выборки.

Критерий Вилкоксона основан на числе инверсий.
Элементы двух выборок из двадцати первых и двадцати последних значений табл. 1 располагаются в общую последовательность в порядке возрастания их значений. Если какому-либо значению x из общей последовательности предшествует некоторый y, то говорят, что эта пара дает инверсию. Суммарное число инверсий обозначим за u.

Далее введем нулевую гипотезу Н0 о том, что выборка, данная в табл. 1, является однородной. Эта гипотеза отвергается, если число инверсий u превосходит выбранную в соответствии с уровнем значимости границу, определяемую из того, что при объемах n>10 и m>10 выборок число инверсий u распределено приблизительно нормально с центром:

дисперсией:

и средним квадратическим отклонением:

В нашем случае получим:

200

1367

37,0

Задавшись уровнем значимости q, построим критическую область, используя соотношение:

где - функция Лапласа.

Используя эту формулу и таблицу нормального распределения, находим значение . Критическая область для гипотезы Н0:

денормализованный вариационный дисперсия полигон

В нашем примере число инверсий:

u=231

Найдем критические области для выдвинутой нулевой гипотезы, задавшись уровнем значимости q, равным 1%, 5% и 10%:

· 1%

·

· 5%

·

· 10%

·

При всех рассмотренных уровнях значимости число инверсий u не лежит в критической области, а потому нулевая гипотеза Н0 об однородности выборки не противоречит данным выборки.

Размещено на Allbest.ru


Подобные документы

  • Методика расчета показателей вариации по средней арифметической взвешенной. Произведение расчетов по данным интервального вариационного ряда. Построение полигона и гистограммы. Элементы и проведение дисперсионного анализа. Правило сложения дисперсий.

    лабораторная работа [67,2 K], добавлен 21.06.2009

  • Группировка статистических показателей, описывающих выборку. Этапы построения вариационного ряда, группировки данных. Определение частости и эмпирической плотности вероятностей. Построение полигона, гистограммы и эмпирической функции распределения.

    практическая работа [71,6 K], добавлен 27.06.2010

  • Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.

    контрольная работа [354,6 K], добавлен 26.04.2010

  • Анализ эффективности деятельности предприятий. Построение статистического ряда распределения организаций по выручке от продажи продукции. Вычисление медианы для интервального вариационного ряда. Группировка предприятий по выручке от продажи продукции.

    контрольная работа [82,4 K], добавлен 30.04.2014

  • Построение дискретного и интервального вариационного ряда работы горных предприятий. Вычисление характеристик меры и степени вариации. Определение основных показателей, показывающих направление и интенсивность количественных изменений динамического ряда.

    курсовая работа [381,0 K], добавлен 13.12.2011

  • Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.

    курсовая работа [344,1 K], добавлен 21.03.2014

  • Определение для вариационного ряда: средней арифметической, дисперсии, моды, медианы, относительных показателей вариации. Проведение смыкания рядов динамики c использованием коэффициента сопоставимости. Вычисление агрегатных индексов цен и стоимости.

    контрольная работа [23,0 K], добавлен 29.01.2011

  • Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.

    курсовая работа [403,2 K], добавлен 17.11.2014

  • Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.

    контрольная работа [69,3 K], добавлен 16.11.2011

  • Формирование информационной базы – начальной стадии экономико-статистического исследования. Расчеты средней и предельной ошибок выборки. Оценка распространения выборочных данных на генеральную совокупность. Построение вариационного возрастающего ряда.

    контрольная работа [79,1 K], добавлен 09.12.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.