Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины

Выполнение основных расчетов, связанных с оценкой факторов, влияющих на процесс, получение его математического описания, выполнение статистического анализа имеющейся информации, определение параметров процесса и создание математической модели процесса.

Рубрика Математика
Вид дипломная работа
Язык русский
Дата добавления 24.04.2014
Размер файла 426,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

Введение

1 Построение непрерывного вариационного ряда в виде гистограммы

2. Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины

2.1 Расчет показателей описательной статистики.

2.2 Критерий пирсона

2.3 Критерий колмогорова

2.4 Критерий мизеса

2.5 Проверка на нормальность распределения графическим методом

3.Биномиальное распределение

4. Расчет корреляционных зависимостей

5. Регрессионный анализ

6. Дисперсионный анализ

7. Анализ временных рядов

Введение

В настоящее время для обработки экспериментальных данных применяются методы математической статистики и теории вероятностей, основной целью которых является получение выводов о массовых явлениях и процессах по данным наблюдений и экспериментов. Такие методы применяются в различных отраслях знаний (медицине, технике, экономике и др.). статистика информация математическая модель

Основные этапы обработки экспериментальных данных - это оценка значений показателей качества средств, комплексов или системы в целом; сжатие информации о функционировании объекта, ее обобщение для последующего применения в интересах исследования подобных объектов, обоснования данных для создания новых систем; выявление закономерностей функционирования объекта в конкретных условиях эксплуатации, т.е. установление зависимостей между параметрами объекта, внешней среды и показателями качества объекта; выявление существенных параметров системы и внешней среды; изучение типологии объектов (распознавание образов, классификация объектов); прогнозирование развития объектов в интересах организационного и технологического управления.

Однако, результаты обработки экспериментальных данных не гарантируют достоверного описания неизвестных показателей или закономерностей.

Целью курсовой работы является выполнение расчетов, связанных с оценкой факторов, влияющих на тот или иной процесс, получение его математического описания, выполнение статистического анализа имеющейся информации, определение параметров процесса и создание математической модели процесса.

Основная часть курсовой работы разбита на 6 разделов и включает следующие расчеты:

- построение непрерывного вариационного ряда в виде гистограммы;

- расчет показателей описательной статистики, проверка нормальности распределения случайной величины с использованием критериев Пирсона, Колмогорова-Смирнова, Мизеса, а также графическим методом ;

- решение задач с использованием дискретных и непрерывных распределений случайных величин;

- расчет корреляционных зависимостей и построение регрессионной модели;

- анализ влияния факторных признаков на результирующую переменную методом дисперсионного анализа;

- анализ данных временного ряда.

1. Построение непрерывного вариационного ряда в виде гистограммы

Основой для построения гистограммы служит вариационный ряд - это представленный в виде таблицы ряд значений изучаемого признака и соответствующими частотами его встречаемости в выборке (Таблица 1).

Таблица 1 - Исходные данные

4040,3920

4040,4425

4040,4925

4040,5221

4040,4681

4040,3925

4040,4453

4040,4967

4040,5251

4040,4716

4040,3942

4040,4478

4040,5001

4040,5281

4040,4745

4040,3968

4040,4502

4040,5040

4040,5311

4040,4769

4040,3993

4040,4521

4040,5068

4040,5340

4040,4798

4040,4021

4040,4547

4040,5090

4040,5362

4040,4832

4040,4048

4040,4572

4040,5114

4040,5400

4040,4856

4040,4073

4040,4609

4040,5144

4040,4367

4040,4886

4040,4109

4040,4645

4040,5175

4040,4395

4040,4327

4040,4146

4040,4214

4040,5199

4040,4288

4040,4249

Находим объем выборки исходных данных: ;

Определяем число классов вариационного ряда по формуле:

, (1)

где - объем выборки.

.

Находим минимальное и максимальное значение выборки

,

.

, (2)

.

Рассчитываем длину интервала по формуле:

, (3)

где - размах выборки;

- число классов вариационного ряда.

.

Результаты представлены в таблице 2.

Таблица 2 - Границы классовых интервалов и подсчет частот

№ интервала

Нижняя граница интервала

Верхняя граница интервала

Среднее значение признака в классе

1

4040,3920

4040,4142

4040,4031

0

2

4040,4142

4040,4365

4040,4254

9

3

4040,4365

4040,4588

4040,4477

5

4

4040,4588

4040,4811

4040,4700

9

5

4040,4811

4040,5034

4040,4922

7

6

4040,5034

4040,5257

4040,5145

6

7

4040,5257

4040,5480

4040,5368

9

На основании проведенных расчетов строим гистограмму распределения исходных значений признака.

Рисунок 1 - Гистограмма распределения исходных значений признака

Форма полученной гистограммы не соответствует нормальному закону распределения случайной величины. Вид гистограммы соответствует гистограмме с прогалами («гребенка»), которая получается когда ширина интервала не кратна единице измерения или при ошибках оператора.

2. Расчет показателей описательной статистики. Проверка на нормальность распределения случайной величины

2.1 Расчет показателей описательной статистики

Параметры распределения - числовые характеристики, показывающие, где в среднем располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака.

На основании исходных данных мы определили:

- объем выборки

;

- минимальное и максимальное значения выборки

;

;

- размах выборки

.

Рассчитываем среднее значение выборки - это среднее арифметическое, рассчитанное путем сложения группы чисел и деления на количество этих чисел.

(4)

Рассчитываем стандартное отклонение - это мера того, насколько широко разбросаны точки данных относительно их среднего.

(5)

.

Определяем медиану - это число, которое является серединой множества чисел. Если множество содержит четное количество чисел, то вычисляют среднее для двух чисел, находящихся в середине множества.

.

Определяем моду - это число, наиболее часто встречающееся в данном множестве чисел.

В таблице исходных данных повторяющихся значений не выявлено.

Рассчитываем дисперсию, характеризующую меру отклонения (рассеивания) результатов параллельных определений от их среднего значения.

(6)

.

Определяем коэффициент асимметрии, характеризующий степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.

(7)

.

Определяем коэффициент эксцесса, характеризующий относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением.

(8)

.

Выводы:

Среднее значение и медиана незначительно отличаются друг от друга, что соответствует не симметричному, но близкому к нему распределению.

Распределение случайной величины сосредоточено на положительном направлении оси ОХ, поскольку .

Коэффициент асимметрии , следовательно для распределения характерна левосторонняя асимметрия. Асимметрия несущественна.

Коэффициент эксцесса , следовательно распределение сглажено и не является островершинным.

Таким образом, наблюдается несоответствие нормальному закону распределения случайной величины.

2.2 Критерий Пирсона

С помощью критерия проверим гипотезу о нормальности распределения случайной величины, при уровне значимости .

с помощью функции для правых границ классовых интервалов .

Рассчитываем теоретические значения вероятности попадания случайной величины в интервал:

(9)

(10)

Рассчитываем взвешенные квадраты отклонения по формуле:

(11)

где частоты классов вариационного ряда.

Подсчитываем сумму взвешенных квадратов отклонений - расчетное значение критерия . Все рассчитанные значения представлены в таблице 3.

Таблица 3 - Рассчитанные значения для критерия

0,259431

0,259431

12,97156

12,97156

0,438689

0,179258

8,962893

0,000154

0,631758

0,193069

9,653435

2,243187

0,795972

0,164214

8,210699

0,075876

0,906269

0,110297

5,514864

0,399942

0,964769

0,0585

2,925003

3,232684

18,92341

Определяем число степеней свободы параметров распределения:

, (12)

где количество классов, ;

число параметров распределения, (предполагается, что распределение нормальное).

.

По справочной таблице распределения определяем .

Вывод: поскольку гипотеза о нормальном распределении генеральной совокупности при уровне значимости противоречит экспериментальным данным.

2.3 Критерий Колмогорова

С помощью критерия Колмогорова проверим гипотезу о том, что экспериментальные данные подчиняются нормальному распределению при уровне значимости .

Рассчитываем значения эмпирической функции распределения для всех исходных значений:

, (13)

где объем выборки.

Рассчитываем значение теоретической функции нормального распределения с помощью функции .

Рассчитываем величины и по следующим формулам:

(14)

(15)

Все рассчитанные значения представлены в таблице 4.

Таблица 4 - Рассчитанные значения для критерия Колмогорова

4040,3920

0,02

0,052016

0,032016

0,052016

4040,3925

0,04

0,053199

0,013199

0,033199

4040,3942

0,06

0,057379

0,002621

0,017379

4040,3968

0,08

0,064267

0,015733

0,004267

4040,3993

0,1

0,071481

0,028519

0,008519

4040,4021

0,12

0,08028

0,03972

0,01972

4040,4048

0,14

0,089518

0,050482

0,030482

4040,4073

0,16

0,098755

0,061245

0,041245

4040,4109

0,18

0,113255

0,066745

0,046745

4040,4146

0,2

0,129678

0,070322

0,050322

4040,4425

0,22

0,303799

0,083799

0,103799

4040,4453

0,24

0,32569

0,08569

0,10569

4040,4478

0,26

0,345761

0,085761

0,105761

4040,4502

0,28

0,365447

0,085447

0,105447

4040,4521

0,3

0,381289

0,081289

0,101289

4040,4547

0,32

0,40329

0,08329

0,10329

4040,4572

0,34

0,424739

0,084739

0,104739

4040,4609

0,36

0,456877

0,096877

0,116877

4040,4645

0,38

0,488422

0,108422

0,128422

4040,4214

0,4

0,163996

0,236004

0,216004

4040,4925

0,42

0,721595

0,301595

0,321595

4040,4967

0,44

0,751773

0,311773

0,331773

4040,5001

0,46

0,774862

0,314862

0,334862

4040,5040

0,48

0,799781

0,319781

0,339781

4040,5068

0,5

0,816604

0,316604

0,336604

4040,5090

0,52

0,829185

0,309185

0,329185

4040,5114

0,54

0,842263

0,302263

0,322263

4040,5144

0,56

0,85766

0,29766

0,31766

4040,5175

0,58

0,872468

0,292468

0,312468

4040,5199

0,6

0,883171

0,283171

0,303171

4040,5221

0,62

0,892408

0,272408

0,292408

4040,5251

0,64

0,904139

0,264139

0,284139

4040,5281

0,66

0,914901

0,254901

0,274901

4040,5311

0,68

0,924731

0,244731

0,264731

4040,5340

0,7

0,933386

0,233386

0,253386

4040,5362

0,72

0,939422

0,219422

0,239422

4040,5400

0,74

0,948831

0,208831

0,228831

4040,4367

0,76

0,260686

0,499314

0,479314

4040,4395

0,78

0,281102

0,498898

0,478898

4040,4288

0,8

0,207477

0,592523

0,572523

4040,4681

0,82

0,52004

0,29996

0,27996

4040,4716

0,84

0,550661

0,289339

0,269339

4040,4745

0,86

0,575813

0,284187

0,264187

4040,4769

0,88

0,596403

0,283597

0,263597

4040,4798

0,9

0,620925

0,279075

0,259075

4040,4832

0,92

0,64906

0,27094

0,25094

4040,4856

0,94

0,66845

0,27155

0,25155

4040,4886

0,96

0,692062

0,267938

0,247938

4040,4327

0,98

0,232903

0,747097

0,727097

4040,4249

1

0,18377

0,81623

0,79623

Выбираем из рассчитанных значений и максимальные значения , .

По справочной таблице определяем значения параметра при заданном уровне значимости , далее рассчитываем значение модуля максимальной разности по формуле:

, (16)

.

Вывод: поскольку расчетные величины и модуля максимальной разности больше критического значения , гипотеза о принадлежности выборки нормальному закону распределения при уровне значимости отвергается.

2.4 Критерий Мизеса

Проверим с помощью критерия Мизеса гипотезу о том, что экспериментальные данные подчиняются нормальному закону распределения при уровне значимости .

Рассчитываем значения эмпирической функции

. (17)

Рассчитываем средний квадрат отклонения по формуле:

. (18)

Рассчитанные значения представлены в таблице 5.

Таблица 5 - Рассчитанные значения для критерия Мизеса

1

4040,3920

0,01

0,052016

1,765363

26

4040,5090

0,51

0,829185

101,8789

2

4040,3925

0,03

0,053199

0,538178

27

4040,5114

0,53

0,842263

97,50805

3

4040,3942

0,05

0,057379

0,05445

28

4040,5144

0,55

0,85766

94,65491

4

4040,3968

0,07

0,064267

0,032864

29

4040,5175

0,57

0,872468

91,48682

5

4040,3993

0,09

0,071481

0,342963

30

4040,5199

0,59

0,883171

85,94906

6

4040,4021

0,11

0,08028

0,883273

31

4040,5221

0,61

0,892408

79,75419

7

4040,4048

0,13

0,089518

1,638816

32

4040,5251

0,63

0,904139

75,1521

8

4040,4073

0,15

0,098755

2,626016

33

4040,5281

0,65

0,914901

70,17243

9

4040,4109

0,17

0,113255

3,219985

34

4040,5311

0,67

0,924731

64,88777

10

4040,4146

0,19

0,129678

3,638794

35

4040,5340

0,69

0,933386

59,23689

11

4040,4425

0,21

0,303799

8,798188

36

4040,5362

0,71

0,939422

52,63468

12

4040,4453

0,23

0,32569

9,156646

37

4040,5400

0,73

0,948831

47,88718

13

4040,4478

0,25

0,345761

9,170186

38

4040,4367

0,75

0,260686

239,4285

14

4040,4502

0,27

0,365447

9,110048

39

4040,4395

0,77

0,281102

239,0215

15

4040,4521

0,29

0,381289

8,333754

40

4040,4288

0,79

0,207477

339,3328

16

4040,4547

0,31

0,40329

8,703109

41

4040,4681

0,81

0,52004

84,07681

17

4040,4572

0,33

0,424739

8,975475

42

4040,4716

0,83

0,550661

78,03051

18

4040,4609

0,35

0,456877

11,42279

43

4040,4745

0,85

0,575813

75,17841

19

4040,4645

0,37

0,488422

14,02386

44

4040,4769

0,87

0,596403

74,85555

20

4040,4214

0,39

0,163996

51,07795

45

4040,4798

0,89

0,620925

72,4016

21

4040,4925

0,41

0,721595

97,09174

46

4040,4832

0,91

0,64906

68,08961

22

4040,4967

0,43

0,751773

103,5379

47

4040,4856

0,93

0,66845

68,40847

23

4040,5001

0,45

0,774862

105,5351

48

4040,4886

0,95

0,692062

66,53223

24

4040,5040

0,47

0,799781

108,7555

49

4040,4327

0,97

0,232903

543,3123

25

4040,5068

0,49

0,816604

106,6705

50

4040,4249

0,99

0,18377

650,0069

Рассчитываем фактическое значение статистики критерия Мизеса по формуле:

. (19)

.

Определяем по справочной таблице при заданном уровне значимости критическое значение статистики критерия Мизеса .

Вывод: поскольку гипотеза о принадлежности выборки нормальному закону распределения при уровне значимости отвергается.

2.5 Проверка на нормальность распределения графическим методом

Графический метод является наиболее простым способом проверки на нормальность распределения. По этому методу результаты располагают в вариационном ряду, затем для каждого результата рассчитывают накопленную частость по формуле:

, (20)

где номер результата в вариационном ряду;

объем выборки.

Для нормального распределения нашли квантили стандартного нормального распределения .

Результаты расчетов вносим в таблицу 6

Таблица 6 - Результаты расчетов

1

4040,3920

0,019608

-2,061917

26

4040,5090

0,509804

0,024577

2

4040,3925

0,039216

-1,759861

27

4040,5114

0,529412

0,073791

3

4040,3942

0,058824

-1,564726

28

4040,5144

0,54902

0,123185

4

4040,3968

0,078431

-1,415702

29

4040,5175

0,568627

0,172881

5

4040,3993

0,098039

-1,292805

30

4040,5199

0,588235

0,223008

6

4040,4021

0,117647

-1,186831

31

4040,5221

0,607843

0,273702

7

4040,4048

0,137255

-1,092736

32

4040,5251

0,627451

0,32511

8

4040,4073

0,156863

-1,007436

33

4040,5281

0,647059

0,377392

9

4040,4109

0,176471

-0,928899

34

4040,5311

0,666667

0,430727

10

4040,4146

0,196078

-0,855712

35

4040,5340

0,686275

0,485318

11

4040,4425

0,215686

-0,786845

36

4040,5362

0,705882

0,541395

12

4040,4453

0,235294

-0,721522

37

4040,5400

0,72549

0,59923

13

4040,4478

0,254902

-0,659143

38

4040,4367

0,745098

0,659143

14

4040,4502

0,27451

-0,59923

39

4040,4395

0,764706

0,721522

15

4040,4521

0,294118

-0,541395

40

4040,4288

0,784314

0,786845

16

4040,4547

0,313725

-0,485318

41

4040,4681

0,803922

0,855712

17

4040,4572

0,333333

-0,430727

42

4040,4716

0,823529

0,928899

18

4040,4609

0,352941

-0,377392

43

4040,4745

0,843137

1,007436

19

4040,4645

0,372549

-0,32511

44

4040,4769

0,862745

1,092736

20

4040,4214

0,392157

-0,273702

45

4040,4798

0,882353

1,186831

21

4040,4925

0,411765

-0,223008

46

4040,4832

0,901961

1,292805

22

4040,4967

0,431373

-0,172881

47

4040,4856

0,921569

1,415702

23

4040,5001

0,45098

-0,123185

48

4040,4886

0,941176

1,564726

24

4040,5040

0,470588

-0,073791

49

4040,4327

0,960784

1,759861

25

4040,5068

0,490196

-0,024577

50

4040,4249

0,980392

2,061917

По результатам расчетов построили точечную диаграмму (Рисунок 2), используя в качестве данных значения изучаемого признака и квантили стандартного нормального распределения. Затем добавили на диаграмму линейную линию тренда.

Рисунок 2 - Проверка нормальности распределения графическим методом

Вывод: поскольку нанесенные на график точки не полностью укладываются вдоль линии тренда, то считается, что результаты неудовлетворительно описываются выбранным теоретическим распределением, и гипотеза о нормальном распределении случайной величины отвергается.

3. Биномиальное распределение

Случайная величина Y имеет дискретное распределение, если она принимает не более чем счетное число значений. К дискретным распределениям относят распределение Бернулли, биноминальное распределение, гипергеометрическое распределение, распределение Пуассона.

Биномиальное распределение. Это то же распределение Бернулли, но в данном случае необходимо знать вероятность появления определенного числа (или не менее этого числа) успешных исходов уже при независимых событиях.

Случайная величина имеет биномиальное распределение в следующих случаях: если в каждой из попыток вероятность наступления события одна и та же, и если все попытки независимы друг от друга.

А) Рабочий обслуживает 12 станков одного типа. Вероятность того, что станок потребует внимания рабочего в течение часа, равна 1/3. Найдите: а) вероятность того, что в течение часа 3 станка потребуют внимания рабочего; б) наиболее вероятное число станков, которые потребуют внимания рабочего в течение часа. Дать геометрическую иллюстрацию.

В данной задаче мы имеем биномиальное распределение, расчет производим с помощью функции =БИНОМРАСП(число успехов; число испытаний; вероятность успеха; интегральная)

- число успехов -- количество успешных испытаний.

- число испытаний -- число независимых испытаний.

- вероятность успеха -- вероятность успеха каждого испытания.

- интегральная -- логическое значение, определяющее вид функции. Если аргумент «интегральная» имеет значение ИСТИНА, функция БИНОМРАСП возвращает интегральную функцию распределения, то есть вероятность того, что число успешных испытаний не меньше значения аргумента «число успехов»; если этот аргумент имеет значение ЛОЖЬ, то возвращается функция вероятностной меры, то есть вероятность того, что число успешных испытаний равно значению аргумента «число успехов».

Таким образом, мы получаем значения, представленные в таблице 7.

Таблица 7 - Расчетные значения

Число успехов

Y

Вероятность

P=Y

Вероятность

P?Y

0

0,007707

0,007707

1

0,046244

0,053951

2

0,127171

0,181123

3

0,211952

0,393075

4

0,238446

0,631521

5

0,190757

0,822278

6

0,111275

0,933552

7

0,047689

0,981242

8

0,014903

0,996144

9

0,003312

0,999456

10

0,000497

0,999953

11

4,52E-05

0,999998

12

1,88E-06

1

а) вероятность того, что в течение часа 3 станка потребуют внимания рабочего составляет 0,2;

Представим полученные значения графически (Рисунок 3)

Рисунок 3 - Биномиальное распределение числа станков

Б) При передаче сообщения вероятность искажения для каждого знака равна 0,1. Какова вероятность того, что сообщение из 5 знаков: а) не будет искажено; б) содержит ровно одно искажение; в) содержит не более 3 искажений.

В данной задаче мы имеем биномиальное распределение, расчет производим с помощью функции =БИНОМРАСП(число успехов; число испытаний; вероятность успеха; интегральная)

Таким образом, мы получаем значения, представленные в таблице 8.

Таблица 8 - Расчетные значения

Число успехов

Y

Вероятность

P=Y

Вероятность

P?Y

0

0,59049

0,59049

1

0,32805

0,91854

2

0,0729

0,99144

3

0,0081

0,99954

4

0,00045

0,99999

5

0,00001

1

а) вероятность того, что сообщение из 5 знаков не будет искажено, составляет 0,6;

б) вероятность того, что сообщение из 5 знаков содержит ровно одно искажение, составляет 0,3;

в) вероятность того, что сообщение из 5 знаков содержит не более 3 искажений, составляет 1.

4. Расчет корреляционных зависимостей

Исходные данные для проведения корреляционного анализа и построения регрессионной модели приведены в таблице 9.

Таблица 9 - Исходные данные

Тревога

Самочувствие

Активность

Тревога

Самочувствие

Активность

52

5,5

3,4

38

4,9

5

47

4,2

4,6

48

4,1

3,5

35

6,2

3,2

42

5,5

4,6

53

5,8

6,2

57

3,8

4,8

33

5,8

6,6

41

5

4,2

36

4,7

4,1

49

5,7

5,1

49

3,5

3,6

54

4,3

3

47

4,7

3,2

44

4,5

4,9

30

5,7

5,6

35

6,3

4,5

31

5,6

5,4

46

2,5

2,9

41

5,4

4,8

30

6,8

7

53

3,9

4

38

5,6

4,1

50

4,7

4,8

43

5,9

5,2

26

6,5

6,4

38

6,1

5,7

45

4,5

4,7

33

6,2

4,4

33

4,3

5,3

36

5,2

5,4

35

5,1

6

58

3,2

3,1

56

4,9

4,2

44

4

4

51

4,8

5,3

42

5,3

4,9

33

5,3

4,6

46

5,5

6,3

25

6,4

6,4

44

4,1

3,6

41

4,4

4,1

36

4,8

5,8

72

2,6

2,7

37

3,6

4,9

51

3,5

4,8

34

6

6,1

63

2,6

3,2

44

4,1

3,8

Корреляционный анализ позволяет оценить степень взаимосвязи между 2 факторами (если такая взаимосвязь вообще существует).

Необходимо определить наличие линейных корреляционных связей между такими факторами, как тревога, самочувствие и активность. Предполагаем, что выборки по всем вариантам подчиняются нормальному закону. Проверку гипотезы о значимости оценок коэффициентов корреляции проводим с уровнем значимости .

Стандартизацию исходной матрицы начинаем с вычисления математического ожидания ? и среднеквадратического отклонения ? по каждой варианте, которые представлены в таблице 10.

Таблица 10 - Оценки параметров распределения

Оценка параметра распределения

Варианта

Тревога

Самочувствие

Активность

м

42,90

4,87

4,68

у

9,69

1,06

1,08

Затем формируем стандартизованную матрицу исходных данных, используя формулу:

, (23)

Далее определяем оценки коэффициентов корреляции по формуле:

. (24)

После чего определяем значения критерия Стьюдента для вычисления оценок коэффициентов корреляции:

. (25)

Полученные данные заносим в таблицу 11.

Таблица 11 - Значения коэффициентов корреляции и критерия Стьюдента

Зависимость

Тревога - Самочувствие

Тревога - Активность

Самочувствие - Активность

-0,7±0,08

-0,6±0,09

0,6±0,08 (*)

6,3

5,0

5,7

(*) - достоверный коэффициент корреляции

Критическое значение .

Таким образом, для каждой оценки коэффициента корреляции. Это означает, что для указанных коэффициентов оценка значима (коэффициент корреляции генеральной совокупности не равен нулю при уровне значимости ).

Между величинами «Тревога» и «Самочувствие» существует сильная отрицательная (обратная) связь.

Между величинами «Тревога» и «Активность» существует средняя отрицательная (обратная) связь.

Между величинами «Активность» и «Самочувствие» существует средняя положительная (прямая) связь.

Для наиболее сильной корреляционной зависимости построена диаграммы рассеяния, изображенная на рисунке 3.

Рисунок 4 - Диаграмма рассеяния, отображающая корреляционную взаимосвязь между «Тревогой» и «Самочувствием»

5. Регрессионный анализ

Регрессионный анализ позволяет получить функциональную зависимость между некоторой случайной величиной Y и некоторыми влияющими на Y величинами X. Такая зависимость получила название уравнения регрессии.

Рассмотрим результаты регрессионного анализа.

Таблица 12 - Регрессионный анализ

Факторы

bi

Уровень значимости б

Тревога

b0

76,84626446

0,00000000000000000006<0,001

Самочувствие=Х1

-4,732326035

0,00037398251960960900<0,001

Активность=Х2

-2,327002567

0,06040555662951250000>0,05

Самочувствие

b0

5,31535972

0,0000029<0,001

Активность

0,366753996

0,0031922<0,005

Тревога

-0,050344252

0,0003740<0,001

Активность

b0

3,761249107

0,006318786<0,05

Тревога

-0,031379323

0,060405557>0,5

Самочувствие

0,464885848

0,003192185<0,05

- линейный коэффициент детерминации. Величина показывает, какая часть (доля) вариации объясняемой переменной обусловлена вариацией объясняющей переменной.

, что свидетельствует о том, что вариация «Тревоги» на 51% обусловлена линейным влиянием величин «Самочувствие» и «Активность».

, что свидетельствует о том, что вариация «Самочувствия» на 56% обусловлена линейным влиянием величин «Тревога» и «Активность».

, что свидетельствует о том, что вариация «Активности» на 46% обусловлена линейным влиянием величин «Тревога» и «Самочувствие».

В итоге получили следующие математические модели:

,

,

Полученные уравнения регрессии являются аналитическим описанием, имеющихся экспериментальных данных.

6. Дисперсионный анализ

Дисперсионный анализ - метод математической статистики, который позволяет изучить влияние одного или нескольких факторов на рассматриваемый признак.

Мы оцениваем влияние «Тревоги» на «Самочувствие» и «Активность», «Самочувствия» на «Тревогу» и «Активность», «Активности» на «Тревогу» и «Самочувствие».

Подготовим исходные данные, представленные в таблице 9, для проведения однофакторного дисперсионного анализа, распределив значения выборок по уровням. Нулевая гипотеза в однофакторном дисперсионном анализе утверждает, что все средние значения из различных генеральных совокупностей, которые представлены выборочными средними, равны между собой:

. (26)

Альтернативная гипотеза утверждает, что хотя бы 2 любых средних не равны между собой:

. (27)

Результаты однофакторного дисперсионного анализа приведены в таблице 12.

Таблица 12 - Результаты однофакторного дисперсионного анализа

Влияние

Уровень значимости б

«Тревоги» на «Самочувствие»

8,9128069

0,005227

3,1950563

«Тревоги» на «Активность»

7,8092785

0,0011797

«Самочувствия» на «Тревогу»

10,7790026

0,0001403

«Самочувствия» на «Активность»

10,8411025

0,0001344

«Активности» на «Тревогу»

11,8912620

0,0000662

«Активности» на «Самочувствие»

15,1374215

0,0000084

На основании рассчитанных значений мы сформулировали следующие выводы, и построили диаграмму влияния «Активности» на «Самочувствие» (Рисунок 5).

Для всех значений , следовательно «Тревога» оказывает влияние на «Самочувствие» и «Активность», «Самочувствие» влияет на «Тревогу» и «Активность», «Активность» оказывает влияние на «Тревогу» и «Самочувствие».

Рисунок 5 - Диаграмма, отображающая зависимость среднего значения «Самочувствия» от степени выраженности фактора «Активность»

7. Анализ временных рядов

Временной ряд представляет собой последовательность данных, описывающих исследуемое явление в последовательные моменты времени (за какой-то период). Составными элементами ряда динамики являются показатели уровней ряда и периоды времени( годы, кварталы, месяцы, сутки) или моменты(даты) времени. Статистические показатели, характеризующие изучаемый объект называют уровнями ряда.

Исследуем динамику продолжительности залегания снежного покрова (в днях) в одном из регионов РФ.

Исходные данные для проведения анализа временного ряда представлены в таблице 13.

Таблица 13 - Исходные данные

Год

Количество дней

Год

Количество дней

1953

106

1966

144

1954

150

1967

133

1955

100

1968

150

1956

159

1969

136

1957

144

1970

135

1958

131

1971

146

1959

151

1972

125

1960

141

1973

153

1961

141

1974

116

1962

148

1975

143

1963

142

1976

145

1964

127

1977

134

1965

143

1978

140

Рисунок 4 - График зависимости дней залегания снежногопокрова от года

Данные расчетов представлены в таблицах 14, 15.

Год

Кол-во

дней

?

Кр

Тр

Тпр

Год

Кол-во

дней

?

Кр

Тр

Тпр

Цепные показатели

Базисные показатели

1953

106

1953

106

1954

150

44

13

141,5

41,5

1954

150

44

1,4

141,5

41,5

1955

100

-50

0,7

66,7

-33,3

1955

100

-6

0,9

94,3

-5,7

1956

159

59

1,6

159,0

59,0

1956

159

53

1,5

150,0

50,0

1957

144

-15

0,9

90,6

-9,4

1957

144

38

1,4

135,8

35,8

1958

131

-13

0,9

91,0

-9,0

1958

131

25

1,2

123,6

23,6

1959

151

20

1,2

115,3

15,3

1959

151

45

1,4

142,5

42,5

1960

141

-10

0,9

93,4

-6,6

1960

141

35

1,3

133,0

33,0

1961

141

0

1,0

100,0

0,0

1961

141

35

1,3

133,0

33,0

1962

148

7

1,0

105,0

5,0

1962

148

42

1,4

139,6

39,6

1963

142

-6

1,0

95,9

-4,1

1963

142

36

1,3

134,0

34,0

1964

127

-15

0,9

89,4

-10,6

1964

127

21

1,2

119,8

19,8

1965

143

16

1,1

112,6

12,6

1965

143

37

1,3

134,9

34,9

1966

144

1

1,0

100,7

0,7

1966

144

38

1,4

135,8

35,8

1967

133

-11

0,9

92,4

-7,6

1967

133

27

1,3

125,5

25,5

1968

150

17

1,1

112,8

12,8

1968

150

44

1,4

141,5

41,5

1969

136

-14

0,9

90,7

-9,3

1969

136

30

1,3

128,3

28,3

1970

135

-1

1,0

99,3

-0,7

1970

135

29

1,3

127,4

27,4

1971

146

11

1,1

108,1

8,1

1971

146

40

1,4

137,7

37,7

1972

125

-21

0,9

85,6

-14,4

1972

125

19

1,2

117,9

17,9

1973

153

28

1,2

122,4

22,4

1973

153

47

1,4

144,3

44,3

1974

116

-37

0,8

75,8

-24,2

1974

116

10

1,1

109,4

9,4

1975

143

27

1,2

123,3

23,3

1975

143

37

1,3

134,9

34,9

1976

145

2

1,0

101,4

1,4

1976

145

39

1,4

136,8

36,8

1977

134

-11

0,9

92,4

-7,6

1977

134

28

1,3

126,4

26,4

1978

140

6

1,0

104,5

4,5

1978

140

34

1,3

132,1

32,1

Таблица 15 - Средние значения

В ходе анализа временных рядов были рассчитаны показатели динамики с постоянной и переменной базой, а также их средние значения. Также было выявлено, что в период с1953 по 1960 года наблюдалось четкое увеличение количества дней залегания снежного покрова, в период с 1960 по 1970 года наблюдалось незначительное уменьшение количества дней залегания снежного покрова и в период с 1970 по 1978 года наблюдалось незначительное увеличение количества дней залегания снежного покрова.

Таким образом было выявлено, что продолжительность залегания снежного покрова в период 1953 по 1978 года увеличилась на 1,1%.

Заключение

В работе был построен непрерывный вариационный ряд в виде гистограммы, которая имеет вид «гребенки». В ходе проверки на нормальность распределения случайной величины с помощью критериев Пирсона, Колмогорова, Мизеса и графического метода сделан вывод, что распределение анормально. Произведено решение задач с помощью дискретного распределения случайной величины. Совершены корреляционный, регрессионный и дисперсионный анализы, в ходе которых найдена взаимосвязь между результирующим признаком и входными факторами. Исследована динамика продолжительности залегания снежного покрова в период с1953 по 1978 года.

Размещено на Allbest.ru


Подобные документы

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.

    реферат [174,7 K], добавлен 25.10.2015

  • Решение задач по определению вероятности событий, ряда и функции распределения с помощью формулы умножения вероятностей. Нахождение константы, математического описания и дисперсии непрерывной случайной величины из функции распределения случайной величины.

    контрольная работа [57,3 K], добавлен 07.09.2010

  • Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.

    контрольная работа [97,1 K], добавлен 26.02.2012

  • Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.

    контрольная работа [38,5 K], добавлен 25.03.2015

  • Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.

    контрольная работа [33,8 K], добавлен 13.12.2010

  • Определение математического ожидания и дисперсии параметров распределения Гаусса. Расчет функции распределения случайной величины Х, замена переменной. Значения функций Лапласа и Пуассона, их графики. Правило трех сигм, пример решения данной задачи.

    презентация [131,8 K], добавлен 01.11.2013

  • Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.

    курсовая работа [147,0 K], добавлен 10.04.2011

  • Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.

    контрольная работа [91,7 K], добавлен 15.11.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.