Статистическая обработка результатов испытаний одномерных и двумерных случайных величин

Проведение статистической обработки результатов контрольных обмеров 100 валиков методом интервальной оценки. Доверительный интервал для оценки среднего квадратического отклонения. Разработка корреляционной модели капиталовложений по группе предприятий.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 23.04.2014
Размер файла 690,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

3

Государственное бюджетное образовательное учреждение высшего профессионального образования Московской области

«Международный университет природы, общества и человека «Дубна»

Факультет Естественных и Инженерных наук

Кафедра прикладной математики и информатики

Курсовая работа по «Теории вероятности и математической статистики»

Статистическая обработка результатов испытаний одномерных и двумерных случайных величин

Студентки II курса группы 2241

Селиверстовой Дарьи Валерьевны

Руководитель:

Доц. к. т.н.: Богомолова Е. В.

Дубна, 2012 г.

Оглавление

Введение

Статистическая обработка

Интервальные оценки

Доверительный интервал для оценки среднего квадратического отклонения

Двумерные случайные величины

Выборочное корреляционное отношение

Доверительные интервалы для коэффициентов регрессии

Заключение

Список использованной литературы

Введение

В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона. Вычисляем числовые характеристики выборки: выборочную среднюю, моду, медиану, выборочную дисперсию, коэффициент вариации, коэффициенты асимметрии и эксцесса. Оцениваем математическое ожидание и среднее квадратическое отклонение нормально распределенного признака генеральной совокупности с помощью доверительных интервалов с заданной надежностью.

Во второй задаче представлена корреляционная таблица распределения 100 предприятий по капиталовложениям Х (млн. руб.) и выписка продукции Y (млн. руб.). По данным этой таблицы находим выборочные уравнения прямых линий регрессии Y на X и X на Y, строим их графики. Вычисляем коэффициент корреляции, который позволяет нам судить о прямой или обратной зависимости прямых линий регрессии и их силе. Также находим выборочное корреляционное отношение, которое оценивает тесноту связи между Y и X, X и Y. Вычисляем интервальные оценки для генеральных коэффициентов регрессии.

Для статистической обработки результатов используем различные методы: метод моментов, наибольшего правдоподобия, метод произведений вычисления выборочных средней дисперсии, метод сумм вычисления выборочных средней дисперсии, используем разделы теории корреляции и статистической проверки статистических гипотез.

интервальная оценка корреляционная модель капиталовложение

Статистическая обработка

Одномерные случайные величины

Задача №1. Контрольные обмеры 100 валиков дали следующие результаты:

Табл.№1

7,39

7,43

7,54

7,64

7,4

7,55

7,4

7,26

7,42

7,5

7,32

7,31

7,28

7,52

7,46

7,63

7,38

7,44

7,52

7,53

7,37

7,33

7,24

7,13

7,53

7,53

7,39

7,57

7,51

7,34

7,39

7,47

7,51

7,48

7,62

7,58

7,57

7,33

7,51

7,4

7,3

7,48

7,4

7,57

7,51

7,4

7,52

7,56

7,4

7,34

7,23

7,37

7,48

7,48

7,62

7,35

7,36

7,4

7,45

7,29

7,48

7,58

7,44

7,56

7,28

7,59

7,47

7,62

7,54

7,2

7,38

7,43

7,35

7,56

7,51

7,47

7,4

7,29

7,2

7,46

7,42

7,44

7,41

7,29

7,48

7,39

7,5

7,38

7,45

7,5

7,45

7,42

7,29

7,53

7,34

7,55

7,33

7,32

7,69

7,46

Составим интервальный ряд для контрольных обмеров 100 валиков. Для этого находим максимальные и минимальные варианты и, используя заданный шаг h=0,07 - расстояние между двумя соседними вариантами, прибавляем h к х=7,13 до тех пор пока не перекроем максимальное значение х=7,69; От интервального вариационного ряда переходим к дискретному вариационному ряду, приняв за новые варианты у - середины интервалов; Перейдем к условным вариантам: u=(y-C)/h, где u - условная варианта середины интервала, С - ложный нуль (С=7,38)

Табл.№2

интервалы:

У

n

U

n*u

n*(

n*

n*

n*

7,13-7,20

7,17

1

0,01

-3

-3

-3,95

15,6025

9

-27

81

7,20-7,27

7,24

5

0,05

-2

-10

-2,95

43,5125

20

-40

80

7,27-7,34

7,31

13

0,13

-1

-13

-1,95

49,4325

13

-13

13

7,34-7,41

7,38

23

0,23

0

0

-0,95

20,7575

0

0

0

7,41-7,48

7,45

18

0,18

1

18

0,05

0,045

18

18

18

7,48-7,55

7,52

23

0,23

2

46

1,05

25,3575

92

184

368

7,55-7,62

7,59

11

0,11

3

33

2,05

46,2275

99

297

891

7,62-7,69

7,66

6

0,06

4

24

3,05

55,815

96

384

1536

сумма

-

100

-

-

95

-3,6

256,75

347

803

2987

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Полигоном частот называют ломаную, отрезки которой соединяют точки (х1; n1), (х2; n2), … (xk;nk).

Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им частоты ni. Точки (xi;ni). Соединяют отрезками прямых и получают полигоны частот.

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1;W1) … (xk;Wk).Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им относительные частоты Wi. Точки …(xi;Wi).соединяют отрезками прямых и получают полигон относительных частот.

Для построения полигона используем частоты и варианты у - середины интервалов дискретного вариационного ряда.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h.

Площадь i-го частичного прямоугольника равна hni/h=ni - сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению Wi/h (плотность относительной частоты).

Для построения гистограммы относительны частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi/h. Площадь i-го частичного прямоугольника равна hWi/h=Wi - относительной частоте вариант, попавших в i интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Для построения гистограммы используем частоты и интервалы интервального ряда

Выборочная средняя:

Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Выборочной средней хв называют среднее арифметическое значение признака выборочной совокупности. Если все значения х1, x2,…,xn признака выборки объема n различны , то

=(х1, x2,…,xn)/h.

Если значения признака х1, x2,…,xk имеют соответственно частоты n1,n2…,nk, причем n1+n2+…+nk=n, то

=(n1х1+n2х2+…+nkхk)/n, или =, [1]

т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равным соответствующим частотам. По данным интервального ряда 7,4465 Выборочная дисперсия:

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят свободную характеристику - выборочную дисперсию.

Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения х1, x2,…,xn признака выборки объема n различны, то

Dв=(?(хi-)2)/n.

Если же значения признака х1, x2,…,xk имеют соответственно частоты n1,n2,…,nk, причем n1+n2+…+nk=n, то

Dв=(, [2]

т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.

Кроме дисперсии для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.

Выборочным средним квадратическим отклонением (стандартом) называют квадратический корень из выборочной дисперсии:

??в = [3]

Вычисление дисперсии можно упростить, используя теорему:

Теорема: Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:

D= [4]

Доказательство: Справедливость теоремы вытекает из преобразований:

Dв=(=

Выборочная дисперсия является смешенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно М(Dв)= Dг. [5]

Чтобы найти исправленную дисперсию, которую обозначают S2 нужно умножить Dв на дробь .

Для контрольных обмеров валика:

Выборочная дисперсия - Dв=0,012581,

Выборочное среднее квадратическое отклонение - ??в =0,11216394,

Исправленная дисперсия - S=0,113297.

Модой М0 называют варианту, которая имеет наибольшую частоту.

Медианой me называют варианту, которая делит вариационный ряд на 2 части, равные по числу вариант. Если число вариант нечетно, т.е. n=2k+1, то me=xk+1; при четном n=2k медиана me=(xk+ xk+1)/2.

Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:

V= [6]

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов. Тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации - безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность.

По результатам контрольного обмера валиков:

Медиана - me=7,44

Мода - Мо=7,44

Коэффициент вариации - V=21,51806%

Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс.

Асимметрия эмпирического распределения определяется равенством

Аs=m3в3, где m3 - центральный эмпирический момент третьего порядка [7]

Эксцесс эмпирического распределения определяется равенством

Ек=m44в - 3, где m4 - центральный эмпирический момент четвертого порядка [8]

m3=[M3-3M2M1+2(M1)3]*h3 [9]

m4=[M4 - 4M3M1+6M2(M1)2 - 3(M1)4]*h4 [10]

m2=[M2 - (M1)2]*h2 [11]

Mk=(?nixik)/n [12]

Для данного интервального ряда условные и эмпирические моменты:

M1

0,95

M2

3,47

M3

8,03

M4

29,87

m3

-5E-05

m4

0,000377

Тогда можно вычислить: As= 0,03518 и = 0,61796

Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона

Пусть эмпирическое распределение задано в виде последовательности интервалов и соответствующих им частот. Для того чтобы при заданном уровне значимости б проверить гипотезу о нормальном распределении генеральной совокупности, надо:

1) Перейти к дискретному вариационному ряду, взяв середины интервалов за новые варианты.

2) Вычислить непосредственно выборочную среднюю и выборочное среднее квадратическое отклонение ??.

3) Вычислить теоретические частоты

, [13]

где n - объем выборки, вероятность попадания нормированной случайной величины в интервал [14]

, где Ф=. [15]

4) Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

А) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия

. [16]

Б) по таблице критических точек распределения , по заданному уровню значимости б и числу степеней свободы k=s-3 (s - число групп выборки) находят критическую точку =(б; k) правосторонней критической области. Если < - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются не значимо. Если > - гипотезу отвергают, т.е. эмпирические и теоретические частоты различаются значимо.

Составим расчетную таблицу, где и концы интервалов контрольных обмеров валиков, их частота, выборочную среднюю и выборочное среднее квадратическое отклонение ?? мы уже вычислили ранее, находим значение случайной величины Z, значение Ф(Z) нашли по таблице приложения №2, разность значений Ф() и Ф(). Уровень значимости б=0,05 и число групп выборки s=7, тогда число степеней свободы k=4. Критическая точка =(б; k)=(0,05; 4)=9,5.

Табл.№3

i

Ф()

Ф()

n'=n

(-n')2/n'

1

7,13

7,2

1

-?

-2,1977

-0,5

-0,4861

0,0139

1,39

2

7,2

7,27

5

-2,1977

-1,5736

-0,4861

-0,4418

0,0443

4,43

0,0056

3

7,27

7,34

13

-1,5736

-0,9495

-0,4418

-0,3289

0,1129

11,29

0,259

4

7,34

7,41

23

-0,9495

-0,3254

-0,3289

-0,1274

0,2015

20,15

0,4031

5

7,41

7,48

18

-0,3254

0,29867

-0,1274

0,1179

0,2453

24,53

1,7383

6

7,48

7,55

23

0,2987

0,92276

0,1179

0,3212

0,2033

20,33

0,3507

7

7,55

7,62

11

0,9228

1,54684

0,3212

0,4394

0,1182

11,82

0,0569

8

7,62

7,69

6

1,5468

?

0,4394

0,5

0,0606

6,06

0,0006

100

1

2,8141

Из таблицы №3 находим 2,8141.

Так как =9,5, то следует, что (2,8141<9,5). Критерий Пирсона выполняется, значит, результаты контрольного обмера валиков имеют нормальное распределение.

Кривая Гаусса

Непрерывная случайная величина Х имеет нормальное распределение с параметрами а и ??2, где а - выборочное среднее значение и ??2 - среднее квадратическое отклонение, если плотность распределения вероятностей имеет вид f(x)= График плотности f(x) нормального распределения называется кривой Гаусса. Для построения графика используем 5 точек:

1) точка максимума (а; )=(7,4465; 2,4904)

2) точка перегиба (а+??; )=(7,6067; 1,5105)

3) точка перегиба (а-??; )=(7,2863; 1,5105)

4) вспомогательная точка (а-2??; )=(7,1260; 0,9162)

5) вспомогательная точка (а+2??; )=( 7,7670; 0,9162)

Интервальные оценки

Интервальной называют оценку, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика ??*служит оценкой неизвестного параметра ??. Будем считать ?? постоянным числом (?? может быть и случайной величиной). ??* тем точнее определяет параметр ??, чем меньше абсолютная величина разности | ?? - ??*|.

Однако статистические методы не позволяют категорически утверждать, что оценка ??* удовлетворяет неравенству | ?? - ??*|<??; можно лишь говорить о вероятности ??, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки ?? по ??* называют вероятность ??, с которой осуществляется неравенство | ?? - ??*|<??. Обычно надежность оценки задается наперед , причем в качестве ?? берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.

Пусть вероятность того, что | ?? - ??*|<??, равна ??:

Р[| ?? - ??*|<??]=??.

Заменив неравенство | ?? - ??* | < ?? равносильным ему двойным неравенством -??<?? - ??*<??, или ??*-??< ?? < ??*+??, имеем

Р[??*-??< ?? < ??*+??]=??.

Это соотношение следует понимать так: вероятность того что интервал (??*-??,??*+??) заключает в себе (покрывает) неизвестный параметр ??, равна ??.

Доверительным называют интервал (??*-??; ??*+??) который покрывает неизвестный параметр с заданной надежностью ??.

Пусть количественный признак Х генеральной совокупности имеет нормальное распределение с неизвестным средним квадратическим отклонением ??. По выборке х1, x2,…,xn требуется оценить математическое ожидание а.

Рассмотрим случайную величину Т=, где Z имеет нормальное распределение N(0,1); V имеет распределение ??2 с «к» степенями свободы; Т имеет распределение Стьюдента «к» степенями свободы.

В качестве Z=, V=(k-1)(S2/??2), где S - исправленное выборочное среднее квадратическое отклонение

Возьмем Т== имеет распределение Стьюдента с (к-1) степенями свободы. Пусть S(t,n) плотность распределения Стьюдента.

Р(||<t??)=2(t,n) dt=??

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим:

P( - t??S/<a< + t??S/)=??

Пользуясь распределением Стьюдента, нашли доверительный интервал покрывающий неизвестный параметр а с надежностью ??: ( - t??S/ + t??S/ [17]

и S находятся по выборке. По таблице приложения 3 по заданным n и ?? можно найти t??.

В первой задаче надежность ?? =0,95; n=100, по таблице приложения №3 - t??=1,984, тогда находим доверительный интервал для оценки математического ожидания при неизвестном ??: 7,4240<a<7,4690. Вывод: в генеральной совокупности средние размеры валиков заключены в пределах от 7,4240 до 7,4690.

Доверительный интервал для оценки среднего квадратического отклонения ??

Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение ?? по х1, x2,…,xn и «исправленному» выборочному среднему квадратическому отклонению S. Нужно найти доверительный интервал, покрывающий неизвестный параметр ?? с заданной надежностью ??=Р(|у-S|<д)

-д<у-S<д

S-д<у<д+S

S(1-д/S)<у<(1+д/S)S

Обозначим q=д/S => S(1-q)<у<S(1+q) [18]

< ; ч=

< <

< <

Обозначим ч= имеющее распределение ч2 с (n-1) степенями свободы

Пусть ее плотность R(t,n) распределения ч2,то Р(ч1 <ч< ч2)= =>P( < ч < )=г=. Из этого выражения находим q.

На практике q находят из таблицы приложения №4 по заданным n и г.

По данным таблицы интервального ряда:

По заданным надежности ?? =0,95 и объема n=100, по таблице приложения №4 q=0,143. Тогда доверительный интервал для оценки среднего квадратического отклонения ?? контрольного обмера валиков имеет вид 0,0971<??<0,1295. Вывод: в генеральной совокупности средние квадратические отклонения размеров валиков заключены в пределах (0,0971; 0,1295).

Примечание: все таблицы приложения находятся в книге «В.Е. Гмурман “Теория вероятностей и математическая статистика”» 1998 г.»

Двумерные случайные величины

Задача №2: Распределение 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.) приведено в таблице:

Табл.№4

У

Х

12

17

22

27

32

37

25

2

4

-

-

-

-

6

35

-

6

3

-

-

-

9

45

-

-

6

45

4

-

55

55

-

-

2

8

6

-

16

65

-

-

-

4

7

3

14

2

10

11

57

17

3

100

Перейдем к условным вариантам:

где =22, =5;

=45, =10;

Табл. №5

U

V

-2

-1

0

1

2

3

-2

2

4

-

-

-

-

6

-1

-

6

3

-

-

-

9

0

-

-

6

45

4

-

55

1

-

-

2

8

6

-

16

2

-

-

-

4

7

3

14

2

10

11

57

17

3

100

Корреляционная зависимость:

Одному значению случайной величины Х отвечает условное математическое ожидание другой случайной величины У.

В качестве оценок условных математических ожиданий применяют условные средние, которые находят по выборке.

Условным средним называют среднее арифметическое значений Y, соответствующих при Х=х.

Условным средним называют среднее арифметическое значений Х, соответствующее при Y=y.

Условное математическое ожидание М(Y|x) является функцией от х, его оценка, т.е. условное среднее , также функция от х; обозначив эту функцию через f*(x), получим уравнение = f*(x).Это уравнение называют выборочным уравнением регрессии Y на Х; функцию f*(x) называют выборочной регрессией Y на Х, а ее график - выборочной линией регрессии Y на Х.

Аналогичное уравнение =??*(у) называют выборочным уравнением регрессии Х на Y; функцию ??*(у) называют выборочной регрессией Х на Y, ее график - выборочной линией регрессии Х на Y.

Пусть известны результаты n независимых опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).

Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать в виде

=kх+b регрессии Y на Х. Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии Y на Х и обозначают ??ух.

Выборочное уравнение прямой линии регрессии Y на Х вида Y= ??ух х+b.

Подберем параметры ??ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой линии регрессии.

Воспользуемся методом наименьших квадратов. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.

F(??, b)=?(Yi-yi)2, или F(??, b)=?(??xi+b-yi)2

Для отыскания минимума приравниваем к нулю соответствующие частные производные:

dF/d??=2;

dF/db=2.

Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно ?? и b:

(?х2)??+(?x)b=?xy; (?х)??+nb=?y.

Решив эту систему, найдем искомые параметры:

??ху=(n?xy-?x?y)/(n?x2-(?x)2);

b=(?x2?y-?x?xy)/(n?x2-(?x)2).

Аналогично можно найти выборочное уравнение прямой линии регрессии Х ни Y:

=х+С, где - выборочный коэффициент регрессии Х на У.

Допустим, что получено большое число данных, среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Воспользуемся тождествами:

?x=n; ?y=n; ?x2=n; ?xy=?xy, пара чисел (x, y)встретилась раз.

Подставив в систему

и сократив обе части второго уравнения на n, получим

Решив эту систему, найдем параметры и b и искомое уравнение

=х+b.

Однако более целесообразно, введя новую величину - выборочный коэффициент корреляции, написать уравнение регрессии в ином виде. Найдем b из второго уравнения второй системы: b=.

Подставив правую часть этого равенства в уравнение =х+b, получим

=(х - ).

Найдем из первой системы коэффициент регрессии, учитывая, что 2- ()2=??2х:

??ху==. [19]

Умножив обе части равенства на дробь ??х/??у

??ух=. [20]

Обозначив правую часть через rв - выборочный коэффициент корреляции

rв=. [21]

Подставив rв в =(х - ): = rв. [22]

Отсюда = rв [23]

то уравнение регрессии Y по Х имеет вид = rв(х - ) [24]

Аналогично уравнение регрессии Х по Y: = rв(y- [25]

Выборочный коэффициент корреляции определяется равенством:

rв=, где и - варианты признаков Х и Y; частота пары вариант (х, у); n - объем выборки; , - выборочные средние квадратические отклонения; - выборочные средние.

Если величины Y и Х независимы, то r=0; если r=1 и r= -1, то У и Х связаны линейной функциональной зависимостью. Коэффициент корреляции измеряет силу (тесноту) линейной связи между Y и Х. Выборочный коэффициент корреляции является оценкой коэффициента корреляции генеральной совокупности и поэтому также служит для измерения линейной связи между величинами - количественными признаками Y и Х.

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность, то заключение о тесноте линейной зависимости между признаками, полученные по данным выборки, может быть распространено и на генеральную совокупность. Рассмотрим 2 вспомогательные таблицы:

Табл.№6 Умножение частоты nij на условную варианту U:

U

V

-2

-1

0

1

2

3

U

v*U

-2

-4

-4

0

0

0

0

-8

16

-1

0

-6

0

0

0

0

-6

6

0

0

0

0

45

8

0

53

0

1

0

0

0

8

12

0

20

20

2

0

0

0

4

14

9

27

54

сумма

96

Табл.№7 Умножение частоты на условную варианту V:

U

V

-2

-1

0

1

2

3

-2

-4

-8

0

0

0

0

-1

0

-6

-3

0

0

0

0

0

0

0

0

0

0

1

0

0

2

8

6

0

2

0

0

0

8

14

6

V

-4

-14

-1

16

20

6

сумма

u*V

8

14

0

16

40

18

96

Вычислим выборочные характеристики случайных величин Х, переходя к условным вариантам

Табл.№8

Ui

Ni

Ui*ni

Ui^2*ni

-2

2

-4

8

-1

10

-10

10

0

11

0

0

1

57

57

57

2

17

34

68

3

3

9

27

сумма

100

86

170

По таблице находим =0,86, =1,7, тогда 0,98

Табл.№9

Vi

Ni

Vi*ni

Vi^2*ni

-2

6

-12

24

-1

9

-9

9

0

55

0

0

1

16

16

16

2

14

28

56

Сумма

100

23

105

По таблице находим = 0,23, = 1,05, тогда 0,998549

Тогда выборочный коэффициент корреляции по формуле [21] rв=0,778885

Выборочное корреляционное отношение

Выборочным корреляционным отношением Y к Х называют отношение межгруппового среднего квадратического отклонения к общему среднему квадрати-ческому отклонению признака Y:

= или ??ух= [26]

Здесь

,

где n - объем выборки; частота значения х признака Х; частота значения у признака Y; общая средняя признака Y; условная средняя признака У.

Аналогично определяется выборочное корреляционное отношение Х к Y:

= [27]

Составим две расчетных таблицы для вычисления выборочного корреляционного отношения:

Табл.№10

)

25

)

31

)

44,0909

)

47,807

)

56,7647

)

65

47,3

0,79007

9,98549

Табл.№11

15,3333

18,6667

26,8182

28,25

31,6429

26,3

0,41488

4,9

Выборочное корреляционное отношение для 0,07912, а для 0,08467

По формуле [23] 1,587255; 0,43308;

Коэффициенты 5,555185, 5,815316; тогда уравнение прямой линии среднеквадратичной регрессии Y на Х имеет вид - =1,5873х+5,5552, а уравнение прямой линии среднеквадратичной регрессии Х на Y имеет вид - =0,3822у+8,2215

Вывод: т.к. rв=0,778885, то связь между переменными Х и Y прямая (r>0) и сильная. При увеличении x на единицу, у в среднем увеличится на 1,5873. При увеличении y на 1, x в среднем увеличиться на 0,4331.

Доверительные интервалы для коэффициентов регрессии

Проверка значимости выборочного коэффициента корреляции:

Пусть имеется двумерная генеральная совокупность (Х, У) с нормальным распределением. Из нее извлечена выборка объема n и найден выборочный коэффициент rв?0. Требуется проверить гипотезу Но: rг=0 о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н1: rг?0.

Если Но отвергается, т.е. rв значимо отличается от нуля, то Х и У коррелированны, т.е. между ними существует линейная зависимость. Если Но подтверждается, т.е. rв не значимо отличается от нуля, тогда Х и У не коррелированны и между ними отсутствует линейная связь.

Для проверки Но используется случайная величина =rв , [28]

имеющая распределение Стьюдента с k=n-2 степенями свободы. Критическое значение =t(б, к), находится из таблицы приложения №6 по заданным б и к для двухсторонней критической области.

Если |Т|<, то нет оснований отвергнуть гипотезу Но.

Если ||>, то Но отвергают.

Если rв значим, то для генеральных коэффициентов регрессии и справедливы доверительные интервалы.

1) Регрессия Y по Х

[29]

Где и - исправленные выборочные средние квадратические отклонения, ??ух - выборочный коэффициент регрессии Y по Х.

2) Регрессия Х по Y

[30]

По данным задачи по формуле [28] =12,2943, (0,05;98)=1,99, то Но отвергают, так как ||>, тогда rв значимо отличается от нуля и Х и У коррелированны, т.е. между ними существует линейная зависимость.

Следовательно, справедливы доверительные интервалы для регрессии Y по Х:

1,3303361,844174, а для регрессии Х по Y: 0,3712140,494946

Заключение

В первой задаче по проведенному статистическому исследованию мы можем сделать вывод о контрольных размерах валиков во всей контролируемой партии валиков, т.е. в генеральной совокупности. Мы проверили гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона. По данным задачи вычислили 2,8141 и =9,5. Так как (2,8141<9,5), то критерий Пирсона выполняется. Следовательно, доказали что, контрольные обмеры валиков имеют нормальное распределение, вычислили их числовые характеристики.

Во второй задаче вычислили корреляционную зависимость распределения 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.). Вычислили коэффициент регрессии rв=0,778885 и проверили его значимость. Доказали, что rв значимо отличается от нуля, тогда Х и Y коррелированны, т.е. между ними существует линейная зависимость. Нашли уравнение прямой линии среднеквадратичной регрессии Y на Х, имеющий вид - =1,5873х+5,5552, и уравнение прямой линии среднеквадратичной регрессии Х на Y: =0,4331у+5,8153. Статистическая обработка данных показала, что связь между переменными Х и Y прямая и сильная.

Список использованной литературы

1)В.Е. Гмурман «Теория вероятностей и математическая статистика» 1998 г.

2)В.Е. Гмурман «Руководство к решению задач по теории вероятностей и математической статистике» 2001 г.

3)Н.Ш. Кремер «Теория вероятностей и математическая статистика» 2009 г.

Размещено на Allbest.ru


Подобные документы

  • Определение среднего арифметического исправленных результатов многократных наблюдений, оценка среднего квадратического отклонения. Расчет доверительных границ случайной составляющей погрешности результата измерения. Методика выполнения прямых измерений.

    лабораторная работа [806,9 K], добавлен 26.05.2014

  • Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.

    реферат [64,9 K], добавлен 15.02.2011

  • Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.

    курсовая работа [413,0 K], добавлен 11.08.2012

  • Построение корреляционного поля результатов измерения непрерывной работы станков в зависимости от количества обработанных деталей. Определение интервала для математического ожидания и среднего квадратического отклонения при доверительной вероятности.

    контрольная работа [200,4 K], добавлен 03.10.2014

  • Значения показателей и коэффициент вариации. Пределы возможных ошибок, исключение ошибочных результатов. Величина доверительных интервалов для заданных значений доверительных вероятностей. Средние квадратичные отклонения. Значения коэффициента доверия.

    лабораторная работа [38,4 K], добавлен 01.03.2011

  • Понятия доверительного интервала и доверительной вероятности и их применение в эконометрических задачах. Доверительный интервал для математического ожидания нормальной случайной величины при известной и при неизвестной дисперсии, генеральная совокупность.

    реферат [2,0 M], добавлен 12.12.2009

  • Элементарные понятия о случайных событиях, величинах и функциях. Числовые характеристики случайных величин. Виды асимметрии распределений. Статистическая оценка распределения случайных величин. Решение задач структурно-параметрической идентификации.

    курсовая работа [756,0 K], добавлен 06.03.2012

  • Расчёт скользящего среднего методом математического усреднения цифровых величин согласно условию задач. Составление таблицы и построение графика полученных результатов расчета. Сравнительный анализ решений трех заданий, построение их общего графика.

    лабораторная работа [26,9 K], добавлен 15.11.2010

  • Метод наименьших квадратов; регрессионный анализ для оценки неизвестных величин по результатам измерений. Приближённое представление заданной функции другими; обработка количественных результатов естественнонаучных опытов, технических данных, наблюдений.

    контрольная работа [382,4 K], добавлен 16.03.2011

  • Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.

    контрольная работа [172,2 K], добавлен 27.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.