Элементы математической статистики и корреляционного анализа
Обработка данных наблюдений и проверка разных гипотез. Построение гистограммы выборки и теоретической нормальной кривой. Элементы корреляционного анализа. Корреляционная таблица и корреляционное поле. Нахождение выборочного коэффициента корреляции.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 20.06.2015 |
Размер файла | 317,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ВВЕДЕНИЕ
Наблюдаемые нами события (явления) можно подразделить на следующие три вида: достоверные, невозможные и случайные. Невозможно учесть влияние на результат всех причин, поскольку число их очень велико и законы их действий неизвестны. Поэтому теория вероятности не ставит перед собой задачу предсказать, произойдет единичное событие или нет, - она просто не в силах это сделать.
По - иному обстоит дело, если рассматриваются случайные события, которые могут многократно наблюдаться при осуществлении одних и тех же условий S, т. е. если речь идет о массовых однородных случайных событий. Оказывается, что достаточно большое число однородных случайных событий независимо от их конкретной природы подчиняется определенным закономерностям, а именно вероятностным закономерностям. Установлением этих закономерностей и занимается теория вероятности. Итак, предметом теории вероятности является изучение вероятностных закономерностей однородных массовых случайных событий. Знание закономерностей, которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.
Методы теории вероятности широко применяются в различных отраслях естествознания и техники. В последние годы методы теории вероятности все шире и шире проникают в различные области науки и техники, способствуя их прогрессу.
Краткая историческая справка.
Первые работы, в которых зарождались основные понятия теории вероятностей, представляли собой попытки создания теории азартных игр (Кардано, Гюйгенс, Паскаль, Ферма и другие в XVI-XVII вв.).
Следующий этап развития теории вероятностей связан с именем Якоба Бернулли (1654-1705). Доказанная им теорема, получившая впоследствии название «Закона больших чисел», была первым теоретическим обоснованием накопленных ранее фактов.
Дальнейшими успехами теория вероятностей обязана Муавру, Лапласу, Гауссу, Пуассону и др.
Новый, наиболее плодотворный период связан с именами П. Л. Чебышева (1821-1894) и его учеников А.А. Маркова (1856-1922) и А. М. Ляпунова (1857-1918). В этот период теория вероятностей становится стройной математической наукой. Ее последующее развитие обязано в первую очередь русским и советским математикам (С. Н. Бернштейн, В. И. Романовский, А. Н. Колмогоров, А. Я. Хинчин, Б. В. Гнеденко, Н. В. Смирнов и др.). В настоящее время ведущая роль в создании новых ветвей теории вероятностей также принадлежит советским математикам.
ГЛАВА I
Обработка данных наблюдений и проверка гипотез
Задание: В результате независимых измерений получены n значений ошибки точности настройки РПУ на заданную частоту: х1, х2,…хn. Произвести полный статистический анализ данных выборки и сделать соответствующие выводы.
Значения выборки
0,637 |
1,121 |
0,409 |
1,082 |
-0,263 |
|
0,267 |
1,627 |
0,061 |
-1,114 |
-0,529 |
|
-0,142 |
0,658 |
-0,964 |
-0,586 |
0,799 |
|
-0,394 |
-0,036 |
0,507 |
0,882 |
-0,856 |
|
-0,118 |
0,678 |
-1,414 |
0,679 |
-0,276 |
|
0,247 |
1,469 |
-0,847 |
-0,032 |
0,379 |
|
-0,973 |
0,522 |
-1,191 |
0,091 |
1,468 |
|
0,486 |
1,642 |
0,185 |
0,838 |
-1,805 |
|
0,820 |
-0,872 |
-0,090 |
-0,304 |
-0,266 |
|
-0,426 |
-0,358 |
-0,866 |
-2,716 |
-0,592 |
|
0,243 |
1,594 |
-1,116 |
0,823 |
-1,473 |
|
-0,822 |
0,109 |
-0,156 |
-1,248 |
-1,266 |
|
0,238 |
0,676 |
-1,387 |
0,346 |
0,702 |
|
-0,220 |
-1,084 |
-0,406 |
-0,537 |
1,071 |
|
-1,566 |
0,318 |
-0,454 |
-0,402 |
-0.383 |
|
0,932 |
0,367 |
0,575 |
1,214 |
0.167 |
|
-0,833 |
-0,992 |
-0,266 |
-1,214 |
-0,348 |
|
-0,039 |
0,529 |
1,246 |
1,353 |
0,192 |
|
0,275 |
0,278 |
0,557 |
1,511 |
-1,447 |
|
-0,163 |
1,392 |
0,004 |
-0,184 |
0,495 |
min=
max=
Статическое распределение выборки
1. По данным выборки найти:
а) размах варьирования: R = xmax - xmin,
R= 1,642-(-2.716)= 4,4
б) количество интервалов (разрядов):
к=7
в) длину разряда:
h= 0,6
Интервал (-2,7 ; 1,6) расширим до интервала (-3 ; 1,9). Сдвиг в каждую стороны при этом не превысит:
Для нового интервала изменения признака (-3;1,9) при k=7 длина разряда получается равной
2. Произведем группировку опытных данных и построим интервальный вариационный ряд. Расчет оформим в виде таблицы 1.
Таблица №1
Границы интервала |
[-3;-2,3) |
[-2,3;-1,6) |
[-1,6;-0,9) |
[-0,9;-0,2) |
[-0,2;0,5) |
[0,5;1,2) |
[1,2;1,9) |
|
Частот |
1 |
1 |
14 |
24 |
29 |
20 |
11 |
|
Относительные частоты |
||||||||
Накопленные частоты ? |
1 |
2 |
16 |
40 |
69 |
89 |
100 |
-
n -
Расчет сводных характеристик выборки
1. Вычислим моду и медиану выборочного распределения.
2. По интервальному вариационному ряду, полученному в §1 составить дискретный вариационный ряд в виде таблицы 2, в котором в качестве вариант берём середины разрядов
Таблица № 2
Вычислим выборочную среднюю (математическое ожидание) и выборочную дисперсию :
3. Для расчета сводных характеристик выборки по методу произведений составим таблицу 3.
Таблица № 3
h=
? |
? |
? |
? |
? |
? |
Контроль расчетов производим по формуле:
4. Вычислим начальные условные эмпирические моменты:
5. Используя начальные моменты , вычислим центральные моменты:
6. Найдем выборочную среднюю (выборочное математическое ожидание):
где, С = 0,09
7. Вычислим выборочную дисперсию и исправленную выборочную дисперсию:
выборка корреляционный анализ коэффициент
8. Найдем выборочное среднее квадратическое отклонение (с.к.о.) и исправленное выборочное с.к.о.:
9. Определим, чему равны выборочная асимметрия и выборочный эксцесс:
Расчет интервальных оценок генеральных параметров
Построим доверительные интервалы для оценки генерального математического ожидания mx и генерального с.к.о. ух. Для этого по заданной доверительной вероятности (надежности) г из таблицы функции Лапласа найдем значение аргумента tг этой функции, для которого Ф(tг) = г.
Используя найденное tг, рассчитаем границы доверительного интервала для
Интервальную оценку генерального с. к. о. определим по одной из формул:
В данном варианте q<1 то <уx<
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
Для того, чтобы при заданном уровне значимости б = 1 - г проверить гипотезу о нормальном распределении обследуемого признака X генеральной совокупности, заполним таблицу 5.
Таблица №5
? |
? |
Контроль вычислений производим по формуле:
Обозначим сумму элементов восьмого столбца , и для заданного уровня значимости б числа свободы р = k - 3 находим критическую точку (б; р)
ВЫВОД: так как, то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).
Построение гистограммы выборки и теоретической нормальной кривой
1. Для построения гистограммы в выбранной системе координат на оси абсцисс откладываем разряды, а на каждом из разрядов как на основании строим прямоугольник с высотой , составляя таблицу 6.
Таблица №6
Разряды |
|||||||||||
На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.
Таблица №7
наносим точки с координатами и соединяем их плавной линией, получая искомую кривую.
ВЫВОД: В данной части курсовой работы проверена гипотеза Пирсона, ее нет оснований отвергнуть, другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).
Разряды |
-1.6 |
-1.1 |
-0.6 |
-0.1 |
0.4 |
0.9 |
1.4 |
1.9 |
2.4 |
2.9 |
|
0,12 |
0,18 |
0,26 |
0,38 |
0,32 |
0,40 |
0,26 |
0,04 |
0,02 |
0,06 |
В последней строке результаты вычислений округлим до 0,01.
На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi и выравнивающие частоты ni из таблицы 5. Эти данные заносим в таблицу 7.
Таблица №7
xi |
-1.6 |
-1.1 |
-0.6 |
-0.1 |
0.4 |
0.9 |
1.4 |
1.9 |
2.4 |
2.9 |
|
0,12 |
0,23 |
0,35 |
0,41 |
0,38 |
0,27 |
0,15 |
0,07 |
0,024 |
0,006 |
наносим точки с координатами и соединяем их плавной линией, получая искомую кривую.
ГЛАВА II
Элементы корреляционного анализа
Вариант №18
Дано: Результаты исследований зависимости между случайными величинами X и Y представлены в виде таблицы 8:
Таблица №8
Y |
X |
|||||||
30 |
35 |
40 |
45 |
50 |
55 |
ny |
||
45 |
4 |
2 |
6 |
|||||
55 |
5 |
3 |
8 |
|||||
65 |
5 |
45 |
5 |
55 |
||||
75 |
7 |
8 |
2 |
17 |
||||
85 |
4 |
3 |
7 |
14 |
||||
nx |
4 |
7 |
15 |
57 |
10 |
7 |
Произвести корреляционный анализ зависимости Y от X, для чего:
Построить корреляционное поле;
1. Найти выборочный коэффициент корреляции ;
2. Получить доверительный интервал rxy для с надежностью г;
3. Найти выборочное уравнение прямой регрессии Y на X;
4. В выбранной системе координат построить точки (xi, yi) и выборочное уравнение регрессии Y на X.
Корреляционная таблица и корреляционное поле
Представим данные корреляционной таблицы в виде корреляционного поля. Для этого в выбранной системе координат изобразим точки (xi, yj) и рядом с каждой точкой укажем, если это позволит масштаб, соответствующую частоту nxy. По расположению точек можно сделать предположение о наличии (или отсутствии) линейной корреляционной зависимости между обследуемыми признаками X и Y.
Для данных таблицы 8 корреляционное поле имеет вид:
Расположение точек говорит о наличии положительной корреляции между признаками X и Y.
Нахождение выборочного коэффициента корреляции
Вычисления можно значительно упростить, если перейти от истинных вариант xi, yj к условным ui, vj соответственно, а именно:
C1 = 45 h1 = 5 u1 = -3 u2 = -2 u3 = -1 u4 = 0 u5 = 1 u6 = 2 |
C2 = 65 h2 = 10 v1 = -1 v2 = 0 v3 = 1 v4 = 2 |
Формула для вычисления эмпирического коэффициента корреляции в условных вариантах имеет вид:
Для нахождения составим расчетную таблицу 9.
Таблица №9
xi |
ui |
ni |
niui |
niui2 |
(ui + 1) |
(ui + 1)2 |
ni(ui + 1)2 |
|
30 |
-3 |
4 |
-12 |
36 |
-2 |
4 |
16 |
|
35 |
-2 |
7 |
-14 |
28 |
-1 |
1 |
7 |
|
40 |
-1 |
15 |
-15 |
15 |
0 |
0 |
0 |
|
45 |
0 |
57 |
0 |
0 |
1 |
1 |
57 |
|
50 |
1 |
10 |
10 |
10 |
2 |
4 |
40 |
|
55 |
2 |
7 |
14 |
28 |
3 |
9 |
63 |
|
100 |
-17 |
117 |
183 |
Контроль
,
то есть вычисления верны
Так как , то
Аналогичные вычисления проводим для v в таблице 10.
Таблица №10
yj |
vj |
nj |
njvj |
njvj 2 |
(vj + 1) |
(vj + 1)2 |
nj(vj + 1)2 |
|
45 |
-2 |
6 |
-12 |
24 |
-1 |
1 |
6 |
|
55 |
-1 |
8 |
-8 |
8 |
0 |
0 |
0 |
|
65 |
0 |
55 |
0 |
0 |
1 |
1 |
55 |
|
75 |
1 |
17 |
17 |
17 |
2 |
4 |
68 |
|
85 |
2 |
4 |
28 |
56 |
3 |
9 |
126 |
|
100 |
25 |
105 |
255 |
Таблица №11
Ui vj |
-3 |
-2 |
-1 |
0 |
1 |
2 |
|||||||||||||||
-3 |
-12 |
-4 |
-16 |
48 |
|||||||||||||||||
4 |
2 |
||||||||||||||||||||
-12 |
-6 |
||||||||||||||||||||
-2 |
-10 |
-3 |
-13 |
26 |
|||||||||||||||||
5 |
3 |
||||||||||||||||||||
-10 |
-6 |
||||||||||||||||||||
-1 |
- |
-5 |
0 |
5 |
0 |
0 |
|||||||||||||||
5 |
45 |
5 |
|||||||||||||||||||
-5 |
-45 |
-5 |
|||||||||||||||||||
0 |
-7 |
0 |
2 |
0 |
-5 |
0 |
|||||||||||||||
7 |
8 |
2 |
|||||||||||||||||||
0 |
0 |
0 |
|||||||||||||||||||
1 |
0 |
3 |
17 |
17 |
|||||||||||||||||
4 |
3 |
||||||||||||||||||||
4 |
3 |
||||||||||||||||||||
-12 |
-16 |
-11 |
-41 |
-2 |
7 |
||||||||||||||||
36 |
32 |
11 |
0 |
-2 |
14 |
контроль |
Контроль вычислений производим по формуле:
вычисления верны.
Для вычисления требуется еще найти. Для ее нахождения составим корреляционную таблицу 11 в условных вариантах.
Подставив найденные значения в формулу (*), получим
Нахождение доверительного интервала для генерального коэффициента корреляции
Задана надежность г = 0,99. Доверительный интервал для генерального коэффициента корреляции rxy имеет вид:
Следовательно с вероятностью 0,99 доверительный интервал имеет вид:
Нахождение выборочного уравнения прямой регрессии Y на X и построение ее графика
Общий вид уравнения прямой линии регрессии Y на X имеет вид:
Полученное уравнение регрессии показывает, как в среднем изменяется значение признака Y в зависимости от изменения признака Х.
В выбранной системе координат строим прямую и точки (xi, yi) корреляционного поля.
Таблица для построения графика
30 |
35 |
40 |
45 |
50 |
55 |
|
43,877 |
52,225 |
60,572 |
68,919 |
77,266 |
85,613 |
ВЫВОД: Построив корреляционное поле мы убеждаемся, что расположение точек говорит о наличии положительной корреляции между Х и Y. По расположению точек можно судить о линейной зависимости между Х и Y.
Заключение
В проделанной курсовой работе была предоставлена возможность проверить гипотезу Пирсона, опираясь на полученные результаты, я могу утверждать, что эмпирические и теоретические частоты различаются незначительно. Так же был проведен корреляционный анализ, была выявлена сильная линейная зависимость между величинами X и Y
Список использованной литературы
1. Гмурман В.Е. «Теория вероятностей математической статистики» - М.: Высшая школа, 1999 г.
2. «Пособие и методические указания к выполнению курсовой работы» - Калининград: 1998 г.
Размещено на Allbest.ru
Подобные документы
Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.
курсовая работа [1,3 M], добавлен 10.06.2013Нахождение выборочной средней и дисперсии. Построение гистограммы продолжительности телефонных разговоров и нормальной кривой Гаусса. Нахождение групповых средних и коэффициента корреляции. Выборочные характеристики и параметры уравнений регрессии.
контрольная работа [87,8 K], добавлен 30.11.2013Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.
практическая работа [132,1 K], добавлен 24.05.2013Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.
курсовая работа [304,0 K], добавлен 02.03.2017Функции эритроцитов в организме человека, учет изменения их количества в связи с возрастом в рамках теории вероятностей и математической статистики. Обработка исходных данных, построение диаграммы рассеивания, гистограммы признаков; проверка гипотез.
курсовая работа [1,6 M], добавлен 18.02.2012Значение математической статистики для анализа закономерностей массовых явлений. Основные теоретические выкладки корреляционного анализа. Применение его инструментария в контексте металлургической промышленности в среде программного средства Statistica 6.
реферат [261,4 K], добавлен 03.08.2014Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.
курс лекций [759,3 K], добавлен 13.06.2015