Определение корреляции и регрессии в примерах
Методика проведения исследования тесноты линейных корреляционных зависимостей между случайными величинами по полученным результатам выборочных наблюдений. Характеристика важнейших свойств, методов расчета выборочного коэффициента линейной корреляции.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 03.03.2018 |
Размер файла | 86,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y. Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:
1. Вычисление выборочных коэффициентов корреляции.
2. Составление корреляционной таблицы.
3. Проверка статистической гипотезы значимости связи.
ОПРЕДЕЛЕНИЕ. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и ц(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.
Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии.
Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.
Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой:
где уX и уY выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:
Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r:
r=rB
Принимая во внимание формулы:
видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:
где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:
Основные свойства выборочного коэффициента линейной корреляции:
1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.
2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.
3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству 0<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. Чем ближе |r| к 1, тем теснее прямолинейная корреляция между величинами Y, X.
По своему характеру корреляционная связь может быть прямой и обратной, а по силе - сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.
Сила и характер связи между параметрами в таблице 1.
Таблица 1
Сила связи |
Характер связи |
||
Прямая (+) |
Обратная (-) |
||
Полная |
1 |
-1 |
|
Сильная |
От 0,7 до 1 |
От -0,7 до -1 |
|
Средняя |
От 0,3 до 0,7 |
От -0,3 до -0,7 |
|
Слабая |
От 0,3 до 0 |
От -0,3 до 0 |
|
Связь отсутствует |
0 |
0 |
Пример 4. Изучалась зависимость между двумя величинами Y и Х. Результаты наблюдений приведены в таблице 2 в виде двумерной выборки объема 11.
Таблица 2.
X |
68 |
37 |
50 |
53 |
75 |
66 |
52 |
65 |
74 |
65 |
54 |
|
Y |
114 |
149 |
146 |
141 |
114 |
112 |
124 |
105 |
141 |
120 |
124 |
выборочный корреляционный линейный
Требуется:
1) Вычислить выборочный коэффициент корреляции;
2) Оценить характер и силу корреляционной зависимости;
3) Написать уравнение линейной регрессии Y на Х.
Решение. По известным формулам:
Отсюда:
Таким образом, следует сделать вывод, что рассматриваемая корреляционная зависимость между величинами Х и Y является по характеру - обратной, по силе - средней.
3) Уравнение линейной регрессии Y на Х:
Пример 5. Изучалась зависимость между качеством Y (%) и количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы (таблица 3).
Таблица 3
Y\X |
18 |
22 |
26 |
30 |
ny |
|
70 |
5 |
5 |
||||
75 |
7 |
46 |
1 |
54 |
||
80 |
29 |
72 |
101 |
|||
85 |
29 |
8 |
37 |
|||
90 |
3 |
3 |
||||
nx |
12 |
75 |
102 |
11 |
200 |
Требуется вычислить выборочный коэффициент линейной корреляции зависимости Y от Х.
Решение. Для упрощения вычислений перейдем к новым переменным - условным вариантам (ui, vi), воспользовавшись формулами (*) (§3) при h1=4, h2=5, x0=26, y0=80. Для удобства перепишем данную таблицу в новых обозначениях (таблица 4).
Таблица 4
u\v |
-2 |
-1 |
0 |
1 |
nv |
|
-2 |
5 |
5 |
||||
-1 |
7 |
46 |
1 |
54 |
||
0 |
29 |
72 |
101 |
|||
1 |
29 |
8 |
37 |
|||
2 |
3 |
3 |
||||
nu |
12 |
75 |
102 |
11 |
200 |
Имеем при xi=ui и yj=vj:
Таким образом:
Отсюда,
Вывод: Корреляционная зависимость между величинами Х и Y - прямая и сильная.
Литература
1. В.Е. Гмурман. Теория вероятностей и математическая статистика. Высшая школа - 2001 г.
2. Е.С. Венцель. Теория вероятностей. Высшая школа - 2001 г.
3. А.Д. Мышкис. Лекции по высшей математике. Наука - 1973 г.
4. В.Г. Дегтяров, И.А. Лапин. Высшая математика. Ленинград - 1980 г.
5. Д.Т. Письменный Конспект лекций по высшей математике. Москва - 2010 г.
6. В.Е. Гмурман. Руководство к решению задач по теории вероятностей и математической статистике. Высшая школа - 2001 г.
Размещено на Allbest.ru
Подобные документы
Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.
курсовая работа [304,0 K], добавлен 02.03.2017Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.
курсовая работа [782,6 K], добавлен 19.05.2014Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.
презентация [92,4 K], добавлен 01.11.2013Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
курсовая работа [593,2 K], добавлен 28.06.2009Понятие и примеры шкалы отношений. Что такое стратифицированная (или расслоенная) выборка. Определение медианы и мощности критерия. Характеристика термина "процентиль". Влияние коэффициента корреляции на зависимость между исследуемыми величинами.
контрольная работа [51,0 K], добавлен 29.09.2010Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.
задача [143,4 K], добавлен 31.01.2011Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.
контрольная работа [178,0 K], добавлен 23.11.2013Вычисление по классической формуле вероятности. Определение вероятности, что взятая наугад деталь не соответствует стандарту. Расчет и построение графиков функции распределения и случайной величины. Вычисление коэффициента корреляции между величинами.
контрольная работа [708,2 K], добавлен 02.02.2011