Корреляционно-регрессионный анализ для определения зависимости объема производства от числа работников
Этапы проведения корреляционного и регрессионного анализа с целью выявления зависимости объема работ от числа рабочих. Анализ и понятие полного факторного эксперимента, его преимущества. Особенности проведения эксперимента, получение уравнения регрессии.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 07.05.2012 |
Размер файла | 302,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Проведения корреляционного и регрессионного анализа
По отдельным бригадам организации имеются следующие данные за месяц (таблица 1.1). Выявить зависимость объема работ(V) от числа рабочих(N). Выполнить корреляционный и регрессионный анализ. () Количество интервалов группировки 4.
Таблица 1.1 Данные задачи
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
|
N |
33 |
36 |
40 |
44 |
39 |
36 |
38 |
37 |
33 |
31 |
44 |
45 |
46 |
45 |
|
V |
155 |
152 |
163 |
166 |
174 |
177 |
178 |
159 |
169 |
179 |
150 |
160 |
170 |
170 |
1.1 Корреляционный анализ
1 Логический анализ.
Y- результативный признак (сопротивление разрыва);
Х - факторный признак (время вулканизации).
Связь парная, так в модели 2 фактора.
2 Сбор первичной информации.
a) Проверка на однородность
Таблица 1.2 - Вспомогательная таблица для расчета показателей корреляции
Расчетные данные |
||||||
-6,07 |
-10,86 |
36,86 |
117,88 |
65,92 |
||
-3,07 |
-13,86 |
9,43 |
192,02 |
42,56 |
||
0,93 |
-2,86 |
0,86 |
8,16 |
-2,65 |
||
4,93 |
0,14 |
24,29 |
0,02 |
0,70 |
||
-0,07 |
8,14 |
0,01 |
66,31 |
-0,58 |
||
-3,07 |
11,14 |
9,43 |
124,16 |
-34,22 |
||
-1,07 |
12,14 |
1,15 |
147,45 |
-13,01 |
||
-2,07 |
-6,86 |
4,29 |
47,02 |
14,20 |
||
-6,07 |
3,14 |
36,86 |
9,88 |
-19,08 |
||
-8,07 |
13,14 |
65,15 |
172,73 |
-106,08 |
||
4,93 |
-15,86 |
24,29 |
251,45 |
-78,15 |
||
5,93 |
-5,86 |
35,15 |
34,31 |
-34,72 |
||
6,93 |
4,14 |
48,01 |
17,16 |
28,70 |
||
5,93 |
4,14 |
35,15 |
17,16 |
24,56 |
||
330,93 |
1205,71 |
-111,86 |
Из полученных расчетов коэффициента вариации по факторному признаку делаем вывод: совокупность однородная, так как .
б) Проверка факторов на нормальность
Формирование таблицы «трех сигм».
Таблица 1.3 - Таблица «трех сигм»
Интервалы значений признаков факторов |
Число единиц входящих в интервал |
Удельный вес единиц, входящих в интервал в общем их числе(%) |
Удельный вес единиц, входящих в интервал при нормальном распределении |
|||
34,2 |
- |
43,9 |
6 |
42,86 |
68,3 |
|
29,3 |
- |
48,8 |
14 |
100 |
95,4 |
|
24,5 |
- |
53,6 |
14 |
100 |
99,7 |
Вывод: первичная информация не подчиняется закону нормального распределения, так как значения удельного веса единиц, входящих в интервал в общем их числе (%) и удельного веса единиц, входящих в интервал при нормальном распределении не равны.
в) Исключение аномальных единиц
Значения по факторному признаку удовлетворяют условиям неравенства , поэтому исключений из массива первичной информации нет.
3 Метод аналитической группировки и определения средних величин
Вычисление длины интервалов
Таблица 1.4 - Группировочная таблица
Интервалы |
||||
31-35 |
33 |
3 |
167.7 |
|
35-39 |
37 |
5 |
168 |
|
39-43 |
41 |
1 |
163 |
|
43-47 |
47 |
5 |
163.2 |
Примечание --середина интервала;
-число факторов, попадающих в интервал;
-среднее значение по результативному признаку (по интервалам).
4 Исследование тесноты связи.
Определение и анализ линейного коэффициента корреляции.
Вывод: так как коэффициент корреляции меньше 1, то можно сказать о том, что между исследуемыми факторами существует обратная связь.
Вывод: коэффициент корреляции не существенен, так как
1.2 Регрессионный анализ
1 Построение и определение модели связи
Связь между факторами линейная. Это видно из графика эмпирической линии связи, следовательно уравнение будет иметь следующий вид:
С помощью метода наименьших квадратов определяются коэффициенты уравнения линейной регрессии линейной модели.
Значения коэффициентов:
Подставив коэффициенты в уравнение, получим уравнение регрессии для данной модели:
2 Оценка уравнения регрессии
Для того чтобы оценить отображает ли уравнение регрессии изучаемую взаимосвязь между факторами необходимо рассчитать среднюю ошибку уравнения линейной регрессии:
Вывод: средняя ошибка уравнения линейной регрессии меньше 10-15%, из этого следует, что уравнение регрессии достаточно хорошо отображает изучаемую взаимосвязь между исследуемыми факторами X и Y, и может быть использовано в практической работе.
2. Полный факторный эксперимент
Полный факторный эксперимент (ПФЭ) - совокупность нескольких измерений, удовлетворяющих следующим условиям:
- Количество измерений составляет 2n, где n - количество факторов;
- Каждый фактор принимает только два значения - верхнее и нижнее;
- В процессе измерения верхние и нижние значения факторов комбинируются во всех возможных сочетаниях.
Преимуществами полного факторного эксперимента являются
- простота решения системы уравнений оценивания параметров;
- статистическая избыточность количества измерений, которая уменьшает влияние погрешностей отдельных измерений на оценку параметров.
Полным факторным экспериментом называется эксперимент, реализующий все возможности неповторяющиеся комбинации уровней n независимых управляемых факторов, каждый из которых варьирует на двух уровнях.
Число неповторяющихся комбинаций определяется по формуле (2.1)
N=2n = 16
Преобразование размерных управляемых независимых факторов xi в безразмерные, нормированные, выполняется по формуле (2.2)
где zi - безразмерный, нормированный фактор;
xi - значение i-го фактора;
xi0 - базовый интервал i-го фактора;
xi0 - интервал варьирования i-го фактора.
Верхние и нижние уровни варьирования в относительных единицах соответственно определяются: zIВ = +1 и zIН = -1.
2.1 Планирование эксперимента
Правила планирования эксперимента (составления матрицы планирования МП):
1 Вводят фиктивную переменную Zg0=+1 (g=1,…,N).
2 В строке g=1 все управляемые факторы Zi выбирают на нижнем уровне, то есть Zi=-1.
Последующие g-е варианты варьирования выбираются так: при построчном переборе всех вариантов управляемых факторов (Zi) частота смены знака факторов для каждого последующего фактора Zi+1 вдвое меньше, чем для предыдущего Zi. Столбцы МП для комбинаций факторов получаются перемножением соответствующих значений управляемых факторов. Все взаимодействия факторов могут принимать только значения +1 или -1.
2.2 Проведение эксперимента на объекте исследования
Изменение отклика Y носит случайный характер, поэтому в каждой точке необходимо проводить m параллельных опытов и результаты наблюдений усреднять:
2.3 Проверка воспроизводимости эксперимента
Проверка гипотезы об однородности выборочных дисперсий . Оценки дисперсий вычисляются по формуле (2.4).
Проверка гипотезы об однородности оценок дисперсий следует вользоваться G-критерием Кохрэна. Эмпирическое значение G-критерия Кохрэна вычисляется по формуле (2.5).
Критическое значение G-критерия Кохрэна определяется по таблице: Gкр=Gтабл{1вос, 2вос,gвос}. Где gвос - уровень значимости, 1вос=m-1, 2вос =N - число степеней свободы.
Если G Gкр, то гипотеза об однородности выборочных дисперсий отвечает результатам наблюдений.
Наилучшая оценка генеральной дисперсии 2{y} воспроизводимости эксперимента вычисляется по формуле:
Если G>Gкр, то эксперимент невоспроизводим относительно управляемых факторов.
2.4 Получение математической модели объекта
По результатам эксперимента может быть получено уравнение регрессии в форме полинома
где b0, bi, bil, bii, … - выборочные коэффициенты регрессии, являющиеся оценками для теоретических коэффициентов b00, bii, bilil, biiii, …;
- оценка математического ожидания случайной величины M{y}.
Проверка гипотезы о значимости оценок b коэффициентов регрессии с помощью t-критерия Стьюдента (Н0: =0).
Эмпирическое значение t-критерия Стьюдента вычисляется по формуле (2.8).
где - дисперсия оценки b коэффициента;
N - число точек факторного пространства;
m - число параллельных опытов в этих точках.
Критическое значение t-критерия Стьюдента определяется по таблице: tкр = = tтабл{зн;gзн }. Где gзн - уровень значимости, зн=N(m-1) - число степеней свободы.
Если t > tкр, то соответствующую оценку b коэффициента признают значимой.
Если t < tкр, то оценку b считают статистически незначимой, то есть =0.
2.5 Проверка адекватности математического описания
Рассеяние результатов наблюдений вблизи уравнения регрессии, оценивающего истинную функцию отклика, характеризуется с помощью дисперсии адекватности.
где d - число членов аппроксимирующего полинома;
- величина отклика, предсказанная по полученному уравнению регрессии;
- результаты наблюдений.
Проверка гипотезы об адекватности математического описание. Эмпирическое значение F-критерия Фишера:
Критическое значение F-критерия Фишера определяется по таблице: Fкр=Fтабл{1ад, 2ад,gад}. Где gад - уровень значимости, 1ад=N-d, 2ад =N(m-1) - число степеней свободы.
Если F < Fкр, то гипотезу об адекватности не отвергают.
Если F > Fкр, то математическое описание признается не адекватным.
2.6 Задача
Найти модель методом полного факторного эксперимента (ПФЭ), выполнив следующие этапы:
1 планирование эксперимента;
2 проведение эксперимента на объекте исследования;
3 проверка воспроизводимости (адекватности выборочных дисперсий) эксперимента;
4 получение математической модели объекта с проверкой статистической значимости выборочных коэффициентов регрессии;
5 проверка адекватности математического описания.
Таблица 2.1 - Взаимодействие факторов (ПФЭ)
№ варианта |
Взаимодействия факторов |
|||
12 |
Z1Z2Z3 |
Z3Z4 |
Z1Z3Z4 |
Таблица 2.2 -Результаты ПФЭ
Список использованной литературы
корреляционный регрессионный уравнение
1.Ефимова М.Р., Танченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие. - М.: Финансы и статистика, 2001.
2.Кремер Н.Ш. Теория вероятностей и математическая статистика/Учебник для вузов.-М.: ЮНИТИ-ДАНА, 2000.
3.Общая теория статистики: Учебник/Под.ред.А.А.Спирина, О.Э.Башиной -М.:Финансы и статистика, 1994.
Размещено на Allbest.ru
Подобные документы
Планирование эксперимента для описания зависимости показателя стойкости концевых фрез от геометрических параметров. Уровни факторов и интервалы варьирования. Применение неполной кубической функции. Использование полного факторного эксперимента.
практическая работа [38,6 K], добавлен 23.08.2015Методы планирования многофакторных экспериментов и преимущества их использования. Математическое планирование эксперимента и его основные направления. Пример применения метода дробного факторного эксперимента. Расчет коэффициентов уравнения регрессии.
курсовая работа [26,7 K], добавлен 13.05.2014Оценка надежности аналитической методики. Дисперсионный анализ результатов опытов и аппроксимация результатов эксперимента. Расчет линейного уравнения связи. Определение полного квадратного уравнения. Вычисление типа и объема химического реактора.
курсовая работа [229,2 K], добавлен 06.01.2015Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.
курсовая работа [694,5 K], добавлен 27.12.2021На основе корреляционно-регрессионного анализа выявление зависимости успеваемости учащихся от таких факторов как: табакокурение; проблемы в семье; времяпровождение в сети Интернет; время, уходящее на телефонные разговоры; посещение дополнительных занятий.
научная работа [212,8 K], добавлен 23.05.2012Планирование эксперимента и факторы параметра оптимизации. Математическая модель и матрица планирования, коэффициенты уравнения регрессии и абсолютная величина доверительного интервала. Имитационный эксперимент и дифференциальные уравнения колебаний.
курс лекций [240,8 K], добавлен 22.09.2011Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Число как основное понятие математики. Натуральные числа. Простые числа Мерсенна, совершенные числа. Рациональные числа. Дробные числа. Дроби в Древнем Египте, Древнем Риме. Отрицательные числа. Комплексные, векторные, матричные, трансфинитные числа.
реферат [104,5 K], добавлен 12.03.2004Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.
курсовая работа [214,6 K], добавлен 04.09.2007