Анализ информации о свойствах исследуемого изделия. Построение регрессионной модели по опытным данным
Освоение методов математической обработки результатов исследования свойств различных материалов и изделий из них. Построение уравнения регрессии по данным однофакторного эксперимента. Способы проверки качества разработанной статистической модели.
Рубрика | Экономико-математическое моделирование |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 15.03.2016 |
Размер файла | 237,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
143
Практическое занятие 1. Анализ информации о свойствах исследуемого изделия. Построение регрессионной модели по опытным данным
Введение
Цель работы:
Освоение методов математической обработки результатов исследования свойств различных материалов и изделий из них; построение уравнения регрессии по данным однофакторного эксперимента.
Содержание работы
1. Получение опытных данных и уяснение задачи.
2. Первичная обработка результатов эксперимента.
3. Выбор вида функциональной зависимости выходного параметра от исходных данных.
4. Определение коэффициентов корреляции и регрессии.
5. Составление уравнения регрессии.
6. Построение линии регрессии.
7. Выводы по работе.
Теоретические сведения
Элементы корреляционного анализа
Зависимость между случайными величинами (СВ) X и Y в теории вероятностей и математической статистике описывается, в первую очередь, такими характеристиками, как корреляционный момент Kxy и коэффициент корреляции rxy.
Статистическую взаимосвязь составляющих системы СВ характеризует корреляционный момент (момент связи)
Таким образом, корреляционный момент (момент связи) системы двух случайных величин является характеристикой рассеивания СВ, однако помимо этого он выражает еще и взаимное влияние этих величин.
Для компактной записи результаты расчётов по приведенной выше формуле представляют в виде корреляционной матрицы
,
где Dx и Dy - дисперсии случайных величин X и Y.
Но размерность корреляционного момента равна произведению размерностей случайных величин-составляющих системы, это не очень удобно для практических приложений…
Поэтому ввели понятие коэффициента корреляции системы двух случайных величин rxy. Коэффициент корреляции связан с корреляционным моментом следующей формулой: , где уx и уy - средние квадратические отклонения случайных величин X и Y. Как известно,
.
Коэффициент корреляции вычисляется на основании результатов наблюдений по формуле:
rxy = , (1.1)
где rxy - коэффициент корреляции случайных величин Х и У;
, - средние арифметические значения этих случайных величин;
n - количество произведенных опытов (объём выборки).
Средние арифметические значения СВ Х и СВ У определяются по известным формулам:
где xi и yi - наблюдаемые значения величин Х и Y в i-м опыте.
При использовании вычислительных средств коэффициент корреляции можно рассчитывать по следующей формуле, дающей аналогичный результат, но позволяющей избежать вычисления отклонений случайных величин от своих средних:
rxy =
Основы регрессионного анализа
Как известно, корреляция случайных величин говорит о наличии взаимосвязи между случайными величинами; более того, не просто какого-то любого вида взаимосвязи, а именно - о наличии линейной связи между случайными величинами. Тогда вполне обоснованной будет попытка выразить предполагаемую взаимосвязь аналитически средствами регрессионного анализа.
Термин регрессия означает отражение влияния количественных изменений одной СВ на количественные изменения другой случайной величины.
Регрессионный анализ - совокупность методов математической статистики, применяемых для исследования характера функциональной зависимости между случайными величинами.
Решение задач регрессионного анализа осуществляется в следующей последовательности:
1. Выбор вида функциональной зависимости (построение математической модели);
2. Оценка параметров этой функции;
3. Оценка статистической адекватности выбранной математической модели;
4. Анализ остатков.
Выбор вида функциональной зависимости
Уравнение регрессии имеет вид: y = f(x; a0, a1, …,am),
где y - прогнозируемое значение функции,
aj - параметры (коэффициенты) уравнения регрессии, j = 1чm.
То есть, в общем случае уравнение регрессии представляет собой полином (многочлен) m - й степени.
Графическое представление вида функциональной зависимости называется линией регрессии.
На практике наиболее часто используется линейная зависимость:
y = a0 + a1*х
из-за простоты оценки и интерпретации коэффициентов линейного уравнения регрессии, а также из-за того, что почти любую достаточно сложную зависимость на малом интервале можно аппроксимировать линейной…
Метод наименьших квадратов оценки параметров функциональной зависимости (параметров уравнения регрессии)
Метод наименьших квадратов заключается в минимизации суммы квадратов отклонений теоретических, предсказываемых по модели, значений функции от эмпирических, полученных в эксперименте:
,
где a0, a1 - параметры линейной функции;
yi - опытное значение функции, полученное в i-м эксперименте (замере).
Решение этой задачи даёт следующие формулы:
Опуская математические преобразования, приведем более простые формулы вычисления коэффициента a1 (или коэффициента регрессии Ry/x) и свободного члена а0:
(1.2)
и
где a0 - свободный член уравнения; он численно равен прогнозируемому значению функции в точке х = 0; a0 имеет размерность случайной величины У;
a1 - коэффициент регрессии; он численно равен изменению случайной величины У при изменении случайной величины Х на единицу; a1 имеет размерность случайной величины У, деленную на размерность случайной величины Х;
- средние значения СВ Х и СВ У.
Следует отметить, что метод наименьших квадратов даёт наиболее точные результаты лишь при предположении нормального распределения ошибок, то есть тех случайных отклонений замеренных значений функции от предполагаемых (теоретических), которые являются следствием многих приблизительно одинаково слабо влияющих факторов, не учитываемых
в разрабатываемой регрессионной модели.
Известна зависимость между коэффициентами корреляции и регрессии:
, (1.3)
где х и y - средние квадратические отклонения величин Х и Y, определяемые по формулам:
Практическая часть работы
Постановка задачи на построение уравнения регрессии по данным однофакторного эксперимента
Каждый магистрант получает индивидуальное задание, содержащее результаты проведения однофакторного эксперимента исследования, например: прочности шва для ниток различной линейной плотности.
Осуществляется исследование; результаты экспериментальных замеров приведены в таблице:
Таблица 1.1
Результаты экспериментальных замеров
xi |
yi |
|
23 |
14,8 |
|
38 |
27,5 |
|
43 |
28,4 |
|
48 |
30,4 |
|
… |
… |
где xi - линейная плотность нитей, текс;
yi - прочность шва, даН.
Построить регрессионную модель свойств исследуемых текстильных материалов и изделий из них:
· выявить и описать аналитически зависимость прочности шва от линейной плотности ниток;
· представить полученную зависимость в графической форме, то есть изобразить линию регрессии;
· оценить качество и точность разработанной регрессионной модели, для чего построить график остатков.
Первичная обработка результатов эксперимента
Первичная обработка результатов эксперимента, как правило, включает проверку опытных данных на отсутствие грубых ошибок в записях результатов замеров (называемых промахами). Скорее всего, в данных, содержащихся в задании, промахи уже исключены. Иногда первичная обработка опытных данных может заключаться в сортировке данных по возрастанию или убыванию и, соответственно, в перенумерации составляющих обрабатываемых числовых рядов.
Определение коэффициентов корреляции и регрессии, составление уравнения регрессии
Для удобства и обеспечения верной последовательности вычислений данные промежуточных расчётов целесообразно представить в табличной форме, например, таблица 1.2. Состав и компоновку расчётной таблицы магистранты, конечно же, могут менять по своему усмотрению.
Коэффициент корреляции вычисляется на основании исходных данных по формуле (1.1): rxy = 0,975319.
Коэффициенты уравнения регрессии вычисляются по формулам (1.2) с использованием сведений из таблицы 1.2. Для этого примера коэффициенты принимают значения a1 = 0,640 и a0 = 0,955.
Проверим соотношение между коэффициентами корреляции и регрессии по формуле (1.3):
a1 = 0,640 = 0,975319 * 7,088 / 10,801.
Значит, уравнение регрессии будет иметь вид:
y = a1 x + a0 = 0,640 x + 0,955.
Таблица 1.2
Данные расчётов
i |
xi |
yi |
yi расч |
yрасч - yср |
(yрасч - yср)2 |
yi - y расч |
(yi - yрасч)2 |
x2i |
xi - xср |
(xi - xср)2 |
xiyi |
yi - yср |
(yi - yср)2 |
|
1 |
23 |
14,8 |
15,675 |
-9,600 |
92,16 |
-0,875 |
0,765625 |
529 |
-15 |
225 |
341,88 |
-10,475 |
109,72563 |
|
2 |
38 |
27,5 |
25,275 |
0,000 |
0 |
2,225 |
4,950625 |
1444 |
0 |
0 |
1045 |
2,225 |
4,950625 |
|
3 |
43 |
28,4 |
28,475 |
3,200 |
10,24 |
-0,075 |
0,005625 |
1849 |
5 |
25 |
1221,2 |
3,125 |
9,765625 |
|
4 |
48 |
30,4 |
31,675 |
6,400 |
40,96 |
-1,275 |
1,625625 |
2304 |
10 |
100 |
1459,2 |
5,125 |
26,265625 |
|
Сумма |
152 |
101,1 |
0 |
143,36 |
3,55E-15 |
7,3475 |
6126 |
0 |
350 |
4067,28 |
0 |
150,7075 |
||
x среднее |
= 38,000 |
х |
=10.801 |
|||||||||||
y среднее |
= 25,275 |
y |
=7.088 |
Рис. 1.1 Результаты замеров y = f(x)
Рис. 1.2 График теоретической зависимости
Построение линии регрессии
Для полноты информации о рассматриваемом процессе следует начать с построения на графике опытных точек (xi, yi) по данным, полученным в замерах (табл. 1.1).
Далее на этом же графике по расчетным точкам (xi, yi) следует построить линию регрессии. Линия регрессии, как уже было указано ранее, является графическим отображением уравнения регрессии. Для построения её нужно правильно выбрать масштабы по осям, чтобы обеспечить наглядность представления исследуемой зависимости.
Рис. 1.3 Объединённый график опытных данных и регрессионной зависимости
Выводы по работе
В выводах должен быть описан вид полученного уравнения регрессии и характер связи между выходными и входными параметрами, оценена адекватность полученного уравнения и точность коэффициентов.
Например: В практическом занятии № 1 была исследована зависимость прочности шва от линейной плотности ниток. Выявлено, что между этими параметрами существует устойчивая прямая положительная линейная взаимосвязь, описываемая коэффициентом корреляции rxy = 0,975319 и уравнением регрессии вида y = a1 x + a0 = 0,640 x + 0,955. То есть, с увеличением плотности ниток пропорционально (a1 = 0,640) нарастает прочность шва (чего, впрочем, и следовало ожидать). Графически это представлено на рис. 1.3.
Варианты заданий
Вариант 1
Исследуется влияние линейной плотности ниток на прочность шва; результаты экспериментов приведены в таблице.
Определить характер зависимости между прочностью шва и линейной плотностью ниток, построить уравнение и линию регрессии, оценить точность полученной регрессионной модели, изобразить и проанализировать график остатков.
Линейная плотность нитей, текс |
Прочность шва, даН |
Линейная плотность нитей, текс |
Прочность шва, даН |
|||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|||
23 |
14,8 |
14,1 |
17,0 |
16,5 |
12,5 |
36 |
22,4 |
26,0 |
23,3 |
26,0 |
24,0 |
|
28 |
17,0 |
17,5 |
18,1 |
15,1 |
14,1 |
38 |
28,6 |
26,0 |
29,7 |
26,5 |
27,5 |
|
31 |
23,0 |
18,0 |
24,8 |
24,8 |
24,8 |
40 |
32,1 |
29,1 |
33,0 |
25,6 |
27,5 |
|
34 |
20,0 |
24,1 |
22,8 |
21,8 |
18,6 |
41 |
33,0 |
35,0 |
35,4 |
35,4 |
35,4 |
|
38 |
27,5 |
23,5 |
28,1 |
24,1 |
25,0 |
42 |
33,6 |
36,1 |
37,1 |
33,6 |
35,1 |
|
42 |
25,0 |
24,2 |
26,5 |
25,5 |
21,5 |
44 |
39,45 |
39,4 |
39,4 |
39,4 |
39,4 |
|
43 |
28,4 |
26,4 |
29,0 |
25,9 |
26,8 |
46 |
41,16 |
41,1 |
41,1 |
40,1 |
35,1 |
|
45 |
26,0 |
24,3 |
25,5 |
23,5 |
23,5 |
48 |
47,87 |
47,8 |
47,8 |
47,8 |
47,8 |
|
46 |
23,0 |
25,2 |
26,7 |
26,7 |
24,7 |
50 |
47,58 |
47,5 |
49,5 |
49,5 |
48,7 |
|
48 |
30,4 |
28,4 |
28,9 |
31,1 |
30,0 |
52 |
53,29 |
53,3 |
53,3 |
52,3 |
54,3 |
Вариант 2
Исследуется прочность льняных тканей различной поверхностной плотности. Результаты испытаний образцов на разрыв приведены
в таблице.
Определить характер зависимости между прочностью и поверхностной плотностью ткани, построить уравнение и линию регрессии, оценить точность полученной регрессионной модели, изобразить и проанализировать график остатков.
Поверх. плотность ткани, г/м2 |
Разрывная нагрузка, Н |
Поверх. плотность ткани, г/м2 |
Разрывная нагрузка, Н |
|||||||||
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
|||
400 |
985 |
943 |
923 |
974 |
974 |
794 |
752 |
732 |
783 |
783 |
||
405 |
990 |
1023 |
1003 |
1002 |
1017 |
797 |
830 |
810 |
809 |
824 |
||
410 |
1065 |
988 |
968 |
1108 |
1138 |
870 |
793 |
773 |
913 |
943 |
||
415 |
1015 |
1053 |
1033 |
1068 |
1113 |
818 |
856 |
836 |
871 |
916 |
||
420 |
1088 |
1053 |
1033 |
1058 |
1118 |
889 |
854 |
834 |
859 |
919 |
||
425 |
1167 |
1163 |
1143 |
1171 |
1246 |
966 |
962 |
942 |
970 |
1045 |
||
430 |
1110 |
1143 |
1123 |
1141 |
1231 |
907 |
940 |
920 |
938 |
1028 |
||
435 |
1205 |
1153 |
1153 |
1170 |
1275 |
1000 |
948 |
948 |
965 |
1070 |
||
440 |
1235 |
1223 |
1203 |
1223 |
1343 |
1028 |
1016 |
996 |
1016 |
1136 |
Вариант 3
Исследуется прочность клеевого соединения прокладочного материала с костюмной тканью при различной площади склеивания. Результаты испытаний образцов приведены в таблице.
Определить характер зависимости между площадью склеивания и прочностью клеевого прокладочного соединения, построить уравнение и линию регрессии, оценить точность полученной регрессионной модели, изобразить и проанализировать график остатков.
Площадь склеивания, мм2 |
Прочность шва, даН |
Площадь склеивания, мм2 |
Прочность шва, даН |
|||||||||
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
|||
500 |
135 |
135 |
125 |
145 |
145 |
500 |
190 |
180 |
360 |
350 |
350 |
|
700 |
148 |
173 |
159 |
139 |
143 |
700 |
178 |
188 |
348 |
338 |
338 |
|
1000 |
220 |
270 |
212 |
232 |
240 |
1000 |
265 |
255 |
395 |
405 |
415 |
|
1200 |
244 |
319 |
257 |
237 |
249 |
1200 |
264 |
274 |
394 |
404 |
394 |
|
1500 |
285 |
385 |
279 |
299 |
315 |
1500 |
320 |
310 |
410 |
400 |
390 |
|
1700 |
339 |
464 |
354 |
334 |
324 |
1700 |
319 |
359 |
439 |
459 |
459 |
|
2000 |
340 |
490 |
336 |
356 |
380 |
2000 |
365 |
355 |
415 |
405 |
405 |
|
2200 |
366 |
541 |
383 |
363 |
391 |
2200 |
366 |
376 |
450 |
460 |
490 |
|
2500 |
380 |
580 |
378 |
398 |
430 |
2500 |
395 |
385 |
466 |
456 |
456 |
|
2800 |
421 |
646 |
440 |
420 |
456 |
2800 |
411 |
421 |
497 |
507 |
547 |
Вариант 4
Исследуется зависимость ширины проймы (Шпр) изделия размера 88 от прибавки на свободное облегание по линии груди (Пг). Результаты измерений приведены в таблице.
Пг, см |
3,4 |
3,6 |
4,3 |
4,8 |
5,3 |
6,5 |
7,3 |
7,9 |
7,9 |
8,1 |
8,5 |
8,9 |
13 |
|
Шпр, см |
12 |
12 |
12,1 |
12,4 |
12,5 |
12,2 |
12,3 |
12,5 |
12,6 |
12,4 |
12,5 |
12,8 |
13 |
Определить характер зависимости между прибавкой на свободное облегание по линии груди и шириной проймы, построить уравнение и линию регрессии, оценить точность полученной регрессионной модели, изобразить и проанализировать график остатков.
Вариант 5
Исследуется зависимость ширины втачного рукава от длины проймы изделия. Результаты измерений приведены в таблице.
Шрук |
16,2 |
16,2 |
16,4 |
16,4 |
16,5 |
16,8 |
16,8 |
17,3 |
17,3 |
17,4 |
17,5 |
17,5 |
17,7 |
|
Дпр |
44,2 |
44,3 |
44,4 |
45,1 |
43,9 |
50 |
47,2 |
48,2 |
51,3 |
51,5 |
47,4 |
48,2 |
48,4 |
17,9 |
18 |
18,2 |
18,8 |
19 |
19 |
20 |
20,3 |
20,3 |
20,5 |
21,1 |
21,3 |
22 |
|
51,5 |
53 |
52,5 |
53,5 |
55 |
54,5 |
57,3 |
57 |
56 |
60 |
58 |
61,3 |
60,5 |
Определить характер зависимости между шириной втачного рукава и длиной проймы, построить уравнение и линию регрессии, оценить точность полученной регрессионной модели, изобразить и проанализировать график остатков.
Практическое занятие 2. Оценка точности, статистической адекватности и информационной способности регрессионной модели. Работа с программой обработки экспериментальных данных
математический регрессия однофакторный уравнение
Цель работы
Проверка качества разработанной статистической модели: оценка её точности с помощью графика остатков; статистической значимости с использованием F-критерия Фишера и информационной состоятельности - на основании вычисления коэффициента детерминации.
Содержание работы
1. Уяснение задачи и уточнение содержания регрессионной модели, разработанной на практическом занятии № 1.
2. Построение и анализ графика остатков для полученного уравнения регрессии.
3. Оценка статистической адекватности уравнения регрессии. Расчет F-критерия Фишера.
4. Характеристика информационной способности разработанной регрессионной модели. Вычисление коэффициента детерминации R2.
5. Установление взаимосвязи рассчитанных показателей качества статистической модели.
6. Выводы по работе.
Теоретические сведения
Уравнение регрессии
На основании обработки опытных данных, полученных в результате серии экспериментов была построена регрессионная модель, представляемая обычно в аналитической форме - уравнение регрессии - или в графической форме - линия регрессии.
Коэффициенты уравнения регрессии (1.2) получаются методом наименьших квадратов, который обеспечивает наиболее точное представление предполагаемой (линейной) зависимости между переменными и, соответственно, наименьшее значение ошибок аппроксимации, называемых остатками. Дело в том, что уравнение регрессии на самом деле представляет собой выражение вида
, (2.1)
где a0 - свободный член уравнения; он численно равен прогнозируемому значению функции в точке х = 0; a0 имеет размерность случайной величины У;
a1 - коэффициент регрессии; он численно равен изменению СВ У при изменении СВ Х на единицу; a1 имеет размерность СВ У, деленную на размерность СВ Х;
дi - так называемые ошибки (остатки), имеющие место на практике из-за каких-то факторов, не учитываемых в разработанной регрессионной модели;
i - номер опыта (эксперимента, замера).
Коэффициент корреляции
Зависимость между случайными величинами X и Y в теории вероятностей и математической статистике описывается, в первую очередь, как уже указывалось ранее, такими характеристиками, как корреляционный момент Kxy и коэффициент корреляции rxy.
Коэффициент корреляции вычисляется на основании результатов наблюдений по формуле (1.1).
При использовании вычислительных средств коэффициент корреляции можно рассчитывать по приведенной ниже формуле, дающей аналогичный результат, но позволяющей избежать вычисления отклонений случайных величин от своих средних:
rxy =
В материалах предыдущего практического занятия приводилась за-висимость между коэффициентами корреляции и регрессии - формула (1.3).
Анализ остатков как метод проверки точности регрессионной модели
Конечно же, при построении линии регрессии желательно, чтобы она проходила как можно ближе ко всем опытным точкам и, соответственно, уравнение регрессии как можно более точно отражало характер изучаемой зависимости. Именно для этого, кстати, и применялся метод наименьших квадратов…
Поэтому в общем случае опытные точки должны располагаться на приблизительно равном и сравнительно небольшом расстоянии (выше или ниже) от линии регрессии.
Для проверки точности созданной регрессионной модели нужно построить график остатков, т. е. функции Дyi = (yi - yi).
Если модель адекватна, то остатки должны быть равномерно распределены в относительно неширокой горизонтальной полосе вдоль оси абсцисс.
В общем случае остатки (yi - yi) можно рассматривать как случайную величину, зависящую от других (неучтённых в модели) факторов, что приводит к необходимости применения многомерного регрессионного анализа, но это уже не относится к теме этого практического занятия.
F-критерий Фишера
Рассеивание случайной величины У «разлагают» на рассеивание, объясняемое моделью, и рассеивание, обусловленное факторами, которые не учтены моделью. Первое нетрудно рассчитать, зная соответствующие разделы теории вероятностей; второе, не поддающееся теоретическому обоснованию на основе созданной модели, желательно свести к минимуму. В качестве критерия статистической значимости регрессионной модели используется F-критерий Фишера:
, (2.2)
где у2r - дисперсия, обусловленная регрессией, иногда она называется факторной дисперсией или дисперсией адекватности;
у20 - дисперсия, обусловленная неучтенными факторами, она, в свою очередь, называется остаточной дисперсией или дисперсией воспроизводимости;
,
где yi - значение функции, рассчитанное по модели,
k - число степеней свободы = число коэффициентов модели - 1.
Иными словами, F-критерий Фишера показывает, насколько полно и точно мы способны объяснить "случайность поведения" функции Y, на основании предлагаемой теории - регрессионной модели - и знаний о "случайности" аргумента X.
Конечно же, желательно, чтобы F-критерий Фишера был много больше 1.
Коэффициент детерминации
Информационная способность модели оценивается коэффициентом детерминации RM = R2:
(2.3)
Сумма факторной дисперсии и остаточной дисперсии (в знаменателе формулы 2.3) называется суммарной дисперсией
.
Коэффициент детерминации характеризует долю изменчивости случайной величины У, обусловленную влиянием факторов, включенных в модель.
Модель считается информационно способной, когда коэффициент детерминации R2 > 0.5.
Между коэффициентом детерминации RM и F-критерием Фишера существует взаимосвязь:
, (2.4)
где m - число факторов (аргументов) в уравнении регрессии; при a0 = 0 вторая дробь превращается в (n - m)/n.
Доказано, что при значениях показателей тесноты связи (коэффициента корреляции rxy) меньше 0,7 величина коэффициента детерминации R2 всегда будет ниже 0,5. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.
Практическая часть работы
Уяснение и постановка задачи на оценку точности, статистической адекватности и информационной способности регрессионной модели
На предыдущем практическом занятии каждый магистрант получил индивидуальное задание, содержащее результаты проведения однофакторного эксперимента. На основании этих данных методом регрессионного анализа была построена аналитическая модель исследуемого процесса; при необходимости для повышения наглядности была использована графическая форма представления полученных результатов.
В ходе данного практического занятия требуется оценить точность построенной аналитической модели исследуемого процесса с помощью графика остатков; дать характеристики статистической значимости с использованием F-критерия Фишера и информационной состоятельности - на основании вычисления коэффициента детерминации.
Анализ остатков как средство оценки точности построенной регрессионной модели
Так называемые остатки представляют собой разницу между практическими результатами, полученными в ходе эксперимента, и «теоретическими» значениями, вычисленными по аналитическому выражению функции, описывающей наблюдаемую зависимость между параметрами исследуемого процесса, то есть Дyi = (yi - yi). Для этого можно добавить еще один столбец в таблицу промежуточных результатов расчётов (табл. 1.2).
На графике остатки должны быть равномерно распределены в неширокой полосе равной высоты выше и ниже оси абсцисс (рис. 2.1).
Рис. 2.1 График остатков
Анализ графика остатков показывает, что уравнение регрессии (а также и линия регрессии) построены верно.
Определение статистической адекватности уравнения регрессии. Расчет F-критерия Фишера
F-критерий Фишера вычисляется по формуле (2.2). Для нашего примера:
В данном случае F >> 1, следовательно, уравнение регрессии, полученное в практическом занятии № 1, статистически адекватно (термин «адекватный» означает - соответствующий, отвечающий требованиям, пригодный) отражает зависимость между прочностью шва и линейной плотностью ниток.
Характеристика информационной способности разработанной регрессионной модели. Вычисление коэффициента детерминации R2
Коэффициент детерминации вычисляется по формуле (2.3) с помощью (как и в предыдущем пункте работы) данных, обобщённых в таблице 2.
Поскольку R2 > 0.5, можно сказать, что разработанная в практическом занятии № 1 регрессионная модель верно отражает зависимость между прочностью шва и линейной плотностью ниток, наблюдаемую на практике.
Установление взаимосвязи рассчитанных показателей качества статистической модели
В формуле (2.4) указана взаимосвязь между коэффициентом детерминации R2 и F-критерием Фишера; проверим её на имеющихся опытных и расчётных данных:
Таким образом, подтвердили и эту упоминаемую ранее взаимосвязь.
Выводы по работе
В практическом занятии № 1 была исследована зависимость прочности шва от линейной плотности ниток. Выявлено, что между этими параметрами существует устойчивая прямая положительная линейная взаимосвязь, описываемая коэффициентом корреляции rxy = 0.975319 и уравнением регрессии вида y = a1 x + a0 = 0,640 x + 0,955.
В практическом занятии № 2 была оценена точность построенной аналитической модели исследуемого процесса: вычислены разности между практическими и теоретическими значениями функции, называемые «остатками», построен их график. Анализ графика остатков показал, что уравнение регрессии, а также и линия регрессии, построены верно.
Была оценена статистическая значимости (адекватность) регрессионной модели с использованием F-критерия Фишера. В данном случае F = 39,0228 >> 1, следовательно, уравнение регрессии, полученное в практическом занятии № 1, статистически адекватно отражает зависимость между прочностью шва и линейной плотностью ниток.
На основании вычисления коэффициента детерминации дана характеристика информационной состоятельности построенной аналитической модели исследуемого процесса.
Поскольку R2 = 0,9505 > 0.5, можно сказать, что разработанная в практическом занятии № 1 регрессионная модель верно воспроизводит характер зависимости между прочностью шва и линейной плотностью ниток, наблюдаемую на практике.
И, наконец, расчётным путём была подтверждена известная из математической статистики взаимосвязь между коэффициентом детерминации R2 и F-критерием Фишера.
Размещено на Allbest.ru
Подобные документы
Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.
контрольная работа [73,9 K], добавлен 23.01.2009Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Изучение зависимости прибыли банков от вложений в уставные капиталы предприятий графическим методом подбора вида уравнения регрессии. Построение модели объема выпуска продукции по данным численности рабочих, элекровооруженности и потери рабочего времени.
контрольная работа [166,2 K], добавлен 22.11.2010Проверка однородности дисперсии и эффективности математической модели. Перевод уравнения регрессии из кодированных обозначений факторов в натуральные. Построение графиков зависимости выходной величины от управляемых факторов. Упрессовка сырого шпона.
курсовая работа [85,8 K], добавлен 13.01.2015Построение уравнения регрессии. Эластичность степенной модели. Уравнение равносторонней гиперболы. Оценка тесноты связи, качества и точности модели. Индекс корреляции и коэффициент детерминации. Оценка статистической значимости регрессионных уравнений.
курсовая работа [1,3 M], добавлен 25.03.2015Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.
курсовая работа [449,1 K], добавлен 22.01.2015Статистический и корреляционный анализ активов, пассивов, прибыли, ВВП. Выбор формы моделей, отражающих зависимости между показателями. Построение и анализ регрессионной модели на основании реальных статистических данных, построение уравнения регрессии.
курсовая работа [494,7 K], добавлен 20.11.2013Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016