Математические и инструментальные методы анализа данных комплексной информационной системы предприятия
Обработка и анализ исходных экспериментальных данных и разработка адекватных математических моделей Разработка эффективной математической модели, которая будет использована при прогнозировании развитии ситуации деятельности строительной компании.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 12.05.2020 |
Размер файла | 2,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ФГБОУ ВО «Северо-Кавказский горно-металлургический институт
(ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ)
Факультет информационных технологий
Кафедра информационных систем
Курсовой проект
Тема: Математические и инструментальные методы анализа данных комплексной информационной системы предприятия
Дисциплина: Математические и инструментальные методы поддержки принятия решений
Выполнила:
студент гр. ИСм-17-1 Гаглоева М.В.
Преподаватель:
Дзгоев А.Э.
г.Владикавказ, 2018 год
Оглавление
Введение
1.Анализ предметной области
2. Обработка и анализ исходных экспериментальных данных и разработка адекватных математических моделей
3. Прогнозирование зависимой переменной Y
Заключение
Список литературы
Введение
Эффективность деятельности организаций в условиях рыночной экономики в большей степени зависит от прогнозирования, а именно от того, насколько достоверно они предвидят ближнюю и дальнюю перспективу своего развития.
Актуальность прогнозирования высока в периоды нестабильности экономики, так как у многих предприятий, которые не успели отреагировать на изменения внешней среды экономики, происходит спад по всем экономическим показателям.
Безусловно, вопросы мирового кризиса должны решаться на мировом уровне и носить всеобщий характер. Однако, потому как организация является главной воспроизводственной составляющей экономики, как раз на этом уровне желательно и разумно сосредоточить внимание прогностической деятельности поверхностной (внешней) и внутренней среды организации.
Эффективное управление строительной организацией подразумевает, прежде всего, адаптацию к рыночным условиям, прогнозирование производственно-финансовой деятельности организаций, формирование стратегии их развития, тактики рыночного поведения, а также разработку ценовой и ассортиментной политики, внедрение новых технологий и прогнозирование конъюнктуры рынка. Одним из путей, способствующих адаптации строительных организаций к изменениям внешней среды является прогнозирование деятельности строительных компаний.
Целью данной курсовой работы является получение качественной адекватной математической модели, которая будет использована при прогнозировании развитии ситуации деятельности строительной компании "ЭКО-строй сервис",а также при оптимизации текущих процессов.
В рамках курсовой работы необходимо реализовать следующие задачи:
ь Анализ предметной области;
ь Обработка и анализ исходных (экспериментальных) данных и разработка адекватных математических моделей, которые будут применяться в прогнозировании:
1) определить зависимую переменную (Y) и независимые переменные (Х факторы, влияющие на зависимую переменную Y);
2) построить график зависимости Х от Y;
3) выбрать наиболее подходящее уравнение регрессии на основе построенного графика;
4) найти коэффициенты уравнения регрессии, проверить значимость коэффициентов;
5) проверить значимость коэффициентов корреляции по t -критерию Стьюдента;
6) найти ошибки коэффициентов регрессии и их доверительные интервалы;
7) проверить адекватность уравнения регрессии по F-критерию Фишера;
8) провести проверку независимых переменных на интеркорреляцию (мультиколлинеарность если имеется, то необходимо ее исключить).
9) проверить данные зависимой переменной Y на автокорреляции с помощью критерия Дарбина - Уотсона (для проверки данных на автокорреляцию необходимо иметь количество наблюдений не менее 12).
ь Прогнозирование зависимой переменной Y;
модель математический компания строительный
1. Анализ предметной области
В качестве предметной области данного курсовой работы рассматривается строительная компания "ЭКО-строй сервис", занимающейся коммерческим строительством.
Строительная фирма является стороной подрядчиком. Клиенты, физические и юридические лица, заинтересованные в строительстве необходимых им объектов, обращаются в строительную фирму. Можно сделать вывод, что фирма просто получает заказы и выполняет свою работу.
Сама деятельность строительной фирмы подразумевает собой: принятие заявки, заказа, составление договора на строительные работы, и наконец, сами работы. Из всего этого следует, что для анализа функциональной деятельности фирмы необходимо тщательно изучить все стороны процесса работы организации.
Процесс деятельности фирмы можно описать так: клиенты обращаются в строительную организацию с целью постройки нужного им объекта. После этого строительная фирма составляет договор строительного подряда и обязуется сдать построенный объект к условленному сроку. После чего начинается сам процесс строительства.
Процесс строительства можно разделить на четыре этапа: проектирование, составление сметы, покупка необходимого материала и само возведение.
Проектирование объекта важная составляющая строительства. Без чертежей, без плана невозможно построить дом. Следовательно, проектирование отвечает за правильность постройки. Проектируют архитекторы и проектировщики - специалисты этого дела.
После этого этапа строительная фирма, в частности сметчики начинают составлять смету. Этот этап подразумевает подсчет сметной стоимости по единичным расценкам, установленным видам работ и по расходу ресурсов. Иными словами это расчет количества средств, необходимых на строительство. Составление сметы невозможно без проекта строительства.
Третьим этапом является закупка материалов. Состоит этап из покупки самих материалов и транспортировки на строительную площадку. Сотрудники фирмы уже знают какой именно и сколько материалов необходимо. Средства на покупку и транспортировку предоставлены бухгалтерией.
И наконец, последний и самый главный этап: строительство объекта. Этот этап можно разделить на еще два: подготовка материала, конструкций и возведение объекта. Подготовка материала производится по ГОСТ и СНиП. Если фирма следит за своей репутацией, то она должна соблюдать все правила и нормы, поэтому должна выполнять свои обязательства перед клиентом качественно.
Возведение объекта начинается с заложения фундамента. После чего идет строительство основной части. Далее следует установка крыши. Затем внешняя и внутренняя отделка. Также как и при других процессах деятельности фирмы при этом соблюдаются все правила и нормы.
2. Обработка и анализ исходных экспериментальных данных и разработка адекватных математических моделей
Для разработки математической модели использован программный продукт MathCad - система, предназначенная для автоматизации решения различных задач средствами компьютерной математики в различных областях науки, техники и образования. Он относится к классу систем автоматизированного проектирования. Главное преимущество MathCad в интуитивно понятом интерфейсе, для использования которого не требуется навыки программирования, а также в системе используются всем привычные формулы.
При обработке экспериментальных данных в Mathcad с целью исследования их природы, возникает необходимость выразить зависимую переменную в виде некоторой математической функции от одной или нескольких независимых переменных. Данная зависимость получила название регрессионная модель или уравнение регрессии, а методы, позволяющие получить эту зависимость, принято называть методами регрессионного анализа в Mathcad.
Уравнение регрессии представляет собой математическую функцию, описывающую взаимозависимость между переменными y и x. Линия регрессии (то есть график некоторой математической функции) наилучшим образом отражает связь между координатами всех точек, нанесённых на график. В подавляющем большинстве случаев корреляция не является полной. Поэтому мы находим уравнение регрессии из условия минимума суммы квадратов отклонений точек от прямой. Уравнения регрессии, полученные данным способом, называются регрессией по методу наименьших квадратов (МНК).
При анализе достоверности регрессионного уравнения оценивается значимость не только уравнения в целом, но и отдельных его параметров. Оценка значимости каждого коэффициента регрессии, а также коэффициента корреляции проводится по t - критерию Стьюдента.
Под адекватностью уравнения регрессии понимается соответствие данного уравнения экспериментальным данным. Наиболее популярными показателями оценки адекватности модели в целом является F-критерий Фишера. Он получают путем сопоставления факторной (объясненной) и остаточной дисперсии в расчете на одну степень свободы.
F-критерий используется для проверки нулевой гипотезы Н0: равенство между факторной (объясненной) и остаточной дисперсии. Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Если расчетное значение критерия выше табличного, то в этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.
Рассмотрим расчет аппроксимации экспериментальных данных уравнением прямой линии Y = B0 + B•X и нелинейное уравнение регрессии второй степени (полный полином 2-ой степени):
Имеется массив экспериментальных данных в виде двух столбцов - векторов X и Y. Необходимо путем обработки этого массива получить уравнение регрессии и обосновать его адекватность экспериментальным данным.
2.1 Линейное уравнение регрессии
N := 12 число данных;
k := 2 число статистически значимых коэффициентов регрессии;
включая свободный член;
- фиктивная переменная;
X1 - время;
X2 - этажи;
Y - количество проданных квартир;
B0 и B - коэффициенты регрессии.
Из графика следует, что зависимость между переменными является линейной. Следовательно , использование линейной аппроксимации является целесообразным.
Команда line(X,Y)
Для нахождения коэффициентов линейного уравнения регрессии в Mathcad предусмотрена функция line (X,Y).
Проверка значимости коэффициента корреляции (r)
по t-критерию
Вывод : в связи с тем, что tr (15,843)> t (2.228) и r (0.981) > rcr(0.576) коэффициент корреляции признан статистически значимым с 95% надежностью. На этом же основании уравнение регрессии может быть признано адекватным экспериментальным данным .
Полный расчет
N := 12 число данных;
k := 2 число статистически значимых коэффициентов регрессии,
включая свободный член.
Ошибки коэффициентов регрессии (Si) и их доверительные интервалы (dB1).
Вывод: в связи с тем, что B0 (421.602) >dB0 (154.584) коэффициенты признаны статистически значимыми, а коэффициент B2 (-3.959) < dB2 (0.058) -незначимым(имеем право исключить этот коэффициент из уравнения).
Оценка адекватности полного уравнения регрессии по F-критерию
Вывод: в связи с тем, FR > F полное уравнение регрессии признано адекватным экспериментальным данным с доверительной надежностью 95%.
Доверительный коридор для зависимой переменной
Доверительные интервалы для зависимой переменной
Доверительный коридор расчетных значений Y
Проверка независимых переменных на интеркорреляцию
Вывод: в связи с тем, FR > F полное уравнение регрессии признано адекватным экспериментальным данным с доверительной надежностью 95%.
Проверка массива на наличие интеркорреляции в массиве независимых переменных
Вывод: коэффициент корреляции r(X1, X2) статистически незначим (-0.115 < 0.596). Следовательно между переменными X1 и X2 имеется слабая связь. Одну из них следует исключить из массива Х. Исключаем Х2 так, как она менее тесно связано с Y. После исключения Х2 получаем следующую матрицу и новые коэффициенты регрессии.
Вывод: в связи с тем, FRМ > F модель признана адекватной.
Проверка данных зависимой переменной Y на автокорреляцию с помощью критерия Дарбина - Уотсона
Автокорреляция - это измерение зависимости между значением какой-либо величины из временного ряда и ее предыдущими или последующими значениями. Один из более распространенных методов определения автокорреляции в остатках - это расчет критерия Дарбина-Уотсона:
,
где величина d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии .
Отклонение расчетных значений переменных от экспериментальных
По данным [] верхняя (dup) и нижняя (dl) границы равны dup=1.4 и dl=1.18.
Если dup<d<(4-dup), то автокорреляция отсутствует .Так как 1.40 < 1.446 < 2.60, следовательно, автокорреляция отсутствует .
2.2 Нелинейное уравнение регрессии второй степени
- число данных;
- число статистически значимых коэффициентов регрессии, включая свободный член ;
- фиктивная переменная;
- время, месяцы;
- этажы;
- вектор - столбец независимых переменных;
- вектор - столбец зависимой переменной, количество проданных квартир;
- коэффициенты регрессии.
Вывод: в связи с тем, что FR > F полное уравнение регрессии признано адекватным экспериментальным данным с доверительной надежностью 95%.
Проверка значимости коэффициента корреляции (r)
по t-критерию
Вывод : в связи с тем, что tr (22.209)> t (2.228) и r (0.99) > rcr(0.576) коэффициент корреляции признан статистически значимым с 95% надежностью. На этом же основании уравнение регрессии может быть признано адекватным экспериментальным данным .
Ошибки коэффициентов регрессии (Si) и их доверительные интервалы (dB1).
Проверка независимых переменных на интеркорреляцию
Вывод: в связи с тем, что FR > F полное уравнение регрессии признано адекватным экспериментальным данным.
Проверка наличия интеркорреляции в массиве независимых переменных
Вывод: коэффициент корреляции r(X1, X2) статистически значим (0.973> 0.707). Следовательно между переменными имеется сильная связь. Одну из них исключим из массива Х. Исключаем Х3 так, как она менее тесно связано с Y. После исключения Х3 получаем следующую матрицу и новые коэффициенты регрессии.
Вывод: в связи с тем, что FR > F полное уравнение регрессии признано адекватным.
Проверка данных зависимой переменной Y на автокорреляцию с помощью критерия Дарбина - Уотсона
Отклонение расчетных значений переменных от экспериментальных
По данным [] верхняя (dup) и нижняя (dl) границы равны dup=1.4 и dl=1.18.Если dup<d<(4-dup), то автокорреляция отсутствует .Так как 1.40 < 1.969 < 2.60, следовательно, автокорреляция отсутствует .
3. Прогнозирование зависимой переменной Y
Прогнозирование деятельности организаций - это отношение планов развития на будущее на основании изменения рыночных условий на будущий период и анализа коньюктуры рынка. Другими словами, порядок количественных и качественных предплановых исследований, которые направлены на выяснение возможного состояния и достижений деятельности предприятия в дальнейшем.
Современные новостройки становятся выше с каждым годом. Наличие большого количества этажей является своеобразным показателем престижности здания. Для строительной компании "ЭКО-строй сервис" необходимо спрогнозировать, в какой период времени и на каких этажах продажа квартир идёт лучше. Прогнозы составляются по различным параметрам и на различные сроки.
3.1 Линейное уравнение регрессии
N := 12 число данных;
k - число статистически значимых коэффициентов регрессии;
включая свободный член;
- фиктивная переменная;
X1 - время,месяц;
X2 - этажи;
Y - количество проданных квартир;
B - коэффициенты регрессии.
Прогноз на 13 месяц
Вывод: в связи с тем, что FR > F полное уравнение регрессии признано адекватным.
Значимость коэффициента регрессии
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Прогноз на 14 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Прогноз на 15 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Прогноз на 16 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
3.2 Нелинейное уравнение регрессии второй степени
- число данных;
- число статистически значимых коэффициентов регрессии, включая свободный член ;
- фиктивная переменная;
- время, месяцы;
- этажы;
- вектор - столбец независимых переменных;
- вектор - столбец зависимой переменной, количество проданных квартир;
- коэффициенты регрессии.
Прогноз на 13 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Прогноз на 14 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Прогноз на 16 месяц
Значимость коэффициента корреляции
Прогнозирование на основе математической модели
Вывод: так как относительная ошибка АОТ<20%, то прогноз является точным.
Заключение
Цель данной курсовой работы заключалась в получении качественной адекватной математической модели.
Я построила две математические модели:
1) математическая модель, описанная с помощью линейного уравнения регрессии;
2) математическая модель, описанная с помощью нелинейного уравнения регрессии второй степени.
В рамках работы необходимо было реализовать следующие задачи:
1) определить зависимую переменную (Y) и независимые переменные (Х факторы, влияющие на зависимую переменную Y);
2) построить график зависимости Х от Y;
3) выбрать наиболее подходящее уравнение регрессии на основе построенного графика;
4) найти коэффициенты уравнения регрессии, проверить значимость коэффициентов;
5) проверить значимость коэффициентов корреляции по t -критерию Стьюдента;
6) найти ошибки коэффициентов регрессии и их доверительные интервалы;
7) проверить адекватность уравнения регрессии по F-критерию Фишера- модели были проверенны на адекватность. Обе модели уравнения регрессии признаны адекватным экспериментальным данным;
8) провести проверку независимых переменных на интеркорреляцию.
9) проверить данные зависимой переменной Y на автокорреляции с помощью критерия Дарбина - Уотсона.
В результате прогнозирования на основе математической модели были рассчитаны прогнозные значения зависимой переменной.
Список литературы
1. Кумаритов А.М., Дзгоев А.Э.,Бетрозов М.С., Бабочиев О.Р Моделирование систем Учебно-методическое пособие по выполнению лабораторных работ/ Владикавказ: Терек, 2014. - 68 стр.
2. Кумаритов А.М.,Алкацев В.М., Дзгоев А.Э., Бабочиев О.Р Математическое моделирование экономических систем и процессов с приминением пакета MATHCAD / Владикавказ: Терек, 2016. - 69 стр.
3. Макаров Е. Инженерные расчеты в Mathcad 15: Учебный курс. - СПб.: Питер, 2011. - 400 с.
4. Очков В.Ф. Mathcad 14 для студентов, инженеров и конструкторов. - СПб.: БВХ-Петербург. 2007. - 368 с.
5. Кирьянов Д. Самоучитель Mathcad 11/ Москва, 2012. - 544 c.
Размещено на Allbest.ru
Подобные документы
Аппроксимация экспериментальных зависимостей методом наименьших квадратов. Правило Крамера. Графическое отображение точек экспериментальных данных. Аномалии и допустимые значения исходных данных. Листинг программы на С++. Результаты выполнения задания.
курсовая работа [166,7 K], добавлен 03.02.2011Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Понятие, виды и методы планирования экспериментальных исследований. Предварительная обработка экспериментальных данных, компьютерные методы статистической обработки и анализ результатов пассивного эксперимента, оценка погрешностей результатов наблюдений.
книга [3,1 M], добавлен 13.04.2009Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Анализ исследований в области лечения диабета. Использование классификаторов машинного обучения для анализа данных, определение зависимостей и корреляции между переменными, значимых параметров, а также подготовка данных для анализа. Разработка модели.
дипломная работа [256,0 K], добавлен 29.06.2017Теория случайных графов, модели сетей (графы Барабаши-Альберт, Эрдеша-Реньи, Уотса-Строгатса и др.) Разработка ускоренного алгоритма калибровки больших сетей по коэффициенту кластеризации на языке Java в среде Eclipse. Анализ экспериментальных данных.
дипломная работа [2,0 M], добавлен 19.11.2013Знакомство с особенностями построения математических моделей задач линейного программирования. Характеристика проблем составления математической модели двойственной задачи, обзор дополнительных переменных. Рассмотрение основанных функций новых переменных.
задача [656,1 K], добавлен 01.06.2016Процесс выбора или построения модели для исследования определенных свойств оригинала в определенных условиях. Стадии процесса моделирования. Математические модели и их виды. Адекватность математических моделей. Рассогласование между оригиналом и моделью.
контрольная работа [69,9 K], добавлен 09.10.2016Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.
курсовая работа [862,4 K], добавлен 06.05.2009Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014