Оценка возможностей нейронных сетей в системе поддержки принятия решений

Теоретические основы нейронных сетей: применение, топология, обучения. Полезные свойства систем содержащих нейронные сети. Содержательная сущность поддержки принятия решений. Оценка возможностей нейронных сетей в системе поддержки принятия решений.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 22.05.2018
Размер файла 849,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Федеральное государственное автономное образовательное учреждение высшего образования

«СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» ЛЕСОСИБИРСКИЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ

филиал Сибирского федерального университета

Физико-математический факультет

кафедра Высшей математики, информатики и естествознания

09.03.02 Информационные системы и технологии код и наименование направления

09.03.02.07 Информационно-управляющие системы наименование профиля

КУРСОВАЯ РАБОТА

по дисциплине: Интеллектуальные системы и технологии

тема: Оценка возможностей нейронных сетей в системе поддержки принятия решений

Содержание

Введение

Глава 1. Теоретические основы нейронных сетей

1.1 Понятие «нейронные сети»

1.2 Полезные свойства систем содержащих нейронные сети

1.3 Применение нейронных сетей

1.4 Топологии нейронных сетей

1.5 Обучение нейронной сети

2. Система поддержки принятия решений

2.1 Содержательная сущность поддержки принятия решений

2.2 Построение систем поддержки принятия решений

2.3 Data Mining

2.4 Оценка возможностей нейронных сетей в системе поддержки принятия решений

Заключение

Список использованных источников

Введение

нейронный сеть решение

Курсовая работа посвящена исследованиям в области систем поддержки принятия решений(СШIР) и возможности использования в них нейронных сетей.

На текущий момент СППР активно внедряются и используются не только в крупных организациях, которым приходится работать с огромными объемами информации, такими, как банки, органы государственного управления и поисковые системы. СППР завоевывают себе место и в среднем бизнесе в связи с удешевлением стоимости разработки и поддержки.

Действительно, сложно отказаться от возможности взвешенного по заданным параметрам решения существующей проблемы, а не редко и ряда проблем. Диапазон решаемых проблем привлекателен от назначения на свободную должность сотрудника, до выбора стратегического направления развития фирмы в ближайшие 10 лет. Это снимает определенную долю нагрузки с лиц, принимающих решение, и упрощает принятие решения. Такие информационно-технологические гиганты, как Google и Microsoft уже давно используют СШИ для принятия взвешенных решений.

Объект исследования: интеллектуальные системы.

Предмет исследования: возможности применения нейронных сетей в

СТР.

Цель исследования: теоретически обосновать возможности нейронных сетей в CFIFIP и раскрыть оценки этих возможностей.

Задачи:

1. Проанализировать научную литературу по теме курсовой работы;

2. Раскрыть понятие «нейронные сети>> и сферу их применения;

З. Рассмотреть понятие и сущность системы поддержки принятия решений, найти точки их соприкосновения и связь между ними;

4. Обосновать возможность использования нейронных сетей в СШIР.

Глава 1. Теоретические основы нейронных сетей

1.1 Понятие «нейронные сети»

Искусственные нейронные сети являются результатом попытки обучения у живой природы способу обработки информации таким образом, как это происходит в нервной системе. Основной элемент -- нейрон, является клеткой нервной системы. У нейрона имеется тело под названием сома, из которого выходят многочисленные отростки. Существует два типа отростков: Дендрит, представляющие собой тонкие ветвящиеся нити и более толстый аксон, расщепляющийся на конце, и обладающий многочисленными нервными окончаниями на конце, которые называют колатералами (коллатералями). За поступление входных сигналов отвечают синапсы, выходной сигнал отводится аксоном через колатералы, которые контактируют с дендритами и непосредственно с сомой других нейронов. Передача сигналов внутри нервной системы достаточно сложный электрохимический процесс. Если упростить, что можно считать, что передача нервного импульса между двумя нейронами основана на выделении нейромедиаторов в области синапсов, которые воздействуют на клеточную мембрану, вызывая ее поляризацию, и уровень поляризации зависит от суммарного количества нейромедиаторов, выделенных во всех синапсах (рис.1.1.) [2].

синапс

Рис.1.1. Тело нейрона

Для рассмотрения в ходе текущей курсовой работы важно лишь то, что каждый вход клетки можно обозначить числом(весом) пропорциональным количеству нейромедиатора однократно выделенного на каждом синапсе. Эти веса могут принимать как положительные (возбуждающие), так и отрицательные (тормозящие) значения. Если в результате действия всех пришедших сигналов отклонение от электрического равновесия невелико, то клетка приходит в исходное состояние самостоятельно, и на ее выходе никаких изменений зарегистрировано не будет. Если же суммарное возбуждение превышает некоторый порог, то значение выходного сигнала начинает лавинообразно нарастать и вдоль аксона распространяется нервный импульс, который передается другим нейронам. После выполнения своей функции, нейромедиатор удаляется. Одновременно с генерацией нервного импульса запускается процесс рефракции, в течение которого нейрон на некоторое время вообще теряет способность к возбуждению. Частота, с которой нейрон может генерировать импульсы ограничивается примерно 100 Гц. Считается, что человеческий мозг содержит порядка 10 11 нейронов, которые связаны между собой связями в количестве порядка 1014-1015

Итак, несмотря на относительно низкое быстродействие отдельного нейрона человеческий мозг или мозг летучей мыши справляется с задачей распознания лиц или с задачей эхолокацией быстрее чем любой компьютер. Очевидно, что свою силу нейронные сети черпают из распараллеливания обработки информации и способности самообучаться и создавать обобщения. Под обобщением понимается способность получать обоснованный результат на основании данных, которые не встречались в процессе обучения. Эти свойства позволяют нейронным сетям решать трудноразрешимые на сегодняшний день задачи. Конечно, на практике одни только нейронные сети не могут обеспечить готовые решения, их необходимо интегрировать в сложные системы, в которых некоторые задачи будут решаться с помощью нейронных сетей.

1.2 Полезные свойства систем содержащих нейронные сети

Рассмотрим некоторые полезные свойства систем содержащих нейронные сети (независимо от того реализованы они программно на обычных компьютерах или аппаратно в специализированных нейрокомпьютерах).

1. Нелинейность. Искусственные нейроны могут быть нелинейными, поэтому и сами нейронные сети на основе таких нейронов являются нелинейными. Эта нелинейность распределена по сети. Нелинейность является важным свойством, особенно если необходимо обрабатывать информацию о физическом процессе, который сам по своей природе является нелинейным.

2. Отображение входной информации в выходную. Одной из популярных парадигм обучения является так называемое обучение с учителем на основе учебных примеров, которые состоят из входного сигнала и соответствующего ему желаемого отклика. При предъявлении учебного примера нейронная сеть модифицирует синаптические веса для минимизации расхождений желаемого выходного сигнала и формируемого сетью. Такое обучение проводится до тех пор пока расхождение станет незначительным.

З. Адаптивность. Нейронные сети могут адаптировать свои синаптические веса к изменениям окружающей среды, то есть при изменении условий могут легко переучиваться или доучиваться.

4. Отказоустойчивость. Нейронные сети, реализованные аппаратно, потенциально отказоустойчивы. Это обусловлено распределенным характером хранения информации в различных связях нейронной сети, если какой - либо нейрон или связь повреждены, то это не означает полной потери нейронной сетью её свойств. [7]

1.3 Применение нейронных сетей

Нейронные сети используются для решения сложных задач, которые требуют аналитических вычислений подобных тем, что делает человеческий мозг. Самыми распространенными применениями нейронных сетей является:

Классификация -- распределение данных по параметрам. Например, на вход дается набор людей и нужно решить, кому из них давать кредит, а кому нет. Эту работу может сделать нейронная сеть, анализируя такую информацию как: возраст, платежеспособность, кредитная история и тд.

Предсказание возможность предсказывать следующий шаг. Например, рост или падение акций, основываясь на ситуации на фондовом рынке.

Распознавание в настоящее время, самое широкое применение нейронных сетей. Используется в Google, когда вы ищете фото или в камерах телефонов, когда оно определяет положение вашего лица и выделяет его и многое другое.

Нейрон представляет собой единицу обработки информации в нейронной сети. Общая модель нейрона состоит в следующем: нейрон имеет несколько каналов ввода информации дендриды и канал вывода информации -- аксон.

Аксон нейрона соединен с дендридами других нейронов с помощью синапсов. При возбуждении нейрон посылает сигнал по своему аксону. Через синапсы сигнал передается другим нейронам, которые в свою очередь могут возбуждаться или переходить в состояния торможения. Нейрон возбуждается если суммарный уровень сигналов, пришедший в него превышает некоторый уровень порог возбуждения или активации[ ]

Рис 1.2. Модель нейрона, лежащего в основе искусственных нейронных сетей

Из рисунка видно, что на вход нейрона поступает сигналы xi через входные каналы, каждый из которых проходит через соединение, имеющее определенную силу и вес wki. Коэффициенты wki называются весами синаптических связей, положительное значение которых соответствует возбуждающим синапсам, отрицательное значение -- тормозящим синапсам. Если wki =0, то говорят, что связь между нейроном К и нейроном i отсутствует.

Далее производится преобразование сигналов в сумматоре и добавляется порог bk, а результат преобразуется с помощью функции (Р и подается на выход нейрона. В математическом представлении функционирование нейрона

К можно описать следующей парой уравнений:

WkiXi i=1 где * --синаптические веса нейрона К; входные сигналы;

Ук = (Р (Vk + Ьк); где 9 -- функция активации;

-- линейная комбинация входных воздействий; bk -- порог активации.

Полученный нейронами сигнал преобразуется с помощью нелинейной функции активации (Р в выходной сигнал ук 9(vw).

Функция активации (Р это некоторая нелинейная функция, моделирующая процесс передачи возбуждения.

Используют несколько функций активации: функция единичного скачка, сигмоидальная функция, кусочно-линейная функция, функция знак. Одной наиболее распространенных является нелинейная функция активации с насыщением, так называемая логистическая функция или сигмоидальная.

1.4 Топологии нейронных сетей

Топологии сети можно разделить на две основные группы: сети прямого распространения и рекуррентные сети.

1. Сети прямого распространения.

В многослойной нейронной сети, нейроны располагаются по слоям. Нейроны первого слоя получают сигналы, преобразуют их и передают нейронам второго слоя, далее срабатывает второй слой, и т.д. до К-ого слоя, который выдает выходные сигналы. Такая сеть называется многослойной сетью прямого распространения. Промежуточные слои между внешним входным сигналом и выходным слоем называется скрытым, рисунок 4. Если все узлы каждого слоя соединены со всеми узлами смежных слоев, то такая сеть называется полносвязной. Если некоторые из синаптических связей отсутствуют, то сеть называется неполносвязной.

Рисунок 4. Входной Слой скрытых Выходной слой слой нейронов нейронов

Сети с прямой связью могут служить универсальным средством для апроксимации, но нет никакого правила, позволяющего найти оптимальную топологию сети для данной задачи.

2. Рекурентные сети.

Рекурентные сети отличаются от сетей прямого распространенияналичием хотя бы одной обратной связью. Наличие обратных связей в сетях оказывает непосредственное влияние на их способность к обучению и на их производительность. Такие сети представляют большой интерес для исследователей в области нейронных сетей. Однако при решении практических задач наиболее полезными оказались сети прямого распространения.

Выбор структуры (топологии) нейронной сети осуществляется в соответствии с особенностями и сложностью задачи. На рисунке 5 представлены наиболее распространенные архитектуры нейронных сетей.

1.5 Обучение нейронной сети

Обучение сети -- это подгонка ее внутренних параметров с целью адаптации к внешним воздействиям для решения конкретной задачи.

Процесс обучения нейронной сети является итеративным, а его шаги называют эпохами или ЦИКЛаМИ. На каждом цикле обучения происходит вычисление синаптичиских коэфициентов wki на основе примеров сгруппированных в обучающие множества (обучающую выборку). Такое множество состоит из данных, с указанным для каждого из них значением, выходного параметра, которое желательно получить. Действие, которое при этом происходит, можно назвать контролируемым обучением: учитель подает на вход сети вектор исходных данных, а на выходной узел сообщает желаемое значение результата. Контролируемое обучение нейронной сети можно рассмотреть как решение оптимизационной задачи. Разность между правильным решением и откликом представляет собой ошибку, которую следует уменьшить с помощью настройки свободных параметров. Корректируя сеть с целью минимизировать ошибку, мы не можем быть уверенны, что можно добиться еще меньшей ошибки.

Поверхность ошибки имеет сложное стоение и обладает рядом неприятных свойств, в частности может иметь локальные минимумы, плоские участки, седловые точки и длинные узкие овраги. Аналитичыескими свойствами невозможно определить положение глобального минимума на поверхности ошибок, поэтому обучение нейронной сети, по сути заключается в исследовании этой поверхности. Достижение глобального минимума называется сходимостью процесса обучения [8]. Разработано более сотни обучающих алгоритмов, отличающихся друг от друга стратегией оптимизации и критерием ошибок. Обычно, в качестве меры ошибки берутся среднеквадратичная ошибка Е (1), которая определяется как сумма квадратов между желаемой велечиной выхода и реально полученными на сети значениями ук для каждого примера

Е = - ук)2 (1)

где Р -- число примеров в обучающем множестве; dk -- желаемая величина выхода; ук -- значения полученные на сети.

Наиболее распространненый алгоритм обучения нейронных сетей с прямой связью -- алгоритм обратного распространения ОШИбКИ. Этот метод основан на вычислении вектора градиента поверхности ошибок, который указывает направление кратчайшего спуска по поверхности из данной точки. Последовательность шагов приводит после ряда итераций к минимуму поверхности ошибок. Очевидную трудность здесь представляет выбор длины шага. При большой длине сходимость более быстрая, но есть опасность «перескочить» через решение, особенно в случаях, когда поверхность отклика имеет форму узкого оврага. При малом шаге направление продвижения выбирается правильное, но требуется много итераций для достижения минимума. На практике величина шага принимается пропорциональной крутизне склона с некоторой постоянной, называемой скоростью обучения.

Алгоритм обратного распространения ошибки является алгоритмом градиентного спуска, минимизирующим квадратичную ошибку Е (2):

2 (2)

Индекс i пробегает все выходы многослойной сети.

На каждой эпохе на вход сети поочередно подается все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями, и вычисляется ошибка, Значение ошибки, а так же градиента поверхности ошибок используются для корректировки весов, после чего все действия повторяются. Процесс обучения прекращается либо когда пройдено определенное количество эпох, либо ошибка достигла некоторого уровня или вовсе перестает уменьшаться.

Опасность метода кроется в том, что таким образом мы минимизируем ошибку на обучающем множестве, и это не то же самое что минимизировать

«настоящую>> ошибку на поверхности ошибок. Сильнее всего это различие сказывается в проблеме переобучения, или излишней подгонки, что необходимо учитывать создавая практические решения.

В данной главе были рассмотрены основные определения и принцип работы нейронных сетей. Для анализа возможности их применения в системе поддержке принятия решений, рассмотрим сущность и основные понятия СГШР.

2. Система поддержки принятия решений

2.1 Содержательная сущность поддержки принятия решений

Деятельность деловых людей связана с необходимостью ежедневно принимать решения различной сложности. Примерами могут служить: выбор направления развития фирмы, выбор варианта автоматизации деятельности компании, определение варианта размещения филиала, типа выпускаемого или закупаемого товара, выбор помещения под офис, типа оборудования, выбор кредитора, соисполнителя работы, назначение на вакантную должность одного из многих кандидатов и т. д. Обоснованность и профессиональный уровень принимаемых решений определяет, в конце концов, эффективность деятельности фирмы. Необходимость учета при принятии управленческих решений большого количества политических, экономических, социальных, юридических и моральных факторов значительно усложняет задачу выбора правильного варианта решения, В первую очередь, это связано с необходимостью сбора необходимой для принятия решения информации. В этом отношении существенную помощь руководителю оказывают современные информационные системы. Однако обладание информацией необходимое, но недостаточное условие для принятия правильного решения.

При принятии действительно сложных решений необходимо привлекать экспертов специалистов в различных областях знаний. Стоит понимать, что человек не способен быть профессионалом в нескольких диаметрально противоположных отраслях, в связи с чем возникает необходимость в привлечении сторонних экспертов. Однако подбор экспертов также является задачей нетривиальной, т.к. круг решаемых проблем и взгляд на конкретную проблему будет ограничен. Опираясь на знания экспертов, принять решение предстоит руководству, поставившему задачу.

В попытке разрешить проблему принятия решений, были созданы информационные системы поддержки принятия решений на основе применения математических методов. Опыт человека, многих людей может быть аккумулирован в форме накопленного опыта логики, накопленного опыта ближайших и предшествующих лет в форме приложений конкретного вида моделей к однотипным ситуациям. Наконец, опыт отражается в виде сопоставляемых с эталонами данных предшествующих периодов для конкретного предприятия, в конкретных реальных условиях, и такой опыт может быть востребован наряду с указанным методическим опытом в виде моделей и методов обработки имеющихся данных [4]. Эти системы начинают все шире применяться государственными организациями и крупными корпорациями (U.S. Navy, NASA, IBM, General Motors, Xerox, ЗМ, Rockwell

Intemational, Reiter Consulting Group Intemational и др.)

Примеры задач, решаемых с привлечением CTITIP:

выбор методов завоевания рынка бытовой техники;

оценка перспективности видов альтернативного горючего для автомобилей; распределение средств между проектами социальной программы гуманитарной направленности;

отбор научно-технических проектов в рамках конкурса; выбор перспективных направлений информатизации страны;

выбор для корпорации и пр.

В последнее время CFIFIP начинают применяться и в интересах малого и среднего бизнеса (например, выбор варианта размещения торговых точек, выбор кандидатуры на замещение вакантной должности, выбор варианта информатизации и т, д.) Главной задачей, которую приходится разрешать при принятии решения, является выбор альтернативы, наилучшей для достижения некоторой цели, или ранжирование множества возможных альтернатив по степени их влияния на достижение этой цели. В настоящее время разработано большое количество методов оказания помощи лицу, принимающему решение (ЛСР), при осуществлении этой задачи.

Рассмотрим основные из них. Прежде всего, необходимо решить нетривиальную задачу выбора множества критериев оценки альтернатив. Для этого может быть использован, в частности, подход, предусматривающий декомпозицию главной цели до того уровня детализации, когда для нижнего уровня иерархии целей можно сформулировать критерии, позволяющие адекватно описать степень достижения целей при принятии той или иной альтернативы. Применительно к задаче выбора варианта информатизации в качестве главной цели фирмы может быть, например, повышение рентабельности фирмы, а критериями оценки вариантов могут выступать, например, затраты на информатизацию, способность поддерживать решения, возможность адаптации к другим видам деятельности фирмы, возможность защиты информации, время реакции на запрос, надежность оборудования и пр. Наборы значений этих критериев используются для описания исходов альтернативных вариантов решений (в дальнейшем, «альтернатив») с последующим формированием функции полезности, отражающей предпочтения ЈШР и позволяющей каждому набору значений оценок альтернатив по выбранным критериям поставить в соответствие некоторое число, характеризующее эффективность альтернативы. Построение функции полезности на основании формального описания предпочтений предполагает, в частности, способность Л? выполнить замещения, то есть в простейшем случае выбрать в качестве лучшей одну из двух альтернатив, причем одна из них превосходит вторую по некоторому критерию А, но уступает по критерию В при равных оценках по остальным. Для этого ЈШР должен полностью владеть проблемой. Применительно к задаче выбора варианта информатизации фирмы MIP должен, в частности, указать, какой из двух вариантов предпочтительней для повышения рентабельности фирмы: тот, который обеспечивает возможность поддержки принятия решений, но уступает по времени реакции, или вариант, обеспечивающий меньшее время реакции на запрос, но не содержащий средств поддержки принятия решений при равных оценках по остальным критериям. Для действительно сложных комплексных проблем допущение о способности JITIP осуществлять подобные замещения весьма сильно, JITIP не может обладать всеми знаниями, необходимыми для квалифицированного решения этой задачи. Поэтому для решения таких сложных проблем следует привлекать многих специалистов в разных областях знаний, что при использовании такого подхода весьма затруднительно.

Упрощение построения функции полезности достигается при использовании метода аналитических иерархических процессов (АНР). Сущность подхода заключается в следующем. ЛПР осуществляет вначале попарное сравнение значимости выбранных критериев. Затем этот же метод используется для попарного сравнения альтернатив относительно каждого выбранного критерия. На основе этого СГТПР рассчитывает коэффициенты значимости критериев, коэффициенты значимости альтернатив относительно каждого критерия, что позволяет рассчитать для каждой альтернативы значения линейной функции полезности. Развитием этого подхода является метод аналитических сетевых процессов (ANP), который позволяет учесть взаимосвязи между критериями. Однако использование каждого из трех названных подходов связано с необходимостью JIIIP решать сложную задачу выбора набора критериев, адекватно описывающих влияние альтернатив на достижение главной цели. Особенно сложным становится эта задача при принятии решений относительно формирования комплексных целевых программ, Опыт разработки сложных СПГ[Р показывает, что для ЈШР понятие «главная цель» программы более бјшзко, чем понятие «критерий». Вследствие этого при разработке сложных CFITIP удобнее пользоваться понятиями «цель», «подцель», <<надцель» и рассматривать процесс выполнения программы как достижение взаимосвязанных подцелей. Для оценки эффективности проектов в этом случае более приемлемым представляется подход, который можно назвать многоцелевым оцениванием альтернатив. Сущность его заключается в следующем. Каждый из проектов (альтернатива) оценивается единым показателем эффективности степенью влияния его выполнения на достижение главной цели программы.

Применительно к задаче выбора варианта информатизации фирмы главной целью может быть «повышение рентабельности». Непосредственная оценка влияния выполнения проектов на достижение главной цели программы является трудной задачей. Поэтому используется прием, основанный на построении иерархии целей, то есть на декомпозиции главной цели программы на подцели, где на нижнем уровне иерархии находятся цели проектов. Применительно к выбору варианта информатизации фирмы в качестве непосредственных подцелей главной цели могут быть конкретные цели такие, как: ускорение оборачиваемости средств, увеличение контролируемой части рынка, снижение цены продукции и т. д. Заметим, что между подцелями могут существовать взаимосвязи, например, подцель «снижение цены продукции>> оказывает положительное влияние на достижение подцели «увеличение контролируемой части

Применительно к рассматриваемому примеру в качестве проектов выступают различные варианты информатизации. В общем случае иерархия целей содержит как стимулирующие, так и угнетающие прямые и обратные связи между целями различных типов, что позволяет отразить многообразие взаимовлияний целей более полно, чем при использовании критериев. После построения иерархии эксперты количественно оценивают влияние подцелей, в том числе и проектов, на достижение непосредственных надцелей, используя методы парных сравнений либо непосредственного оценивания. На основании этой информации, а также структуры иерархии подцелей рассчитываются показатели относительной эффективности проектов. Такая технология построения иерархии целей позволяет действительно квалифицированно структурировать проблему, наметить промежуточные цели и превратить ее в базу знаний о проблеме, аккумулирующей знания экспертов именно в областях их действительной («проверенной временем>>) компетенции. Очевидно, напрашивается вопрос, для чего необходим ЛТР? ЛГУ решает стратегические вопросы: формулирует главную цель программы, выражая тем самым свой замысел. Кроме того, он, как правило, определяет подцели главной цели, решая оперативные задачи. Если к тому же он высокий профессионал в какой-нибудь узкой области (например, финансист), то может выступать в роли эксперта и при декомпозиции некоторой цели более низкого порядка, относящейся к области своей компетенции. Может возникнуть еще один вопрос: <<Нельзя ли, осуществив декомпозицию главной цели на ее непосредственные подцели, разделить сложную задачу на более простые, для которых полученные подцели являются главными?>> Как правило, нельзя, так как при этом не будут учитываться многие реально существующие связи между целями.

Какова же сложность иерархий целей? Ни одному человеку не под силу учесть большое (разрастающееся) количество связей при принятии решений. Однако современные ГК справляются с такого рода задачами. Построение в полном объеме иерархии достаточно трудоемко и дорого. Однако -- такой труд оправдывается соответствующим возникновением базы знаний для решения не одной управленческой задачи. Она может и должна использоваться для решения многих задач. Для этого предусматриваются средства связи вариантов решений (альтернатив) различных задач к иерархии целей. Можно, например, иерархию целей, построенную для выбора варианта информатизации, использовать для определения наилучшего в отношении той же главной цели варианта организации рекламной кампании, выбора типа продукции и т. д. Здесь изменится лишь содержание проектов и их связи с подцелями. Рассмотренные методы поддержки решений основаны на определении коэффициентов влияния экспертами или ЈШР. Однако разработаны методы поддержки принятия решений, адаптирующиеся к предыдущему опыту JIFIP. Необходимость такого подхода возникает при периодическом решении однотипных задач.

Поясним это на простом примере. Пусть вам, как руководителю, нужно выбрать одного из нескольких кандидатов и назначить его на вакантную должность, причем на подобных должностях у вас уже работает несколько сотрудников. Система предложит вам проранжировать этих сотрудников по степени успешности работы. Как правило, для руководителя это не составит труда, хотя в большинстве случаев будет затруднительно четко сформулировать критерий, по которому проводится ранжирование. Далее система предложит вам сформулировать частные критерии (профессионально важные качества), которые, по вашему мнению, определяют успешность работы на данной должности (например, добросовестность, обязательность, эрудиция, трудолюбие, коммуникабельность и т. д.) и проранжировать уже работающих на данной должности сотрудников по каждому из этих частных критериев. На основании этого система рассчитывает коэффициенты важности этих частных критериев, которые несут информацию о вашем опыте в принятии решения по данному кадровому вопросу. Далее вам следует проранжировать кандидатов на должность по каждому из частных критериев, и система, используя эти оценки и ранее рассчитанные коэффициенты значимости частных критериев, определит рейтинг каждого из кандидатов и предложит вам самого достойного кандидата. Нетрудно видеть, что эта же система поможет выбрать вам тип сетевого оборудования, исполнителя работ по информатизации вашей фирмы и т. д. Отметим, что такая система является вашим личным инструментом, поэтому в качестве частных критериев вы можете использовать и конфиденциальные. Исходя из изложенных принципов поддержки решений, представляется целесообразным определить три класса СШIР в зависимости от сложности решаемых задач и областей применения.

1. СГПТР первого класса, обладающие наибольшими функциональными возможностями, предназначены для применения в органах государственного управления высшего уровня (администрация президента, министерства) и органах управления больших компаний (совет директоров корпорации) при планировании крупных комплексных целевых программ для обоснования решений относительно включения в программу различных политических, социальных или экономических мероприятий и распределения между ними ресурсов на основе оценки их влияния на достижение основной цели программы. СГШР этого класса являются системами коллективного пользования, базы знаний которых формируются многими экспертами специалистами в различных областях знаний.

2. СГШР второго класса являются системами индивидуального пользования, базы знаний которых формируются непосредственным пользователем. Они предназначены для использования государственными служащими среднего ранга, а также руководителями малых и средних фирм для решения оперативных задач управления.

З. СППР третьего класса являются системами индивидуального пользования, адаптирующимися к опыту пользователя. Они предназначены для решения часто встречающихся прикладных задач системного анализа и управления (например, выбор субъекта кредитования, выбор исполнителя работы, назначение на должность и пр.). Такие системы обеспечивают получение решения текущей задачи на основе информации о результатах практического использования решений этой же задачи, принятых в прошлом. Кроме того, системы этого класса предназначены для использования в торговых предприятиях, торгующих дорогими товарами длительного пользования, в качестве средства «интеллектуальной рекламы>>, позволяющего покупателю выбрать товар на основе своего опыта применения товаров аналогичного назначения [15].

В компьютерном мире происходят удивительные события: люди одного поколения стали свидетелями стремительного прогресса в области вычислительной техники и программного обеспечения от программирования вычислительных задач в машинных кодах до современных ПЭВМ и конструирования сложных информационных систем в объектноориентированной среде, Такой же прогресс наблюдается и в прикладном программном обеспечении. По-видимому, в недалеком будущем обычными пользователями будут повседневно широко применяться системы, являющиеся интеллектуальными помощниками, в частности, системы поддержки принятия решений. Такие системы уже реально существуют.

2.2 Построение систем поддержки принятия решений

Подводя итог вышесказанному, система поддержки принятия решений (СГПIР) (англ. Decision Support System, DSS) компьютерная автоматизированная система, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности. возникли в результате слияния управленческих информационных систем и систем управления базами данных. Для анализа и выработки предложений в СПГIР используются разные методы, такие как: информационный поиск, интеллектуальный анализ данных, поиск знаний в базах данных, рассуждение на основе прецедентов, имитационное моделирование, генетические алгоритмы, нейронные сети и др. Некоторые из этих методов были разработаны в рамках искусственного интеллекта. Если в основе работы СПГЈР лежат методы искусственного интеллекта, то говорят об интеллектуальной СПГТ, или ИСППР[1]. Близкие к СПГIР классы систем это экспертные системы и автоматизированные системы управления. Современные СГПТР представляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятельности, являются инструментом, призванным оказать помощь лицам, принимающим решения (ЈШР). С помощью СШIР может производится выбор решений некоторых неструктурированных и слабоструктурированных задач, в том числе и многокритериальных, СШЈР, как правило, являются результатом мультидисциплинарного исследования, включающего теории баз данных, искусственного интеллекта, интерактивных компьютерных систем, методов имитационного моделирования. С момента появления первых разработок по созданию СШТР, не было дано четкого определения CTIFIP. Ранние определения СШТР (в начале 70-х годов прошлого века) отражали следующие три момента:

1. возможность оперировать с неструктурированными или слабоструктурированными задачами, в отличие от задач, с которыми имеет дело исследование операций;

2. интерактивные автоматизированные (то есть реализованные на базе компьютера) системы;

З. разделение данных и моделей.

Приведем возможные определения СГШР:

1. СГШР -- совокупность процедур по обработке данных и суждений, помогающих руководителю в принятии решений, основанная на использовании моделей. Далее уточнялось, что СГШР -- это интерактивные автоматизированные системы, помогающие лицу, принимающему решения, использовать данные и модели для решения слабоструктуризированных проблем.

2. - СГП1Р -- это система, которая обеспечивает пользователям доступ к данным и/или моделям, так что они могут принимать лучшие решения. [15]

Нужно признать, что и в настоящее время нет общепринятого определения СГТГЈР, поскольку конструкция CMIP существенно зависит от вида задач, для решения которых она разрабатывается, от доступных данных, информации и знаний, а также от пользователей системы. Можно привести, тем не менее, некоторые элементы и характеристики, общепризнанные, как части CTIFIP. СГШР -- в большинстве случаев это интерактивная автоматизированная система, которая помогает пользователю (JITIP) использовать данные и модели для идентификации и решения задач и принятия решений. Система должна обладать возможностью работать с интерактивными запросами с достаточно простым для изучения языком запросов.

СШТР обладает следующими четырьмя основными характеристиками:

1. СШТР использует и данные, и модели;

2. СГПП предназначены для помощи менеджерам в принятии решений для слабоструктурированных и неструктурированных задач;

З. Они поддерживают, а не заменяют, выработку решений менеджерами;

4. Цель СГШР -- улучшение эффективности решений.[18]

В 1978 были исчерпывающе описаны аспекты создания CTIFIP:

1. анализ;

2. проектирование;

З. внедрение;

4. оценка и разработка.

В 1981г. Robert Н. Bonczek, Clyde W. Holsapple и Andrew В. Whinston создали теоретические основы проектирования СГ[ГЈР. Они выделили четыре необходимых компонента, присущих всем СГШР:

1. Языковая система -- СППР может принимать все сообщения;

2. Система презентаций - СШТР может выдавать свои сообщения;

3. Система знаний -- все знания СГШР сохраняет;

4. Система обработки задач -- программный <<механизм>>, который пытается распознать и решать задачу во время работы СГПП.

На сегодняшний день выделяют четыре основных компонента СШIР:

1. информационные хранилища данных;

2. средства и методы извлечения, обработки и загрузки данных (ETL);

З. многомерная база данных и средства анализа в реальном времени (OLAP)*,

4. средства интеллектуального анализа данных (Data Mining).

Как понятно из описания, именно Data Mining отвечает в СГШР за интеллектуальный анализ данных, и, как следствие, именно Data Mining теоретически возможно реализовать, используя нейронные сети. Разберем этот термин подробней.

2.3 Data Mining

Data Mining (рус. Добыча Данных, интеллектуальный анализ Данных, глубинный анализ Данных) собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием ПятецкимШапиро в 1989 году. [20]

Однако существует более применимое в нашем случае определение: Data Mining - процесс аналитического исследования больших массивов информации с целью выявления определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных.[З] Этот процесс включает три основных этапа: исследование, построение модели или структуры и ее проверку. В идеальном случае, при достаточном количестве данных можно организовать итеративную процедуру для построения устойчивой (робастной) модели. В то же время, в реальной ситуации практически невозможно проверить экономическую модель на стадии анализа и поэтому начальные результаты имеют характер эвристик, которые можно использовать в процессе принятия решения.

Методы Data Mining приобретают все большую популярность в качестве инструмента для анализа экономической информации, особенно в тех случаях, когда предполагается, что из имеющихся данных можно будет извлечь знания для принятия решений в условиях неопределенности. В целом, системы Data Mining основываются на классических принципах разведочного анализа Данных и построения моделей и используют те же подходы и методы. [19]

Имеется, однако, важное отличие процедуры Data Mining от классического разведочного анализа Данных : системы Data Mining в большей степени ориентированы на практическое приложение полученных результатов, чем на выяснение природы явления. Иными словами, при Data Mining нас не очень интересует конкретный вид зависимостей между переменными задачи. Выяснение природы участвующих здесь функций или конкретной формы интерактивных многомерных зависимостей между переменными не является главной целью этой процедуры. Основное внимание уделяется поиску решений, на основе которых можно было бы строить достоверные прогнозы. Таким образом, в области Data Mining принят такой подход к анализу данных и извлечению знаний, который иногда характеризуют словами ”черный ящик“. При этом используются не только классические приемы разведочного анализа Данных, но и такие методы, которые позволяют строить достоверные прогнозы, не уточняя конкретный вид тех зависимостей, на которых такой прогноз основан.

2.4 Оценка возможностей нейронных сетей в системе поддержки принятия решений

Т.к. нейронные сети - это класс аналитических методов, построенных на (гипотетических) принципах обучения мыслящих существ и функционирования мозга и позволяющих прогнозировать значения некоторых переменных в новых наблюдениях по данным других наблюдений (для этих же или других переменных) после прохождения этапа так называемого обучения на имеющихся данных. Они являются одним из методов так называемой Data Mining.

При применении этих методов прежде всего встает вопрос выбора конкретной архитектуры сети (числа ”слоев” и количества ”нейронов” в каждом из них). Размер и структура сети должны соответствовать (например, в смысле формальной вычислительной сложности) существу исследуемого явления. Поскольку на начальном этапе анализа природа явления обычно не бывает хорошо известна, выбор архитектуры является непростой задачей и часто связан с длительным процессом “проб и ошибок“ (однако, в последнее время стали появляться нейронно-сетевые программы, в которых для решения этой трудоемкой задачи поиска ”наилучшей” архитектуры сети применяются методы искусственного интеллекта).

Затем построенная сеть подвергается процессу так называемого ”обучения”. На этом этапе нейроны сети итеративно обрабатывают входные данных и корректируют свои веса таким образом, чтобы сеть наилучшим образом прогнозировала (в традиционных терминах следовало бы сказать ”осуществляла подгонку“) данные, на которых выполняется ”обучение”. После обучения на имеющихся данных сеть готова к работе и может использоваться для построения прогнозов.

”Сеть”, полученная в результате “обучения”, выражает закономерности, присутствующие в данных. При таком подходе она оказывается функциональным эквивалентом некоторой модели зависимостей между переменными, подобной тем, которые строятся в традиционном моделировании. Однако, в отличие от традиционных моделей, в случае ”сетей” эти зависимости не могут быть записаны в явном виде, подобно тому как это делается в статистике (например, ”А положительно коррелировано с В для наблюдений, у которых величина С мала, а D - велика”). Иногда нейронные сети выдают прогноз очень высокого качества; однако, они представляют собой типичный пример нетеоретического подхода к исследованию (иногда это называют ”черным ящиком”). При таком подходе мы сосредотачиваемся исключительно на практическом результате в данном случае - на точности прогнозов и их прикладной ценности, - а не на сути механизмов, лежащих в основе явления, или соответствии полученных результатов какой-либо имеющейся ”теории".

Следует, однако, отметить, что методы нейронных сетей могут применяться и в таких исследованиях, где целью является построение объясняющей модели явления, поскольку нейронные сети помогают изучать данные на предмет поиска значимых переменных или групп таких переменных, и полученные результаты могут облегчить процесс последующего построения модели. Более того, сейчас имеются нейросетевые программы, которые с помощью сложных алгоритмов могут находить наиболее важные входные переменные, что уже непосредственно помогает строить модель.

Одно из главных преимуществ нейронные сетей состоит в том, что они, по крайней мере теоретически, могут аппроксимировать любую непрерывную функцию, и поэтому исследователю нет необходимости заранее принимать какие-либо гипотезы относительно модели, и даже - в ряде случаев - о том, какие переменные действительно важны. Однако, существенным недостатком нейронных сетей является то обстоятельство, что окончательное решение зависит от начальных установок сети и, как уже говорилось выше, его практически невозможно ”интерпретировать" в традиционных аналитических терминах, которые обычно применяются при построении теории явления.

Некоторые авторы отмечают тот факт, что нейронные сети используют или, точнее, предполагают использование вычислительных систем с массовым параллелизмом. Например Хайкинопределяет нейронную сеть как ”процессор с массивным распараллеливанием операций, обладающий естественной способностью сохранять экспериментальные знания и делать их доступными для последующего использования. Он похож на мозг в двух отношениях: (1) сеть приобретает знания в результате процесса обучения и (2) для хранения информации используются величины интенсивности межнейронных соединений, которые называются синаптическими весами"[17].

Однако большинство существующих нейросетевых программ работают на однопроцессорных компьютерах. По его мнению, существенное ускорение работы может быть достигнуто не только за счет разработки программного обеспечения, использующего преимущества многопроцессорных систем, но также путем разработки более эффективных алгоритмов обучения.

Таким образом, нейронные сети являются полноценным инструментом для реализации data mining в системе поддержки принятия решений.

Заключение

В ходе курсовой работы были исследованы системы поддержки принятия решений. Рассмотрена сущность поддержки принятия решений, возможные варианты реализации СГШР, сфера их применения.

Проанализировано понятие («нейронные сети>>, подробно рассмотрен способ реализации data mining при помощи нейронных сетей, функционал и основные формы их обучения.

Фактически нейронные сети исполняют основную функцию СППР интеллектуальный анализ, что является фундаментальной частью системы поддержки принятия решений. Остальное части исполняют функцию хранения, получения и передачу данных средствам интеллектуального анализа, что помогает ускорить обработку и обеспечивать своевременность обрабатываемой информации.

На текущий момент СГIПР активно используются многими мировыми ведущими производителями, банками, частично определяют векторы политических решений. Сложно судить, насколько это верный путь, однако практика показывает, что подобные системы работают, действительно облегчая жизнь лицам, принимающим решения.

Список использованных источников

1. Бабкин Э, Визгунов А, Куркин А, Козырев О. Общие принципы построения интеллектуальных систем поддержки принятия решений / Э. Бабкин, А. Визгунов, А. Куркин, О. Козырев -- Н. Новгород: Нижегородский государственный технический университет им. Р.Е. Алексеева, 2008 -- 225с.

2. Баин А. Современные информационные технологии систем поддержки принятия решений. -- М. : Издательский дом Форум, 2009. -- 239 с.

з. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: 0LAP и Data Mining. Сп6.:БХВПетербург,2ОО4. - 336с.

4. Вишнеков А, Курилова Н,Сафонова И, Штейнберг В. Многоцелевые задачи принятия проектных решений: Учебное пособие. /

А.В.Вишнеков, Н.С.Курилова, И.Е.Сафонова, В.И.Штейнберг - ИЭМ. - М., 2002. - 101 с.

5. Головко В. А. Нейронные сети: обучение, организация и применение. -- М.: ШТР- ЖР, 2001. -- 220 с.

6. Жданов А. Автономный искусственный интеллект / А. Жданов -- М.: БИНОМ. Лаборатория знаний, 2015 -- 359 с.

7. Каллан Р. Основные концепции нейронных сетей/ Р. Каллан; пер. с анг. -- М.: Издательский дом Вильямс, 2001. -- 291 с.

8, Ларичев О.И., Петровский А.В. Системы поддержки принятия решений. Современное состояние и перспективы их развития. // Итоги науки и техники. Сер. Техническая кибернетика. - Т.21. М.: ВШ-ШТИ, 1987 -- С. 131-164.

9. Люггер Д.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. -- М.: Издательский дом <<Вильямс», 2005. 864 с.

10. Осовский С. Нейронные сети для обработки информации / С. Осовский; пер. с польского И. Рудинский -- М.: Финансы и статистика, 2002. -- 344 с.

11. Сегаран Т. Программируем коллективный разум / Т. Сегаран; пер. с анг. А. Слинкин -- М.: Символ-плюс, 2012. -- 368с.

12. Тадеусевич Р, Боровик Б, Гончаж Т, Леппер Б. Элементарное введение в технологию нейронных сетей с примерами программ / Р. Тадеусевич Р, Б. Боровик, Т. Гончаж, Б. Леппер; пер. с анг. И. Рудинский -- М. : Горячая линия - телеком, 2011. -- 408 с.

13. Тархов Д. Нейросетевые модели и алгоритмы / Д. Тархов М.. Радиотехника, 2014 -- 352 с.

14. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика/

Ф. Уоссермен ; пер. с анг. Ю. А. Зуев, В. А. Точенов . -- М.: Мир, 1992 г. 184С.

15. Уринцов А, Дик В. Системы поддержки принятия решений / А. Уринцов, В. дик - М.: МЭСИ, 2008 - 245 с.

16. Форсайт Д. Компьютерное зрение. Современный подход. / Д. Форсайт; пер. с анг. А. Назаренко, И. Дорошенко -- М. : Издательский дом Вильямс, 2004. -- 928 с.

17. Хайкин С. Нейронные сети: Полный курс./ С. Хайкин; пер. с анг.

М. : Издательский дом Вильямс, 2006. -- 1 104с.

18. Черноруцкий И.Г. Методы принятия решений. -- СПб.: БХВПетербург, 2005. -- 41 бс.

19. Чубукова И. Data Mining. Учебное пособие - 2 изд./ И. Чубукова

М.: БУТОМ. Лаборатория знаний, 2008. -- 550с.

20, Data Mining (Методы добычи данных). Statsoft. [Электронный ресурс]. -- http://statsoft.ru/home/textbook/modules/stdatmin.html

Размещено на Allbest.ru


Подобные документы

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

  • Задача анализа деловой активности, факторы, влияющие на принятие решений. Современные информационные технологии и нейронные сети: принципы их работы. Исследование применения нейронных сетей в задачах прогнозирования финансовых ситуаций и принятия решений.

    дипломная работа [955,3 K], добавлен 06.11.2011

  • Анализ существующих решений системы поддержки принятия решений для корпоративной сети. Многоагентная система. Разработка концептуальной модели. Структура базы знаний. Разработка модели многоагентной системы на базе сетей Петри. Методика тестирования.

    дипломная работа [5,1 M], добавлен 19.01.2017

  • Классификация систем поддержки принятия решений. Сравнительный анализ методик для оценки рисков розничного кредитования. Структура системы поддержки принятия решений, формирование начальной базы знаний. Проектирование базы данных информационной системы.

    дипломная работа [1,9 M], добавлен 10.07.2017

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Классификация задач системы поддержки принятия решений, их типы и принципы реализации при помощи программы "Выбор". Обзор современных систем автоматизированного проектирования "Компас", "AutoCad", "SolidWorks", оценка преимуществ и недостатков программ.

    курсовая работа [1,4 M], добавлен 22.07.2014

  • Способы применения технологий нейронных сетей в системах обнаружения вторжений. Экспертные системы обнаружения сетевых атак. Искусственные сети, генетические алгоритмы. Преимущества и недостатки систем обнаружения вторжений на основе нейронных сетей.

    контрольная работа [135,5 K], добавлен 30.11.2015

  • Методы решения проблем, возникающих на стадиях и этапах процесса принятия решений, их реализация в информационных системах поддержки принятия решений (СППР). Назначение СППР, история их эволюции и характеристика. Основные типы СППР, области их применения.

    реферат [389,3 K], добавлен 22.11.2016

  • Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

    дипломная работа [814,6 K], добавлен 29.09.2014

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.