Использование нейродинамики для моделирования производственных процессов предприятия

Задача оптимизации с ограничениями. Системы с динамически-оптимальным управлением. Управляемая оптимальная динамика. Прогностическое управление на основе нейросетевой модели. Итерации в уравнениях Беллмана. Нейросетевая аппроксимация функции ценности.

Рубрика Экономико-математическое моделирование
Вид реферат
Язык русский
Дата добавления 17.03.2009
Размер файла 146,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Содержание

Введение3

1 Системы с динамически-оптимальным управлением

1.1 Классическая задача оптимизации с ограничениями

1.2 Управляемая оптимальная динамика

1.2.1 Программное управление

1.2.2 Прогностическое управление на основе нейросетевой модели системы

1.3 Прогнозирование на основе нейронных сетей

2 Нейродинамическое программирование

2.1 Итерации в уравнениях Беллмана

2.2 Нейросетевая аппроксимация функции ценности

3 Практическое применение

3.1 Задачи, решаемые на основе нейронных сетей

3.2 Пример прикладной разработки

Выводы

Введение

Одним из современных подходов к многошаговым проблемам служат приближенные методы поиска адаптационной стратегии, включающие аппроксимации функций оптимального поведения искусственными нейронными сетями. Общее семейство таких нейросетевых методов получило специальное название - нейродинамическое программирование.

Методы нейродинамического программирования не требуют построения прямых моделей среды, и позволяют системе начинать действовать, не дожидаясь завершения обучения.

1 Системы с динамически-оптимальным управлением

1.1 Классическая задача оптимизации с ограничениями

Пусть исследуемая система описывается набором (вектором) переменных x={s,a}, включающим переменные состояния и переменные, описывающие возможные целенаправленные изменения (управления) в системе. Пусть далее определена функция ценности (цели) F(x), которую желательно максимизировать.

В классической постановке эта оптимизация целиком выполняется во временной точке, без учета характера последующей динамики системы. В результате применения управлений система сразу переходит в окончательное состояние s(a), которое и оценивается целевой функцией. Задача оптимизации может формулироваться, например, следующим способом:

Найти а*, такое, что:

,

где А - множество допустимых управлений, определяемое ограничениями:

.

Постановки задач такого типа оказываются весьма содержательными на практике. Достаточно отметить, что даже “простейший” вариант этой задачи, в котором все функции предполагаются линейными, достаточен для формулирования большинства предметных задач исследования операций.

При описании задачи оптимизации предполагалось, что система мгновенно переходит в конечное состояние исключительно вследствие управляющих воздействий. Для задач, в которых существенна динамика системы, это является серьезным упрощением. Отказ от него приводит к проблеме поиска оптимальных динамических траекторий, которая относятся к классу задач оптимального управления.

1.2 Управляемая оптимальная динамика

1.2.1 Программное управление

Относительно просто может быть сформулирована так называемая задача программного управления. В ней предполагается, что управляющие сигналы воздействуют на систему на всем протяжении процесса, вплоть до достижения конечного состояния, однако эти сигналы не зависят от фактической траектории управляемой системы. Автомат программируется на следование некоторой, заранее синтезированной программе, которая выполняется независимо от того, что происходит с системой. Другими словами, система не наблюдается агентом-автоматом.

Математически задача программного управления формулируется, как задача поиска минимума функционала, который часто предполагается аддитивным:

Найти а*(t), такое, что:

,

где - множество допустимых управлений, определяемое ограничениями на всей траектории:

.

В выражении для оптимизируемого функционала выделен член, отвечающий оценке конечного (терминального) состояния системы. Изменение функции управления влечет за собой изменение траектории системы s(a(t)), поэтому и оптимальная траектория, и оптимальное управление должны определяться одновременно. Итерационное варьирование траектории или управления при поиске оптимума может быть затруднено, поскольку в отсутствии решения не ясно, какие вариации являются допустимыми.

Для численного решения задачи программного управления класс управлений ограничивают параметрическим семейством функций, и сводят задачу к конечномерной задаче поиска оптимальных значений параметров (т.е. к уже рассмотренной задаче оптимизации).

Представляет большой интерес возможность использования нейронной сети в качестве пробной функции, т.к. она обладает свойствами контролируемой гладкости и ограниченными производными.

1.2.2 Прогностическое управление на основе нейросетевой модели системы

Программное управление является приемлемым подходом во многих прикладных ситуациях. На этом принципе основаны, например, простые металлорежущие станки или бытовые стиральные машины. В этих случаях система полностью подчинена управлению.

В более сложных случаях поведение системы под воздействием программного управления может оказаться неустойчивым, и для его стабилизации необходима возможность наблюдения за системой (измерения состояния) и использования этой обратной связи в законе управления. Оптимальное управление с обратной связью так же, как и задачи оптимизации, имеет свою глубокую историю и многообразие постановок задач и методик их решения.

Рассмотрим один из подходов этого класса - прогностическое управление на основе модели (MPC-Model Predictive Control). Метод MPC особенно ценен по трем основным причинам:

- метод основан в явной форме на многошаговом поиске решения;

- в качестве базового инструмента может использоваться искусственная нейронная сеть, что повышает технологичность подхода;

- метод разработан для прямых промышленных приложений с большим коммерческим эффектом.

Алгоритмы MPC используют численную оптимизацию для нахождения оптимального управления на некотором временном горизонте в будущем, основываясь на модели процесса. В современных приложениях, таких, как очистка нефти, нефтехимия, целлюлозная и пищевая промышленность, отклик управляемой системы часто является существенно нелинейным. Это, наряду с более высокими ограничениями на качество продукта и увеличивающимися требованиями производительности, экологическими требованиями и, не в последнюю очередь, экономическими соображениями требует, чтобы система эксплуатировалась в режимах, близких к технологически допустимым границам. Это, в свою очередь требует разработки точных моделей не только для отклика системы, но и для ограничений.

Нейронные сети де-факто стали очень популярной методикой для моделирования нелинейной многомерной динамики систем, вследствие их уникальных аппроксимационных свойств.

Рисунок 1 - Прогностическое управление на основе модели динамики системы

MPC включает следующие шаги:

- нейронная сеть обучается на статистических данных и данных, полученных в результате испытаний управляемой системы в условиях программного управления. После обучения, нейронная сеть может использоваться для предсказания динамики системы при заданном законе управления на N последовательных шагов по времени (горизонт прогнозирования);

- на каждом шаге управления новое состояние системы измеряется в петле обратной связи;

- управляющие воздействия на последующих M шагах рассматриваются как неизвестные переменные. Набор этих переменных вместе с нейросетевой моделью отклика системы синтезируют теоретическую траекторию изменения состояния системы. Оптимальные значения управляющих переменных далее определяются итерационно путем минимизацией стоимости прогнозируемой траектории;

- только первое управляющее действие (из N последовательных значений управления) фактически применяется к управляемой системе. Далее алгоритм повторяется для следующего шага.

В рамках MPC-подхода могут быть рассмотрены две важные прикладные проблемы управления:

- адаптивное управление, при котором состояние управляемой системы следует заданной траектории. Целевая функция штрафует отклонение теоретической траектории от желательной траектории;

- оптимальное управление - нахождение траектории системы, ведущей к указанному множеству конечных состояний, вдоль которой стоимость управления минимальна. Стоимость может включать как прямые материальные затраты, так и косвенные требования к управлению (технологическое качество кривой управления, стоимость модификации управляющей системы, робастность, и т.д.).

MPC-подход не свободен от недостатков. В частности, могут возникать проблемы с устойчивостью, вызванные конечностью горизонта управления. Конечно, они стоят менее остро, чем при применении обычных линейных систем управления к существенно нелинейной системе, работающей в нескольких операционных режимах.

Требует также специального обоснования адекватность нейросетевой модели в условиях нехватки обучающих данных о системе.

1.3 Прогнозирование на основе нейронных сетей

Среди различных конфигураций искусственных нейронных сетей встречаются такие, при классификации которых по принципу обучения, строго говоря, не подходят ни обучение с учителем, ни обучение без учителя. В таких сетях весовые коэффициенты синапсов рассчитываются только однажды перед началом функционирования сети на основе информации об обрабатываемых данных, и все обучение сети сводится именно к этому расчету. С одной стороны, предъявление априорной информации можно расценивать, как помощь учителя, но с другой - сеть фактически просто запоминает образцы до того, как на ее вход поступают реальные данные, и не может изменять свое поведение, поэтому говорить о звене обратной связи с учителем не приходится. Из сетей с подобной логикой работы наиболее известны сеть Хопфилда и сеть Хэмминга, которые обычно используются для организации ассоциативной памяти. Далее речь пойдет именно о них.

Структурная схема сети Хопфилда состоит из единственного слоя нейронов, число которых является одновременно числом входов и выходов сети. Каждый нейрон связан синапсами со всеми остальными нейронами, а также имеет один входной синапс, через который осуществляется ввод сигнала. Выходные сигналы, как обычно, образуются на аксонах. Задача, решаемая данной сетью в качестве ассоциативной памяти, как правило, формулируется следующим образом. Известен некоторый набор двоичных сигналов (данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить («вспомнить» по частичной информации) соответствующий образец (если такой есть) или «дать заключение» о том, что входные данные не соответствуют ни одному из образцов.

Ассоциативность памяти нейронной сети Хопфилда не является единственным ее достоинством, которое используется на практике. Другим важным свойством этой архитектуры является уменьшение ее функции Ляпунова в процессе нейродинамики. Следовательно, нейросеть Хопфилда можно рассматривать, как алгоритм оптимизации целевой функции в форме энергии сети. Для сети Хопфилда число запоминаемых образов m не должно превышать величины, примерно равной 0,15· n.

Когда нет необходимости, чтобы сеть в явном виде выдавала образец, то есть достаточно, скажем, получать номер образца, ассоциативную память успешно реализует сеть Хэмминга. Данная сеть характеризуется, по сравнению с сетью Хопфилда, меньшими затратами на память и объемом вычислений.

Задача прогнозирования формализуется через задачу распознавания образов. Данных о прогнозируемой переменной за некоторый промежуток времени образуют образ, класс которого определяется значением прогнозируемой переменной в некоторый момент времени за пределами данного промежутка т.е. значением переменной через интервал прогнозирования. Метод окон предполагает использование двух окон Wi и W0 с фиксированными размерами n и m соответственно. Эти окна, способны перемещаться с некоторым шагом по временной последовательности исторических данных, начиная с первого элемента, и предназначены для доступа к данным временного ряда, причем первое окно Wi, получив такие данные, передает их на вход нейронной сети, а второе - W0 - на выход. Получающаяся на каждом шаге пара используется как элемент обучающей выборки (распознаваемый образ, или наблюдение).

Выделяются две возможности: одношаговое и многошаговое прогнозирование.

Многошаговое прогнозирование используется для осуществления долгосрочного прогноза и предназначено для определения основного тренда и главных точек изменения тренда для некоторого промежутка времени в будущем. При этом прогнозирующая система использует по-лученные (выходные) данные для моментов времени k+1, k+2 и т.д. в качестве входных данных для прогнозирования на моменты времени k+2, k+3 и т.д.

Одношаговое прогнозирование используется для краткосрочных прогнозов, обычно - абсолютных значений последовательности. Осу-ществляется прогноз только на один шаг вперед, но используется реальное, а не прогнозируемое значение для осуществления прогноза на следующем шаге.

Как было сказано выше, результатом прогноза на нейронных сетях является класс к которому принадлежит переменная, а не ее конкретное зна-чение. Формирование классов должно проводиться в зависимости от того каковы цели прогнозирования. Общий подход состоит в том, что область определения прогнозируемой переменной разбивается на классы в соответствии с необходимой точностью прогнозирования. Классы могут представлять качественный или численный взгляд на изменение переменной.

2 Нейродинамическое программирование

Применение описанного в предыдущем разделе подхода к оптимизации динамики системы ограниченно несколькими обстоятельствами:

- необходимость наличия адекватной математической модели управляемого объекта. В некоторых важных приложениях математической модели системы может и не быть, либо ее использование требует неприемлемых вычислительных ресурсов. Для наблюдения может быть доступна лишь локальная оценка управляющего решения, так называемое reinforcement или «подкрепление на шаге». Особенно ярко эта ситуация проявляется в автономных системах (роботы, автопилоты и т.д.). Поиск оптимального управления в них сопровождается экспериментальным исследованием окружения. При рассмотрении таких систем лучше говорить о задаче оптимальной адаптации;

- поиск многошагового оптимального управления путем прямой оптимизации возможен лишь в задачах с небольшим числом переменных и временных шагов. При увеличении числа состояний и возможных управлений сложность задачи оптимизации резко возрастает. Это явление названо Р. Беллманом «проклятием размерности»;

- в общем случае объект управления демонстрирует вероятностное поведение, которое может быть вызвано как неполнотой описания сложной системы, так и объективными характером процессов. Для представления вероятности перехода из состояния в состояние при заданном управлении могут использоваться Байесовы сети.

В подходе MPC задача оптимизации на каждом этапе решается заново, найденные оптимальные управления для прошлых состояний системы никак не используются. Выдающейся заслугой Р. Беллмана явилось открытие способа решения многошаговой задачи оптимизации, при котором эффективно используются ранее полученные оценки состояний системы, одновременно с этим большая задача разбита на серию более простых одношаговых задач, решаемых на каждом этапе.

Метод получил название «динамического программирования». Основная идея, проиллюстрирована на простом примере максимизации многомерной аддитивной функции с ограничениями, предложенном самим Р. Беллманом.

Решить задачу оптимизации:

,

при ограничениях

.

Здесь функции непрерывны g при неотрицательных х. Так как максимум F зависит только от числа элементов N в сумме (при сохранении порядка) и величины c обозначим его . Легко заметить, что для набора введенных функций f справедливо рекуррентное соотношение:

,

поскольку, по определению, величина описывает оптимальное значение для суммы из (N-1) упорядоченных слагаемых, а аргументы x и (c-x) гарантируют выполнение ограничений задачи. Рекурсия замыкается соотношением:

Таким образом, исходная многомерная задача оптимизации свелась к последовательности одномерных задач, которые можно рассматривать как многошаговый процесс поиска оптимума. В некоторых приложениях индексу N придается смысл дискретного времени.

2.1 Итерации в уравнениях Беллмана

Одним из прямых подходов к поиску оптимальной адаптации служит итерационное вычисление оценки позиции (value iteration).

.

Здесь состояние s' находится на допустимой траектории, ведущей из состояния s при применении действия р(s) в данной стратегии. Если получена оценка состояний в выбранной стратегии, то ее можно использовать для улучшения самой стратегии (policy iteration). А именно, гарантированно более ценной стратегией будет стратегия:

.

При разработке алгоритмов, шаги оценивания стратегии и ее уточнения могут чередоваться. В дискретном случае возникающие при прямом итерировании уравнения Беллмана трудности, в основном, связаны с практическим обеспечением сходимости за интересные времена вычислений. Неизвестные величины цены состояния могут представляться в виде векторов, а вероятности переходов - в виде матриц. В частности, соотношения для оценивания стратегии могут рассматриваться, как система линейных уравнений:

,

а задача вычисления оценки позиции может быть сформулирована, как задача решения линейных неравенств типа:

,

с дополнительными требованиями максимальности оценок.

2.2 Нейросетевая аппроксимация функции ценности

Табличное представление цен действий и состояний задачи имеет естественные ограничения по масштабируемости задачи на большую размерность. В дискретных моделях, имеющихся в литературе, число измерений весьма редко превосходит дюжину. Выход состоит в поиске приближенных аппроксимаций функций задачи.

Имеются два важных условия, влияющих на эффективность выбираемых алгоритмов аппроксимации. Во-первых, алгоритм должен основываться на функциях, обладающих богатыми возможностями по аппроксимации, и во-вторых, для выбранного алгоритма должны существовать масштабируемые алгоритмы выбора параметров аппроксимаций. Эти два требования часто являются противоречащими друг другу - богатый набор аппроксимирующих функций обычно связан с большим числом свободных параметров.

Искусственные нейронные сети являются весьма естественным инструментом для приближенного представления оценок состояний при росте размерности. Однако в стандартной постановке задача аппроксимации нейронной сетью рассматривается, как задача обучения с учителем, т.е. с использованием обучающих пар «вектор аргументов - значение аппроксимируемой функции».

В задаче аппроксимации ценности состояния или «правильные» обучающие значения отсутствуют - они являются решением задачи оптимизации, которую как раз предстоит решить. Это обстоятельство вносит новый, принципиальный уровень сложности в постановку задачи, а именно, оптимальное решение задачи, содержащей приближения в оптимизируемом функционале на классе выбранных аппроксимаций не обязано существовать, а если решение приближенной задачи все-таки существует, оно не обязано приближать собой решение исходной точной задачи.

На практике это приводит к тому, что приходится довольствоваться суб-оптимальными стратегиями, представленными аппроксимациями, и эти стратегии весьма расширительно трактуются, как приближенные решения задачи оптимальной адаптации (управления). Семейство приближенных алгоритмов, основанных на нейросетевых методах аппроксимации функций оценки состояний в многошаговых задачах принято называть нейродинамическим программированием.

Рассмотрим вначале, как может быть построено обучение нейронной сети в случае задачи итерационного вычисления цены состояния. Алгоритм value iteration состоит в поиске неподвижной точки уравнения типа V=g(V) методом простой итерации. Операция присваивания нового итерационного значения в случае нейросетевой аппроксимации не может быть применена непосредственно, и должна быть заменена некоторой операцией изменения весовых коэффициентов нейронной сети.

Простые варианты наталкиваются на методические сложности. Например, операцию присваивания можно было бы заменить одним шагом градиентного уменьшения ошибки:

,

который приводит к следующим формулам обновления весов нейронной сети с некоторым шагом:

.

Хотя эти соотношения представляются весьма естественными, имеется несколько серьезных контрпримеров, указывающих на отсутствие сходимости такого алгоритма даже в случае простых линейных аппроксимаций. Причина кроется в потере свойства безусловной сжимаемости отображения, в котором используется аппроксимация. Несмотря на то, что в литературе было предложено много практически полезных способов стабилизации итераций, общий вывод таков - локальные методы value iteration с аппроксимацией функции ценности, в общем случае, не сходятся.

Идея решения проблемы со сходимостью состоит в использовании для вычисления функции цены состояния глобальной информации о траектории из состояний, которые «посещались» системой. Семейство алгоритмов, основанных на этом подходе, получило название «методы разностей по времени» (temporal difference methods, TD(л)). В современном виде теория TD(л) сформулирована Sutton и Barto.

В дискретном случае алгоритмы с разностями по времени обходят (частично) также и другое ограничение методов value iteration, а именно, они являются online-алгоритмами и не требуют для новых приближений посещения всех состояний. Обучение происходит отдельными траекториями (эпизодами). В простейшей трактовке, если происходит изменение в оценке некоторого состояния, это изменение отражается и на предыдущих состояниях. Обновление оценки происходит синхронно.

Наиболее просто алгоритм формулируется в случае дискретных состояний. Предполагается, что если оценка текущего состояния после шага уточняется на величину дV, то оценка предыдущего состояния должна быть уточнена на лдV, состояния перед ним - на л2дV и т.д. Для накопления информации об истории состояний отводится специальная память (eligibility trace).

.

В этом алгоритме используемая стратегия р(s) может быть постоянной, в этом случае вычисляется функция оценки состояний относительно этой стратегии. Альтернативно, стратегия может быть выбрана жадной по отношению к текущей оценке V, в таком случае алгоритм оценивает значение оптимальной стратегии V*. На практике сходящееся решение достигается для е-жадных стратегий, в которых с вероятностью е предпринимается случайное действие, а в остальных случаях - жадное (максимизирующее текущее значение V).

Приведенный алгоритм обобщается на вариант с нейросетевой аппроксимацией функции оценки. Шаги внутреннего цикла имеют вид:

.

Заметим, что вектор «следа памяти» определен здесь для каждого параметра нейросетевой модели , а не для набора состояний (как в дискретном случае). К сожалению, точных результатов о сходимости алгоритмов TD(л) с аппроксимациями известно мало.

3 Практическое применение

3.1 Задачи, решаемые на основе нейронных сетей

Признаки, которыми должна обладать задача, чтобы применение нейронных сетей было оправдано и нейронная сеть могла бы ее решить:

- отсутствует алгоритм или не известны принципы решения задач, но накоплено достаточное число примеров;

- проблема характеризуется большими объемами входной информации;

- данные неполны или избыточны, зашумлены, частично противоречивы.

Таким образом, нейронные сети хорошо подходят для распознавания образов и решения задач классификации, оптимизации и прогнозирования. Ниже приведен перечень возможных промышленных применений нейронных сетей, на базе которых либо уже созданы коммерческие продукты, либо реализованы демонстрационные прототипы.

Банки и страховые компании:

- автоматическое считывание чеков и финансовых документов;

- проверка достоверности подписей;

- оценка риска для займов;

- прогнозирование изменений экономических показателей.

Административное обслуживание:

- автоматическое считывание документов;

- автоматическое распознавание штриховых кодов.

Нефтяная и химическая промышленность:

- анализ геологической информации;

- идентификация неисправностей оборудования;

- разведка залежей минералов по данным аэрофотосъемок;

- анализ составов примесей;

- управление процессами.

Военная промышленность и аэронавтика:

- обработка звуковых сигналов (разделение, идентификация, локализация, устранение шума, интерпретация);

- обработка радарных сигналов (распознавание целей, идентификация и локализация источников);

- обработка инфракрасных сигналов (локализация);

- обобщение информации;

- автоматическое пилотирование.

Промышленное производство:

- управление манипуляторами;

- управление качеством;

- управление процессами;

- обнаружение неисправностей;

- адаптивная робототехника;

- управление голосом.

- служба безопасности:

- распознавание лиц, голосов, отпечатков пальцев.

Биомедицинская промышленность:

- анализ рентгенограмм;

- обнаружение отклонений в ЭКГ.

Телевидение и связь:

- адаптивное управление сетью связи;

- сжатие и восстановление изображения.

Представленный перечень далеко не полон. Ежемесячно западные средства массовой информации сообщают о новых коммерческих продуктах на базе нейронных сетей. Так, фирма LIAC выпускает аппаратуру для контроля качества воды. Нейросистемы фирмы SAIC находят пластиковые бомбы в багаже авиапассажиров. Специалисты инвестиционного банка Citicomp (Лондон) с помощью программного нейропакета делают краткосрочные прогнозы колебаний курсов валют.

3.2 Пример прикладной разработки

Пример успешного использования методов многошагового обучения для задачи управления производством. Рассмотрим простейший вариант, когда производится лишь один товар с фиксированной ценой Z, и автоматическая система вырабатывает оптимальную последовательность решений . Три варианта решений соответствуют покупке сырья (long), пассивному ожиданию и, соответственно, продаже (short) продукции. При этом, для простоты, будем считать, что объем каждой сделки фиксирован. В момент свершения эта сделка не изменяет ни стоимости сырья, ни стоимости произведенной продукции, однако она вредно или полезно сказывается на ценах на ресурсы или продукцию в будущем.

Данная система может следовать некоторой параметрической модели:

.

Здесь и - обучаемые параметры, - дополнительные внешние переменные в соответствующие моменты времени (например, индекс инфляции и др.). Соотношение для дохода, получаемого системой за T шагов, имеет вид:

,

где х - объем сделки;

- прибыль от реализации единицы товара в момент времени t.

Возможны другие соотношения для прибыли предприятия, учитывающие, например частичное реинвестирование прибыли.

Цель данной системы может формулироваться, как достижение максимальной прибыли. На практике, в соответствии с представлениями в области финансов, принято оптимизировать величину отношения средней прибыли к ее дисперсии (отношение Шарпа). Для целей применения методик многошаговой оптимизации в работе был предложен дифференциальный вид отношения Шарпа.

Схожий алгоритм многошагового обучения был применен торговой системой (портфели финансовых активов) для торговли на среднемесячных значениях индекса S&P 500. В модели использовались дополнительно еще около 80 временных рядов (как макроэкономических, так и финансовых). Для стартового обучения трейдер-системы использовались исторические данные за 1950-1969 г. В игровом режиме система проверялась на 25-летнем промежутке с 1970 по 1994 г. Полученное соотношение Шарпа составило величину 0.83 в год. Для сравнения стратегия «купи и держи» дает на этом растущем рынке значение 0.34 в год, в качестве безрисковых активов рассматривались годовые векселя казначейства США (US Treasure Bills).

Авторы отмечают, что торговая система, основанная на алгоритмах нейродинамического программирования, принимала весьма качественны решения в периоды нефтяного кризиса в 1974, финансовых проблем начала 80-х, рыночных поправок 1984 г. и обвала рынка в 1987 г.

Выводы

Исходя из вышеизложенного, можно заключить, что для решения задач прогнозирования наиболее подходит сеть с обратным распространением. Она позволяет формальным образом обучить сеть прогнозировать изменение требования на основе исторических данных о требовании.

Для общего случая, когда описание поведения сети задано в виде набора векторов возможных состояний, поиск синаптических весов сводится к решению соответствующей системы нелинейных уравнений. Такое решение было впервые найдено Хопфилдом. Появление этой работы около 10 лет назад продемонстрировало эффективность применения аналитических методов для интерпретации поведения нейронных сетей и привело к разработке проекционного алгоритма, позволяющего вычислять значения синаптических весов, сократив тем самым затраты времени на обучение.

Прогнозирование на основе нейронных сетей обладает рядом недостатков. Необходимо как минимум 50 и лучше 100 наблюдений для создания приемлемой модели. Это достаточно большое число данных и существует много случаев, когда такое количество исторических данных недоступно. Например, при производстве сезонного товара, истории предыдущих сезонов недостаточно для прогноза на текущий сезон, из-за изменения стиля продукта, политики продаж.

Даже при прогнозировании требования на достаточно стабильный продукт на основе информации о ежемесячных продажах, в некоторых случаях накопить историю за период от 50 до 100 месяцев. Для сезонных процессов проблема еще более сложна. Каждый сезон истории фактически представляет собой одно наблюдение. То есть, в ежемесячных наблюдениях за пять лет будет только пять наблюдений за январь, пять наблюдений за февраль и т.д. Может потребоваться информация за большее число сезонов для того, чтобы построить се-зонную модель. Однако, необходимо отметить, что существует возможность постро-ить удовлетворительную модель даже в условиях нехватки дан-ных. Модель может уточняться по мере того, как свежие данные становится доступными.

Другим недостатком нейронных моделей - значительные затраты по времени и другим ресурсам для построения удовлетворительной модели. Эта проблема не очень важна, если исследуется небольшое число временных последовательностей. Тем не менее, обычно прогнозирующая система в области управления производством может включать от нескольких сотен до нескольких тысяч временных последовательностей.

Однако, несмотря на перечисленные недостатки, модель обладает рядом достоинств. Существует удобный способ модифицировать модель по мере того как появляются новые наблюдения. Модель хорошо работает с временными последовательностями, в которых мал интервал наблюдений, т.е. может быть получена относительно длительная временная последовательность. По этой причине модель может быть использована в областях, где нас интересуют ежечасовые, ежедневные или еженедельные наблюдения. Эти модели также используются в ситуациях, когда необходимо анализировать небольшое число временных последовательностей.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.