Непараметрическое адаптивное двухконтурное управление динамическими процессами при частичной неопределенности

Построение алгоритмов непараметрической идентификации и дуального управления для внешнего контура управления системами, имеющими типовой регулятор. Проверка их работоспособности методами статистического моделирования. Уровни априорной информации.

Рубрика Производство и технологии
Вид статья
Язык русский
Дата добавления 26.05.2017
Размер файла 389,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ФГАОУ ВПО «Сибирский федеральный университет»

Непараметрическое адаптивное двухконтурное управление динамическими процессами при частичной неопределенности

Раскина Анастасия Владимировна

Аннотация

В настоящей статье рассматривается задача, ориентированная на управление стохастическими объектами с дискретно-непрерывным характером технологического процесса в условиях частичной непараметрической неопределенности. В данном случае из априорной информации известна только глубина памяти исследуемого динамического процесса, при этом вид уравнения, описывающего данный процесс остается неизвестным. Основное внимание уделяется построению непараметрических алгоритмов адаптивного дуального управления для внешнего контура управления. Предлагаемый внешний контур предназначен для систем, в технологической цепочке которых уже функционирует типовой регулятор.

При решении данной проблемы использовались методы непараметрической теории идентификации, теории управления, теории адаптивных и обучающихся систем, математической статистики и статистического моделирования. В статье приводятся теоретические сведения о непараметрических алгоритмах управления в условиях неполной информации об управляемом процессе. Основное внимание уделяется построению непараметрических алгоритмов дуального управления.

Существенное отличие алгоритмов дуального управления от общепринятых состоит в том, что управляющее устройство выполняет две функции: изучение и управление в процессе активного накопления информации. Достаточно подробно изложены результаты вычислительного эксперимента, которые показывают, что при введении предложенной схемы существенно повышается качество управления, при этом в существующей системе управления действующие регуляторы сохраняются

Ключевые слова: адаптивные системы, непараметрические системы дуального управления, дискретно-непрерывные процессы, уровни априорной информации

Введение

Проблемы проектирования и исследования моделей динамических процессов, и создание интеллектуальных систем управления на их основе являются достаточно важными проблемами теории управления. В настоящее время, широко распространенными типами регуляторов при управлении различными процессами являются устройства управления, в основе которых лежит использование стандартных законов регулирования (П, ПИ, ПИД регуляторы и их разновидности). Следует отметить, что в ряде случаев качество управления при использовании подобных систем оказывается недостаточно эффективными.

В основном это вызвано двумя основными факторами. Во-первых, типовые регуляторы при формировании управления используют информацию об отклонении выходной величины от задающего воздействия, при этом данные о неуправляемых входных воздействиях, которые также влияют на выход процесса, при формировании управляющих воздействия часто не учитываются. Во-вторых, типовые регуляторы, не являются обучающими, адаптивными. Это означает, что при переводе объекта от одного задающего воздействия к другому, регулятор не будет улучшать своих рабочих характеристик. Это значительно увеличивает время перерегулирования, и как следствие, повышает возможность выхода за пределы технологического регламента.

Но и исключение из общей схемы управления типовых регуляторов в большинстве случаев не является целесообразным. Это связано с тем, что типовые регуляторы, широко используемые в промышленности, являются, в большинстве своем, аналоговыми, а, следовательно, наиболее надежными по сравнению с цифровыми устройствами. Следует отметить также, что в некоторые технологические объекты уже содержат в себе встроенные типовые регуляторы, демонтаж и замена которых не является целесообразными, так как требует привлечения дополнительных денежных средств.

В связи с этим, остается актуальным вопрос о разработке новых управляющих систем, позволяющих решить данные проблемы. С учетом вышеперечисленного представляется целесообразным ввести внешний контур управления, содержащий адаптивное управляющее устройства, которое в процессе функционирования, улучшает рабочие свойства управляющей системы. Основная задача данного устройства управления - это корректирование работы типового регулятора. Введение внешнего контура позволит повысить качество управления существующей системы, без вывода из эксплуатации функционирующих типовых регуляторов. Таким образом, качество управления технологическим процессом повышается без потери надежности общей системы управления и привлечения дополнительных средств.

На данном пути естественно использование теории адаптивных управляющих систем [1,9]. Но следует отметить, что вышеупомянутая теория предполагает предварительную параметризацию объекта. В случае недостатка априорной информации параметрическая теория неприемлема. В большинстве случаев, априорная информация о структуре модели объекта присутствует редко, только для узкого класса хорошо изученных процессов. В случае, когда информации недостаточно, целесообразно использовать теорию непараметрической системы управления [5,6]. Непараметрическая теория, в отличие от предыдущей, предполагает, что известны только качественные характеристики системы. Это означает, что использование данной теории позволяет полностью уйти от вопроса определения параметрической структуры объекта.

1. Уровни априорной информации

Различные уровни априорной информации при постановке задач управления подробно рассматривались А.А. Фельдбаумом [8]. Ниже мы остановимся только на трех уровнях априорной информации, предложенных Медведевым А.В. [7]:

- уровень параметрической неопределенности. Параметрический уровень априорной информации предполагает наличие параметрической структуры модели и некоторых характеристик случайных помех, обычными из них являются нулевое математическое ожидание и ограниченная дисперсия. Для оценивания параметров используются чаще всего разнообразные итеративные вероятностные процедуры [9].

- уровень непараметрической неопределенности. Непараметрический уровень априорной информации не предполагает наличие параметрической модели, но требует наличие некоторых сведений качественного характера о процессе, например, однозначность, либо неоднозначность его характеристик, линейность для динамических процессов либо характер его нелинейности. Для решения задач идентификации на этом уровне априорной информации (идентификация в «широком смысле» [5]) применяются методы непараметрической статистики.

- уровень параметрической и непараметрической неопределенности. Важными с точки зрения практики являются задачи идентификации многосвязных систем в условиях, когда объем исходной информации не соответствует ни одному из вышеописанных типов. Например, для отдельных характеристик многосвязного процесса на основании физико-химических закономерностей, энергетических, закона сохранения массы, балансовых соотношений могут быть выведены параметрические закономерности, а для других нет. Таким образом, мы находимся в ситуации, когда задача идентификации формулируется в условиях и параметрической, и непараметрической априорной информации [7]. Тогда и модели представляют собой взаимосвязанную систему параметрических и непараметрических соотношений.

2. Постановка задачи

В условиях параметрической и непараметрической неопределенности структура модели процесса может быть частично параметризована, то есть можно предположить, что исследуемый процесс описывается уравнением:

(1)

где f(.) неизвестный функционал, - выходная переменная процесса, - управляющие воздействие, - входная переменная процесса, m - известная «глубина» памяти [8], так или иначе найденная на основании имеющейся априорной информации. Здесь существенным является, что вид функционала не определен с точностью до вектора параметров. Следует отметить, что в данном случае, параметрическая структура рассматриваемого процесса нам известна с недостаточной точностью, но можно говорить о частичной параметризации модели исследуемого процесса Для изложения дальнейшего нам понадобится анализ следующей блок-схемы (рис.1).

На рисунке 1 приняты обозначения: (t) - непрерывное время, индекс t - дискретное время, - задающие воздействие для внешнего контура, - задающие воздействие для внутреннего контура, случайные помехи измерений , , соответствующих переменных процесса, - случайная помеха, действующая на процесс.

Контроль переменных осуществляется через интервал времени , Таким образом, можно получить исходную выборку «входных-выходных» переменных , где - объем выборки, индекс h у переменных объекта из соображения простоты опущен.

Рисунок 1 - Двухконтурная системы управления дискретно-непрерывными процессами

Примечательно в выше описанной схеме, что встроенный в систему управления регулятор сохранен, но добавлен внешний конур управления, несущий в себе черты обучаемости и дуализма. Предлагаемое устройство управление не будет заменять типовой регулятор (формирование управляющих входных воздействий продолжает осуществлять типовой регулятор). Разрабатываемое устройство управления будет введено как внешнее устройство по отношению к типовому регулятору.

3. Непараметрическое дуальное управление

В большинстве случаев априорной информации недостаточно, чтобы обосновано выбрать параметрическую модель исследуемого процесса. Поэтому приходится проводить серию экспериментов на объекте (часто длительных и дорогостоящих), чтобы качественно, с практической точки зрения, решить задачу идентификации. Недостаток априорной информации об объекте приводит к необходимости совмещать изучение объекта и управление им. При таком управлении управляющие воздействия носят двойственный характер. Они служат средством изучения, познавания объекта, но также и средством приведения объекта к требуемому состоянию. Такое управление, при котором управляющие воздействия носят двойственный характер, называют дуальным управлением [8].

Дуальное управление было открыто А.А. Фельдбаумом и развито на основе теории статистических решений [8]. Следует отметить, что обучающиеся системы управления являются системами «с памятью» т.е. они не только способны изучать характеристики объекта, но и, сохраняя их в памяти, вырабатывать рациональные управляющие воздействия. В дальнейшем значительное развитие получила теория дуального адаптивного управления для линейных стохастических систем с постоянными, но неизвестными параметрами [2, 4], а также были исследованы различные методы управления линейной дискретной системой с нестационарными случайными параметрами в присутствии помех [3]. Выше указанные методы и алгоритмы применимы для уровня параметрической неопределенности. В случае, когда структура динамического процесса не определена с точностью до вектора параметров, целесообразно применять теорию непараметрических систем управления, которая достаточно подробно изложена в [7].

Введем оператор объекта A, описывающий процесс, т.е., где - управляющие воздействие, - выходная переменная объекта. Если существует оператор, обратный A, т. е. , - единичный оператор, то

(2)

Таким образом, вид идеального регулятора (??-регулятор) [7] может быть представлен в форме (2). Задавая теперь траекторию x(t) = x*(t), находим из (2) идеальное значение u*(t). Основная проблема состоит в том, что в большинстве случаев операторы A и неизвестны. Поэтому встает вопрос о построении схемы управления, приближенной к идеальной.

Непараметрический алгоритм дуального управления, подробно описанный в [7] имеет вид:

, (3)

где - слагаемое, отвечающей за накопление информации об объекте, а - «изучающие» поисковые шаги. В этом и состоит дуализм алгоритма (3).

В условиях, когда параметрическая структура объекта может быть частично параметризована в качестве модели процесса может быть принята следующая непараметрическая оценка функции регрессии по наблюдениям

(4)

где - ядерная колоколообразная функция и коэффициент размытости ядра удовлетворяют некоторым условиям сходимости [7].

Параметр размытости определяется путем решения задачи минимизации квадратичного показателя соответствия выхода объекта и выхода модели, основанного на «методе скользящего экзамена», когда в модели (4) исключается i-я переменная из формулы (4), предъявляемая для экзамена:

(5)

Если же входная переменная представляет собой вектор, то для каждой компоненты необходимо найти свой параметр размытости . Однако если предварительно привести выборку значений вектора к одному интервалу, используя операции центрирования и нормирования, то параметр размытости можно принять скалярной величиной.

Если принять в качестве прямого оператора А выражение (4), то обратным оператором будет является выражение (6):

(6)

где ядерная колоколообразная функция вида . Выражение (6) является слагаемым из уравнения (6).

Проанализируем характер дуализма алгоритма (3). На начальной стадии управления основная роль принадлежит второму слагаемому из формулы (3). Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменных объекта. По мере процесса обучения (накопления информации) всё возрастающую роль при формировании управляющего воздействия начинает играть первое слагаемое, т.е. . Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели.

4. Численное исследование

Проверка работоспособности изложенных алгоритмов непараметрической идентификации и дуального управления осуществлялась методами статистического моделирования. Для вычислительного эксперимента был выбран объект, описывающийся уравнением вида:, где - выходная переменная процесса, - входная переменная процесса.

Отметим, что данное уравнение объекта нам необходимо для имитации потенциально реального процесса для проведения вычислительного эксперимента.

Пусть управление задано в виде уравнения: . Построим модель объекта с помощью непараметрической модели (4). Результаты моделирования представлены на рисунке 2:

Рисунок 2 - Результаты идентификации процесса при использовании модели (3)

На рисунке 2: - выход модели объекта. Относительная ошибка моделирования равна 0,015. В данном случае глубина памяти m является известной величиной. Как можно заметить из рисунка 2 и значения относительной ошибки моделирования непараметрическая модель (4) успешно справляется с задачей идентификации.

В следующем эксперименте величина помехи, действующей на объект составляет 5%. Управляющие воздействие задано в виде уравнения: . Результаты моделирования представлены на рисунке 3:

Рисунок 3 - Результаты идентификации процесса при использовании модели (4) при помехе, действующей на объект, равной 5 %

Относительная ошибка моделирования для данного эксперимента равна 0,089. Как можно заметить из рисунка 3 непараметрическая модель (4) успешно справляется с задачей идентификации даже при условии действия внешних помех на процесс.

Сравним результаты управления двухконтурной системы, содержащей непараметрический адаптивный регулятор (3) с системой управления, которая содержит только типовой регулятор, в качестве которого был выбран ПИ - регулятор. Объем выборки равен 100. Приведем работу двух систем управления при изменяющемся задающем воздействии (рисунок 4).

На рисунке 4 приняты следующие обозначения: - значение выходной переменной объекта, при управлении двухконтурной системой, содержащей непараметрический адаптивный регулятор, - значение выходной переменной объекта, при управлении ПИ - регулятором, - задающие воздействии. Ошибка регулирования в случае двухконтурной схемы равна 0,07, для ПИ-регулятора ошибка возрастает до 0,21.

Рисунок 4 -Сравнение двухконтурной системы управления и системы, содержащей типовой ПИ - регулятор при задающем воздействии в виде ступенчатой функции

Рассмотрим работу непараметрического дуального алгоритма управления подробнее. Обучение управлению начинается с первой триады наблюдений .На начальной стадии управления необходимо некоторое время (накопление выборки) для приведения объекта в заданное состояние, но уже на следующих этапах работы, алгоритм почти мгновенно достигает задания.

На рисунке 5 представлены графики задающих воздействий для ПИ - регулятора и задающие воздействие для двухконтурной схемы управления . Напомним, что задающие воздействие для типового ПИ регулятора формирует внешний контур управления, содержащий непараметрический адаптивный регулятор.

Как видно из рисунка 5, при переводе задающего воздействия для двухконтурной системы управления от одного значения к другому, непараметрический адаптивный регулятор изменяет задающее воздействие , что позволяет типовому ПИ- регулятору быстрее достигать желаемого значения выходной переменной, что в конечном итоге приводит к уменьшению время перерегулирования типового ПИ - регулятора.

Рисунок 5 - Задающие воздействие для двухконтурной системы управления и задающие воздействие для типового ПИ - регулятора при задающем воздействии в виде ступенчатой функции

идентификация управление регулятор информация

Заключение

В настоящей статье рассматривается проблема двухконтурного управления дискретно-непрерывными процессами в условиях параметрической и непараметрической неопределенности. Актуальность этой задачи обусловлена тем, что при управлении динамическими процессами, типовые регуляторы сохраняются, но добавляется внешний контур управления, что существенно улучшает качество управления системы в целом. Приведены модели и алгоритмы дуального управления, ориентированные на случай частичной непараметрической неопределенности, т.е. на случай, когда априорные сведенья об исследуемом объекте включают информации о глубине памяти динамического процесса.

Основное внимание уделяется построению двухконтурной непараметрической системы адаптивного дуального управления. В этой связи, обсуждается проблема дуализма при управлении стохастическими процессами. Достаточно подробно изложены результаты вычислительного эксперимента. Показано, что введение внешнего контура позволяет повысить качество регулирования процессом.

Список литературы

1. E Asarin, A Donzй, O Maler, D Nickovic, Parametric identification of temporal properties // Lecture Notes in Computer Science. - Springer - Runtime Verification. 2012. pp 147-160

2. Duan Lia, Fucai Qianb, Peilin Fuc. Optimal nominal dual control for discrete-time linear-quadratic Gaussian problems with unknown parameters // Automatica Volume 44, Issue 1, 2008. pp 119-127

3. Tse, E. Bar-Shalom, Y. An actively adaptive control for linear systems with random parameters via the dual control approach // Automatic Control, IEEE Transactions on. Volume:18 Issue:2, 2012. pp 623 - 627

4. Wenk, C.J. Bar-Shalom, Y. A multiple model adaptive dual control algorithm for stochastic systems with unknown parameters // Automatic Control, IEEE Transactions on. Volume:25 Issue:4, 2003. pp. 703-710

5. Медведев А.В. Теория непараметрических систем. Управление-1 // Вестник СибГАУ. - Краснорск: изд. СибГАУ, 2010. - № 4 (30). С. 4-9.

6. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ.- Краснорск: изд. СибГАУ, 2013.- №2(48). С.57-63.

7. Медведев А. В. Основы теории адаптивных систем. Красноярск. Изд. СибГАУ. 2015. С.525

8. Фельдбаум А.А. Основы теории оптимальных автоматических систем. Москва. Изд. Физматгиз. 1963. С. 552.

9. Цыпкин Я.З. Адаптация и обучение в автоматических системах. Москва. Изд. Наука, 1968. С. 400.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.