Сингулярный спектральный анализ последовательностей данных на этапе эксплуатации имитационной модели

Исследование погрешности восстановления аддитивных составляющих временного ряда методом сингулярного спектрального анализа. Разработка формальной и построение имитационной модели системы. Испытание модели в составе комплексной информационной системы.

Рубрика Экономико-математическое моделирование
Вид статья
Язык русский
Дата добавления 27.05.2018
Размер файла 294,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

сингулярный спектральный анализ последовательностей данных на этапе эксплуатации имитационной модели

УДК 519.61+519.876.5:004

Е.А. Якимов, О.М. Демиденко, А.И. Якимов

Представлены методика и результаты исследования погрешности восстановления аддитивных составляющих временного ряда методом сингулярного спектрального анализа. Даны рекомендации по практическому применению сингулярного спектрального анализа в имитационном моделировании на этапе эксплуатации имитационных моделей.

Ключевые слова: сингулярный спектральный анализ, имитационная модель, комплексная информационная система, временной ряд.

В настоящее время актуальным направлением совершенствования деятельности предприятия является использование имитационной модели (ИМ) в контуре управления. Построение имитационной модели реализуется последовательным выполнением следующих этапов [1]:

Этап 1. Разработка содержательного описания исследуемой системы и объектов в системе по результатам работы с заказчиком и экспертами в соответствии с целью моделирования.

Этап 2. На основе содержательного описания разрабатывается концептуальная модель с использованием, например, методологии функционального моделирования в нотации IDEF0.

Этап 3. Разработка формальной и построение имитационной модели системы. При этом IDEF0 используется не только для формализации системы, но и для изучения и анализа выполняемых ею функций, для описания имитационной модели, проработки вопросов синхронизации процессов и их взаимодействия с управляющей программой моделирования, задания начальных условий, организации сбора статистики и окончания имитации.

Этап 4. Программирование и отладка имитационной модели на основе концепции объектно-ориентированного программирования, что позволяет создавать библиотеку моделей объектов системы, расширять их функциональные возможности.

Этап 5. Испытание и исследование модели в составе комплексной информационной системы (КИС) предприятия, что требует разработки программного обеспечения для интеграции ИМ с КИС в реальных условиях производства для подготовки актуальных исходных данных, проведения экспериментов при решении поставленных задач.

Этап 6. Эксплуатация имитационной модели. Предполагает длительное использование ИМ в контуре управления промышленным предприятием. При этом на основе ИМ формируются управляющие решения, реализация которых приводит к изменению параметров и структуры системы, что, в свою очередь, требует доопределения ИМ и обеспечения ее актуальными исходными данными.

Эксплуатация имитационных моделей в производственных условиях затруднена отсутствием методов обработки накопленных данных и подготовки их для использования в моделях [2]. Эффективная подготовка входных данных для имитационного моделирования становится возможной при использовании данных, накопленных в информационных системах организаций. Для этого, например, разработан программный инструментарий, который позволяет подключаться к базе данных и извлекать их, представляя в CMSD - формате (CMSD - Core Manufacturing Simulation Data), пригодном для дискретно-событийных моделей [3].

В имитационном моделировании в основном используются статистические методы оценки последовательностей данных. В работе [4] представлен анализ программных средств для определения закона распределения случайных величин, используемых для ввода в имитационную модель (например, программа StatFit имеет 32 различных распределения, BestFit имеет 37 распределений вероятности, ExpertFit [5] имеет 40 распределений). Для наиболее точного определения типа распределения данных используются обобщенные законы распределения Пирсона, Джонсона и др. В последнее время все более часто применяются методы извлечения информации, основанные на искусственных нейронных сетях с использованием нечетких множеств и нечеткой логики, кластерном анализе и др. В то же время отсутствуют сведения о применении в имитационном моделировании сингулярного спектрального анализа (SSA - Singular Spectrum Analysis) последовательностей числовых данных, который позволяет получить дополнительную информацию о структуре данных разложением исходной последовательности на трендовую, периодическую и шумовую составляющие [6].

Содержательное описание SSA. Данные в комплексной информационной системе, представленные вещественными числами и определенные последовательно во времени, именуют временной последовательностью данных. В общем случае такую последовательность числовых данных, обычно упорядоченных во времени, называют временным рядом. При исследовании SSA трендом полагают медленно меняющуюся составляющую, описывающую глобальное поведение ряда. Под шумовой составляющей ряда понимают реализацию случайной последовательности чисел. Сингулярный спектральный анализ временных рядов включает следующие этапы: вложение, сингулярное разложение, группировку, диагональное усреднение. Чтобы выделить аддитивную составляющую ряда длины n (, причем , и - соответственно трендовая, гармоническая и шумовая составляющие), SSA-методом по ряду строится траекторная матрица заданного размера , , ( называется длиной окна), которая по правилам построения является ганкелевой. Для матрицы вычисляются решением характеристического уравнения собственные числа , а также левые и правые ортонормированные собственные векторы . Матрица сингулярным разложением представляется в виде , . Обозначим корень собственного числа матрицы через . Наборы группируются для получения трендовой, гармонической и шумовой составляющих. Соответственно определяются матрицы , , . После диагонального усреднения матриц , , получают восстановленные аддитивные составляющие , , . Если , и заданы известными функциями соответственно , и известен закон распределения , то можно оценить показатели ошибки восстановления , и тип распределения восстановленной шумовой составляющей . Показатели погрешности восстановления определяются характеристиками положения (математическое ожидание, оцениваемое средним (мean); медиана (мed)) и характеристиками рассеяния (среднеквадратическое отклонение, оцениваемое стандартным отклонением (s); максимум (мax); минимум (мin), диапазон (range)) [7].

Методика исследования. Исследование сингулярного спектрального анализа временных рядов с комплексным применением информационных технологий основано на использовании табличного процессора MS Excel, математического пакета Mathcad, пакета статистической обработки данных Statistica и отличается применением сдвиговых процедур при формировании ганкелевой матрицы на этапе вложения и при восстановлении составляющих исходного временного ряда на этапе диагонального усреднения [8]. На этапе группировки наборов в MS Excel используется лепестковая диаграмма, которая является аналогом графика в полярной системе координат, отображая распределение значений относительно начала координат. По особенностям представления сингулярных векторов на лепестковой диаграмме принимается решение о принадлежности их одной группе (рис. 1 и 2).

Рис. 1. Лепестковая диаграмма вектора тренда

Рис. 2. Лепестковая диаграмма вектора шума

имитационный спектральный сингулярный погрешность

Исследования проведены для детерминированных числовых последовательностей и последовательностей, содержащих шумовую составляющую.

Для оценивания результатов исследования каждой из составляющих временного ряда используется сумма модулей значений элементов временного ряда, которая именуется Ц-оценкой соответственно для трендовой, гармонической и шумовой составляющих:

,

где - значение i-го элемента M-й составляющей временного ряда; n - длина временного ряда (n = 43); T, H, N - соответственно трендовая, гармоническая и шумовая составляющие.

При анализе временных рядов и сравнении результатов SSA-преобразований используются относительные ц-оценки, определяемые соответственно для трендовой, гармонической и шумовой составляющих:

.

Принятые ц-оценки характеризуют соотношение между значениями составляющих временного ряда. Аналогично Ц-оценкам и относительным ц-оценкам составляющих временного ряда приняты оценки для сингулярной последовательности собственных чисел:

;

,

где k - количество собственных чисел.

В практике имитационного моделирования случайные последовательности определяются типами непрерывных распределений, относящимися к различным классам. При нормальном распределении случайная величина принимает значения на положительной и отрицательной полуосях, экспоненциальное распределение относится к классу распределений с возможными значениями на положительной полуоси, равномерное - к классу распределений с возможными значениями на ограниченном интервале. Проверка соответствия полученных в ходе преобразования случайных чисел известному типу распределения выполнена по критерию Колмогорова - Смирнова (p = 0,01).

Результаты исследований и их обсуждение. Проведены исследования, получены оценки и выявлены особенности погрешности восстановления временного детерминированного ряда , образованного функциями , - параметры, . Относительная ошибка восстановления тренда составляет 2,3%, гармонической составляющей - 14,3 %. При анализе результатов обнаружено, что абсолютная ошибка восстановления тренда и гармонической составляющей для начальных и конечных значений ряда имеет наибольшие значения (рис. 3 и 4).

Рис. 3. Распределение абсолютной ошибки восстановления гармоники

Рис. 4. Распределение абсолютной ошибки восстановления тренда

При исследовании методом сингулярного спектрального анализа временных рядов показано, что шумовая составляющая восстановленного ряда для равномерного, экспоненциального и нормального распределений смещается в сторону нуля на величину математического ожидания шумовой составляющей исходного ряда с погрешностью до 6% и возрастает до 30% при росте дисперсии шума исходного ряда до 25 раз. Стандартное отклонение шумовой составляющей восстановленного ряда отличается от исходного на 7-9% во всех случаях.

Показано, что восстановление гармонической составляющей затруднено при наличии значительной шумовой составляющей. Например, в исследованиях рассматривается временной ряд с соотношением цл-оценок цлT : цлH : цлN = 28,6 : 1,0 : 10,5, т. е. шум на порядок превышает гармоническую составляющую. При этом восстанавливается лишь количество периодов, максимальная абсолютная ошибка превышает амплитуду гармонической составляющей более чем в два раза.

Для проверки соответствия восстановленных случайных величин теоретическому распределению используется критерий Колмогорова - Смирнова. Критическое значение Дp для наибольшего отклонения эмпирического распределения от теоретического при p = 0,01 и n = 43 равно 0,24332. Поскольку наблюдаемое значение во всех случаях меньше критического, гипотеза H0 об известном распределении восстановленных случайных величин принимается.

Важным результатом исследования является вывод о независимости качества восстановления составляющих временного ряда от величины постоянной составляющей исходного временного ряда. Однако следует заметить, что при нулевой постоянной составляющей (GTC = 0) не удается восстановить динамическую составляющую тренда исходного временного ряда (рис. 5 и 6).

Рис. 5. Показатели ошибки ДFH(x) восстановления

Рис. 6. Показатели ошибки ДFT(x) восстановления

Исследовано влияние процедуры сжатия/растяжения (пропорциональное уменьшение/увеличение) значений элементов временного ряда на качество восстановления его составляющих методом сингулярного спектрального анализа.

Утверждение. Изменение элементов временного ряда пропорционально величине изменяет показатели (характеристики положения: среднее (mean), медиана (med); характеристики рассеяния: стандартное отклонение (s), максимум (max), минимум (min), диапазон (range)) погрешности восстановления аддитивных трендовой , гармонической и шумовой составляющих () методом сингулярного спектрального анализа также пропорционально величине .

Доказательство. Пусть временной ряд , причем , и заданы известными функциями соответственно , и известен закон распределения . Методом сингулярного спектрального анализа по ряду построена ганкелева матрица заданного размера . Для матрицы вычисляют решением характеристического уравнения собственные числа , а также левые и правые векторы [6], формируя разложение , . Определены матрицы , , . После диагонального усреднения матриц , , получены восстановленные аддитивные составляющие , , , что позволяет оценить показатели ошибки восстановления , и восстановленной шумовой составляющей .

Пусть далее , тогда и , или . Решением характеристического уравнения находят собственные числа , причем , и тогда . При этом определяют левые и правые векторы , формируя разложение , . Определены матрицы , , .

После диагонального усреднения матриц , , получены восстановленные аддитивные составляющие , , , что позволяет оценить показатели ошибки восстановления , и восстановленной шумовой составляющей . Заметим, что ==, т. е. , , . Тогда становится очевидным, что =.

Аналогично =. Соответственно шумовая составляющая . По определению показателей погрешности восстановления, задаваемых характеристиками положения (математическое ожидание, оцениваемое средним (mean); медиана (med) [8]) и характеристиками рассеяния (среднеквадратическое отклонение, оцениваемое стандартным отклонением (s); максимум (max); минимум (min); диапазон (range) [8]), доказывается исходное утверждение.

Доказательство закончено.

Таким образом, исследован нормированный временной ряд, определяемый по формуле . Здесь - среднее элементов xi, i = 0, …, n-1, временного ряда G; - коэффициент сжатия/растяжения (параметр б определяется наибольшим по модулю значением элемента ряда ); - нормирующий параметр масштаба, определяемый верхней границей исследуемых значений элементов нормированного временного ряда (как правило, или (определяется исследователем)); - параметр сдвига элементов временного ряда в область положительных вещественных чисел, [9].

Полученные результаты в области практического применения метода SSA ориентированы для применения в различных предметных областях, где естественно предположить существование тренда и/или периодическое поведение, и направлены на выявление особенностей в своей предметной области. Однако прежде всего результаты исследований направлены на повышение эффективности эксплуатации имитационных моделей на функционирующих предприятиях с развитой комплексной информационной системой, в которой накапливаются данные о разных сторонах функционирования предприятия в виде вещественных чисел. При этом в первую очередь полученные результаты ориентированы на имитационные модели случайных процессов. Эффективная подготовка входных данных для имитационного моделирования, построение моделей данных, подчиняющихся определенным зависимостям, повышает эффективность эксплуатации имитационных моделей. Поэтому в работе основное внимание уделено оценке погрешности восстановления трендовой, гармонической и шумовой составляющих SSA-методом.

Следует отметить, например, что проблема управления системами централизованного теплоснабжения охватывает широкий комплекс взаимосвязанных вопросов, касающихся технической политики в области развития систем, их оптимального проектирования и управления режимами работы в процессе эксплуатации. В имитационной модели системы теплоснабжения температура наружного воздуха (ТНВ) моделируется в среде имитационного моделирования PowerSim Studio. Модель ТНВ включает трендовую, гармоническую и шумовую составляющие. На примере работы индивидуального теплового пункта, оснащенного системой автоматического регулирования, показана эффективность капитальных вложений [10].

имитационный спектральный сингулярный погрешность

СПИСОК ЛИТЕРАТУРЫ

1. Якимов, А. И. Технология имитационного моделирования систем управления промышленных предприятий : монография / А. И. Якимов. - Могилев: Белорус.-Рос. ун-т, 2010. - 304 с.

2. Johansson, B. Information structure to support discrete event simulation in manufacturing systems / B. Johansson, J. Johаnsson, A. Kinnander // Proceedings of the 2003 Winter Simulation Conference, ed. S. Chick, P. J. Sanchez, D. Ferrin and D. J. Morrice. - New Orleans, Louisiana, 2003. - Р. 1290-1295.

3. Bengtsson, N. Input Data Management Methodology for Discrete Event Simulation / N. Bengtsson, G. Shao, B. Johansson, T. Lee, S. Leong, A. Skoogh, C. McLean // Proceedings of 2009 Winter Simulation Conference. - 2009. - P. 1335-1344. - http://www.informs-sim.org/wsc09papers/125.pdf.

4. Biller, B. Introduction to Simulation Input Modeling / B. Biller, C. Gunes // Proceedings of 2010 Winter Simulation Conference. - 2010. - P. 49-58. - http://www.informs-sim.org/wsc10papers/006.pdf.

5. Law, A. M. ExpertFit Version 7 / A. M. Law // User's Guide.pdf. - 2006. - 144 p. - http://www.averill-law.com/.

6. Golyandina, N. Analysis of Time Series Structure: SSA and Related Techniques / N. Golyandina, V. Nekrutkin, A. Zhigljavsky. - Boca Raton: Chapman & Hall/CRC, 2001. - 310 p.

7. Якимов, Е. А. Исследование SSA-метода на основе комплексного применения информационных технологий / Е. А. Якимов // Доклады БГУИР. - 2010. - № 2(48). - С. 77-83.

8. Крамер, Г. Математические методы статистики : [пер. с англ.] / Г. Крамер. - 2-е изд. - М.: Мир, 1975. - 648 с.

9. Якимов, Е. А. О приведении последовательностей данных к нормированному виду для преобразования методом сингулярного спектрального анализа / Е. А. Якимов, О. М. Демиденко, Д. М. Албкеират, А. А. Ковалевич // Изв. Гомел. гос. ун-та им. Ф. Скорины. - 2011. - № 6(69). - С. 204-214.

10. Якимов, Е. А. Исследование системы теплоснабжения на основе имитационной модели / Е. А. Якимов // Изв. Гомел. гос. ун-та им. Ф. Скорины. - 2010. - № 5(62). - С. 94-99.

Размещено на Allbest.ru


Подобные документы

  • Процедура проведения имитационных экспериментов с моделью исследуемой системы. Этапы имитационного моделирования. Построение концептуальной модели объекта. Верификация и адаптация имитационной модели. Метод Монте-Карло. Моделирование работы отдела банка.

    курсовая работа [549,5 K], добавлен 25.09.2011

  • Разработка проекта имитационной модели функционирования системы, отдельные элементы которой могут отказывать во время работы. Закон распределения времени безотказной работы всей системы. Вероятность не отказа работы в течении заданного промежутка времени.

    курсовая работа [694,9 K], добавлен 04.02.2011

  • Построение имитационной модели "AS-IS" подсистемы управления производственными запасами ООО "Фаворит", адаптация программного обеспечения. Функциональные возможности табличного процессора MS Excel, VBA for Excel. Математическое обеспечение модели.

    курсовая работа [1,4 M], добавлен 12.07.2011

  • Изучение понятия имитационного моделирования. Имитационная модель временного ряда. Анализ показателей динамики развития экономических процессов. Аномальные уровни ряда. Автокорреляция и временной лаг. Оценка адекватности и точности трендовых моделей.

    курсовая работа [148,3 K], добавлен 26.12.2014

  • Организация отгрузки заказов потребителям фирмы. Оформление товаросопроводительных документов у диспетчера. Разработка имитационной модели грузового терминала. Executive - блок-сердце каждой отдельной модели. Блок Generator, генерирующий транзакты.

    контрольная работа [679,7 K], добавлен 26.11.2010

  • Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.

    реферат [192,1 K], добавлен 15.06.2015

  • Понятие экономико-математического моделирования. Совершенствование и развитие экономических систем. Сущность, особенности и компоненты имитационной модели. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    курсовая работа [451,4 K], добавлен 23.04.2013

  • Построение модели, имитирующей процесс работы отдела обслуживания ЭВМ, разрабатывающего носители с программами для металлорежущих станков с ЧПУ. Этапы решения задач по автоматизации технологических процессов в среде имитационного моделирования GPSS World.

    курсовая работа [64,6 K], добавлен 27.02.2015

  • Построение функциональной схемы, на которой представлены основные блоки модели и маршруты транзактов между ними. Выбор способов оптимизации работы ЭВМ, который будет зависеть от технических возможностей реальной системы и экономической оправданности.

    курсовая работа [21,4 K], добавлен 14.01.2011

  • Исследование вычислительных систем неоднородной структуры. Применение программы GPSS для создания имитационной модели предложенной системы массового обслуживания. Оценка погрешности, переходного периода, чувствительности и устойчивости измерений.

    курсовая работа [63,6 K], добавлен 20.07.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.