Анализ и устранение шумовой компоненты во временных рядах с переменным шагом
Методика оценки шумовой компоненты во временных рядах с переменным шагом, ее обоснование и разработка алгоритма удаления шума. Выполнение требований гладкости функции, представляющей исходные данные и имеющей непрерывные производные до третьего порядка.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 08.03.2019 |
Размер файла | 987,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Анализ и устранение шумовой компоненты во временных рядах с переменным шагом
Скляр Александр Яковлевич
кандидат технических наук
доцент, кафедра прикладной математики, Российский технологический университет (МИРЭА)
Аннотация
В статье рассматривается методика оценки шумовой компоненты во временных рядах с переменным шагом, ее обоснование и предлагается алгоритм удаления шума из данных. Анализ строится на основе требования гладкости функции, представляющей исходные данные и имеющей непрерывные производные до третьего порядка. Предлагаемая методика и алгоритмы оценки и устранения шума в данных в предположении о гладкости, представляемой ими функции, позволяют обоснованно определить как абсолютного, так и относительного шума в данных вне зависимости от равномерности шага измерений в исходных данных уровень шума в данных, удалить из данных шумовую компоненту. Алгоритм решения задачи основан на минимизации отклонений рассчитываемых значений от гладкой функции при условии соответствия отклонений от исходных данных уровню шума. Предлагаемая методика и алгоритмы оценки и устранения шума в данных в предположении о гладкости, представляемой ими функции, позволяют обоснованно определить как абсолютный, так и относительный шум в данных вне зависимости от равномерности шага измерений в исходных данных и их зашумленности, удалить из данных шумовую компоненту. Учитывая гладкость данных, получаемых в результате устранения шума, данные полученные удалением шума пригодны для выявления в них как аналитических, так и дифференциальных зависимостей
Ключевые слова: абсолютный шум, относительный шум, цифровая фильтрация шума, временной ряд, тренд, декомпозиция данных, численное моделирование, анализ временного ряда, математическая модель, обработка статистики шум временной ряд функция
Большое количество процессов происходящих в экономике, результатов экспериментальных исследований в различных областях можно описать в виде временных рядов или последовательностей данных. Элементами такого ряда являются пары, задающие момент наступления события (значение аргумента) и соответствующий ему результат (значение функции). Последовательность событий может измеряться как с постоянным, так и с переменным шагом. Значения, сопоставляемые элементам получающегося ряда, содержат и ошибки измерения и, в общем случае, подвержены случайным внешним воздействиям. В дальнейшем такого рода ошибки измерений и результаты внешних воздействий будем трактовать, как шум.
При анализе данных временного ряда и прогнозировании на его основе возникает множество задач, связанных с выделением трендовой, колебательной и составляющих [1,2.3,4]. Для выявления таких рядов используются различные методы в зависимости от характера данных [5,6,7,8]. В то же время анализ и обработка зашумленных данных вызывает значительные трудности. Возникает задача устранения, по возможности, такого шума. Для устранения такого шума используются различные методы сглаживания, такие как, методы скользящей средней, экспоненциального сглаживания и др. [9], в частности методы, связанные с добавлением белого шума и последующим устранением шумовой компоненты за счет его усреднения [10].
2. Оценка шумовой компоненты в исходных данных
Обозначим значения аргумента (временные отрезки) через xi , соответствующие им наблюдаемые значения через yi , предполагаемую функцию «истинной» зависимости - f( x) . И исследуемый ряд представим в виде пар ( xi , f( xi)) . Будем рассматривать общий случай, когда исходные данные задаются с переменным шагом xi+1= xi+ hi , где величины hi , вообще говоря, различны.
Наблюдаемые данные будем представлять в виде , где si - шум.
Пусть функцию f( x) имеет производные до 4 порядка включительно, тогда ее значение в точке x+ t может быть представлено как
(1)
Рассмотрим значения функции в окрестности точки x0 . Выберем точки xk =x0+ tk , где k =0,1,2,3,4; t0 =0 и все tkразличны.
В матричном виде она примет вид.
AB = C
Где ; ;.
Индекс k принимает значения 1, 2, 3, 4.
Ранг матрицы A равен 3, следовательно, существует вектор , где не все л k равны 0 такой, что , тогда .
Значения л k определяются с точностью до постоянного множителя, в частности, положив л4= 1, получим допустимый набор из решения системы линейных уравнений
(2)
Определитель матрицы A
Аналогично
Поскольку вектор определен с точностью до произвольного множителя, то их удобнее представить в симметричном виде
(3)
В частности, решение этой системы для равноотстоящих узлов [11] t0=0, t1=-1, t2=1, t3=-2, t4=2 дает значения
Учитывая (2) получаем
(4)
Отметим, что выражение слева дает с точностью до множителя t4 численное представление четвертой производной и при функциях f( x) , представимых в виде полиномов не выше третьей степени, тождественно обращается в 0.
Далее учтем, что f ( xm + tk )= ym + k - sm + k и, следовательно
При отсутствии быстрых, то есть с периодами соизмеримыми с шагом ряда, осцилляций f ( x ) величину можно считать малой, и тогда получаем
(5)
Величина систематических отклонений от 0 будет тем меньше, чем меньше будет , то есть при выборе набора из пяти точек в качестве базовой точки x целесообразно выбирать точку x3 . Перенумеруем точки и введем , тогда (5) примет вид
(6)
Правая часть равенства (6) представляет собой случайную величину. Пусть величины sm+ k - независимые случайные величины с 0 математическим ожиданием и дисперсией у2 , тогда математическое ожидание
.
Среднеквадратичное значение шума у2 , таким образом, можно оценить исходя из
(7)
3. Выделение в данных функциональной и шумовой компонент
В этих условиях можно определить значения шумовой компоненты s и, следовательно, f( x) исходя из
(8)
Перепишем (7) в матричных обозначениях. Для этого введем матрицу L=( lij) , где , тогда
(9)
И условие минимума принимает вид
или
(10)
В отличие от случая с равноотстоящими узлами здесь возникает необходимость вычисления элементов матрицы L для каждой строки (при равноотстоящих узлах ненулевые элементы матрицы L одинаковы для всех строк). Система (9) из-за ограничения является нелинейной и нахождение ее решений даже при небольшой размерности встречает значительные вычислительные трудности. В то же время решение системы линейных алгебраических уравнений (СЛАУ) из (10) при заданном значении t не создает особых проблем. В самом деле, матрица является 9 диагональной ленточной матрицей и можно показать, что время решения СЛАУ с такой матрицей линейно по числу уравнений.
Отметим, что матрица является неотрицательно определенной и все ее собственные числа м i?0 .
Пусть Ei - собственные вектора матрицы, соответствующие собственным числам м i?0,
Тогда первое из равенств (9) примет вид
В этих условиях представляет собой при t>0 монотонно убывающую функцию от t .
Заметим, что при t>0 минимум функции F( s) в (8) будет достигаться, как следует из (5), при . Последнее условие означает стремление 4-ой производной к 0, то есть исходная функция будет близка к полиному не выше 3 степени.
При t>? минимум F( s) будет достигаться, при si>0 и, следовательно, функция f( xi)> yi .
4. Алгоритм удаления шума и выделения функциональной компоненты в данных
Учитывая сделанные замечания о характере функции F( s) можно предложить следующий итеративный алгоритм.
1. Вычисляем оценку шума у2 на основе (6). Задаем начальное значение t 0 .
2. Решаем СЛАУ в соответствии с (9) и вычисляем значение < s, s>.
3. Если < s, s> > у2 , переходим к пункту 4, иначе к пункту 5.
4. Решаем СЛАУ в соответствии с (9) с t=2 t0 и вычисляем значение < s, s>. Если < s, s> > n у2 , устанавливаем t0= t и повторяем пункт 4. В противном случае устанавливаем t1= t и переходим к пункту 6.
5. Решаем СЛАУ в соответствии с (9) с t= t0 /2 и вычисляем значение < s, s>. Если < s, s> < n у2 , устанавливаем t0= tи повторяем пункт 5. В противном случае устанавливаем t0= t, t1= t0 и переходим к пункту 6.
6. Искомое значение t лежит между t0 и t1 . Решаем СЛАУ в соответствии с (9) с t= ( t0 + t1)/2 и вычисляем значение <s, s>. Если |< s, s> - n у2 |<е, то останавливаем процесс и на основе вычисленных значений si рассчитываем значения искомой функции f( xi)= yi- si . Если нет, то строим новый интервал, устанавливая в зависимости от выполнения неравенства < s, s> > n у2 либо t0= t, либоt1= t и переходим к пункту 6.
Отметим, что говоря о шуме и его дисперсии в (6) и (7) предполагается, что он представляет собой одинаково распределенную случайную величину на всем временном ряде.
Если это не так, то вместо абсолютной величины шума si в (5) шум удобнее представлять в виде si=ц( x, y) ui так, чтобы случайная величина ui была бы одинаково распределенной на всем временном ряде. Наиболее естественно предполагать при большом разбросе исходных данных, что шум является результатом измерений, которые имеют постоянной относительную погрешность. В этом случае естественно принять si= yiui , тогда (6) и (7) примут соответственно вид
(10)
(11)
Тогда дисперсия относительного шума u определяется из (11)
И задача (7) приобретает вид
(12)
Или в матричном виде
Тогда условие минимума принимает вид
или
Отдельно следует отметить, что предлагаемая схема исключает из выделения шума компоненты зависимостей до полиномов 3 степени включительно. Последнее может оказаться обременительным для сильно зашумленных данных. В этом случае для исключения шума удобнее использовать более грубую схему, исключающую из выделения шума компоненты зависимостей до полиномов только 2 степени.
(13)
В частности, решение этой системы для равноотстоящих узлов [11] t0=0, t1=- h, t2= h, t3=-2 h, t4=2 h дает значения
5. Результаты численного моделирования
На рисунке 1 представлены результаты обработки зашумленных данных.
Значения по осям x и y - , где rnd представляет собой случайную величину, равномерно распределенную на интервале (-0,1;0,1).
Рисунок 1
На рисунке 2 представлены результаты обработки данных, представляющих значения функции y=ex на интервале (0;10) с шагом 0,1 округленные до двух значащих цифр.
Среднеквадратичная абсолютная погрешность исходных данных от теоретической кривой в рассматриваемом примере составляет 56, при удалении абсолютного шума - 30, при удалении относительного шума - 19. Таким образом, в случаях, когда данные меняются в широких пределах, а в данном случае отношение максимального значения к минимальному составляет 22000, удаление относительного шума приводит и к лучшему удалению абсолютного шума по сравнению с методом прямого удаления абсолютного шума.
Рисунок 2
Таким образом, предлагаемая методика и алгоритмы выявления и устранения шума в данных в предположении о гладкости, представляемой ими функции, позволяют:
* обоснованно определить уровень как абсолютного, так и относительного шума в данных вне зависимости от равномерности шага измерений в исходных данных;
* удалить из данных шумовую компоненту;
* учитывая гладкость данных, получаемых в результате устранения шума, проводить анализ выделенных данных для выявления в них аналитических и дифференциальных зависимостей.
Библиография
1. Грешилов А.А., Стакун В.А., Стакун А.А. Математические методы построения прогнозов. М.: Радио и связь, 1997. 112 с.
2. Канторович Г.Г. Анализ временных рядов. Экономический журнал ВШЭ. №1 2002, №2 2002, №3 2002, №4 2002, №1 2003
3. Андерсон Т. Статистический анализ временных рядов. М: Мир, 1976. 523 с.
4. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. М.; Финансы и статистика,2001. -- 228 с.
5. Губанов В.А. Выделение тренда из временных рядов макроэкономических показателей. В сб.: Научные труды: Институт народнохозяйственного прогнозирования РАН, 2005. -- Т.3
6. Большаков А.А., Каримов Р.Н. Методы обработки многомерных данных и временных рядов. М.: Горячая линия-Телеком, 2007. -- 522 с.
7. Ф.Александров, Н.Голяндина. Выбор параметров при автоматическом выделении трендовых и периодических составляющих временного ряда в рамках подхода «Гусеница»-SSA. Труды IV Международной конференции «Идентификация систем и задачи управления» SICPRO'05.
8. Дубовиков М. М., Старченко Н. В. О фрактальном анализе хаотических временных рядов. 2014 International Conference on Adaptive and Intelligent Systems - ICAIS'14.
9. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. М.: Мир, 1974. 406 с.
10. Zhaohua wu and Norden E. Huang. ensemble empirical mode decomposition: A noise-assisted data analysis method. Advances in Adaptive Data AnalysisVol. 01, No. 01, pp. 1-41 (2009)
11. Скляр А.Я. Анализ и устранение шумовой компоненты во временных рядах. Успехи современной науки, №11, 2017 г. - 11с.
References (transliterated)
1. Greshilov A.A., Stakun V.A., Stakun A.A. Matematicheskie metody postroeniya prognozov. M.: Radio i svyaz', 1997. 112 s.
2. Kantorovich G.G. Analiz vremennykh ryadov. Ekonomicheskii zhurnal VShE. №1 2002, №2 2002, №3 2002, №4 2002, №1 2003
3. Anderson T. Statisticheskii analiz vremennykh ryadov. M: Mir, 1976. 523 s.
4. Afanas'ev V.N., Yuzbashev M.M. Analiz vremennykh ryadov i prognozirovanie. M.; Finansy i statistika,2001. -- 228 s.
5. Gubanov V.A. Vydelenie trenda iz vremennykh ryadov makroekonomicheskikh pokazatelei. V sb.: Nauchnye trudy: Institut narodnokhozyaistvennogo prognozirovaniya RAN, 2005. -- T.3
6. Bol'shakov A.A., Karimov R.N. Metody obrabotki mnogomernykh dannykh i vremennykh ryadov. M.: Goryachaya liniya-Telekom, 2007. -- 522 s.
7. F.Aleksandrov, N.Golyandina. Vybor parametrov pri avtomaticheskom vydelenii trendovykh i periodicheskikh sostavlyayushchikh vremennogo ryada v ramkakh podkhoda «Gusenitsa»-SSA. Trudy IV Mezhdunarodnoi konferentsii «Identifikatsiya sistem i zadachi upravleniya» SICPRO'05.
8. Dubovikov M. M., Starchenko N. V. O fraktal'nom analize khaoticheskikh vremennykh ryadov. 2014 International Conference on Adaptive and Intelligent Systems - ICAIS'14.
9. Boks Dzh., Dzhenkins G. Analiz vremennykh ryadov. Prognoz i upravlenie. Vyp. 1. M.: Mir, 1974. 406 s.
10. Zhaohua wu and Norden E. Huang. ensemble empirical mode decomposition: A noise-assisted data analysis method. Advances in Adaptive Data AnalysisVol. 01, No. 01, pp. 1-41 (2009)
11. Sklyar A.Ya. Analiz i ustranenie shumovoi komponenty vo vremennykh ryadakh. Uspekhi sovremennoi nauki, №11, 2017 g. - 11s.
Размещено на Allbest.ru
Подобные документы
Создание программы на языке матрично-ориентированной системы Mat LAB. Особенности математической интерпретации метода. Оценка влияния величины шага интегрирования и начальных значений на качество и точность вычислений. Анализ полученных результатов.
курсовая работа [459,0 K], добавлен 27.04.2011Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.
лабораторная работа [58,7 K], добавлен 14.03.2014Особенности ариорного выбора числа итераций в методе простых итераций с попеременно чередующимся шагом для уравнений I рода. Анализ и постановка задачи. Сходимость при точной правой части. Сходимость при приближенной правой части. Оценка погрешности.
контрольная работа [187,3 K], добавлен 28.05.2010Априорный выбор числа итераций в методе простых с попеременно чередующимся шагом. Доказательство сходимости процесса в исходной норме гильбертова пространства. Оценка погрешности и решение неравенств. Случай неединственного решения с попеременной.
дипломная работа [695,6 K], добавлен 17.02.2012Сведения о плоских кривых. Замечательные кривые третьего порядка. Классификация Ньютона кривых третьего порядка. Циссоида и ее свойства. Преобразования плоскости, переводящие кривые второго порядка в кривые третьего порядка. Преобразования Маклорена.
дипломная работа [960,1 K], добавлен 22.04.2011Вспомогательные леммы. Теоремы Джексона для к-го обобщенного модуля гладкости. Обобщенное неравенство Минковского. Тригонометрический полином. Вычисление модулей гладкости для некоторых функций. Понятие прямой и обратной теоремы теории приближений.
курсовая работа [3,0 M], добавлен 26.05.2013Понятие, предел и непрерывность функции двух переменных. Частные производные первого порядка, нахождение полного дифференциала. Частные производные высших порядков и экстремум функции нескольких переменных. Необходимые условия существования экстремума.
контрольная работа [148,6 K], добавлен 02.02.2014Задача теории приближений - нахождение связей между структурными свойствами функции и порядком стремления к нулю последовательности ее наилучших приближений тригонометрическими или алгебраическими полиномами. Вычисление модулей гладкости для функций.
дипломная работа [4,4 M], добавлен 11.06.2013Расчет частных производных первого порядка. Поиск и построение области определения функции. Расчет полного дифференциала. Исследование функции на экстремум. Поиск наибольшего и наименьшего значения функции в замкнутой области. Производные второго порядка.
контрольная работа [204,5 K], добавлен 06.05.2012Общая схема методов спуска. Метод покоординатного спуска. Минимизация целевой функции по выбранным переменным. Алгоритм метода Гаусса-Зейделя. Понятие градиента функции. Суть метода наискорейшего спуска. Программа решения задачи дискретной оптимизации.
курсовая работа [90,8 K], добавлен 30.04.2011