Метод объединения выявленных взаимосвязей между сигналами с помощью кластерного анализа

Сущность и представление кластера прецедентов в виде графа, характеристика процесса кластерного анализа. Определение размера кластера, выявления наиболее взаимосвязанных прецедентов с целью локализации источника возникновения нештатных ситуаций.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 29.07.2017
Размер файла 60,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Метод объединения выявленных взаимосвязей между сигналами с помощью кластерного анализа

А.И. Башмаков, Д.Р. Гуляева

Аннотация: Предложен метод объединения выявленных взаимосвязей между сигналами, представленных в виде прецедентов распределенной управляющей системы, с помощью кластерного анализа для последующего выявления наиболее взаимосвязанных прецедентов с целью локализации источника возникновения нештатных ситуаций.

Ключевые слова: прецедент, кластер, дерево решений, градиент, интеллектуальный анализ данных, надежность, метод.

При решении задачи обеспечения надежности в распределенных управляющих системах наряду с определением критериев достоверности данных информационного обмена важную роль играет восстановление системы после обнаружения ее нештатного функционирования. При использовании методов интеллектуального анализа (Data Mining) информационных потоков целесообразно выделять отдельные обнаруживаемые прецеденты в группы с устойчивыми взаимосвязями. Осуществление подобных объединений может быть решено при помощи задачи кластеризации [1].

Целью кластеризации является группировка объектов (наблюдений, событий) на основе данных (свойств), описывающих сущность объектов. Объекты внутри кластера должны быть похожими друг на друга и отличаться от объектов, вошедших в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше отличий между кластерами, тем точнее кластеризация. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных.

Отсутствие накладываемых ограничений на представление исследуемых объектов позволяет анализировать разнородные показатели (интервальные данные, частоты, бинарные данные). Важным условием является необходимость измерения и сравнения переменных в нормализованном представлении.

Кластерный анализ предназначен для сокращения размерности анализируемых данных и их представления в наглядном структурированном виде. кластерный сигнал граф

Кластерный анализ может применяться к совокупностям временных рядов, могут выделяться периоды схожести некоторых показателей и определяться группы временных рядов со схожей динамикой [2]. Выделяют следующие группы задач кластерного анализа:

1. задача разработки типологии или классификации;

2. задача исследования концептуальных схем группирования объектов;

3. задача выдвижения гипотез на основе исследования данных;

4. задача подтверждения гипотез для определения достоверности входимости выделенных типов в имеющихся данных.

В общем случае, при применении кластерного анализа решаются одновременно несколько указанных задач.

Кластер описывается следующими математическими характеристиками: центр, радиус, среднеквадратичное отклонение, размер кластера. Центр кластера - среднее геометрическое место точек в пространстве переменных. Радиус кластера - максимальное расстояние точек от центра кластера. Возможно возникновение ситуации, при которой невозможно определить принадлежность объекта к конкретному кластеру, используя математические процедуры.

Размер кластера определяется либо радиусом кластера, либо среднеквадратичным отклонением объектов для данного кластера [3]. Объект принадлежит кластеру, если расстояние от объекта до центра кластера меньше радиуса кластера.

Процесс кластерного анализа допускает два предположения [7]:

- рассматриваемые признаки объекта допускают требуемое разбиение совокупности объектов на кластеры;

- при сопоставлении признаков были выбраны правильные масштабы или единицы измерения признаков (произведена их нормализация).

В данной статье предложен метод объединения выявленных взаимосвязей между сигналами с помощью кластерного анализа. Исходными данными является набор прецедентов, формируемый на основе алгоритма поиска взаимосвязей между сигналами для определения нештатного функционирования систем [4].

В контексте предложенного метода под кластером будет пониматься группа выявленных прецедентов, содержащих сведения о взаимосвязях между сигналами на основе информации, хранящейся в базе знаний в виде временных рядов [5]. Условием вхождения в кластер для прецедента является наличие в его составе сигнала, присутствующего хотя бы в одном из прецедентов кластера. Критерием близости прецедента к центру кластера [6] является значение градиента частоты возникновения прецедентов кластера. Если прецедент не входит ни в один из имеющихся кластеров, то он образует новый кластер и является его центром.

В представленном методе для кластеризации каждого из прецедентов определены следующие этапы:

1. Включение прецедента в состав одного из ранее выявленных кластеров либо создание для него нового кластера.

Для каждого из сигналов в составе прецедента осуществляется поиск его вхождений в прецеденты, ранее включенные в состав кластеров. В случае обнаружения такого вхождения прецедент включается в состав кластера. При нахождении уникального прецедента, не имеющего общих сигналов ни с одним из кластеров, данный прецедент включается в состав нового кластера.

2. Определение центра кластера, в состав которого был включен прецедент, определения расстояния до центра кластера для каждого прецедента.

Центр кластера определяется значением градиента частот [8] возникновения прецедентов.

,

где - значения, обратные частотам возникновения прецедентов; - суммарное условие возникновения прецедентов в кластере: .

Соответственно, расстояние до центра кластера для i-го прецедента вычисляется следующим образом:

.

3. Построение неориентированного невзвешенного графа прецедентов в рамках кластера.

Вершинами графа являются прецеденты в составе кластера, связи между ними устанавливаются на основании наличия общих сигналов в составе прецедентов. Пример построения кластера представлен на рисунке 1.

4. Выбор оптимального правила в графе кластера на основе классификационного алгоритма C4.5 для выделения в составе кластера набора прецедентов, имеющих наибольшую взаимосвязанность.

Алгоритм C4.5 [9] предназначен для построения дерева решений с неограниченным количеством ветвей узла. Область применения алгоритма ограничена только дискретными зависимыми атрибутами, вследствие чего данный алгоритм предназначен для решения исключительно классификационных задач. Для реализации алгоритма C4.5 предъявляются следующие требования [10]:

- Каждая запись набора данных должна быть ассоциирована с одним из предопределенных классов, т.е. один из атрибутов набора данных должен являться меткой класса.

- Классы должны быть дискретными. Каждый пример должен однозначно относиться к одному из классов.

- Количество классов должно быть значительно меньше количества записей в исследуемом наборе данных.

Рис. 1. - Представление кластера прецедентов в виде графа

В связи с тем, что все описанные выше требования удовлетворяются в рамках предложенного метода, алгоритм C4.5 может быть применен для построения дерева решений с целью выделения в составе кластера набора прецедентов, имеющих наибольшую взаимосвязанность.

Таким образом, предложенный метод объединения выявленных взаимосвязей между сигналами с помощью кластерного анализа позволяет распределять выявленные прецеденты на основе их взаимосвязей и частот возникновения и определять наиболее взаимосвязанные прецеденты. Данный метод может быть использован для локализации источника возникновения нештатных ситуаций в распределенных управляющих системах.

Литература

1. Дюк В., Самойленко А. Data mining. Учебный курс. СПб.: Питер, 2001. 368 с.

2. Чубукова И.А. Data mining. М.: Бином, 2008. 384 с.

3. Барсегян, Куприянов, Степаненко, Холод, Под ред. Барсегяна А.А. Технологии анализа данных: DataMining, VisualMining, TextMining, OLAP / 2 изд. СПб.: БХВ-Петербург, 2007. 336 с.

4. Башмаков А.И., Дудко Я.В. Алгоритм обнаружения и анализа нештатных ситуаций // Информатика, вычислительная техника и управление. Ижевск: Системная инженерия. Научно-теоретический журнал, 2015. С. 100-104.

5. Клевцов С.И., Клевцова А.Б., Буринов С.В. Модель параметрической качественной иерархической оценки состояния технической системы // Инженерный вестник Дона, 2015, №3 URL: ivdon.ru/ru/magazine/archive/n3y2015/3088/.

6. Латыпова В.А. Оценка эффективности процесса обучения при наличии сложных открытых задач с помощью экспертных методов // Инженерный вестник Дона, 2016, №1 URL: ivdon.ru/ru/magazine/archive/n1y2016/3540/.

7. Гитис Л. Х. Кластерный анализ в задачах классификации, оптимизации и прогнозирования. М.: МГГУ, 2001. 103 с.

8. Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия методы и приложения: учебное пособие для физико-математических специальностей университетов. М.: Наука, 1986. 759 с.

9. Hand, D., H. Mannila and P. Smyth, 2001. Principles of Data Mining. London: MIT Press, pp: 197-201.

10. Han, J., M. Kamber and J. Pei, 2011. Data mining: concepts and techniques. Waltham, MA, USA: Morgan Kaufmann, pp: 54-61.

Размещено на Allbest.ru


Подобные документы

  • Математическая модель САР в виде систем дифференциальных уравнений. Представление линейной математической модели САР в виде взвешенного сигнального графа и структурной схемы. Нахождение главного оператора с помощью правил преобразования структурной схемы.

    курсовая работа [435,3 K], добавлен 01.10.2016

  • Характеристика стандарта GSM. Определение размерности кластера. Расчет числа радиоканалов, допустимой телефонной нагрузки, количества базовых станций, радиуса обслуживания, величины защитного расстояния. Разработка частотно-территориального плана сети.

    курсовая работа [646,9 K], добавлен 17.06.2011

  • Двоичные логические операции с цифровыми сигналами. Преобразование десятичных чисел в двоичную систему счисления. Применение шифратора. Изучение результатов исследований работы логических устройств с помощью программы схемотехнического моделирования.

    дипломная работа [868,1 K], добавлен 11.01.2015

  • Определение системной функции дискретной математической системы, нахождение зависимости между сигналами. Расчет импульсной и переходной характеристик линейной системы, оценка ее устойчивости. Построение графиков АЧХ и ФЧХ с помощью программы MathCad.

    курсовая работа [299,7 K], добавлен 22.11.2010

  • Принципиальная схема телевизора не отражает наличия всех элементов схемы и не позволяет судить о пространственном расположении элементов. Метод анализа монтажа. Элементы (детали), используемые в телевизоре, имеют определенные физические характеристики.

    реферат [1,5 M], добавлен 04.01.2009

  • Качественный и количественный подходы к оценке опасностей и выявления отказов систем. Прямой и обратный порядок определения причин отказов и нахождения аварийного события при анализе состояния системы. Метод анализа опасности и работоспособности.

    курсовая работа [74,2 K], добавлен 03.01.2014

  • Исследование взаимосвязей между параметрами типовых динамических звеньев и их характеристиками. Оценка влияния изменения постоянной времени и коэффициента демпфирования на характер переходного процесса. Определение параметров звеньев первого порядка.

    лабораторная работа [805,8 K], добавлен 06.04.2016

  • Метод электромеханических аналогий: сведение анализа механических устройств к анализу эквивалентных электрических схем. Электромеханические преобразователи механической энергии в электрическую. Основные системы электромеханических преобразователей.

    реферат [63,0 K], добавлен 16.11.2010

  • Исследование математических методов анализа сигналов с помощью преобразований Фурье и их связь. Соотношение Парсеваля, которое выполняется для вещественной, частотно-ограниченной функции f(t), интегрируемой на интервале, соответствующем одному периоду.

    контрольная работа [903,7 K], добавлен 16.07.2016

  • Особенности анализа систем. Описание системы уравнений с использованием стандартных типов системы "Тополог": функция и вектор. Итерационный метод нахождения собственных значений по методу Якоби. Пример анализа из электротехники (линейная система).

    реферат [793,2 K], добавлен 28.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.