Экспертная система для применения в автоматизации дилерского агентства по заключению договоров об услугах хостинга

Назначение экспертной системы. Метод главных компонент, его назначение. Проекция исследуемых тарифов на пространство двух главных компонентов. Кластерный анализ с применением дендрограмм. Обоснование выбора модели представления знаний, таблицы решений.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 10.03.2012
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Центральная парадигма интеллектуальных технологий сегодня - это обработка знаний. Системы, ядром которых является база знаний (БЗ) или модель предметной области, описанная на языке сверхвысокого уровня, приближенном к естественному, называют интеллектуальными. Чаще всего интеллектуальные системы (ИС) применяются для решения сложных задач, где основная сложность решения связана с использованием слабо-формализованных знаний специалистов-практиков и где логическая (или смысловая) обработка информации превалирует над вычислительной. Например, понимание естественного языка, поддержка принятия решения в сложных ситуациях, постановка диагноза и рекомендации по методам лечения, анализ визуальной информации, управление диспетчерскими пультами и др. Наиболее распространенным видом ИС являются экспертные системы

Экспертные системы (ЭС) ? это наиболее распространенный класс ИС, ориентированный на тиражирование опыта высококвалифицированных специалистов в областях, где качество принятия решений традиционно зависит от уровня экспертизы, например, медицина, юриспруденция, геология, экономика, военное дело и др. ЭС эффективны лишь в специфических «экспертных» областях, где важен эмпирический опыт специалистов.

Основным назначением ЭС является разработка программных средств, которые при решении задач, трудных для человека, получают результаты, не уступающие по качеству и эффективности решения решениям, получаемым человеком-экспертом. ЭС используются для решения так называемых неформализованных задач, общим для которых является то, что:

* задачи не могут быть заданы в числовой форме;

* цели нельзя выразить в терминах точно определенной целевой функции;

* не существует алгоритмического решения задачи;

* если алгоритмическое решение есть, но его нельзя использовать из-за ограниченности ресурсов (время, память).

Кроме того, неформализованные задачи обладают ошибочностью, неполнотой, неоднозначностью и противоречивостью, как исходных данных, так и знаний о решаемой задаче

Экспертная система - это программное средство, использующее экспертные знания для обеспечения высокоэффективного решения неформализованных задач в узкой предметной области. Основу ЭС составляет база знаний (БЗ) о предметной области, которая накапливается в процессе построения и эксплуатации ЭС. Накопление и организация знаний ? важнейшее свойство всех ЭС. Знания являются явными и доступными, что отличает ЭС от традиционных программ, и определяет их основные свойства, такие, как применение высококачественного опыта, наличие прогностических возможностей, институциональная память, возможность обучения и тренировки.

Применение для решения проблем высококачественного опыта, который представляет уровень мышления наиболее квалифицированных экспертов в данной области, что ведёт к решениям творческим, точным и эффективным.

Наличие прогностических возможностей, при которых ЭС выдает ответы не только для конкретной ситуации, но и показывает, как изменяются эти ответы в новых ситуациях, с возможностью подробного объяснения каким образом новая ситуация привела к изменениям.

Обеспечение такого нового качества, как институциональная память, за счет входящей в состав ЭС базы знаний, которая разработана в ходе взаимодействий со специалистами организации, и представляет собой текущую политику этой группы людей. Этот набор знаний становится выводом квалифицированных мнении и постоянно обновляемым справочником наилучших с стратегий и методов, используемых персоналом.

Ведущие специалисты уходят, но их опыт остается.

Возможности использования ЭС для обучения и тренировки руководящих работников обеспечивают новых служащих обширным багажом опыта и стратегий, по которым можно изучать рекомендуемую политику и методы.

1. Идентификация проблемной области

1.1 Постановка задачи

Разработать ЭС, для применения в выборе услуг платного хостинга. Данная ЭС позволяет разбивать тарифные планы на классы.

1.2 Назначение ЭС

Назначение ЭС ? классификация тарифов хостинга на классы.

Особенности решения задачи связаны с тем, что ЭС настраивается на требования и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в отдельном файле. ЭС должна относить тарифы к соответствующему классу.

Цель разработки ЭС - консультация сотрудников дилерского агентства по заключению договоров об услугах хостинга.

1.3 Класс ЭС по решаемой задаче

Класс решаемой задачи - задача поддержки принятия решения (ПНР). ЭС позволяет сформировать классы тарифных планов.

1.4 Цель

Цель ?классификация тарифных планов на услуги хостинга.

Целевая переменная "Класс" принимает следующие значения: 1,2,3.

1.5 Ожидаемые результаты

Разработать ЭС, для применения ее в автоматизации дилерского агентства по заключению договоров об услугах хостинга. Сформировать классы тарифных планов.

1.6 Промежуточные цели

Промежуточные цели при построении данной ЭС определяются следующими переменными: Compl = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая.

1.7 Исходные данные

Исходные данные при построении данной ЭС определяются такими переменными, как:

1. Цена в месяц = [0.99; 49]

2. Цена в год = [10.15; 499]

3. Объем = [5;2500]

4. Трафик = [0.4;1000]

5. Количество сервисов = [1;4]

6. Виртуальных серверов = [1;1000]

7. FTP входов = [1;1000]

2. Концептуализация предметной области

2.1 Извлечение знаний

2.1.1 Анализ методом главных компонент

Метод главных компонент даст возможность по p исходным признакам выделить в общем случае р главных компонент

Введем исходные данные в электронную таблицу STATGRAPHICS (50x7) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.

Таблица 2.1 - Исходная сводка МГК

Component Number

Eigen Value

Percent of Variance

Cumulative Percentage

1

3.10802

44.400

44.400

2

1.45952

20.850

65.251

3

0.913763

13.054

78.304

4

0.797564

11.394

89.698

5

0.506804

7.240

96.938

6

0.20519

2.931

99.870

7

0.00913

0.130

100.000

Number of complete cases : 50

Из полученной сводки заключаем, что анализу подвергаются переменные цена/месяц, цена/год, количество сервисов, количество ftp входов, объем, трафик, количество виртуальных серверов и что число объектов составляет 50

Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).

Приведенные цифры говорят о том, что уже первые три главные компоненты описывают 78,304 % дисперсии исходных данных.

Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).

Таблица 2.2 - Веса признаков в главных компонентах

Component1

Component2

Component3

Цена/мес

0.5386

0.1130

0.0844

Цена/год

0.5258

0.1691

0.0541

Объем

0.51509

-0.02169

0.103268

Трафик

0.1791

0.5622

-0.1295

FTP входов

0.1571

-0.6791

-0.1488

Виртуальных серверов

0.2588

-0.2142

-0.7796

Сервисов

0.21025

-0.3672

0.5766

Как следует из полученных цифр, в первой компоненте наблюдается наибольшая зависимость от цены за месяц, цены за год, и объема. Во второй главной компоненте наблюдается обратнопропорциональная зависимость от количества ftp входов и количества сервисов, а также прямопропорциональная зависимость от трафика. В третьей главной компоненте наблюдается прямопропорциональная зависимость от количества сервисов, а также обратнопропорциональная зависимость от количества виртуальных серверов.

Перейдем к рассмотрению диаграммы рассеивания всей совокупности тарифов хостинга на плоскости выделенных двух главных компонент (рисунок 2.1).

Рисунок 2.1 - Проекция исследуемых тарифов на пространство двух ГК

На представленном рисунке хорошо видно, что вся исследуемая совокупность тарифов разделилась на три класса.

Рисунок 2.2 - Проекция исследуемых тарифов на пространство трех ГК

Выбор значащих компонент и определение названия для них представлено ниже.

1) Выберем p=3 главных компонент.

2) Определим названия для них по формуле:

,

где [wkj] - подмножество участвующих в названии весовых коэффициентов j-й компоненты;

[wj] - все весовые коэффициенты j-й компоненты.

0.5386

0.1130

0.0844

0.5258

0.1691

0.0541

0.51509

-0.02169

0.103268

0.1791

0.5622

-0.1295

0.1571

-0.6791

-0.1488

0.2588

-0.2142

-0.7796

0.21025

-0.3672

0.5766

Для первой компоненты имеем:

Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 83,1%) следующими показателями: цена за месяц, цена за год, и объема выделяемой памяти.

Для второй компоненты

Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 91,2%) следующими показателями: трафик, количество ftp входов, и количество сервисов.

Для третьей компоненты

Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 94%) следующими показателями: количество виртуальных серверов и количество сервисов.

На представленном рисунке хорошо видно, что первый класс характеризуется низким значением первой компоненты; низким, средним высоким значением второй компоненты; низким, средним высоким значением третьей компоненты.

Второй класс характеризуется средним значением первой компоненты; низким, средним высоким значением второй компоненты; высоким значением третьей компоненты.

Третий класс характеризуется высоким значением первой компоненты; низким и высоким значением второй компоненты; низким и высоким значением третьей компоненты.

Учитывая зависимость компонент от признаков, охарактеризуем каждый из классов.

В первый класс входят тарифы с малой ценой, малым размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, различным количеством сервисов и различным количеством виртуальных серверов.

Во второй класс входят тарифы с средней ценой, средним размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, высоким количеством сервисов и средним количеством виртуальных серверов.

В третий класс входят тарифы с высокой ценой, высоким размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, высоким количеством сервисов и высоким количеством виртуальных серверов.

кластерный компонент экспертная система

2.1.2 Кластерный анализ с применением дендрограмм

Этот анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации

Введем исходные данные в электронную таблицу STATGRAPHICS (50x7). Для более детального анализа проделали ряд операций. Получили дендрограмму методом Варда для трех кластеров (классов) (рисунок 2.3).

Рисунок 2.3 - Дендрограмма для трех классов

После преобразований получили сводку кластерного анализа (таблица 2.3).

Таблица 2.3 - Сводка кластерного анализа

Cluster

Members

Percent

1

34

66.67

2

6

13.73

3

10

19.61

Centroids:

Cluster

ftp входов

В.серверов

Объем

Сервисов

Трафик

Цена

в год

Цена

в мес.

1

7,705

3,7352

351,912

3,441

707,203

87,6

7,778

2

159,0

151,143

1275,7

3,741

850,143

329

30,19

3

1000

13,2

770

4

311,0

121

12,32

Качественная характеристика кластеров

Cluster

ftp входов

В.серверов

Объем

Сервисов

Трафик

Цена

в год

Цена

в мес.

1

низкое

низкое

низкий

средний

средний

низкая

низкая

2

среднее

высокое

высокий

средний

высокий

высокая

высокая

3

высокое

среднее

средний

средний

низкий

средний

средняя

Как видно из таблицы 2.3, в сводке кластерного анализа прежде всего учитываются имена переменных, участвующих в анализе, количество полных образцов, использованный метод кластерного анализа и принятая метрика. Затем, в сводке описывается число кластеров, количество объектов в каждом кластере и соответствующий процент. Кроме того, в нижней части сводки приводится дополнительная информация по координатам центроидов. По этим координатам можно судить о том, какие переменные играют наиболее важную роль в каждом кластере.

Перейдем к рассмотрению диаграммы рассеивания (рисунок 2.4)

Рисунок 2.4 ? Двухмерная диаграмма рассеивания

Диаграмма показывает, как группируются исследуемые наблюдения на плоскости двух переменных ftp входов и виртуальных серверов. Каждый кластер представлен на диаграмме собственным символом. Из рисунка следует, что первый кластер включает тарифы с количеством виртуальных серверов до 15 и с количеством ftp входов до 20. Во втором кластере находятся в основном тарифы с количеством виртуальных серверов от 25 и с количеством ftp входов от 25, а также тарифы с неограниченным количеством виртуальных серверов и ftp входов. В третий кластер попадают тарифы с неограниченным количеством ftp входов и количеством виртуальных серверов до 50.

Рассмотрим трехмерную диаграмму рассеивания (рисунок 2.5)

Рисунок 2.5 ? Трехмерная диаграмма рассеивания

Таким образом, кластерный анализ помог разбить множество объектов на заданное число классов на основании некоторою математического критерия качества классификации. Диаграмма показывает, как группируются исследуемые тарифы в пространстве трех переменных: количества виртуальных серверов, количество ftp входов, объем.

2.1.3 Кластерный анализ с применением самоорганизующихся карт Кохонена

Для решения задачи кластеризации использовались самоорганизующиеся карты Кохонена с применением нейросетевого пакета SOMap analyzer 1.0.

Self-Organizing Maps (SOM) - это самоорганизующиеся структуры, основанные на нейросети Кохонена, которые представлены в виде двухмерной сетки, в узлах которой находятся нейроны.

Структура сети Кохонена представлена на рисунке 2.6. Сеть имеет 7 входов по количеству признаков, по которым ведется кластеризация, и 1 выход, который выдает номер кластера. Сеть однослойная (слой Кохонена). Каждый нейрон слоя Кохонена с помощью своих весовых коэффициентов запоминает координаты ядра кластера и отвечает за отнесение объектов к этому кластеру. Интерпретатор выбирает максимальное значение среди всех выходов и выдает номер этого выхода, который является номером кластера.

Рисунок 2.6 - Структура сети Кохонена

Процесс обучения сети состоит из 5 шагов: выбор источника данных; настройка полей; установка параметров обучения; установка параметров визуализации; обучение (построение) карты.

В качестве источника данных используем созданную обучающую выборку. Параметры обучения, параметры визуализации представлены на рисунке 2.7.

Рисунок 2.7 - Информация о карте

Для построения карт открываем окно с картами по обучающей выборке и выбираем нужные компоненты. Результаты построения представлены на рисунке 2.8.

Рисунок 2.8 - Карты по обучающей выборке

В результате анализа карт было выявлено 3 кластера тарифов:

Кластер характеризуется малым количеством ftp входов, высоким количеством сервисов, малым объемом выделяемой памяти, низкой стоимостью, малым количеством виртуальных серверов, малым лимитом на трафик.

Кластер характеризуется неограниченным количеством ftp входов, высоким количеством сервисов, высоким объемом выделяемой памяти, высокой стоимостью, большим количеством виртуальных серверов, большим лимитом на трафик.

Кластер высоким количеством ftp входов, высоким количеством сервисов, средним объемом выделяемой памяти, средней стоимостью, малым количеством виртуальных серверов, неограниченным лимитом на трафик.

Статистика по каждому классу в отдельности представлена на следующих рисунках 2.9 - 2.11

Рисунок 2.9 - Статистика по 1-ому кластеру

Рисунок 2.10- Статистика по 2-ому кластеру

Рисунок 2.11 - Статистика по 3-ому

кластеру

Окно со статистикой показывает следующие статистические показатели:

минимальное значение;

максимальное значение;

среднее значение;

стандартное отклонение (дисперсия);

количество элементов.

На основе проведенного кластерного анализа можно извлечь следующие правила.

1. Если количество ftp входов=малое, количество сервисов= высокое и объемом выделяемой памяти=малый и стоимость=низкая и количество виртуальных серверов= малое и лимит на трафик= малый,то Кластер 1

2. Если количество ftp входов=неограниченное и количество сервисов= высокое и объем выделяемой памяти=высокий и стоимость= высокая и количество виртуальных серверов= большое и лимит на трафик= большой, то Кластер 2.

3. Если количество ftp входов =высокое и количество сервисов= высокое и объемом выделяемой памяти=средний и стоимость = высокая и количество виртуальных серверов=малое и лимит на трафик=неограниченный, то Кластер 3.

2.1.4 Построение деревьев решений

Система See5/C5.0 предназначена для анализа больших баз данных содержащих до сотни тысяч записей и до сотни числовых или номинальых полей. Результат работы See5/C5.0 выражается в виде деревьев решений и множества if - then - правил.

Задача See5/C5.0 состоит в предсказании диагностического класса какого-либо объекта по значениям его признаков. При это See5/C5.0 конструирует классификатор в виде дерева решений, которому, в свою очередь, может быть поставлено в соответствие некоторое множество логистических правил.

Файл имен переменных для компонентного анализа hosting.names выглядит следующий образом:

Class.

Class:1,2,3

Pricemonth:continuous

Priceyear:continuous

Size:continuous

Traffic:continuous

Service:continuous

VirtualServer:continuous

ftp_account:continuous

Целевой признак Class принимает три значения: 1 - первый класс, 2 - второй класс, 3 - третий класс. Затем описывается совокупность признаков: Pricemonth -цена за месяц, Priceyear - цена за год, Size - выделяемый объем, Traffic - лимит трафика, Service-количество сервисов,VirtualServer-количество виртуальных серверов, ftp_account-количество ftp входов.

Создаем файл данных hosting.data, которые будет использоваться для работы See5 (Приложение Б).

На первом этапе обработки данных обычно используются параметры системы, установленные по умолчанию. Результаты построения начального дерева решений приведены в таблице 2.4

Таблица 2.4 - Результаты построения дерева рещений

Дерево решений

Извлеченные правила

ftp_account > 50: 3(11/1)

ftp_account <= 50:

:...Size <= 1000: 1(36/2)

Size > 1000: 2 (3)

Rule 1: (36/2, lift 1.4)

Size <= 1000

ftp_account <= 50

-> class 1 [0.921]

Rule 2: (3, lift 6.7)

Size > 1000

ftp_account <= 50

-> class 2 [0.800]

Rule 3: (11/1, lift 4.2)

ftp_account > 50

-> class 3 [0.846]

Результаты классификации

Decision Tree

Size Errors

3 3 (6.0%)

(a) (b) (c)

---- ---- ----

34 (a): class1

2 3 1 (b): class2

10 (c): class3

Файл данных mobile.data содержит 50 объектов, каждый из которых описан 8 признаками.

Дерево решений можно проинтерпретировать следующим образом: «Если количество ftp входов больше 50, то класс 3 (11 объектов), иначе если количество ftp входов меньше либо равно 50 и объем выделяемой памяти больше 1000 мб, то класс = 2 (3 объекта), иначе если количество ftp входов меньше или равно 50 и объем выделяемой памяти меньше либо равен 1000 мб, то класс = 1(36 объектов).»

Каждая ветка дерева заканчивается указанием номера класса, к которому она принадлежит. Например, самая первая ветка заканчивается записью 3 (11/1). Это означает, что данной ветке соответствует 11 объектов из определенного 3 класса. Аналогично для дочерних веток.

Исходя из данных таблицы результата классификации, можно сказать, что из класса 1 правильно классифицируются 34 объекта, в классе 2 правильно классифицируется 3 объекта, в классе 3 правильно классифицируются 10 объектов.

Количество сработавших правил равно 3, наблюдались ошибки извлечения объектов(6.0%).

2.2 Структурирование проблемной области

Структурирование проблемной области можно представить в виде дерева целей (рисунок 2.12):

Рисунок 2.12 - Дерево целей

Представим структурирование предметной области в более детальном виде с учетом результатов компонентного анализа:

Рисунок 2.13 - Скорректированное дерево целей

3. Формализация базы знаний

3.1 Краткий обзор модели представления знаний

Для представления знаний используется продукционная модель. В общем виде продукционное правило представляется следующей нотацией:

PRi = <N, Q, Р, С, А => В, S>,

где N ? имя 1-го продукционного правила, Q ? сфера применения, которая позволяет определить некоторую область из множества продукционных правил, которая будет анализироваться, Р ? предусловие, которое устанавливает на множестве правил выделенной сферы некоторый порядок приоритета их использования, С ? условие применения правила, А=>В ? ядро продукционного правила, которое описывает преобразования, составляющее сущность правила:

А ? предпосылка (антицендент).

В ? заключение (консеквент),

S ? действие, которое необходимо выполнить после ядра.

Предпосылка и заключение могут быть представлены несколькими фактами: <предпосылка> = <факт 1> и <факт 2> и ... и <факт n> База знании содержит известные факты, которые выражены в виде объектов, атрибутов и условий, т.е. факты представляют в виде объектов, описывая их атрибуты и придавая им эквиваленты или значения.

3.2 Обоснование выбора модели представления знаний

В ряде случаев полученное дерево решении может оказаться слишком сложным для восприятия. Например, при построении задач высокой размерности для неоднородных данных дерево нередко получается кустистое и довольно большое. Поэтому, с целью упрощения логического вывода рекомендуется использовать логическую связку "И". Если по смыслу существует логическая связка "ИЛИ", то формируется второе аналогичное правило, содержащее только связки "И".

3.3 Таблицы решений

Таблица решений представляет собой имя переменной, ее возможные значения и варианты решения. Таблицы решений для определения сущностей Compl, Comp2, Comp2, Класс и Решение приведены в таблицах 3.1-3.5.

Таблица 3.1 - Таблица решений для сущности "Comp1"

Comp1=большая

Comp1=средняя

Comp1=малая

Цена за месяц

Цена за год

Объем

+

малая

малая

малый

+

малая

малая

средний

+

малая

малая

большой

+

средняя

средняя

малый

+

средняя

средняя

средний

+

средняя

средняя

большой

+

большая

большая

малый

+

большая

большая

средний

+

большая

большая

большой

Таблица 3.2 - Таблица решений для сущности "Comp2"

Comp2=большая

Comp2=средняя

Comp2=малая

Трафик

Количество

ftp входов

+

большой

большое

+

большой

среднее

+

большой

малое

+

средний

большое

+

средний

среднее

+

средний

малое

+

малый

большое

+

малый

среднее

+

малый

малое

Таблица 3.3 - Таблица решений для сущности "Comp3"

Comp3=большая

Comp3=средняя

Comp3=малая

Количество

в. серверов

Количество сервисов

+

большое

большое

+

большое

среднее

+

большое

малое

+

среднее

большое

+

среднее

среднее

+

среднее

малое

+

малое

большое

+

малое

среднее

+

малое

малое

Таблица 3.4 - Таблица решений для сущности "Класс"

Класс=1

Класс=2

Класс=3

Класс=не определен

Comp1

Comp2

Comp2

+

большая

большая

большая

+

большая

большая

средняя

+

большая

большая

малая

+

большая

средняя

большая

+

большая

средняя

средняя

+

большая

средняя

малая

+

большая

малая

большая

+

большая

малая

средняя

+

большая

малая

малая

+

средняя

большая

большая

+

средняя

большая

средняя

+

средняя

большая

малая

+

средняя

средняя

большая

+

средняя

средняя

средняя

+

средняя

средняя

малая

+

средняя

малая

большая

+

средняя

малая

средняя

+

средняя

малая

малая

+

малая

большая

большая

+

малая

большая

средняя

+

малая

большая

малая

+

малая

средняя

большая

+

малая

средняя

средняя

+

малая

средняя

малая

+

малая

малая

большая

+

малая

малая

средняя

+

малая

малая

малая

3.4 Сеть вывода

По полученным таблицам генерируем сети выводов, приведенные на рисунках 3.1-3.5:

Рисунок 3.1 - Сеть вывода для сущности "Comp1"

Рисунок 3.2 - Сеть вывода для сущности "Comp2"

Рисунок 3.3 - Сеть вывода для сущности "Comp3"

Рис. 3.4

4. База знаний

В данном курсовом проекте разрабатывается ЭС поддержки принятия решения. В коде разработки было составлено 54 правила поведения системы.

Если Comp1=большая и Comp2=большая и Comp3=большая, то Класс=1

Если Comp1=большая и Comp2=большая и Comp3=средняя, то Класс=1

Если Comp1=большая и Comp2=большая и Comp3=малая, то Класс=2

Если Comp1=большая и Comp2=средняя и Comp3=большая, то Класс=1

Если Comp1=большая и Comp2=средняя и Comp3=средняя, то Класс=2

Если Comp1=большая и Comp2=средняя и Comp3=малая, то Класс=2

Если Comp1=большая и Comp2=малая и Comp3=большая, то Класс=2

Если Comp1=большая и Comp2=малая и Comp3=средняя, то Класс=2

Если Comp1=большая и Comp2=малая и Comp3=малая, то Класс=3

Если Comp1=средняя и Comp2=большая и Comp3=большая, то Класс=1

Если Comp1=средняя и Comp2=большая и Comp3=средняя, то Класс=2

Если Comp1=средняя и Comp2=большая и Comp3=малая, то Класс=2

Если Comp1=средняя и Comp2=средняя и Comp3=большая, то Класс=2

Если Comp1=средняя и Comp2=средняя и Comp3=средняя, то Класс=3

Если Comp1=средняя и Comp2=средняя и Comp3=малая, то Класс=3

Если Comp1=средняя и Comp2=малая и Comp3=большая, то Класс=3

Если Comp1=средняя и Comp2=малая и Comp3=средняя, то Класс=3

Если Comp1=средняя и Comp2=малая и Comp3=малая, то Класс=не определен

Если Comp1=малая и Comp2=большая и Comp3=большая, то Класс=2

Если Comp1=малая и Comp2=большая и Comp3=средняя, то Класс=3

Если Comp1=малая и Comp2=большая и Comp3=малая, то Класс=3

Если Comp1=малая и Comp2=средняя и Comp3=большая, то Класс=3

Если Comp1=малая и Comp2=средняя и Comp3=средняя, то Класс=3

Если Comp1=малая и Comp2=средняя и Comp3=малая, то Класс=не определен

Если Comp1=малая и Comp2=малая и Comp3=большая, то Класс=3

Если Comp1=малая и Comp2=малая и Comp3=средняя, то Класс=не определен

Если Comp1=малая и Comp2=малая и Comp3=малая, то Класс=не определен

Если Объем большой и Цена за месяц/год высокая, то Comp1=большая

Если Объем большой и Цена за месяц/год средняя, то Comp1=большая

Если Объем большой и Цена за месяц/год малая, то Comp1=средняя

Если Объем средний и Цена за месяц/год малая, то Comp1=малая

Если Объем средний и Цена за месяц/год средняя, то Comp1=средняя

Если Объем средний и Цена за месяц/год высокая, то Comp1=высокая

Если Объем малый, и Цена за месяц/год высокая, то Comp1=средняя

Если Объем малый, и Цена за месяц/год средняя, то Comp1=средняя

Если Объем малый, и Цена за месяц/год низкая, то Comp1=малая

Если Трафик = большой и Количество ftp входов=большое, то Comp2=большое

Если Трафик = большой и Количество ftp входов=среднее, то Comp2=среднее

Если Трафик = большой и Количество ftp входов=малое, то Comp2=среднее

Если Трафик = средний и Количество ftp входов=большое, то Comp2=большое

Если Трафик = средний и Количество ftp входов=среднее, то Comp2=среднее

Если Трафик = средний и Количество ftp входов=малое, то Comp2=среднее

Если Трафик = малый и Количество ftp входов=большое, то Comp2=среднее

Если Трафик = малый и Количество ftp входов=среднее, то Comp2=малое

Если Трафик = малый и Количество ftp входов=малое, то Comp2=малое

Если Количество виртуальных серверов=большое и количество сервисов=большое, то Comp3=большое

Если Количество виртуальных серверов=большое и количество сервисов=среднее, то Comp3=большое

Если Количество виртуальных серверов=большое и количество сервисов=малое, то Comp3=среднее

Если Количество виртуальных серверов=среднее и количество сервисов=большое, то Comp3=большое

Если Количество виртуальных серверов=среднее и количество сервисов=среднее, то Comp3=среднее

Если Количество виртуальных серверов=среднее и количество сервисов=малое, то Comp3=среднее

Если Количество виртуальных серверов=малое и количество сервисов=большое, то Comp3=среднее

Если Количество виртуальных серверов=малое и количество сервисов=среднее, то Comp3=малое

Если Количество виртуальных серверов=малое и количество сервисов=малое, то Comp3=малое

Заключение

В результате анализа данных методом главных компонент, кластерным анализом (с применением дендрограмм и карт Кохонена) и построения дерева решений, были выделены 3 класса тарифов хостинга, с различными характеристиками.

В данной курсовой работе разработана ЭС для применения в автоматизации дилерского агентства по заключению договоров об услугах хостинга. Данная ЭС позволяет классифицировать тарифные планы предоставляемого хостинга. В ходе разработки ЭС было проведено извлечение знаний с помощью анализа характеристик тарифов методом главных компонент, кластерным анализом и построением деревьев решений.

По результатам метода главных компонент выделили три главных компоненты Comp1, Comp2 и Comp3, определили их состав.

В результате получили, что значениями признаков «Цена за месяц», «Цена за год», «объем выделяемой памяти» первая главная компонента определяется более чем на 83,1%. Значениями признаков «трафик», «количество ftp входов», «количество сервисов» вторая главная компонента определяется более чем на 91,2%. Значениями признаков «количество виртуальных серверов» и «количество сервисов» третья главная компонента определяется более чем на 94%.

При построении деревьев решений с помощью системы Sce5/C 5.0 проанализировали результаты компонентного и кластерного анализов. Результат работы системы See5 выразился в виде деревьев решений и множестве if-then правил. Результаты, полученные в ходе построения деревьев решений, совпали с результатами компонентного анализа, и кластерных анализов с применением дендрограмм и сетей Кохонена.

Список литературы

1. Методические указания к курсовому проектированию по дисциплине "Моделирование ИАС" дли специальности АСОИУ / Уфимск. roc. авиац. техн. ун-т; Сост.: Е.А. Макарова. - Уфа, 2001.

2. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский - СПб: Питер, 2000 - 384 с.

3. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. - Уч. пособие. - М.: Синтег, 1998. - 216 с.

4. Статические и динамические экспертные системы: Учеб. пособие / Э.В. Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот. - М.: Финансы и статистика, 1996. - 320 с.

Приложение А

Исходная выборка исследуемых тарифов

Название

Цена/мес($)

Цена/год($)

Объем(mb)

Трафик(Gb)

Сервисов

В.серверов

ftp входов

PeterHost(Alfa)

4

39

30

1000

1

1

1

PeterHost(Alfa+)

6

130

100

1000

1

1

1

PeterHost(Beta)

9

92

580

1000

4

6

1

PeterHost(Omega)

15

149

880

1000

4

12

5

PeterHost(Vega)

49

499

1400

1000

4

25

25

eServer(Минимум)

5.75

57

250

1000

3

1

5

eServer(Медиум)

7.5

81

500

1000

3

2

25

eServer(Бизнес)

15.5

192

1000

1000

4

15

1000

eServer(Оптиум)

13.75

144

750

1000

4

15

50

eServer(Максимум)

29.5

312

1500

1000

4

1000

1000

Mastak(Любимый)

4.95

59

50

3

3

1

1

Mastak(Подарочный)

7.95

100

100

3

3

1

1

Mastak(Малый плюс)

3

30

30

10

3

1

1

Mastak(Лидер)

14.95

170

250

20

3

1

6

Arbatek(Mail)

2.95

35.4

100

1000

2

0

20

Arbatek(Open)

5.95

71.4

160

1000

4

0

2

Arbatek(Nova)

9.95

119.4

640

1000

4

0

9

Arbatek(Nova+)

12.95

155.4

720

1000

4

0

12

Arbatek(Pilot)

14.95

179.4

960

1000

4

0

15

Arbatek(Portal)

19.95

239.4

1280

1000

3

0

18

XP-hosting(XP1)

1.95

18

50

2

4

1

1000

XP-hosting(XP2)

3.95

36

200

5

4

1

1000

XP-hosting(XP3)

7.95

70

600

12

4

6

1000

XP-hosting(XP4)

15.95

140

1200

25

4

15

1000

XP-hosting(XP5)

27.95

250

2500

50

4

50

1000

GoldHost(Парковка)

0.99

10.15

5

0.4

4

1

1

GoldHost(Эконом)

2

20.52

15

0.5

4

6

1

GoldHost(Старт)

3.3

33.85

25

1

4

6

3

GoldHost(Подарок)

3.99

40.93

50

3

4

6

10

GoldHost(Оптима)

5.95

61.04

300

9

4

6

1000

GoldHost(Голд)

10

102.6

350

15

4

8

1000

GoldHost(Стандарт)

12

123.12

500

1000

4

10

1000

GoldHost(Бизнес)

22

225.72

1000

1000

4

20

1000

Agava Hosting(Lite)

5

54

200

1000

1

1

1

Agava Hosting(Normal)

9

97.2

500

1000

4

1

10

Agava Hosting(PRO)

25

270

1000

1000

4

1

10

ValueHost(План А)

8.95

96.7

500

1000

4

6

6

ValueHost(План Б)

18.75

204.7

700

1000

4

12

12

ValueHost(План В)

29.95

350

1000

1000

4

30

30

SpaceWeb(KID)

2.6

31

20

1000

4

3

1

SpaceWeb(Litle)

4.9

59

150

1000

4

5

2

SpaceWeb(Real)

6.6

79

500

1000

4

10

10

SpaceWeb(Profy)

12.4

149

1000

1000

4

20

20

ATLEX(200)

6

60

200

1000

4

1

5

ATLEX(400)

9

90

400

1000

4

1

10

ATLEX(800)

17

170

800

1000

4

1

10

ATLEX(2000)

30

300

2000

1000

4

1

20

Host Web Site(200)

3.95

47.4

200

1

3

1

1

Host Web Site(500)

7.95

83.4

500

3

3

1

3

Host Web Site(750)

27.95

335.4

750

7

3

1

10

Приложение Б

Принадлежность наблюдений к классам

Название

Компонентный анализ

Кластерный анализ с применением дендограмм

Кластерный анализ с применением карт Кохонена

Деревья решений

1

PeterHost(Alfa)

1

1

3

1

2

PeterHost(Alfa+)

1

1

3

1

3

PeterHost(Beta)

1

1

3

1

4

PeterHost(Omega)

1

1

3

1

5

PeterHost(Vega)

2

2

3

2

6

eServer(Минимум)

1

1

3

1

7

eServer(Медиум)

1

1

2

1

8

eServer(Бизнес)

1

3

3

3

9

eServer(Оптиум)

1

1

2

1

10

eServer(Максимум)

1

2

1

2

11

Mastak(Любимый)

1

1

1

1

12

Mastak(Подарочный)

1

1

1

1

13

Mastak(Малый плюс)

1

1

1

1

14

Mastak(Лидер)

1

1

1

1

15

Arbatek(Mail)

1

1

3

1

16

Arbatek(Open)

1

1

3

1

17

Arbatek(Nova)

1

1

3

1

18

Arbatek(Nova+)

1

1

3

1

19

Arbatek(Pilot)

1

1

3

1

20

Arbatek(Portal)

1

2

3

2

21

XP-hosting(XP1)

3

3

2

3

22

XP-hosting(XP2)

3

3

2

3

23

XP-hosting(XP3)

3

3

2

3

24

XP-hosting(XP4)

3

3

2

3

25

XP-hosting(XP5)

3

3

1

3

26

GoldHost(Парковка)

1

1

1

1

27

GoldHost(Эконом)

1

1

1

1

28

GoldHost(Старт)

1

1

1

1

29

GoldHost(Подарок)

1

1

1

1

30

GoldHost(Оптима)

1

3

2

3

31

GoldHost(Голд)

3

3

2

3

32

GoldHost(Стандарт)

3

3

2

3

33

GoldHost(Бизнес)

3

3

2

3

34

Agava Hosting(Lite)

1

1

3

1

35

Agava Hosting(Normal)

1

2

3

2

36

Agava Hosting(PRO)

1

1

3

1

37

ValueHost(План А)

1

1

3

1

38

ValueHost(План Б)

1

1

3

1

39

ValueHost(План В)

2

2

3

2

40

SpaceWeb(KID)

1

1

3

1

41

SpaceWeb(Litle)

1

1

3

1

42

SpaceWeb(Real)

1

1

3

1

43

SpaceWeb(Profy)

1

1

3

1

44

ATLEX(200)

1

1

3

1

45

ATLEX(400)

1

1

3

1

46

ATLEX(800)

1

1

3

1

47

ATLEX(2000)

1

1

1

1

48

Host Web Site(200)

1

2

1

2

49

Host Web Site(500)

1

1

1

1

50

Host Web Site(750)

1

1

1

1

Размещено на Allbest.ru


Подобные документы

  • Фреймовые модели представления знаний. Разработка структуры фреймов для реализации экспертной системы. Разработка экспертной системы с фреймовой моделью представления знаний. Редактирование базы фактов кандидатов и описание режима консультации.

    курсовая работа [1,3 M], добавлен 13.10.2012

  • Назначение экспертной системы. Разработка экспертной системы путем самостоятельного программирования в полном объеме простейшей ЭС в "GURU". Листинг экспертной системы по прогнозированию на бирже уровня цен, если валютный курс доллара падает или растет.

    лабораторная работа [17,8 K], добавлен 15.01.2011

  • Процесс подбора экспертной системой наиболее подходящих вариантов, оценки альтернатив в поисках оптимально подходящего конкретному пользователю мотоцикла. Экспертная система как набор программ и база знаний. Исходный код разрабатываемой системы.

    курсовая работа [626,5 K], добавлен 23.11.2012

  • Создание интеллектуальной экспертной системы по подбору комплектующих для стационарного компьютера. Медицина как пример экспертной системы с использованием метода Криса-Нейлора. Извлечение знаний, их структурирование, представление, стратегия вывода.

    контрольная работа [827,5 K], добавлен 14.12.2012

  • Понятие и сущность экспертной системы, ее внутренняя структура и назначение, этапы и принципы разработки. Продукционная и фреймовая модель представления знаний, порядок построения семантической сети. Разработка алгоритма программы, создание интерфейса.

    курсовая работа [1,2 M], добавлен 22.01.2015

  • Аналитический обзор системы управления курсами Moodle, программное построение ее модулей. Разработка структурной схемы и базы знаний экспертной системы. Создание дерева вопросов и выбор алгоритма поиска решений. Анализ возможных угроз и защита информации.

    дипломная работа [534,7 K], добавлен 14.12.2013

  • Сущность и назначение экспертной системы, ее основные элементы и предъявляемые требования, обоснование важности и области применения. Методика получения объяснений в результате действия экспертной системы, их виды. Построение модели гибкого интерфейса.

    курсовая работа [202,4 K], добавлен 10.11.2009

  • Метод главных компонент. Процесс распознавания. Ковариационная матрица, диагональная матрица собственных чисел. Использовании метрики Махаланобиса и Гауссовского распределения для оценки близости изображений. Входные вектора. Библиотека OpenCV.

    статья [22,1 K], добавлен 29.09.2008

  • Разработка базы данных с применением выбранной модели представления знаний и системы пользовательского интерфейса. Определение системы логического вывода. Спецификация составных частей программы. Обзор основных используемых приёмов и методов обработки.

    курсовая работа [765,6 K], добавлен 12.05.2013

  • Анализ существующих решений по автоматизации предметной области. Методология проектирования информационной системы агентства недвижимости. Спецификация и аттестация требований. Проектирование пользовательского интерфейса. Обоснование выбора платформы.

    курсовая работа [412,8 K], добавлен 10.02.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.