Экспертная система интеллектуального анализа рынка видеокарт
Разработка экспертной системы для применения ее в целях автоматизации работы отдела продаж компьютерного магазина для выдачи рекомендаций при выборе комплектующих компьютерной техники - видеокарты. Обоснование выбора модели представления знаний.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 24.09.2012 |
Размер файла | 1,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Курсовая работа
по дисциплине
«Методы искусственного интеллекта»
«Экспертная система интеллектуального анализа рынка видеокарт»
Введение
Центральная парадигма интеллектуальных технологий сегодня - это обработка знаний. Системы, ядром которых является база знаний (БЗ) или модель предметной области, описанная на языке сверхвысокого уровня, приближенном к естественному, называют интеллектуальными. Чаще всего интеллектуальные системы (ИС) применяются для решения сложных задач, где основная сложность решения связана с использованием слабо-формализованных знаний специалистов-практиков и где логическая (или смысловая) обработка информации превалирует над вычислительной Например, понимание естественного языка, поддержка принятия решения в сложных ситуациях, постановка диагноза и рекомендации по методам лечения, анализ визуальной информации, управление диспетчерскими пультами и др. Наиболее распространенным видом ИС являются экспертные системы.
Экспертные системы (ЭС) ? это наиболее распространенный класс ИС, ориентированный на тиражирование опыта высококвалифицированных специалистов в областях, где качество принятия решений традиционно зависит от уровня экспертизы, например, медицина, юриспруденция, геология, экономика, военное дело и др. ЭС эффективны лишь в специфических «экспертных» областях, где важен эмпирический опыт специалистов.
Основным назначением ЭС является разработка программных средств, которые при решении задач, трудных для человека, получают результаты, не уступающие по качеству и эффективности решения решениям, получаемым человеком-экспертом. ЭС используются для решения так называемых неформализованных задач, общим для которых является то, что:
* задачи не могут быть заданы в числовой форме;
* цели нельзя выразить в терминах точно определенной целевой функции;
* не существует алгоритмического решения задачи;
* если алгоритмическое решение есть, но его нельзя использовать из-за ограниченности ресурсов (время, память).
Кроме того, неформализованные задачи обладают ошибочностью, неполнотой, неоднозначностью и противоречивостью как исходных данных, так и знаний о решаемой задаче
Экспертная система - это программное средство, использующее экспертные знания для обеспечения высокоэффективного решения неформализованных задач в узкой предметной области. Основу ЭС составляет база знаний (БЗ) о предметной области, которая накапливается в процессе построения и эксплуатации ЭС. Накопление и организация знаний ? важнейшее свойство всех ЭС. Знания являются явными и доступными, что отличает ЭС от традиционных программ, и определяет их основные свойства, такие, как применение высококачественного опыта, наличие прогностических возможностей, институциональная память, возможность обучения и тренировки.
Применение для решения проблем высококачественного опыта, который представляет уровень мышления наиболее квалифицированных экспертов в данной области, что ведёт к решениям творческим, точным и эффективным.
Наличие прогностических возможностей, при которых ЭС выдает ответы не только для конкретной ситуации, но и показывает, как изменяются эти ответы в новых ситуациях, с возможностью подробного объяснения каким образом новая ситуация привела к изменениям.
Обеспечение такого нового качества, как институциональная память, за счет входящей в состав ЭС базы знаний, которая разработана в ходе взаимодействий со специалистами организации, и представляет собой текущую политику этой группы людей. Этот набор знаний становится выводом квалифицированных мнении и постоянно обновляемым справочником наилучших с стратегий и методов, используемых персоналом.
Ведущие специалисты уходят но их опыт остается.
Возможности использования ЭС для обучения и тренировки руководящих работников обеспечивают новых служащих обширным багажом опыта и стратегий, по которым можно изучать рекомендуемую политику и методы.
1. Идентификация проблемной области
1.1 Постановка задачи
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Данная программа позволяет выдавать рекомендации пользователю по принимаемым решениям при выборе комплектующих компьютерной техники (видеокарты).
1.2 Назначение ЭС
Назначение ЭС ? консультирование в области принятия решений и формирование списка видеокарт из каталога, которые соответствуют требованиям покупателя.
Особенности решения задачи связаны с тем, что ЭС настраивается на требования и запросы пользователя. ЭС должна выполнять функции когнитолога, поддерживать интерфейс пользователя, а также хранить и пополнять БЗ в отдельном файле. ЭС должна выдавать рекомендации лицу, принимающему решение (ЛПР), по принимаемым решениям при выборе комплектующих для компьютера (видеокарты).
Цель разработки ЭС - консультация сотрудников отдела продаж компьютерного магазина в процессе обслуживания клиентов.
1.3 Класс ЭС по решаемой задаче
Класс решаемой задачи - задача поддержки принятия решения (ПНР). ЭС позволяет сформировать множество рекомендации но решению каких-либо задач и представить их в удобной форме.
1.4 Цель
Цель ? выдавать рекомендации по выбору видеокарты при комплектации системного блока.
Целевая переменная «Решение» принимает следующие значения Решение = покупать. Решение = не покупать.
1.5 Ожидаемые результаты
Разработать ЭС, для применения ее в автоматизации отдела продаж компьютерного магазина. Сформировать множество возможных действий по мотивации покупателя в соответствии с заданными требованиями.
1.6 Промежуточные цели
Промежуточные цели при построении данной ЭС определяются такими переменными, как: Comp1 = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая; Класс = 1, 2, 3, не определен.
1.7 Исходные данные
Исходные данные при построении данной ЭС определяются такими переменными, как:
1. Цена = [1000, 23000]
2. Объем памяти (0 - 64, 1 - 128, 2 - 256, 3 - 512) = {0, 1, 2, 3}
3. Тип шины (0 - AGP, 1 - PCI-X) = {0, 1}
4. Разрядность шины памяти (0 - 64, 1 - 128, 2 - 256) = {0, 1, 2}
5. Частота чипа = [200, 650]
6. Частота памяти = [150, 1200]
7. Наличие SLI (0 - Нет, 1 - Да) = {0, 1}
8. Наличие DVI (0 - Нет, 1 - Да) = {0, 1}
9. Наличие TV-In (0 - Нет, 1 - Да) = {0, 1}
10. Наличие TV-Out (0 - Нет, 1 - Да) = {0, 1}
2. Концептуализация предметной области
2.1 Извлечение знаний
2.1.1 Анализ методом главных компонент
Метод главных компонент даст возможность по p исходным признакам выделить в общем случае р главных компонент
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10) Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 2.1.
Таблица 2.1. Исходная сводка МГК
Component Number |
Eigen Value |
Percent of Variance |
Cumulative Percentage |
|
1 |
3.850 |
38.495 |
38.495 |
|
2 |
1.248 |
12.479 |
50.973 |
|
3 |
1.108 |
11.077 |
62.050 |
|
4 |
0.982 |
9.918 |
71.867 |
|
5 |
0.836 |
8.364 |
80.231 |
|
6 |
0.618 |
6.182 |
86.413 |
|
7 |
0.526 |
5.264 |
91.676 |
|
8 |
0.357 |
3.575 |
95.251 |
|
9 |
0.281 |
2.811 |
98.062 |
|
10 |
0.194 |
1.938 |
100.000 |
|
Number of complete cases: 50 |
Из полученной сводки заключаем, что анализу подвергаются переменные цена, объем памяти, тип шины, разрядность шины памяти, частота чипа, частита памяти, наличие SLI, наличие DVI, наличие TVIn, наличие TVOut и что число объектов составляет 50.
Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).
Приведенные цифры говорят о том, что уже первые две главные компоненты описывают 50,973% дисперсии исходных данных. Третья главная компонента добавляет еще 11,077% дисперсии, так что в сумме получается 62,050% дисперсии.
Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах (таблица 2.2).
Таблица 2.2. Веса признаков в главных компонентах
Component1 |
Component2 |
Component3 |
||
Цена |
0.432 |
0.048 |
-0.178 |
|
Объем памяти |
0.347 |
0.334 |
0.270 |
|
Тип шины |
0.284 |
-0.563 |
0.040 |
|
Разрядность шины памяти |
0.411 |
0.202 |
0.272 |
|
Частота чипа |
0.380 |
0.037 |
-0.248 |
|
Частота памяти |
0.333 |
-0.120 |
-0.260 |
|
Наличие SLI |
0.222 |
-0.325 |
-0.055 |
|
Наличие DVI |
0.063 |
0.637 |
-0.191 |
|
Наличие TV-In |
0.325 |
0.015 |
-0.209 |
|
Наличие TV-Out |
0.171 |
-0.038 |
0.779 |
Как следует из полученных цифр, в первой компоненте наблюдается наибольшая зависимость от цены, объема памяти, частоты и разрядность шины, частоты памяти и наличия TVIn. Во второй главной компоненте наблюдается сочетание объема памяти, типа шины, и наличия выхода DVI. В третьей главной компоненте наибольшие веса имеют объем памяти, ее разрядность и наличие выхода TVOut.
Перейдем к рассмотрению диаграммы рассеивания всей совокупности работников на плоскости выделенных двух главных компонент (рисунок 2.1).
Рисунок 2.1 - Проекция исследуемых видеокарт на пространство двух ГК
На представленном рисунке хорошо видно, что вся исследуемая совокупность работников разделилась на три достаточно четких класса.
Рисунок 2.2 - Проекция исследуемых видеокарт на пространство трех ГК
Выбор значащих компонент и определение названия для них представлено ниже.
1) Выберем p=3 главных компонент.
2) Определим названия для них по формуле:
,
где [wkj] - подмножество участвующих в названии весовых коэффициентов j-й компоненты;
[wj] - все весовые коэффициенты j-й компоненты.
Для первой компоненты имеем:
Т.к. принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 83,5%) следующими показателями: цены, объем памяти, частота и разрядность шины, частота памяти и наличие входа TVIn
Для второй компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 83,4%) следующими показателями: объем памяти, тип шины, и наличия выхода DVI.
Для третьей компоненты
Т.к. принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 75,4%) следующими показателями: объем памяти, ее разрядность и наличие выхода TVOut.
2.1.2 Кластерный анализ с помощью дендрограмм
Этот анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации
Введем исходные данные в электронную таблицу STATGRAPHICS (50x10). Для более детального анализа проделали ряд операций. Получили дендрограмму методом Варда для трех кластеров (классов) (рисунок 2.3).
Рисунок 2.3 - Дендрограмма для трех классов
После преобразований получили сводку кластерного анализа (таблица 2.3).
Таблица 2.3. Сводка кластерного анализа
Cluster |
Members |
Percent |
||||||
1 |
36 |
72.00 |
||||||
2 |
3 |
6.00 |
||||||
3 |
11 |
22.00 |
||||||
Centroids: |
||||||||
Cluster |
BusType |
BusWidth |
ChipFreq |
DVI |
Mem |
TVIn |
TVOut |
|
1 |
0.33 |
0.861 |
350.889 |
0.972 |
1.306 |
0 |
1.0 |
|
2 |
0 |
0 |
333.333 |
1.000 |
0.667 |
0 |
0 |
|
3 |
0.818 |
1.545 |
486.818 |
1.000 |
1.818 |
0.272 |
1.0 |
Как видно из таблицы 2.3, в сводке кластерного анализа прежде всего учитываются имена переменных, участвующих в анализе, количество полных образцов, использованный метод кластерного анализа и принятая метрика. Затем, в сводке описывается число кластеров, количество объектов в каждом кластере и соответствующий процент. Кроме того, в нижней части сводки приводится дополнительная информация по координатам центроидов. По этим координатам можно судить о том, какие переменные играют наиболее важную роль в каждом кластере.
Таблица 2.4. Принадлежность объектов к кластерам
Name |
Cluster |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON 9600> (OEM) +DVI+TV Out |
1 |
|
SVGA 64Mb <AGP>8x Soltek SiS Xabre 600, DDR, DVI-Out, TV-Out |
1 |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON 9550> (OEM) 128bit +DVI+TV Out |
1 |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON 9250> (OEM) 128bit +DVI+TV Out |
1 |
|
SVGA 128Mb <AGP> DDR Sapphire <ATI RADEON 9250> (OEM) 64bit +DVI |
2 |
|
SVGA 128Mb <AGP> DDR Sapphire <ATI RADEON 9600 Pro> (OEM) +DVI+TV Out |
1 |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON 9600 Pro Advantage> (OEM) +DVI+TV Out |
1 |
|
SVGA 128Mb <AGP> DDR Sapphire <ATI RADEON 9600XT> (OEM) +DVI+TV Out |
1 |
|
SVGA 128Mb <AGP> DDR Micro-Star MS-8958 FX5700V-TD128 (RTL) 64bit +DVI+TV Out |
1 |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON X800 GTO> (RTL) 256bit+DVI+TV Out |
1 |
|
SVGA 512Mb <AGP> DDR Sapphire <ATI RADEON X1600 Pro> (RTL) 128bit+DVI+TV Out |
1 |
|
SVGA 64Mb <AGP> DDR Matrox Millennium P650 <P65-MDDA8X64> (OEM) +DualDVI |
2 |
|
SVGA 128Mb <AGP> Manli M-GF5800/R128-TV, nVidia GeForceFX 5800 -8Х, DVI-Out, TV-Out |
1 |
|
SVGA 128Mb <AGP> DDR Leadtek A6600 TD (OEM) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 128Mb <AGP> DDR Micro-Star MS-8951 RX9600XT-TD128 (RTL) +DVI+TV Out |
1 |
|
SVGA 256Mb <AGP> DDR Sapphire <ATI RADEON X1600 Pro> (RTL) 128bit+DVI+TV Out |
3 |
|
SVGA 128Mb <AGP> DDR Gigabyte GV-N62128DE (OEM) 64bit +DVI+TV Out <GeForce 6200> |
3 |
|
SVGA 128Mb <AGP> DDR Gigabyte GV-N55128DP (OEM) 128bit +DVI+TV Out <GeForce FX 5500> |
1 |
|
SVGA 128Mb <AGP> DDR Gigabyte GV-N52128DS (OEM) 64bit +DVI+TV Out <GeForce FX 5200> |
1 |
|
SVGA 128Mb <AGP> DDR Gigabyte GV-N66128DP (OEM) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 256Mb <AGP> DDR Gigabyte GV-N66256DP (OEM) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK A9550/TD (RTL) 64bit +DVI+TV Out <ATI RADEON 9550> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK A9550 (GE)/TD (RTL) 128bit +DVI+TV Out <ATI RADEON 9550> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK V9520/TD (RTL) +DVI+TV Out <GeForce FX 5200> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK V9520-X/TD (RTL) +DVI <GeForce FX 5200> |
2 |
|
SVGA 256Mb <AGP> DDR ASUSTeK A9600PRO/TD (RTL) +DVI+TV Out <ATI RADEON 9600Pro> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK N6600/TD (RTL) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 256Mb <AGP> DDR ASUSTeK N6600/TD (RTL) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 128Mb <AGP> DDR ASUSTeK V9570/TD (RTL) +DVI+TV Out <GeForce FX 5700> |
1 |
|
SVGA 128Mb <PCI-E> DDR ASUSTeK EAX600XT/TD (RTL) +DVI+TV Out <ATI X600 XT> |
1 |
|
SVGA 128Mb <PCI-E> DDR Leadtek PX6600GT TDH (OEM) +DVI+TV Out+SLI<GeForce 6600GT> |
3 |
|
SVGA 128Mb <PCI-E> DDR Gigabyte GV-NX66128DP (OEM) +DVI+TV Out <GeForce 6600> |
1 |
|
SVGA 64Mb <PCI-E> DDR ASUSTeK EN6200TC256/TD (RTL) +DVI+TV Out <GeForce 6200TC> |
1 |
|
SVGA 128Mb <PCI-E> DDR ASUSTeK EAX550/TD (RTL) +DVI+TV Out <ATI X550> |
1 |
|
SVGA 256Mb <PCI-E> DDR Sapphire <ATI RADEON X800 GTO2> (RTL) +DVI +TV Out |
1 |
|
SVGA 256Mb <PCI-E> DDR Sapphire <ATI RADEON X600 Pro> (OEM) 128bit +DVI+TV Out |
1 |
|
SVGA 128Mb <PCI-E> DDR Sapphire <ATI RADEON X300SE> (OEM)+TV Out |
1 |
|
SVGA 128Mb <PCI-E> DDR Sapphire <ATI RADEON X700 Pro> (OEM) 128bit+DVI+TV Out |
1 |
|
SVGA 128Mb <PCI-E> DDR Sapphire <ATI RADEON X300SE> (OEM) 64bit +DVI+TV Out |
1 |
|
SVGA 128Mb <PCI-E> DDR Micro-Star V034 NX7300GS-TD128E (OEM) +DVI+TV Out |
1 |
|
SVGA 128Mb <PCI-E> DDR Leadtek PX6600GT TDH (RTL) +DVI+TV Out+SLI+HDTV |
3 |
|
SVGA 128Mb <PCI-E> DDR Gigabyte GV-NX66128D (RTL) +DVI+TV Out |
1 |
|
SVGA 256Mb <PCI-E> DDR Chaintech AE7800GTX <GF 7800GTX> 256Mb (TV-out, 2xDVI) |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EAX850PRO/HTVD (RTL) +DVI+TV In/Out <ATI X850 Pro> |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EN6800GT/2DT (RTL) +DVI+TV Out <GeForce 6800 GT> |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EN6800/TD (RTL) +DVI+TV Out+SLI <GeForce 6800> |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EN7800GT/2D (RTL) +DVI+TV In/Out <GeForce 7800 GT> |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EAX800XT-A319/2DT (RTL) +DVI+TV Out <ATI X800 XT> |
3 |
|
SVGA 512Mb <PCI-E> DDR ASUSTeK EAX1900CF/2DHTV (RTL)+DVI, HDTV-Out, Video-In |
3 |
|
SVGA 256Mb <PCI-E> DDR ASUSTeK EN6600Silencer/TD (RTL) +DVI+TV Out <GeForce 6600> |
1 |
Перейдем к рассмотрению диаграммы рассеивания (рисунок 2.4).
Диаграмма показывает, как группируются исследуемые наблюдения на плоскости двух переменных BusWidth ? разрядность шины и BusType ? тип шины. Каждый кластер представлен на диаграмме собственным символом. Из рисунка следует, что первый кластер включает видеокарты с типом шины AGP и разрядностью шины памяти от 128 до 256 бит и шину PCI-X с разрядностью памяти от 64 до 128 бит. Во втором кластере находятся видеокарты с типом шины AGP и разрядностью шины памяти 64 бит. В третий кластер попадают видеокарты в основном с типом шины PCI-X и разрядностью шины памяти 256 бит.
Рисунок 2.4 ? Двухмерная диаграмма рассеивания
Рассмотрим трехмерную диаграмму рассеивания (рисунок 2.5)
Рисунок 2.5 ? Трехмерная диаграмма рассеивания
Таким образом, кластерный анализ помог разбить множество объектов на заданное число классов на основании некоторою математического критерия качества классификации. Диаграмма показывает, как группируются исследуемые видеокарты в пространстве трех переменных: BusWidth ? разрядность шины, BusType ? тип шины, ChipFreq - тактовая частота чипа.
На основе проведенного кластерного анализа можно извлечь следующие правила.
1. Если BusType = средняя И BusWidth памяти = средняя, то Кластер 1.
2. Если BusType = малая И BusWidth памяти = малая, то Кластер 2.
3. Если BusType = большая И BusWidth памяти = большая, то Кластер 3.
2.1.3 Кластерный анализ с помощью Карт Кохонена
Для решения задачи кластеризации использовались самоорганизующиеся карты Кохонена с применением нейросетевого пакета SOMap analyzer 1.0.
Self-Organizing Maps (SOM) - это самоорганизующиеся структуры, основанные на нейросети Кохонена, которые представлены в виде двухмерной сетки, в узлах которой находятся нейроны.
Структура сети Кохонена представлена на рисунке 3.1. Сеть имеет 10 входов по количеству признаков, по которым ведется кластеризация, и 1 выход, который выдает номер кластера. Сеть однослойная (слой Кохонена). Каждый нейрон слоя Кохонена с помощью своих весовых коэффициентов запоминает координаты ядра кластера и отвечает за отнесение объектов к этому кластеру. Интерпретатор выбирает максимальное значение среди всех выходов и выдает номер этого выхода, который является номером кластера.
Рисунок 2.6 - Структура сети Кохонена
Выборка, состоящая из видеокарт в приложении А. То есть в качестве исходных данных взяты признаки: цена, частота и объем памяти, тип шины, разрядность шины памяти, тактовая частота чипа и другие показатели.
Процесс обучения сети состоит из 5 шагов: выбор источника данных; настройка полей; установка параметров обучения; установка параметров визуализации; обучение (построение) карты.
В качестве источника данных используем созданную обучающую выборку. Параметры обучения, параметры визуализации представлены на рисунке 3.2.
Рисунок 2.7 - Информация о карте
Для построения карт открываем окно с картами по обучающей выборке и выбираем нужные компоненты. Результаты построения представлены на рисунке 2.8 и 2.9.
Рисунок 2.8 - Карты по обучающей выборке
Рисунок 2.9 - Карты по обучающей выборке
В результате анализа карт было выявлено 3 кластера видеокарт:
Таблица 2.5. Характеристика кластеров по признакам
Кластер 1 |
Кластер 2 |
Кластер 3 |
||
Цена |
средний |
малый |
малый |
|
Объем памяти |
большой |
средний |
средний |
|
Тип шины |
средний |
средний |
средний |
|
Разрядность шины |
большой |
средний |
средний |
|
Частота чипа |
большой |
средний |
средний |
|
Частота памяти |
средний |
средний |
малый |
|
Наличие DVI |
большой |
большой |
большой |
|
Наличие SLI |
средний |
малый |
малый |
|
Наличие TVIn |
средний |
малый |
малый |
|
Наличие TVOut |
большой |
большой |
большой |
В таблице приведены значения признаков наиболее характерных для каждого из кластеров. Жирным шрифтом отмечены признаки определяющие принадлежность видеокарты к кластеру.
Окно со статистикой показывает следующие статистические показатели:
минимальное значение;
максимальное значение;
среднее значение;
стандартное отклонение (дисперсия);
количество элементов.
На основе проведенного кластерного анализа можно извлечь следующие правила.
1. Если Цена = средняя И Частота памяти = средняя, то Кластер 1.
2. Если Цена = малая И Частота памяти = средняя, то Кластер 2.
3. Если Цена = малая И Частота памяти = малая, то Кластер 3.
2.1.4 Построение деревьев решений
Система See 5/C 5.0 предназначена для анализа больших баз данных, содержащих до сотни тысяч записей и до сотни числовых или номинальных полей. Результат работы See 5/C 5.0 выражается в виде деревьев решении и множества if-then-правил.
Задача See 5/C 5.0 состоит в предсказании диагностического класса какого-либо объекта по значениям его признаков. При этом, See 5/C 5.0 конструирует классификатор в виде дерева решений, которому, в свою очередь, может быть поставлено в соответствие некоторое множество логических правил.
Файл имен переменных для компонентного анализа vk.names выглядит следующим образом:
Class.
Class: 1, 2, 3.
Price: continuous.
Mem: 0,1,2,3.
BusType: 0,1.
BusWidth: 0,1,2.
ChipFreq: continuous.
MemFreq: continuous.
SLI: 0,1.
DVI: 0,1.
TVIn: 0,1.
TVOut: 0,1.
Целевой признак Class принимает три значения: 1 ? первый класс, 2 ? второй класс, 3 ? третий класс. Затем описывается совокупность признаков: Price ? цена, Mem ? объем памяти, BusType ? тип шины, BusWidth ? разрядность шины памяти, ChipFreq ? тактовая частота чипа, MemFreq ? тактовая частота памяти, SLI ? наличие SLI, DVI ? наличие выхода DVI, TVIn ? наличие выхода TVIn, TVOut ? наличие входа TVOut.
Файл данных vk.data, который имеет следующий вид:
3,2176,2,0,1,325,400,0,1,0,1
1,1379,0,0,0,250,200,0,1,0,1
1,1832,2,0,1,400,200,0,1,0,1
1,1655,2,0,1,350,200,0,1,0,1
1,1241,1,0,0,350,200,0,1,0,0
2,1375,1,0,1,380,225,0,1,0,1
1,2390,2,0,1,400,225,0,1,0,1
1,2758,1,0,1,400,300,0,1,0,1
1,2604,1,0,0,300,225,0,1,0,1
1,6005,2,0,2,400,490,0,1,0,1
1,5239,3,0,1,500,380,0,1,0,1
1,4718,0,0,0,400,450,0,1,0,0
2,9238,1,0,1,350,380,0,1,0,1
1,3156,1,0,1,300,275,0,1,0,1
1,3770,1,0,1,400,300,0,1,0,1
1,4473,2,0,1,500,800,0,1,0,1
3,1808,1,0,0,500,1000,0,1,0,1
3,1730,1,0,1,300,225,0,1,0,1
1,1226,1,0,0,250,166,0,1,0,1
1,3278,1,0,1,300,325,0,1,0,1
1,3401,2,0,1,300,325,0,1,0,1
1,1770,1,0,0,400,200,0,1,0,1
1,1833,1,0,1,400,200,0,1,0,1
1,1578,1,0,1,250,200,0,1,0,1
2,1186,1,0,0,250,200,0,1,0,0
1,2559,2,0,1,400,300,0,1,0,1
1,3003,1,0,1,300,275,0,1,0,1
1,3248,2,0,1,300,275,0,1,0,1
1,3952,1,0,1,427,275,0,1,0,1
1,3707,1,1,1,500,368,0,1,0,1
3,4381,1,1,1,500,500,1,1,0,1
1,2850,1,1,1,300,325,0,1,0,1
1,1624,0,1,0,350,350,0,1,0,1
1,1762,1,1,1,400,500,0,1,0,1
1,5484,2,1,2,400,490,0,1,0,1
1,2344,2,1,1,380,400,0,1,0,1
1,1456,1,1,0,300,360,0,0,0,1
1,3505,1,1,1,400,460,0,1,0,1
1,1563,1,1,0,300,360,0,1,0,1
1,2176,1,1,0,320,380,0,1,0,1
3,4412,1,1,1,500,500,1,1,0,1
1,2865,1,1,1,300,275,0,1,0,1
3,15012,2,1,2,430,1200,0,1,0,1
3,7598,2,1,2,520,540,0,1,1,1
3,7996,2,1,2,530,500,1,1,0,1
3,8108,2,1,2,350,300,1,1,0,1
3,14705,2,1,2,400,500,1,1,1,1
3,18933,2,1,2,500,500,0,1,0,1
3,22158,3,1,2,625,725,0,1,1,1
1,3345,2,1,2,300,325,0,1,0,1
На первом этапе обработки данных обычно используются параметры системы, установленные по умолчанию.
2.2 Структурирование проблемной области
Структурирование проблемной области можно представить в виде дерева целей (рисунок 2.13):
Рисунок 2.13 - Дерево целей
Представим структурирование предметной области в более детальном виде с учетом результатов компонентного анализа:
Рисунок 2.14 - Скорректированное дерево целей
3. Формализация базы знании
3.1 Краткий обзор модели представления знаний
Для представления знаний используется продукционная модель. В общем виде продукционное правило представляется следующей нотацией:
PRi = <N, Q, Р, С, А => В, S>,
где N ? имя 1-го продукционного правила, Q ? сфера применения, которая позволяет определить некоторую область из множества продукционных правил, которая будет анализироваться, Р ? предусловие, которое устанавливает на множестве правил выделенной сферы некоторый порядок приоритета их использования, С ? условие применения правила, А=>В ? ядро продукционного правила, которое описывает преобразования, составляющее сущность правила:
А ? предпосылка (антицендент).
В ? заключение (консеквент),
S ? действие, которое необходимо выполнить после ядра.
Предпосылка и заключение могут быть представлены несколькими фактами: <предпосылка> = <факт 1> и <факт 2> и… и <факт n> База знании содержит известные факты, которые выражены в виде объектов, атрибутов и условий, т.е. факты представляют в виде объектов, описывая их атрибуты и придавая им эквиваленты или значения.
видеокарта экспертный магазин автоматизация
3.2 Обоснование выбора модели представления знаний
В ряде случаев полученное дерево решении может оказаться слишком сложным для восприятия. Например, при построении задач высокой размерности для неоднородных данных дерево нередко получается кустистое и довольно большое. Поэтому, с целью упрощения логического вывода рекомендуется использовать логическую связку «И». Если по смыслу существует логическая связка «ИЛИ», то формируется второе аналогичное правило, содержащее только связки «И».
3.3 Таблицы решений
Таблица решений представляет собой имя переменной, ее возможные значения и варианты решения. Таблицы решений для определения сущностей Compl, Comp2, Comp2, Класс и Решение приведены в таблицах 3.1-3.5.
Таблица 3.1. Таблица решений для сущности «Comp1»
Comp1=большая |
Comp1=средняя |
Comp1=малая |
Частота чипа |
Частота памяти |
Наличие TVIn |
|
+ |
большая |
большая |
да |
|||
+ |
большая |
большая |
нет |
|||
+ |
большая |
средняя |
да |
|||
+ |
большая |
средняя |
нет |
|||
+ |
большая |
малая |
да |
|||
+ |
большая |
малая |
нет |
|||
+ |
средняя |
большая |
да |
|||
+ |
средняя |
большая |
нет |
|||
+ |
средняя |
средняя |
да |
|||
+ |
средняя |
средняя |
нет |
|||
+ |
средняя |
малая |
да |
|||
+ |
средняя |
малая |
нет |
|||
+ |
малая |
большая |
да |
|||
+ |
малая |
большая |
нет |
|||
+ |
малая |
средняя |
да |
|||
+ |
малая |
средняя |
нет |
|||
+ |
малая |
малая |
да |
|||
+ |
малая |
малая |
нет |
Таблица 3.2. Таблица решений для сущности «Comp2»
Comp2=большая |
Comp2=средняя |
Comp2=малая |
Объем памяти |
Тип шины |
Наличие DVI |
|
+ |
большая |
большая |
да |
|||
+ |
большая |
большая |
нет |
|||
+ |
большая |
малая |
да |
|||
+ |
большая |
малая |
нет |
|||
+ |
средняя |
большая |
да |
|||
+ |
средняя |
большая |
нет |
|||
+ |
средняя |
малая |
да |
|||
+ |
средняя |
малая |
нет |
|||
+ |
малая |
большая |
да |
|||
+ |
малая |
большая |
нет |
|||
+ |
малая |
малая |
да |
|||
+ |
малая |
малая |
нет |
Таблица 3.3. Таблица решений для сущности «Comp3»
Comp3=большая |
Comp3=средняя |
Comp3=малая |
Разрядность шины памяти |
Наличие TVOut |
|
+ |
большая |
да |
|||
+ |
большая |
нет |
|||
+ |
средняя |
да |
|||
+ |
средняя |
нет |
|||
+ |
малая |
да |
|||
+ |
малая |
нет |
Таблица 3.4. Таблица решений для сущности «Класс»
Класс=1 |
Класс=2 |
Класс=3 |
Класс=не определен |
Comp1 |
Comp2 |
Comp2 |
|
+ |
большая |
большая |
большая |
||||
+ |
большая |
большая |
средняя |
||||
+ |
большая |
большая |
малая |
||||
+ |
большая |
средняя |
большая |
||||
+ |
большая |
средняя |
средняя |
||||
+ |
большая |
средняя |
малая |
||||
+ |
большая |
малая |
большая |
||||
+ |
большая |
малая |
средняя |
||||
+ |
большая |
малая |
малая |
||||
+ |
средняя |
большая |
большая |
||||
+ |
средняя |
большая |
средняя |
||||
+ |
средняя |
большая |
малая |
||||
+ |
средняя |
средняя |
большая |
||||
+ |
средняя |
средняя |
средняя |
||||
+ |
средняя |
средняя |
малая |
||||
+ |
средняя |
малая |
большая |
||||
+ |
средняя |
малая |
средняя |
||||
+ |
средняя |
малая |
малая |
||||
+ |
малая |
большая |
большая |
||||
+ |
малая |
большая |
средняя |
||||
+ |
малая |
большая |
малая |
||||
+ |
малая |
средняя |
большая |
||||
+ |
малая |
средняя |
средняя |
||||
+ |
малая |
средняя |
малая |
||||
+ |
малая |
малая |
большая |
||||
+ |
малая |
малая |
средняя |
||||
+ |
малая |
малая |
малая |
Таблица 3.5. Таблица решений для сущности «Решение»
Решение - Покупать |
Решение - Не покупать |
Класс |
Цена |
|
+ |
1 |
большая |
||
+ |
1 |
средняя |
||
+ |
1 |
малая |
||
+ |
2 |
большая |
||
+ |
2 |
средняя |
||
+ |
2 |
малая |
||
+ |
3 |
большая |
||
+ |
3 |
средняя |
||
+ |
3 |
малая |
||
+ |
не определен |
большая |
||
+ |
не определен |
средняя |
||
+ |
не определен |
малая |
3.4 Сеть вывода
По полученным таблицам генерируем сети выводов, приведенные на рисунках 3.1-3.5:
Рисунок 3.1 - Сеть вывода для сущности «Comp1»
Рисунок 3.2 - Сеть вывода для сущности «Comp2»
Рисунок 3.3 - Сеть вывода для сущности «Comp3»
Рисунок 3.4 - Сеть вывода для сущности «Класс»
Рисунок 3.5 - Сеть вывода для сущности «Решение»
4. База знаний
В данном курсовом проекте разрабатывается ЭС поддержки принятия решения. В коде разработки было составлено 75 правил поведения системы.
1. Если Класс=1 и Цена=большая, то Решение - Покупать
2. Если Класс=1 и Цена=средняя, то Решение - Не покупать
3. Если Класс=1 и Цена=малая, то Решение - Не покупать
4. Если Класс=2 и Цена=большая, то Решение - Не покупать
5. Если Класс=2 и Цена=средняя, то Решение - Покупать
6. Если Класс=2 и Цена=малая, то Решение - Не покупать
7. Если Класс=3 и Цена=большая, то Решение - Не покупать
8. Если Класс=3 и Цена=средняя, то Решение - Не покупать
9. Если Класс=3 и Цена=малая, то Решение - Покупать
10. Если Comp1=большая и Comp2=большая и Comp3=большая, то Класс=1
11. Если Comp1=большая и Comp2=большая и Comp3=средняя, то Класс=1
12. Если Comp1=большая и Comp2=большая и Comp3=малая, то Класс=2
13. Если Comp1=большая и Comp2=средняя и Comp3=большая, то Класс=1
14. Если Comp1=большая и Comp2=средняя и Comp3=средняя, то Класс=2
15. Если Comp1=большая и Comp2=средняя и Comp3=малая, то Класс=2
16. Если Comp1=большая и Comp2=малая и Comp3=большая, то Класс=2
17. Если Comp1=большая и Comp2=малая и Comp3=средняя, то Класс=2
18. Если Comp1=большая и Comp2=малая и Comp3=малая, то Класс=3
19. Если Comp1=средняя и Comp2=большая и Comp3=большая, то Класс=1
20. Если Comp1=средняя и Comp2=большая и Comp3=средняя, то Класс=2
21. Если Comp1=средняя и Comp2=большая и Comp3=малая, то Класс=2
22. Если Comp1=средняя и Comp2=средняя и Comp3=большая, то Класс=2
23. Если Comp1=средняя и Comp2=средняя и Comp3=средняя, то Класс=3
24. Если Comp1=средняя и Comp2=средняя и Comp3=малая, то Класс=3
25. Если Comp1=средняя и Comp2=малая и Comp3=большая, то Класс=3
26. Если Comp1=средняя и Comp2=малая и Comp3=средняя, то Класс=3
27. Если Comp1=средняя и Comp2=малая и Comp3=малая, то Класс=не определен
28. Если Comp1=малая и Comp2=большая и Comp3=большая, то Класс=2
29. Если Comp1=малая и Comp2=большая и Comp3=средняя, то Класс=3
30. Если Comp1=малая и Comp2=большая и Comp3=малая, то Класс=3
31. Если Comp1=малая и Comp2=средняя и Comp3=большая, то Класс=3
32. Если Comp1=малая и Comp2=средняя и Comp3=средняя, то Класс=3
33. Если Comp1=малая и Comp2=средняя и Comp3=малая, то Класс=не определен
34. Если Comp1=малая и Comp2=малая и Comp3=большая, то Класс=3
35. Если Comp1=малая и Comp2=малая и Comp3=средняя, то Класс=не определен
36. Если Comp1=малая и Comp2=малая и Comp3=малая, то Класс=не определен
37. Если Частота чипа=большая и Частота памяти=большая и Наличие TVIn=да, то Comp1=большая
38. Если Частота чипа=большая и Частота памяти=большая и Наличие TVIn=нет, то Comp1=большая
39. Если Частота чипа=большая и Частота памяти=средняя и Наличие TVIn=да, то Comp1=большая
40. Если Частота чипа=большая и Частота памяти=средняя и Наличие TVIn=нет, то Comp2=средняя
41. Если Частота чипа=большая и Частота памяти=малая и Наличие TVIn=да, то Comp2=средняя
42. Если Частота чипа=большая и Частота памяти=малая и Наличие TVIn=нет, то Comp2=средняя
43. Если Частота чипа=средняя и Частота памяти=большая и Наличие TVIn=да, то Comp1=большая
44. Если Частота чипа=средняя и Частота памяти=большая и Наличие TVIn=нет, то Comp2=средняя
45. Если Частота чипа=средняя и Частота памяти=средняя и Наличие TVIn=да, то Comp2=средняя
46. Если Частота чипа=средняя и Частота памяти=средняя и Наличие TVIn=нет, то Comp2=средняя
47. Если Частота чипа=средняя и Частота памяти=малая и Наличие TVIn=да, то Comp2=средняя
48. Если Частота чипа=средняя и Частота памяти=малая и Наличие TVIn=нет, то Comp2=малая
49. Если Частота чипа=малая и Частота памяти=большая и Наличие TVIn=да, то Comp2=средняя
50. Если Частота чипа=малая и Частота памяти=большая и Наличие TVIn=нет, то Comp2=средняя
51. Если Частота чипа=малая и Частота памяти=средняя и Наличие TVIn=да, то Comp2=средняя
52. Если Частота чипа=малая и Частота памяти=средняя и Наличие TVIn=нет, то Comp2=малая
53. Если Частота чипа=малая и Частота памяти=малая и Наличие TVIn=да, то Comp2=малая
54. Если Частота чипа=малая и Частота памяти=малая и Наличие TVIn=нет, то Comp2=малая
55. Если Объем памяти=большая и Тип шины=большая и Наличие DVI=да, то Comp2=большая
56. Если Объем памяти=большая и Тип шины=большая и Наличие DVI=нет, то Comp2=большая
57. Если Объем памяти=большая и Тип шины=малая и Наличие DVI=да, то Comp2=большая
58. Если Объем памяти=большая и Тип шины=малая и Наличие DVI=нет, то Comp2=средняя
59. Если Объем памяти=средняя и Тип шины=большая и Наличие DVI=да, то Comp2=большая
60. Если Объем памяти=средняя и Тип шины=большая и Наличие DVI=нет, то Comp2=средняя
61. Если Объем памяти=средняя и Тип шины=малая и Наличие DVI=да, то Comp2=средняя
62. Если Объем памяти=средняя и Тип шины=малая и Наличие DVI=нет, то Comp2=малая
63. Если Объем памяти=малая и Тип шины=большая и Наличие DVI=да, то Comp2=средняя
64. Если Объем памяти=малая и Тип шины=большая и Наличие DVI=нет, то Comp2=малая
65. Если Объем памяти=малая и Тип шины=малая и Наличие DVI=да, то Comp2=малая
66. Если Объем памяти=малая и Тип шины=малая и Наличие DVI=нет, то Comp2=малая
67. Если Разрядность шины памяти=большая и Наличие TVOut=да, то Comp3=большая
68. Если Разрядность шины памяти=большая и Наличие TVOut=нет, то Comp3=большая
69. Если Разрядность шины памяти=средняя и Наличие TVOut=да, то Comp3=большая
70. Если Разрядность шины памяти=средняя и Наличие TVOut=нет, то Comp3=средняя
71. Если Разрядность шины памяти=малая и Наличие TVOut=да, то Comp3=средняя
72. Если Разрядность шины памяти=малая и Наличие TVOut=нет, то Comp3=малая.
Заключение
В результате анализа данных методом главных компонент, кластерным анализом и построения дерева решений, были выделены 3 класса видеокарт, с различными характеристиками. Результаты анализа данных, полученные различными методами, совпадают.
В данной курсовой работе разработана ЭС для применения в автоматизации отдела продаж компьютерного магазина. Данная ЭС позволяет выдавать рекомендации пользователю по принимаемым решениям при выборе комплектующих компьютерной техники (видеокарты) в зависимости от его потребностей.
В ходе разработки ЭС было проведено извлечение знаний с помощью анализа характеристик работников методом главных компонент, кластерным анализом и построением деревьев решений.
По результатам метода главных компонент выделили три главных компоненты Comp1, Comp2 и Comp3, определили их состав.
В результате получили, что значениями признаков Цена, Объем памяти, Частота и Разрядность шины, Частота памяти и Наличие входа TVIn первая главная компонента определяется более чем на 83,5%. Значениями признаков Объем памяти, Тип шины, и Наличие выхода DVI вторая главная компонента определяется более чем на 83,4%. Значениями признаков Объем памяти, ее Разрядность и Наличие выхода TVOut вторая главная компонента определяется более чем на 75,4%.
При построении деревьев решений с помощью системы Sce5/C 5.0 проанализировали результаты компонентного и кластерного анализов. Результат работы системы See5 выразился в виде деревьев решений и множестве if-then правил. Результаты, полученные в ходе построения деревьев решений, полностью совпали с результатами компонентного и кластерного анализов с использованием дендрограмм и карт Кохонена.
Список литературы
1. Методические указания к курсовому проектированию по дисциплине «Моделирование ИАС» дли специальности АСОИУ / Уфимск. roc. авиац. техн. ун-т; Сост.: Е.А. Макарова. - Уфа, 2001.
2. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский - СПб: Питер, 2000 - 384 с.
3. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. - Уч. пособие. - М.: Синтег, 1998. - 216 с.
4. Статические и динамические экспертные системы: Учеб. пособие / Э.В. Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот. - М.: Финансы и статистика, 1996. - 320 с.
Размещено на Allbest.ru
Подобные документы
Фреймовые модели представления знаний. Разработка структуры фреймов для реализации экспертной системы. Разработка экспертной системы с фреймовой моделью представления знаний. Редактирование базы фактов кандидатов и описание режима консультации.
курсовая работа [1,3 M], добавлен 13.10.2012Процесс подбора экспертной системой наиболее подходящих вариантов, оценки альтернатив в поисках оптимально подходящего конкретному пользователю мотоцикла. Экспертная система как набор программ и база знаний. Исходный код разрабатываемой системы.
курсовая работа [626,5 K], добавлен 23.11.2012Создание интеллектуальной экспертной системы по подбору комплектующих для стационарного компьютера. Медицина как пример экспертной системы с использованием метода Криса-Нейлора. Извлечение знаний, их структурирование, представление, стратегия вывода.
контрольная работа [827,5 K], добавлен 14.12.2012Проектирование и создание базы данных в СУБД Access для автоматизации работы магазина компьютерной техники. Режимы работы с базами данных, таблицы как основные объекты базы. Источники записей для форм, отчетов и страниц доступа, хранение структуры базы.
курсовая работа [249,8 K], добавлен 14.09.2011Моделирование информационной системы для автоматизации работы отдела поставок и отгрузок склада бытовой техники. Построение функциональной модели. Определение информационных объектов и связей между ними. Контрольный пример и алгоритма решения задачи.
контрольная работа [365,9 K], добавлен 17.11.2012Разработка экспертной системы по выбору языка программирования для данного программного обеспечения. Выбор и обоснование механизма вывода решения. Дерево базы знаний экспертной системы. Программа формирования основного меню, руководство пользователя.
курсовая работа [1,9 M], добавлен 15.08.2012Назначение экспертной системы. Разработка экспертной системы путем самостоятельного программирования в полном объеме простейшей ЭС в "GURU". Листинг экспертной системы по прогнозированию на бирже уровня цен, если валютный курс доллара падает или растет.
лабораторная работа [17,8 K], добавлен 15.01.2011Понятие и сущность экспертной системы, ее внутренняя структура и назначение, этапы и принципы разработки. Продукционная и фреймовая модель представления знаний, порядок построения семантической сети. Разработка алгоритма программы, создание интерфейса.
курсовая работа [1,2 M], добавлен 22.01.2015Обследование объекта, обоснование необходимости систем компьютерного тестирования. Анализ существующих разработок и обоснование выбора технологии проектирования. Создание системы компьютерного тестирования на основе случайного выбора в среде Visual Basic.
дипломная работа [2,4 M], добавлен 18.08.2013Конфигурирование персонального компьютера для Вооруженных сил Российской Федерации и обоснование выбора комплектующих для него. Анализ характеристик комплектующих: процессора, материнской платы, видеокарты, жесткого диска и периферийных устройств.
курсовая работа [1,9 M], добавлен 16.07.2013