Базы знаний как современные интеллектуальные информационные системы
Представление знаний, разработка их систем, стратегия получения и практические методы извлечения. Виды и технологии интеллектуальных информационных систем. Задачи формирования и формализация баз знаний. Автоматизированные системы распознавания образов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 18.12.2009 |
Размер файла | 578,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
34
Введение
Возможности электронно-вычислительных машин уже никого не удивляют. Компьютеризация различных областей человеческой деятельности, помимо прямого эффекта от внедрения вычислительной техники, зачастую порождает новые классы программных продуктов и технологии их разработки. Любая технология - это прежде всего поле интеллектуальной деятельности для специалистов, однако, в отличии от других видов деятельности технологии разработки программных продуктов немедленно становятся объектами автоматизации, что выводит соответствующий раздел программирования на новый уровень развития.
Типичную эволюцию от конкретных программ до инструментальных средств разработки прошли системы, основанные на знаниях, и в первую очередь - экспертные системы, предназначенные для решения задач из тех областей, где решающую роль играют знания и опыт профессиональной деятельности. В экспертных системах поиск решений осуществляется посредством имитации рассуждений, присущих выдающимся профессионалам. Формализованные знания составляют ядро экспертной системы - ее базу знаний. Остальные блоки системы реализуют функции преобразования знаний и определяются не столько содержимым знаний, сколько свойствами их формальных структур.
1. Понятие искусственного интеллекта. Представление знаний и разработка систем, основанных на знаниях
1.1 Основные понятия искусственного интеллекта
Термин интеллект (intelligence) происходит от латинского intellectus -- что означает ум, рассудок, разум; мыслительные способности человека. Соответственно искусственный интеллект (artificial intelligence) -- ИИ (AI) обычно толкуется, как свойство автоматических систем брать на себя отдельные функции интеллекта человека, например, выбирать и принимать оптимальные решения на основе ранее полученного опыта и рационального анализа внешних воздействий.
Интеллектом называется способность мозга решать (интеллектуальные) задачи путем приобретения, запоминания и целенаправленного преобразования знаний в процессе обучения на опыте и адаптации к разнообразным обстоятельствам Хант Э. Искусственный интеллект. М.1978..
В этом определении под термином "знания" подразумевается не только ту информацию, которая поступает в мозг через органы чувств. Такого типа знания чрезвычайно важны, но недостаточны для интеллектуальной деятельности. Дело в том, что объекты окружающей нас среды обладают свойством не только воздействовать на органы чувств, но и находиться друг с другом в определенных отношениях. Ясно, что для того, чтобы осуществлять в окружающей среде интеллектуальную деятельность (или хотя бы просто существовать), необходимо иметь в системе знаний модель этого мира. В этой информационной модели окружающей среды реальные объекты, их свойства и отношения между ними не только отображаются и запоминаются, но и, как это отмечено в данном определении интеллекта, могут мысленно "целенаправленно преобразовываться". При этом существенно то, что формирование модели внешней среды происходит "в процессе обучения на опыте и адаптации к разнообразным обстоятельствам".
В 1954 г. в МГУ начал свою работу семинар «Автоматы и мышление» под руководством академика Ляпунова А.Д. (1911-1973), одного из основателей российской кибернетики. В этом семинаре принимали участие физиологи, лингвисты, психологи, математики. Принято считать, что именно в это время родился искусственный интеллект в России. Как и за рубежом, выделились два основных направления -- нейрокибернетики и кибернетики «черного ящика».
В 1954-1964 гг. создаются отдельные программы и проводятся исследования в области поиска решения логических задач. В Ленинграде (ЛОМИ -- Ленинградское отделение математического института им. Стеклова) создается программа АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на оригинальном обратном выводе Маслова, аналогичном методу резолюций Робинсона. Среди наиболее значимых результатов, полученных отечественными учеными в 60-е годы, следует отметить алгоритм «Кора» М. М. Бонгарда, моделирующий деятельность человеческого мозга при распознавании образов. Большой вклад в становление российской школы ИИ внесли выдающиеся ученые Цетлин М. Л., Пушкин В. Я., Гаврилов М. А, чьи ученики и явились пионерами этой науки в России (например, знаменитая Гавриловская школа).
В 1965-1980 гг. происходит рождение нового направления -- ситуационного управления (соответствует представлению знаний, в западной терминологии). Основателем этой научной школы стал проф. Поспелов Д. А. Были разработаны специальные модели представления ситуаций -- представления знаний.
При том, что отношение к новым наукам в советской России всегда было настороженное, наука с таким «вызывающим» названием тоже не избежала этой участи и была встречена в Академии наук в штыки. К счастью, даже среди членов Академии наук СССР нашлись люди, не испугавшиеся столь необычного словосочетания в качестве названия научного направления. Двое из них сыграли огромную роль в борьбе за признание ИИ в нашей стране. Это были академики А. И. Берг и Г. С. Поспелов.
Только в 1974 году при Комитете по системному анализу при президиуме АН СССР был создан Научный совет по проблеме - «Искусственный интеллект», его возглавил Г. С. Поспелов, его заместителями были избраны Д. А. Поспелов и Л. И. Микулич. В состав совета входили на разных этапах М. Г. Гаазе-Рапопорт, Ю. И. Журавлев, Л. Т. Кузин, А. С. Нариньяни, Д. Е. Охоцимский, А. И. Половинкин, О. К. Тихомиров, В. В. Чавчанидзе.
По инициативе Совета было организовано пять комплексных научных проектов, которые были возглавлены ведущими специалистами в данной области. Проекты объединяли исследования в различных коллективах страны: «Диалог» (работы по пониманию естественного языка, руководители А. П. Ершов, А. С. Нариньяни), «Ситуация» (ситуационное управление, Д. А. Поспелов), «Банк» (банки данных, Л. Т. Кузин), «Конструктор» (поисковое конструирование, А. И. Половинкин), «Интеллект робота» (Д. Е. Охоцимский).
В 1980-1990 гг. проводятся активные исследования в области представления знаний, разрабатываются языки представления знаний, экспертные системы (более 300). В Московском университете создается язык РЕФАЛ. В 1988 г. создается АИИ -- Ассоциация искусственного интеллекта. Ее членами являются более 300 исследователей. Президентом Ассоциации единогласно избирается Д. А. Поспелов, выдающийся ученый, чей вклад в развитие ИИ в России трудно переоценить. Крупнейшие центры -- в Москве, Петербурге, Переславле-Залесском, Новосибирске. В научный совет Ассоциации входят ведущие исследователи в области ИИ -- В. П. Гладун, В. И. Городецкий, Г. С. Осипов, Э. В. Попов, В. Л. Стефанюк, В. Ф. Хорошевский, В. К. Финн, Г. С. Дентин, А С. Эрлих и другие ученые. В рамках Ассоциации проводится большое количество исследований, организуются школы для молодых специалистов, семинары, симпозиумы, раз в два года собираются объединенные конференции, издается научный журнал.
Уровень теоретических исследований по искусственному интеллекту в России ничуть не ниже мирового. К сожалению, начиная с 80-х гг. на прикладных работах начинает сказываться постепенное отставание в технологии. На данный момент отставание в области разработки промышленных интеллектуальных систем составляет порядка 3-5 лет Уинстон П. Искусственный интеллект. М.1980..
2. Основные виды и технологии интеллектуальных информационных систем
2.1 Базы знаний - основа интеллектуальной системы
Многие виды умственной деятельности человека, такие, как написание программ для вычислительной машины, занятие математикой, ведение рассуждений на уровне здравого смысла и даже вождение автомобиля - требуют "интеллекта". На протяжении последних десятилетий было построено несколько типов компьютерных систем, способных выполнять подобные задачи.
Имеются системы, способные диагностировать заболевания, планировать синтез сложных синтетических соединений, решать дифференциальные уравнения в символьном виде, анализировать электронные схемы, понимать ограниченный объем человеческой речи и естественного языкового текста. Можно сказать, что такие системы обладают в, некоторой степени, искусственным интеллектом.
Работа по построению таких систем проводится в области, получившей название искусственный интеллект (ИИ).
При реализации интеллектуальных функций непременно присутствует информация, называемая знаниями. Другими словами, интеллектуальные системы являются в то же время системами обработки знаний.
В настоящее время в исследованиях по искусственному интеллекту выделились несколько основных направлений.
1. Представление знаний. В рамках этого направления решаются задачи, связанные с формализацией и представлением знаний в памяти системы ИИ. Для этого разрабатываются специальные модели представления знаний и языки описания знаний, внедряются различные типы знаний. Проблема представления знаний является одной из основных проблем для системы ИИ, так как функционирование такой системы опирается на знания о проблемной области, которые хранятся в ее памяти.
2. Манипулирование знаниями. Чтобы знаниями можно было пользоваться при решении задачи, следует научить систему ИИ оперировать ими. В рамках данного направления разрабатываются способы пополнения знаний на основе их неполных описаний, создаются методы достоверного и правдоподобного вывода на основе имеющихся знаний, предлагаются модели рассуждений, опирающихся на знания и имитирующих особенности человеческих рассуждений. Манипулирование знаниями очень тесно связано с представлением знаний, и разделить эти два направления можно лишь условно.
3. Общение. В круг задач этого направления входят: проблема понимания и синтеза связных текстов на естественном языке, понимание и синтез речи, теория моделей коммуникаций между человеком и системой ИИ. На основе исследований в этом направлении формируются методы построения лингвистических процессов, вопросно-ответных систем, диалоговых систем и других систем ИИ, целью которых является обеспечение комфортных условий для общения человека с системой ИИ.
4. Восприятие. Это направление включает разработку методов представления информации о зрительных образах в базе знаний, создание методов перехода от зрительных сцен к их текстовому описанию и методов обратного перехода, создание средств, порождающих зрительные сцены на основе внутренних представлений в системах ИИ.
5. Обучение. Для развития способности систем ИИ к обучению, т.е. к решению задач, с которыми они раньше не встречались, разрабатываются методы формирования условий задач по описанию проблемной ситуации или по наблюдению за ней, методы перехода от известного решения частных задач (примеров) к решению общей задачи, создание приемов разбиения исходной задачи на более мелкие и уже известные для систем ИИ. В этом направлении ИИ сделано еще весьма мало.
6. Поведение. Поскольку системы ИИ должны действовать в некоторой окружающей среде, то необходимо разрабатывать некоторые поведенческие процедуры, которые позволили бы им адекватно взаимодействовать с окружающей средой, другими системами ИИ и людьми. Это направление в ИИ также разработано ещё очень слабо.
В последние годы термин "знание" все чаще употребляется в информатике. Специалисты подчеркивают, что совершенствование так называемых интеллектуальных систем (информационно-поисковых систем высокого уровня, диалоговых систем, базирующихся на естественных языках, интерактивных человеко-машинных систем, используемых в управлении, проектировании, научных исследованиях) во многом определяется тем, насколько успешно будут решаться задачи (проблемы) представления знаний Базы знаний интеллектуальных систем\ Т.А. Гаврилова, В.Ф. Хорошевский - СПб: Питер, 2000.-384 с.: ил..
2.2 Аспекты представления знаний
Неудивительно, что перед теми, кто занимается проблемой представления знаний, встает вопрос о том, что такое знание, какова его природа и основные характеристики. В связи с этим предпринимаются, например, попытки дать такое определение знания, из которого можно было бы исходить в решении задач представления знаний в компьютерных системах.
Представлению данных присущ пассивный аспект: книга, таблица, заполненная информацией память. В теории искусственного интеллекта особо подчеркивается активный аспект представления знаний: приобретение знания должно стать активной операцией, позволяющей не только запоминать, но и применять воспринятые (приобретенные, усвоенные) знания для рассуждений на их основе.
Использование символического языка, такого, как язык математической логики, позволяет формулировать описания в форме, одновременно близкой и к обычному языку, и к языку программирования. Впрочем, математическая логика позволяет рассуждать, базируясь на приобретенных знаниях: логические выводы действительно являются активными операциями получения новых знаний из уже усвоенных.
Принципиальная мировоззренческая установка состоит в рассмотрении ЭВМ как предмета-посредника в познавательной человеческой деятельности. Компьютерная система, подобно другим предметам-посредникам (орудиям труда и предметам быта, инструментам, приборам, знаково-символическим системам, научным текстам и т. д.), играя инструментальную роль в познании, является средством объективизации накопленного знания, воплощением определенного социально-исторического опыта практической и познавательной деятельности.
Проблема представления знаний возникла как одна из проблем искусственного интеллекта. Она связана с переходом исследований в этой области в некоторую новую фазу. Речь идет о создании практически полезных систем (прежде всего так называемых экспертных систем), применяемых в медицине, геологии, химии. Создание такого рода систем требует интенсивных усилий по формализации знания, накопленного в соответствующей науке.
С термином "представление знаний" связывается определенный этап в развитии математического обеспечения ЭВМ. Если на первом этапе доминировали программы, а данные играли вспомогательную роль своеобразной "пищи" для "голодных" программ, то на последующих этапах роль данных неуклонно возрастала. Их структура усложнялась: от машинного слова, размещенного в одной ячейке памяти ЭВМ, происходил переход к векторам, массивам, файлам, спискам. Венцом этого развития стали абстрактные типы данных, обеспечивающие возможность создания такой структуры данных, которая наиболее удобна при решении задачи. Последовательное развитие структур данных привело к их качественному изменению и к переходу от представления данных к представлению знаний. Уровень представления знаний отличается от уровня представления данных не только более сложной структурой, но и существенными особенностями: интерпретируемость, наличие классифицируемых связей (например, связь между знаниями, относящихся к элементу множества, и знаниями об этом множестве), которые позволяют хранить информацию, одинаковую для всех элементов множества, записанную одноактно при описании самого множества, наличие ситуативных отношений (одновременности, нахождения в одной точке пространства и т. п., эти отношения определяют ситуативную совместимость тех или иных знаний, хранимых в памяти). Кроме того, для уровня знаний характерны такие признаки, как наличие специальных процедур обобщения, пополнения имеющихся в системе знаний и ряда других процедур.
Моделирование на ЭВМ понималось как техническая реализация определенной формы знакового моделирования. Однако, рассматривая ЭВМ в гносеологическом плане в качестве посредника в познании, имеет смысл не фиксировать внимание, прежде всего на "железной части" (hardware) компьютера, а рассматривать всю компьютерную систему как сложную систему взаимосвязанных и до некоторых пределов самостоятельных моделей - как материальных, так и знаковых, т. е. идеальных. Такой подход не только соответствует рассмотрению компьютерных систем в современной информатике, но является и гносеологически оправданным. В последние годы все чаще стал употребляться термин "компьютерное моделирование". Очевидно, имеет смысл обозначать им построение любого из составляющих компьютерной системы - будь то знаковая модель или материальная Базы знаний интеллектуальных систем\ Т.А. Гаврилова, В.Ф. Хорошевский - СПб: Питер, 2000.-384 с.: ил..
2.3 Задача формирования баз знаний
При всей претенциозности своего названия, инженерия знаний является дисциплиной сугубо прозаической, в ее задачу входит разработка практически полезных программ для слабо "математизированных" областей человеческой деятельности. Главным аргументом в пользу плодотворности такого подхода является факт существования в реальной жизни института экспертов - классных профессионалов, способных решать плохо формализуемые задачи из той или иной проблемной области.
С точки зрения инженерии знаний, в любой прикладной программе (по-крайней мере теоретически) можно выделить компоненту, содержащую знания о проблемной области. Именно эта компонента, именуемая базой знаний, определяет практическую ценность программы. Построение базы знаний требует специальных изысканий в проблемной области, в то время как остальные блоки программы находятся полностью в ведении программиста.
В настоящее время известны четыре основных способа представления знаний, из которых можно конструировать "гибридные" способы представления знаний.
Продукционные системы
Семантические сети
Фреймы
Логические исчисления
Комбинированные способы представления знаний
Модели проблемных областей
Продукционная модель
Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если (условие), то (действие)».
Под «условием» (антецедентом) понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под «действием» (консеквентном) -- действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия и терминальными или целевыми, завершающими работу системы).
Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения -- к данным). Данные -- это исходные факты, хранящиеся в базе фактов, на основании которых запускается машина вывода или интерпретатор правил, перебирающий правила из продукционной база знаний.
Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода. Имеется большое число программных средств, реализующих продукционный подход (язык OPS 5; «оболочки» или «пустые» ЭС -- EXSYS Professional, Kappa, ЭКСПЕРТ; ЭКО, инструментальные системы ПЙЭС [Хорошевский, 1993] и СПЭИС [Ковригин, Перфильев, 1988] и др.), а также промышленных ЭС на его основе (например, ЭС, созданных средствами G2 [Попов, 1996]) и др.
Семантические сети
Термин семантическая означает «смысловая», а сама семантика -- это наука, устанавливающая отношения между символами и объектами, которые они обозначают, то есть наука, определяющая смысл знаков.
Семантическая сеть--это ориентированный граф, вершины которого -- понятия, а дуги - отношения между ними.
В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения -- это связи типа: «это» («АКО -- A-Kind-Of», «is»), «имеет частью» («has part»), «принадлежит», «любит». Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:
класс -- элемент класса (цветок -- роза);
свойство -- значение (цвет -- желтый);
пример элемента класса (роза -- чайная).
Можно предложить несколько классификаций семантических сетей, связанных с типами отношений между понятиями.
По количеству типов отношений:
Однородные (с единственным типом отношений).
Неоднородные (с различными типами отношений). По типам отношений:
Бинарные (в которых отношения связывают два объекта).
*N-арные (в которых есть специальные отношения, связывающие более двух понятий).
Наиболее часто в семантических сетях используются следующие отношения:
связи типа «часть -- целое («класс -- подкласс, «элемент - множество, и т. п.);
функциональные связи (определяемые обычно глаголами «производит», «влияет»...);
количественные (больше, меньше, равно».);
пространственные (далеко от, близко от, за, под, над...);
временные (раньше, позже, в течение...);
атрибутивные связи (иметь свойство, иметь значение);
логические связи (И, ИЛИ, НЕ);
лингвистические связи и др.
Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, отражающей поставленный запрос к базе.
Пример 2.3
На рис. 1.1 изображена семантическая сеть. В качестве вершин тут выступают понятия «человек», «т. Иванов», «Волга», «автомобиль», «вид транспорта» и «двигатель».
Рис. 1.1. Семантическая сеть
Данная модель представления знаний была предложена американским психологом Куиллианом. Основным ее преимуществом является то, что она более других соответствует современным представлениям об организации долговременной памяти человека. Недостатком этой модели является сложность организации процедуры поиска вывода на семантической сети.
Для реализации семантических сетей существуют специальные сетевые языки, например NET [Цейтин, 1985], язык реализации систем SIMER+MIR [Осипов, 1997] и др. Широко известны экспертные системы, использующие семантические сети в качестве языка представления знаний -- PROSPECTOR, CASKET, TORUS [Хейес-Рот и др., 1987; Durkin, 1998] Тимофеев А.А. "Информатика и компьютерный интеллект", М., 1991.
Фреймы
Термин фрейм (от английского frame, что означает «каркас» или «рамка») был предложен Маренном Минским [Минский, 1979], одним из пионеров ИИ, в 70-е годы для обозначения структуры знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование.
Фрейм--это абстрактный образ для представления некоего стереотипа восприятия. В психологии и философии известно понятие абстрактного образа. Например, произнесение вслух слова «комната» порождает у слушающих образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 мг». Из этого описания ничего нельзя убрать (например, убрав окна, мы получим уже чулан, а не комнату), но в нем есть «дырки» или «слоты» -- это незаполненные значения некоторых атрибутов -- например, количество окон, цвет стен, высота потолка, покрытие пола и др.
В теории фреймов такой образ комнаты называется фреймом комнаты. Фреймом также называется и формализованная модель для отображения образа.
Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через:
фреймы-структуры, использующиеся для обозначения объектов и понятий (заем, залог, вексель);
фреймы-роды (менеджер, кассир, клиент);
фреймы-сценарии (банкротство, собрание акционеров, празднование именин);
*фреймы-ситуации (тревога, авария, рабочий режим устройства) и др. Традиционно структура фрейма может быть представлена как список свойств: (ИМЯ ФРЕЙМА:
(имя 1-го слота: значение 1-го слота),
(имя 2-го слота: значение 2-го слота),
(имя N-ro слота: значение N-ro слота)).
Ту же запись можно представить в виде таблицы, дополнив ее двумя столбцами.
В таблице дополнительные столбцы предназначены для описания способа получения слотом его значения и возможного присоединения к тому или иному слоту специальных процедур, что допускается в теории фреймов. В качестве значения слота может выступать имя другого фрейма, так образуются сети фреймов. Существует несколько способов получения слотом значений во фрейме-экземпляре:
по умолчанию от фрейма-образца (Default-значение);
через наследование свойств от фрейма, указанного в слоте АКО;
по формуле, указанной в слоте;
через присоединенную процедуру;
явно из диалога с пользователем;
из базы данных.
Важнейшим свойством теории фреймов является заимствование из теории семантических сетей -- так называемое наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of - это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов.
Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека [Шенк, Хантер, 1987], а также ее гибкость и наглядность.
Специальные языки представления знаний в сетях фреймов FRL (Frame Representation Language) [Байдун, Бунин, 1990], KRL (Knowledge Representation Language) [Уотермен, 1989], фреймовая «оболочка» Kappa [Стрельников, Борисов, 1997] и другие программные средства позволяют эффективно строить промышленные ЭС. Широко известны такие фрейм-ориентированные экспертные системы, как ANALYST, МОДИС, TRISTAN, ALTERID [Ковригин, Перфильев, 1988; Николов, 1988; Sisodia, Warkentin, 1992].
Формальные логические модели
Традиционно в представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов 1-го порядка, когда предметная область или задача описывается в виде набора аксиом. Мы же опустим описание этих моделей по следующим причинам. Исчисление предикатов 1-го порядка в промышленных экспертных системах практически не используется. Эта логическая модель применима в основном в исследовательских «игрушечных» системах, так как предъявляет очень высокие требования и ограничения к предметной области.
В промышленных же экспертных системах используются различные ее модификации и расширения, изложение которых выходит за рамки этого учебника Тимофеев А.А. "Информатика и компьютерный интеллект", М., 1991.
2.3.1 Формализация базы знаний
На этапе формализации базы знаний осуществляется выбор метода представления знаний. В рамках выбранного формализма осуществляется проектирование логической структуры базы знаний.
Этап формализации базы знаний - выбор метода представления знаний, в рамках которого проектируется логическая структура базы знаний.
Логическая модель предполагает унифицированное описание объектов и действий в виде предикатов первого порядка.
Логическая модель отражает логические связи между элементами данных вне зависимости от их содержания и среде хранения.
Логическая модель данных может быть реляционной, иерархической или сетевой. Пользователям выделяются подмножества этой логической модели, называемые внешними моделями, отражающие их представления о предметной области. Внешняя модель соответствует представлениям, которые пользователи получают на основе логической модели, в то время как концептуальные требования отражают представления, которые пользователи первоначально желали иметь и которые легли в основу разработки концептуальной модели. Логическая модель отображается в физическую память, такую, как диск, лента или какой-либо другой носитель информации Веб-сайт http://www.msclub.ce.cctpu.edu.ru..
2.3.2 Нечеткие знания
При попытке формализовать человеческие знания исследователи вскоре столкнулись с проблемой, затруднявшей использование традиционного математического аппарата для их описания. Существует целый класс описаний, оперирующих качественными характеристиками объектов (много, мало, сильный, очень сильный и т. п.). Эти характеристики обычно размыты и не могут быть однозначно интерпретированы, однако содержат важную информацию (например, «Одним из возможных признаков гриппа является высокая температура»).
Кроме того, в задачах, решаемых интеллектуальными системами, часто приходится пользоваться неточными знаниями, которые не могут быть интерпретированы как полностью истинные или ложные (логические true/false или 0/1). Существуют знания, достоверность которых выражается некоторой промежуточной цифрой, например 0.7.
Как, не разрушая свойства размытости и неточности, представлять подобные знания формально? Для разрешения таких проблем в начале 70-х американский математик Лотфи Заде предложил формальный аппарат нечеткой (fuzzy) алгебры и нечеткой логики [Заде, 1972]. Позднее это направление получило широкое распространение [Орловский, 1981; Аверкин и др., 1986; Яшин, 1990] и положило начало одной из ветвей ИИ под названием -- мягкие вычисления (soft computing).
2.4 Автоматизированные системы распознавания образов
Системой распознавания образов будем называть класс систем искусственного интеллекта, обеспечивающих:
- формирование конкретных образов объектов и обобщенных образов классов;
- обучение, т.е. формирование обобщенных образов классов на основе ряда примеров объектов, классифицированных (т.е. отнесенных к тем или иным категориям - классам) учителем и составляющих обучающую выборку;
- самообучение, т.е. формирование кластеров объектов на основе анализа неклассифицированной обучающей выборки;
- распознавание, т.е. идентификацию (и прогнозирование) состояний объектов, описанных признаками, друг с другом и с обобщенными образами классов;
- измерение степени адекватности модели;
- решение обратной задачи идентификации и прогнозирования (обеспечивается не всеми моделями).
Распознавание - это операция сравнения и определения степени сходства образа данного конкретного объекта с образами других конкретных объектов или с обобщенными образами классов, в результате которой формируется рейтинг объектов или классов по убыванию сходства с распознаваемым объектом.
Ключевым моментом при реализации операции распознавания в математической модели является выбор вида интегрального критерия или меры сходства, который бы на основе знания о признаках конкретного объекта позволил бы количественно определить степень его сходства с другими объектами или обобщенными образами классов http://www.inftech.webservis.ru/it/database/datamining/ar4.html.
3. Нейрокомпьютеры и сети
3.1 Нейрокомпьютеры
Нейрокомпьютеры - это системы, в которых алгоритм решения задачи представлен логической сетью элементов частного вида - нейронов с полным отказом от булевских элементов типа И, ИЛИ, НЕ. Как следствие этого введены специфические связи между элементами, которые являются предметом отдельного рассмотрения.
В отличие от классических методов решения задач нейрокомпьютеры реализуют алгоритмы решения задач, представленные в виде нейронных сетей. Это ограничение позволяет разрабатывать алгоритмы, потенциально более параллельные, чем любая другая их физическая реализация.
Нейрокомпьютер - это вычислительная система с архитектурой MSIMD, в которой реализованы два принципиальных технических решения: упрощен до уровня нейрона процессорный элемент однородной структуры и резко усложнены связи между элементами; программирование вычислительной структуры перенесено на изменение весовых связей между процессорными элементами.
Общее определение нейрокомпьютера может быть представлено в следующем виде. Нейрокомпьютер - это вычислительная система с архитектурой аппаратного и программного обеспечения, адекватной выполнению алгоритмов, представленных в нейросетевом логическом базисе http://www.inftech.webservis.ru/it/database/datamining/ar4.html.
3.2 Что такое нейронные сети?
Каждый нейрон получает сигналы от соседних нейронов по специальным нервным волокнам. Эти сигналы могут быть возбуждающими или тормозящими. Их сумма составляет электрический потенциал внутри тела нейрона. Когда потенциал превышает некоторый порог, нейрон переходит в возбужденное состояние и посылает сигнал по выходному нервному волокну. Отдельные искусственные нейроны соединяются друг с другом различными методами. Это позволяет создавать разнообразные нейронные сети с различной архитектурой, правилами обучения и возможностями.
Термин “искусственные нейронные сети” у многих ассоциируется с фантазиями об андроидах и бунте роботов, о машинах, заменяющих и имитирующих человека. Это впечатление усиливают многие разработчики нейросистем, рассуждая о том, как в недалеком будущем, роботы начнут осваивать различные виды деятельности, просто наблюдая за человеком. Если переключиться на уровень повседневной работы, то нейронные сети это всего-навсего сети, состоящие из связанных между собой простых элементов формальных нейронов. Большая часть работ по нейроинформатике посвящена переносу различных алгоритмов решения задач на такие сети.
В основу концепции положена идея о том, что нейроны можно моделировать довольно простыми автоматами, а вся сложность мозга, гибкость его функционирования и другие важнейшие качества определяются связями между нейронами. Каждая связь представляется как совсем простой элемент, служащий для передачи сигнала. Коротко эту мысль можно выразить так: “структура связей все, свойства элементов ничто”.
Совокупность идей и научно-техническое направление, определяемое описанным представлением о мозге, называется коннекционизмом (connection связь). С реальным мозгом все это соотносится примерно так же, как карикатура или шарж со своим прототипом. Важно не буквальное соответствие оригиналу, а продуктивность технической идеи.
С коннекционизмом тесно связан следующий блок идей:
однородность системы (элементы одинаковы и чрезвычайно просты, все определяется структурой связей);
надежные системы из ненадежных элементов и “аналоговый ренессанс” использование простых аналоговых элементов;
“голографические” системы при разрушении случайно выбранной части система сохраняет свои свойства.
Предполагается, что широкие возможности систем связей компенсируют бедность выбора элементов, их ненадежность и возможные разрушения части связей.
Для описания алгоритмов и устройств в нейроинформатике выработана специальная “схемотехника”, в которой элементарные устройства (сумматоры, синапсы, нейроны и т.п.) объединяются в сети, предназначенные для решения задач. Для многих начинающих кажется неожиданным, что ни в аппаратной реализации нейронных сетей, ни в профессиональном программном обеспечении эти элементы вовсе не обязательно реализуются как отдельные части или блоки. Используемая в нейроинформатике идеальная схемотехника представляет собой особый язык описания нейронных сетей и их обучения. При программной и аппаратной реализации, выполненные на этом языке описания, переводятся на более подходящие языки другого уровня http://www.inftech.webservis.ru/it/database/datamining/ar4.html.
4. Классификация информационных систем
Любая информационная система (ИС) выполняет следующие функции: воспринимает вводимые пользователем информационные запросы и необходимые исходные данные, 2обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и формирует требуемую выходную информацию.
С точки зрения реализации перечисленных функций ИС можно рассматривать как фабрику, производящую информацию, в которой заказом является информационный запрос, сырьем - исходные данные, продуктом - требуемая информация, а инструментом (оборудованием) - знание, с помощью которого данные преобразуются в информацию.
…если в ходе эксплуатации ИС выяснится потребность в модификации одного из двух компонентов программы, то возникнет необходимость ее переписывания. Это объясняется тем, что полным знанием проблемной области обладает только разработчик ИС, а программа служит “недумающим исполнителем” знания разработчика. Этот недостаток устраняются в интеллектуальных информационных системах.
Интеллектуальная информационная система (ИИС) - это ИС, которая основана на концепции использования базы знаний для генерации алгоритмов решения экономических задач различных классов в зависимости от конкретных информационных потребностей пользователей.
Для интеллектуальных информационных систем, ориентированных на генерацию алгоритмов решения задач, характерны следующие признаки:
-развитые коммуникативные способности,
-умение решать сложные плохо формализуемые задачи,
-способность к самообучению,
Коммуникативные способности ИИС характеризуют способ взаимодействия (интерфейса) конечного пользователя с системой.
Сложные плохо формализуемые задачи - это задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний Перспективы развития вычислительной техники.Кн.2. Интеллектуализация ЭВМ.М., 1989..
4.1 Экспертная система (ЭС)
Экспертная система - это ИИС, предназначенная для решения слабоформализуемых задач на основе накапливаемого в базе знаний опыта работы экспертов в проблемной области.
Экспертная система является инструментом, усиливающим интеллектуальные способности эксперта, и может выполнять следующие роли:
1 консультанта для неопытных или непрофессиональных пользователей;
2 ассистента в связи с необходимостью анализа экспертом различных вариантов принятия решений;
3 партнера эксперта по вопросам, относящимся к источникам знаний из смежных областей деятельности.
Исторически, ЭС были первыми системами искусственного интеллекта, которые привлекли внимание потребителей.
Классы экспертных систем. По степени сложности решаемых задач экспертные системы можно классифицировать следующим образом:
- По способу формирования решения экспертные системы разделяются на два класса: аналитические и синтетические. Аналитические системы предполагают выбор решений из множества известных альтернатив, а синтетические системы - генерацию неизвестных решений. Аналитическая экспертная система - это ЭС, осуществляющая оценку вариантов решений (проверку гипотез). Синтетическая экспертная система - это ЭС, осуществляющая генерацию вариантов решений (формирование гипотез).
- По способу учета временного признака экспертные системы могут быть статическими или динамическими. Статические системы решают задачи при неизменяемых в процессе решения данных и знаниях, динамические системы допускают такие изменения.
Статическая экспертная система - это ЭС, решающая задачи в условиях, не изменяющихся во времени исходных данных и знаний.
Динамическая экспертная система - это ЭС, решающая задачи в условиях изменяющихся во времени исходных данных и знаний.
- По видам используемых данных и знаний экспертные системы классифицируются на системы с детерминированными (четко определенными) знаниями и неопределенными знаниями. Под неопределенностью знаний (данных) понимается их неполнота (отсутствие), недостоверность (неточность измерения), двусмысленность (многозначность понятий), нечеткость (качественная оценка вместо количественной).
По числу используемых источников знаний экспертные системы могут быть построены с использованием одного или множества источников знаний.
4.2 Система с интеллектуальным интерфейсом
Система с интеллектуальным интерфейсом - это ИИС, предназначенная для поиска неявной информации в базе данных или тексте для произвольных запросов, составляемых, как правило, на ограниченном естественном языке.
Интеллектуальные БД отличаются от обычных БД возможностью выборки по запросу необходимой информации, которая может явно не храниться, а выводиться из имеющейся в базе данных. Примерами таких запросов могут быть следующий: - “Вывести список товаров, цена которых выше среднеотраслевой”.
В запросе требуется осуществить поиск по условию, которое должно быть доопределено в ходе решения задачи. Формулирование запроса осуществляется в диалоге с пользователем, последовательность шагов которого выполняется в максимально удобной для пользователя форме. Запрос к базе данных может формулироваться и с помощью естественно-языкового интерфейса.
Естественно-языковой интерфейс предполагает трансляцию естественно-языковых конструкций на внутримашинный уровень представления знаний.
Естественно-языковый интерфейс используется для:
-доступа к интеллектуальным базам данных;
-контекстного поиска документальной текстовой информации;
-голосового ввода команд в системах управления;
-машинного перевода c иностранных языков.
Гипертекстовые системы предназначены для реализации поиска по ключевым словам в базах текстовой информации. Механизм поиска работает прежде всего с базой знаний ключевых слов, а уже затем непосредственно с текстом.
Системы контекстной помощи можно рассматривать, как частный случай интеллектуальных гипертекстовых и естественно-языковых систем. В системах контекстной помощи пользователь описывает проблему (ситуацию), а система с помощью дополнительного диалога ее конкретизирует и сама выполняет поиск относящихся к ситуации рекомендаций. Такие системы относятся к классу систем распространения знаний (Knowledge Publishing) и создаются как приложение к системам документации (например, технической документации по эксплуатации товаров).
Системы когнитивной графики позволяют осуществлять интерфейс пользователя с ИИС с помощью графических образов, которые генерируются в соответствии с происходящими событиями http://www.inftech.webservis.ru/it/database/datamining/ar4.html.
4.3 Самообучающаяся система
Самообучающаяся система - это ИИС, которая на основе примеров реальной практики автоматически формирует единицы знаний.
В основе самообучающихся систем лежат методы автоматической классификации примеров ситуаций реальной практики (обучения на примерах). Примеры реальных ситуаций накапливаются за некоторый исторический период и составляют обучающую выборку. Эти примеры описываются множеством признаков классификации. Причем обучающая выборка может быть:
- “с учителем”, когда для каждого примера задается в явном виде значение признака его принадлежности некоторому классу ситуаций (классообразующего признака);
- “без учителя”, когда по степени близости значений признаков классификации система сама выделяет классы ситуаций.
В результате обучения системы автоматически строятся обобщенные правила или функции, определяющие принадлежность ситуаций классам, которыми обученная система пользуется при интерпретации новых возникающих ситуаций. Таким образом, автоматически формируется база знаний, используемая при решении задач классификации и прогнозирования. Эта база знаний периодически автоматически корректируется по мере накопления опыта реальных ситуаций, что позволяет сократить затраты на ее создание и обновление.
5. Стратегия получения знаний. Практические методы извлечения знаний
5.1 Стратегия получения знаний
Выделяют три стратегии получения знаний - приобретение знаний, извлечение знаний и обнаружение знаний в базах данных:
Под приобретением (acquisition) знаний понимают способ автоматизированного наполнения базы знаний посредством диалога эксперта и специальной программы.
Извлечением (elicitation) знаний называют процедуру взаимодействия инженера по знаниям с источником знаний (экспертом, специальной литературой и др.) без использований вычислительной техники http://www.park.glossary.ru/serios/read_05.php.
Термином “обнаружение знаний в базах данных” (knowledge discovery in databases - KDD) сегодня обозначают процесс получения из “сырых” данных новой, потенциально полезной информации о предметной области. Этот процесс включает несколько этапов (рис. 1.2). Сюда относится накопление сырых данных, отбор, подготовка, преобразование данных, поиск закономерностей в данных, оценка, обобщение и структурирование найденных закономерностей.
Рис. 1.2. Процесс обнаружения знаний в БД
Стратегия KDD все более выдвигается на первую роль. Это во многом обусловлено быстрым развитием разнообразных хранилищ данных (data warehouse) - собраний данных, отличающихся предметной ориентированностью, интегрированностью, поддержкой хронологии, неизменяемостью, и предназначенных для последующей аналитической обработки.
Специфика современных требований к обработке данных с целью обнаружения знаний следующая:
Данные имеют неограниченный объем
Данные являются разнородными (количественными, качественными, категориальными)
Результаты должны быть конкретны и понятны
Инструменты для обработки “сырых” данных должны быть просты в использовании.
5.2 Практические методы извлечения данных
Классификация методов извлечения знаний (рис. 1.3) позволит инженерам по знаниям, в зависимости от конкретной задачи и ситуации, выбрать конкретный метод. Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).
Разделение этих групп методов на верхнем уровне классификации не означает их антагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.
Рис. 1.3. Классификация методов извлечения знаний.
В свою очередь, коммуникативные методы можно также разделить на две группы: активные и пассивные. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами - в играх, диалогах, беседах за "круглым столом" и т.д.
Пассивные методы на первый взгляд достаточно просты, но на самом деле требуют oт инженера по знаниям умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность инженера по знаниям) значительно ослабляет эффективность этих методов, чем и объясняется их обычно вспомогательная роль при активных методах.
Активные методы можно разделить на две группы в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно помимо серии индивидуальных контактов с каждым применять и методы групповых обсуждений предметной области. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.
Отдельно следует сказать об играх. Игровые методы сейчас широко используются и социологии, экономике, менеджменте, педагогике для подготовки руководителей, учителей, врачей и других специалистов. Игра - это особая форма деятельности и творчества, где человек раскрепощается и чувствует себя намного свободнее, чем в обычной трудовой деятельности http://help-inform.ru/Klassif_ekspertnih_system.htm.
Заключение
В ходе выполнения работы были сделаны следующие выводы: База знаний - это один из структурных элементов экспертной системы.
Экспертная система - это интеллектуальная программа, способная делать логические выводы на основании знаний в конкретной предметной области и обеспечивающая решение специфических задач.
В настоящее время в области баз знаний интеллектуальных систем уже имеется серьезный теоретический базис, существует достаточно широкий спектр соответствующих методов и технологий разработки. Многие из них поддержаны адекватным программным инструментарием.
Не секрет, что для построения и использования баз знаний, на которых основываются современные интеллектуальные системы, требуются исследовательские коллективы, работающие вместе долго и имеющие опыт разработки такого рода систем. Для получения действительно хороших результатов необходимы дорогостоящие людские и материальные ресурсы -- специалисты, лицензионные инструментарии, документация. Кроме того, разработка их достаточно трудоемкий (годы) и дорогостоящий (десятки, если не сотни тыс. долларов) процесс. Вот почему в настоящее время действующие интеллектуальные системы ориентированы в основном на поддержку работы постоянно работающих групп пользователей для достаточно специализированных задач. Следует отметить и то, что в настоящее время почти нет действительно интеллектуальных систем, удобных для работы широкого круга пользователей в сети Интернет.
Таким образом, разработка теории, методов и технологий представления и использования знаний остается актуальной задачей для дальнейшего развития интеллектуальных систем. Особую актуальность, по нашему мнению, приобретают на современном этапе развития науки и общества в целом Интернет - ориентированные технологии и распределенный искусственный интеллект. Уже сейчас ясно, что применение систем, основанных на знаниях, должно привести к рассмотрению и использованию Всемирной паутины как организованного и структурированного пространства знаний.
Литература
1. Алексеева И.Ю. "Знание как объект компьютерного моделирования."// "Вопросы философии", 1987, №3, с. 42-49.
2. Веб-сайт http://www.msclub.ce.cctpu.edu.ru.
3. Базы знаний интеллектуальных систем\ Т.А. Гаврилова, В.Ф. Хорошевский - СПб: Питер, 2000.-384 с.: ил.
4. Перспективы развития вычислительной техники.Кн.2. Интеллектуализация ЭВМ.М., 1989.
5. Петрунин Ю.Ю. "Искусственный интеллект как феномен современной культуры."// "Вестник Московского университета", 1994, №8, с. 28-34.
6. Тимофеев А.А. "Информатика и компьютерный интеллект", М., 1991
7. Уинстон П. Искусственный интеллект. М.1980.
8. Хант Э. Искусственный интеллект. М.1978.
9. Эндрю А. "Искусственный интеллект", М.: Мир, 1985
10. http://www.park.glossary.ru/serios/read_05.php
11. http://ai.obrazec.ru/defin.html
12. http://revolution.allbest.ru/programming/00029613_0.html
13. http://help-inform.ru/Klassif_ekspertnih_system.htm
14. http://window.edu.ru/window_catalog/pdf2txt?p_id=28644
15. http://www.mosdiplom.ru/download_file.php?download_propertys_items_id=1289
16. http://www.inftech.webservis.ru/it/database/datamining/ar4.html
Подобные документы
Понятие базы знаний для управления метаданными. Особенности баз знаний интеллектуальной системы. Языки, используемые для разработки интеллектуальных информационных систем. Классические задачи, решаемые с помощью машинного обучения и сферы их применения.
реферат [16,9 K], добавлен 07.03.2010Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.
дипломная работа [1,6 M], добавлен 29.09.2013Основные виды и технологии интеллектуальных информационных систем. Аспекты представления знаний. Функциональная структура использования ИИС. Интеллектуальная поддержка дистанционного образования и экстерната. Электронные учебники и тесты.
контрольная работа [93,8 K], добавлен 29.11.2006Информация, как сырье и как товар: абсолютная, относительная и аналитическая информация. Автоматизированные системы распознавания образов. Система искусственного интеллекта. Признаки и этапы жизненного цикла интеллектуальных информационных систем.
шпаргалка [60,4 K], добавлен 10.06.2009База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.
презентация [51,3 K], добавлен 17.10.2013Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.
курсовая работа [768,2 K], добавлен 16.02.2015Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.
аттестационная работа [4,7 M], добавлен 14.06.2010Понятие искусственного интеллекта. Представление знаний и разработка систем, основанных на знаниях. Распознавание образов и машинный перевод. Нейрокомпьютеры и сети. Экспертные системы, их структура,классификация и инструментальные средства построения.
курсовая работа [922,1 K], добавлен 12.01.2009Понятие искусственного интеллекта и интеллектуальной системы. Этапы развития интеллектуальных систем. Модели представления знаний, процедурный (алгоритмический) и декларативный способы их формализации. Построение концептуальной модели предметной области.
презентация [80,5 K], добавлен 29.10.2013Интеллектуальные информационные системы: понятие, классификация, этапы проектирования. Анализ предметной области и методы приобретения знаний. Моделирование деятельности нотариальной конторы в программной среде AllFusion Process Modeler в стандарте IDEF0.
курсовая работа [5,5 M], добавлен 14.06.2012