Искусственный интеллект – основа новой информационной технологии
Знакомство с основными направлениями развития исследований и систем искусственного интеллекта. Анализ проблем использования ЭВМ конечными пользователями. Общая характеристика интеллектуальных информационно-поисковых систем, особенности развития.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | книга |
Язык | русский |
Дата добавления | 27.02.2019 |
Размер файла | 3,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
1.4.3 Логические модели знаний и системы логического вывода
Логические модели знаний -- основа человеческих рассуждений и умозаключений, которые, в свою очередь, могут быть описаны подходящими логическими исчислениями. К таким исчислениям в первую очередь следует отнести силлогистику Аристотеля, прикладные исчисления высказываний и предикатов, аксиоматика которых используется в качестве логических моделей знаний.
После более чем 2000-летнего неизменного состояния силлогистика Аристотеля получила развитие и важное практическое применение. В работе [11] было предложено частотное расширение аристотелевых силлогизмов за счёт введения нечётких квантификаторов, отражающих условные и безусловные частоты появления событий.
Логические исчисления могут быть представлены как формальные системы, в виде четвёрки [12]
М = <Т, Р, А, F>,
где Т -- множество базовых элементов (например, буквы некоторого алфавита); Р -- множество синтаксических правил, на основе которых из Т строятся правильно построенные формулы; А - множество правильно построенных формул, элементы которого называются аксиомами; Р -- правила вывода, которые из множества А позволяют получать новые правильно построенные формулы -- теоремы.
Примерами формальной системы М являются исчисление высказываний и исчисление предикатов. Дедуктивные модели. В исчислении высказываний полагается, что каждая правильно построенная формула есть высказывание, которое может быть истинным или ложным. Например, высказывание «Иванов работает на заводе» может быть истинным или ложным в зависимости от того, работает или не работает Иванов на заводе. Утверждение «Тяжелоатлет поднял штангу в сто тонн» заведомо ложное. Из подобного рода элементарных высказываний с помощью логических связок образуют более сложные высказывания, которые также могут принимать два значения -- «истина» (И) и «ложь» (Л). Эти связки суть следующие:
конъюнкция («И») -- ?,
дизъюнкция («или») -- ?,
импликация («если -- то») ?
отрицание («не») -- ~.
Ниже для указанных связок приводится истинностная таблица:
Таблица 1
Предикаты первого порядка -- это высказывания, отнесённые к объектам определённого типа. Все базовые элементы исчисле-ния высказываний входят в множество базовых элементов исчисления предикатов. Синтаксические правила, аксиомы и правила вывода исчисления предикатов первого порядка полностью включают в себя соответствующие правила и аксиомы исчисления высказываний.
Предикаты бывают одноместные и многоместные. Одноместные (унарные) предикаты отражают свойства определённого объекта или класса объектов. Они записываются в виде Р(х), где предикатный символ Р обозначает свойство, а символ предметной переменной х -- объект. Предикат Р(х) принимает два значения: И, если объект х обладает свойством Р, и Л, если не обладает. Примером унарного предиката является утверждение «компьютер необходим». Здесь Р имеет смысл свойства «быть необходимым», а х -- переменная, имеющая значение «компьютер».
Многоместные предикаты (бинарные, тернарные и т. д.) позволяют записывать отношения, которые существуют между группой элементов. Например, утверждение «число х больше числа у» можно записать бинарным предикатом Q(х, у), в котором предикатный символ Q есть отношение «больше». Предикат Q(х, у) будет истинным, когда для чисел х и у выполняется условие х > у, и ложным в противном случае.
В исчисление предикатов входят также символы функций (f, g, h), задаваемых на множестве предметных переменных. Например, если х -- телефон, то g = f(х) может означать квартиры в данном доме, в которых есть телефон. Выражения Р(х, у, z, ...) называются в исчислении предикатов атомарными формулами. Атомарные формулы с помощью связок образуют сложные правильно построенные формулы, например:
Об истинности или ложности этой формулы ничего сказать нельзя, если не указаны значения переменных х и у. Обычно интересуются, истинна ли эта формула для всех объектов (или, напротив, хотя бы для одного). Соответствующие утверждения выражаются кванторами общности ? и существования ?, которые ставятся перед формулой. Так, запись означает, что для каждого х существует по крайней мере одно значение у, когда последующая формула будет истинной.
Формула, у которой все переменные «связаны» кванторами, называется замкнутой. Такая формула представляет собой высказывание.
Дедуктивные модели необходимы для получения логически истинных утверждений из ряда посылок (аксиом) Р1, Р2, …, Рп, являющихся также некоторыми правильно построенными формулами. Говорят, что формула В является следствием формул Р1, Р2, ..., Рп, если В истинна тогда и только тогда, когда истинно Р1 ?Р2 ... ? Рп. Доказательство формулы В из множества посылок Р1, Р2, …, Рп сводится к доказательству ложности формулы Р1 ?Р2 ... ? Рп ? ~В. Процедуры доказательства, основанные на этом, называются процедурами опровержения.
Наиболее известным из них является метод резолюций. Для использования метода резолюций формулы исчисления предикатов преобразуются так, что они оказываются свободными от кванторов и импликаций. При этом, разумеется, происходит известная потеря исходного семантического представления. Для доказательства теорем в исчислении предикатов можно использовать также обратный метод Маслова [13].
Язык исчисления предикатов можно использовать в качестве языка запросов к реляционной базе данных. Обычные базы данных (например, реляционные) являются экстенсиональными. В этом случае пользователь записывает предложения (запросы) на некотором подъязыке исчисления предикатов. Помимо обычных баз данных имеются дедуктивные базы данных, содержащие интенсиональную и экстенсиональную части и, следовательно, являющиеся комбинацией баз знаний и баз данных. В дедуктивных базах данных для получения фактов из аксиом используются методы доказательства теорем.
Индуктивные модели. Системы индуктивного вывода относятся к классу формальных систем М, в которых правила вывода порождаются в процессе получения общих выводов на основе совокупности частных утверждений. Индуктивный вывод позволяет получить общие закономерности на основе экспериментальных наблюдений. Есть два способа получать такие закономерности: вероятностно-статистический и логический. Первый возможен в случае достаточно большой повторяемости событий или наблюдаемых данных.
Однако в практике человеческого рассуждения не всегда можно опираться на вероятностно-статистические методы. Возникает потребность делать выводы об общих закономерностях или о возможности появления каких-либо событий в будущем на основе совокупности частных примеров или проявлений, которые наблюдаются у какого-либо объекта или во внешней среде. Иными словами, осуществлять рассуждения от частного к общему. Это и есть индуктивный вывод.
Попытки построения моделей индуктивных рассуждений были предприняты ещё Сократом. Затем Аристотель предложил схему вывода под названием «популярная индукция». В новое время Ф. Бекон (1620 г.) предпринял попытки формализовать индуктивные выводы с помощью таблиц причин.
Идеи Ф. Бекона были развиты Д. С. Миллем (1900 г.), который предложил индуктивные методы: сходства, различия, остатков и сопутствующих изменений. Были предприняты попытки построить формальные имитации индуктивных методов Д. С. Милля. Большой вклад в теорию индукции внесли чешский математик П. Гаек и его коллеги. Советскими специалистами В. К. Финном и другими был развит логико-математический аппарат ДСМ-метода на основе использования многозначной логики [7].
Этот метод моделирует индуктивные рассуждения исследователя-экспериментатора. ДСМ-метод позволяет автоматически формировать гипотезы-закономерности и является новым средством логической обработки данных, характеризующихся неполнотой информации. Формализованные индуктивные методы (в том числе ДСМ-метод) открывают возможности автоматического пополнения баз знаний из экспериментальных данных. Использование ДСМ-метода в интерактивном режиме позволяет строить весьма эффективные системы автоматизации научных исследований.
Эксперименты показали высокую эффективность ДСМ-метода, в частности, для решения задач прогнозирования биологической активности вновь синтезированных химических соединений [14]. Для проверки гипотез целесообразно привлечение дедуктивных методов. В связи с этим возникает проблема объединения дедуктивных и индуктивных формализмов в единую систему.
Г. Саймоном в 1975 г. была разработана программа индуктивного вывода ВАСОМ, предназначенная для открытия законов в естественных науках методами искусственного интеллекта. Усовершенствованная программа ВАСОМ-5 описана в статье [15]. Примечательно, что с помощью программы ВАСОМ на основе экспериментальных данных были переоткрыты закон идеального газа, закон Кулона, третий закон Кеплера, закон Ома, законы Галилея для маятника и постоянного ускорения.
Псевдофизические логики. Несмотря на большие возможности логики предикатов первого порядка*, она оказывается неудобной для логического представления знаний, когда речь идёт о таких сложных понятиях, как время, пространство, причинность и т. п.
В этих случаях более удобны логические представления в виде специальных логик отношений, которые получили название «псевдофизические логики». Термин «псевдофизические» связан с тем, что в этих логиках отражаются отношения, имеющие физическую реальность. Как показано в публикации [7], применение псевдофизических логик позволяет:
имитировать нестрогие человеческие рассуждения об окружающем его физическом мире (рассуждения о временных соотношениях событий,
* В логиках высших порядков кванторы применяются не только к переменным х, у, z, но и к предикатам и функциям. пространственном расположении объектов, причинно-следственных связях между физическими явлениями, частоте их возникновения и т. п.);
генерировать на основе правил вывода новые знания. Эти знания пополняют описания ситуаций, полученные из текстов на естественном языке или от сенсорных систем, и вводятся в память интеллектуальных систем.
Создание псевдофизических логик включает построение формальной системы, учитывающей семантику отношений (времени, пространства и т. д.) и построение модели той физической реальности, которая определяет данную псевдофизическую логику. Например, логика времени для интеллектуального устройства включает формальную систему, позволяющую выводить временные отношения, неявно присутствующие в описании ситуации (на основании заложенных в память устройства базовых отношений и правил вывода) и систему декларативных описаний (в виде семантических сетей, фреймов и сценариев), с помощью которых восстанавливаются отношения, явно не присутствующие в описании ситуации (см. пример в 1.4.1).
Основная проблема, связанная с псевдофизическими логика-ми, заключается в разработке такой совокупности этих логик (пространственная, временная, каузальная, логика действий), которая позволит решать задачу имитации нестрогих рассуждений человека и задачу получения новых знаний с необходимой для функционирования интеллектуальной системы полнотой.
Продукции. В том практическом смысле, который представляет для нас интерес, продукция есть правило-продукция, представляющая собой пару ситуация ? действие, посылки ? заключение, причина ? следствие и т. п. Подобного рода правила встречаются в различных областях знаний и видах деятельности; в повседневной жизни мы постоянно окружены различного рода правилами поведения, уличного движения, грамматическими правилами. Статьи уголовного кодекса также выступают как правила, левая часть которых называется диспозицией, а правая -- санкцией. Если говорить о программировании, то продукция выступает как тройка (имя продукции, условие применимости, оператор). В некоторых случаях продукция близка по смыслу импликации «если -- то», так что можно принять для продукции обозначение в виде импликации а если требуется раскрыть более подробно условие применимости, то можно использовать запись следующего вида:
где Pi (i = 1,2,..., n) -- условия применимости, образующие конъ-юнктивную форму; В -- заключение, которое может иногда трактоваться и как действие (что существенно отличает такие продукции от импликаций). Приведём два примера.
1. Правило-продукция из области эксплуатации оборудования: «Если температура газа Т ? 30° С и давление 49?104 Па, то нарушен режим, поэтому необходимо включить вентилятор и выключить жидкостный насос».
2. Пример продукции системы DENDRAL [16]:
где хi (i = 1, 2, 3, 4) -- отношение атомного числа к заряду; Р1, Р2, Р3 -- высокие пики на спектрограмме; Р4 -- какой-либо иной пик на спектрограмме. Если x1 = 71, x2 = 43, x3 = 86 и x4 = 58, то в обследуемом веществе должна присутствовать подструктура ? -- пропиликтена-3.
Если говорить о продукционной системе безотносительно к пользователю, то она выступает как программная система, которая может быть представлена состоящей из трёх модулей, или блоков (в разных источниках [7, 17] эти модули (блоки) называются по-разному):
глобальная база данных (просто база, или Б-модуль);
множество правил-продукций (П-модуль);
система управления (У-модуль).
Связь модулей между собой показана на рис. 1.7. (А. С. Нариньяни, Т. Яхно [7, с. 136]).
Рис. 1.7. Продукционная система как динамическая система
Глобальную базу данных не следует путать с базой данных в общепринятом смысле слова. Это скорее некая рабочая зона базы данных, которую можно рассматривать как динамическую систему, изменяющую своё состояние х(t) под воздействием правил-продукций. Множество правил-продукций (П-модуль) представляет собой базу знаний системы. Из П-модуля система управления выбирает по определённой стратегии нужные продукции для воздействия на глобальную базу данных и перевода её из состояния х(t) в состояние х(t+1).
Продукционная система функционирует, пока не дойдёт до терминального состояния или не остановится из-за отсутствия необходимой в данной ситуации продукции. Терминальное состояние может означать, что задача решена. В то же время, если терминальное состояние определено как состояние, которое наступает не более чем заранее обусловленное число тактов, то факт достижения этого состояния за указанное число тактов означает, что задача продукционной системой не решена. Стимулом действия системы управления является различие между текущим х(t) и терминальным состоянием. Таким образом, формально функционирование продукционной сис-темы можно записать следующим образом:
х (t+1) = f (х(t), u(x)),
где ui ? U, U -- множество правил-продукций.
Рассмотрим пример игры «Восемь» [17].
Состояние глобальной базы данных -- это текущее расположение восьми оцифрованных фишек в квадрате 3?3 из девяти клеток. Правилами-продукциями в данном случае будут альтернативные передвижения пробела, которые соответственно замещаются какой-нибудь оцифрованной пешкой. Если пробел находится в центре квадрата, то имеется четыре альтернативы перемещения пешек, если -- с краю, то -- три.
Состоянием глобальной базы данных х(t) будет в данном случае текущее расположение оцифрованных фишек на квадрате. Полную картину изменения можно представить в виде графа-дерева «ИЛИ», где вершинами будут все состояния, которые прошла система при использовании всех альтернатив из каждого состояния.
Если теперь выбрать определённую стратегию управления U:(х), то образуется единственный путь в графе, приводящий в целевую вершину. Этой стратегией в данном случае могут быть определённые на каждом шаге суммы цифр на фишках, находящихся не на своём месте. Каждый раз выбирается такое перемещение пробела, чтобы U:(х) уменьшалась или не возрастала. Подобная стратегия даёт единственный путь в графе от исходного состояния к целевому, проходящему через четыре промежуточных состояния.
Другой пример из той же книги [17] -- задача о коммивояжёре, маршрут которого лежит через пять городов: АВСDЕ. Глобальной базой данных в этом случае будет х(t) -- текущий список городов, которые к моменту t посетил коммивояжёр. Начальное состояние х(0) = А, целевое состояние х(5) = А, поскольку после объезда всех городов коммивояжёр возвращается в пункт А. Просмотр всех альтернатив движения приводит к графу «ИЛИ» с числом концевых вершин. 4! = 24. Если выбрать какую-либо стратегию (например, всякий раз ехать к ближайшему городу), то образуется один путь в графе с соответствующей концевой вершиной (в данном примере АСDЕ-ВА).
В обоих рассмотренных примерах при выбранной стратегии правила-продукции имеют обычный вид т. е. «если на данном шаге t имеется различие между текущим и целевым состояниями ?, то предприми действие ?». Если на каждом состоянии использованы все п альтернатив управления, и тем самым построен граф «ИЛИ», то продукции будут иметь вид
Не во всех случаях, однако, удаётся выбрать стратегию, обеспечивающую единственный путь в графе. В этом случае приходится предпринимать на графе поиск в ширину и глубину с возвратом, если необходимо, к прежним состояниям. В процессе поиска используются различные эвристики, вытекающие из существа решаемой задачи.
В рассмотренных примерах продукции использовались в прямом направлении от исходного состояния к целевому. Такие продукции называются прямыми (П-продукциями). Однако возможен обратный процесс -- от цели к исходному состоянию, когда с помощью обратных продукций (О-продукции) происходит разбиение цели на подцели. Возможен и двусторонний процесс, но при этом в глобальной базе данных должны быть представлены как состояния, так и цели.
Продукции могут сочетаться с исчислением предикатов [17]. При этом открывается возможность реализовать дедуктивный вывод на основе правил-продукций. Иными словами, появляется в ряде случаев более эффективная процедура вывода по сравнению с методом резолюций.
По поводу исчисления предикатов как модели знаний хотелось бы сделать одно замечание. При рассмотрении семантических сетей подчёркивалось [7], что с ними при некоторых условиях могут быть связаны системы логического вывода. В монографии [17] показан переход от исчисления предикатов с продукциями к семантическим сетям. Фреймы, как уже указывалось, в своих слотах могут содержать продукции. Таким образом, наблюдается далеко идущая общность между известными сейчас различными моделями знаний. Это и неудивительно, так как во всех случаях дело идёт об отношениях.
1.5 Моделирование творческих процессов
Это одно из первых направлений развития искусственного интеллекта.
Как указывалось во введении, здесь сложилось два подхода: бионический и прагматический. Бионический подход связан с вскрытием глубинных биологических, психических механизмов и процессов у человека и попыткой смоделировать их на ЭВМ или специальных автоматах. Сюда относятся исследования, связанные с проблемой левого и правого полушарий головного мозга, исследования по нейронным сетям и ассоциативной памяти.
Большое значение имеют исследования того, как человек распознаёт зрительные образы, поскольку через зрительный канал человек воспринимает около 80% информации. Известно, что если взрослому человеку, слепому от рождения, восстановить зрение, то он учится видеть так, как видит нормальный человек, в течение нескольких лет. Очень важно вскрыть механизмы видения у человека, взаимодействие глаза и мозга, чтобы создать более совершенные системы распознавания зрительных образов.
Значимость бионического подхода, видимо, будет расти с появлением новых идей в электронике. Однако все основные достижения в области искусственного интеллекта, в том числе экспертных систем, связаны со вторым направлением, которое назвали прагматическим. Здесь, как уже указывалось ранее, вычислительная машина рассматривается как инструмент и за пределами исследования этого направления остаются проблемы психофизиологического характера. При моделировании творческих процессов в этом направлении судят по конечному результату. В рамках прагматического подхода получены впечатляющие результаты по моделированию творческих процессов, которые есть результат того, что в компьютере овеществлены в виде алгоритмов и программ знания человека.
В сложной обстановке, в условиях острого дефицита времени пользователь, принимающий решение, вынужден будет обратиться за советом, за консультацией к ЭВМ, а иногда и доверить решение непосредственно машине. В этом случае качество решения, его уместность в данной ситуации, возможные последствия целиком и полностью будут зависеть от огромной предварительной работы специалистов из данной предметной области -- математиков и программистов -- по тщательному прогнозу возможных ситуаций и формализации вариантов решений. А ответственность будет нести человек, принявший в качестве решения тот или иной машинный вариант.
Можно указать следующие в разной степени решённые проблемы моделирования творческой деятельности:
игровые задачи (шахматы, шашки, домино) [18, 19];
синтез музыкальных произведений [20];
синтез «жёстких» текстов (волшебных сказок) [21, 22];
создание орнаментов (в том числе автоматическое плетение кружев) [20];
доказательство теорем и автоматический синтез программ [7, 17, 23];
анализ и синтез текстов и речи, автоматический перевод [9, 24, 25];
ситуационное управление (принятие решения при дефиците времени и в стрессовых ситуациях) [8];
имитация человеческих рассуждений (моделирование мышления исторических деятелей, вскрытие намерений лидеров групп) [12].
В основе алгоритмизации и программирования большинства творческих задач можно усмотреть две психологические модели:
лабиринтная модель мышления (выдвинутая в начале нашего века Э. Торндайком);
семантическая модель мышления (предложенная в конце 60-х годов В. Н. Пушкиным).
Суть первой модели заключается в том, что решение любой творческой задачи является поиском пути в некотором лабиринте возможностей достижения цели. Ясно, что такой подход связан с перебором огромного количества вариантов типа шагов при доказательстве теорем, продолжении игр и т. п. Он предопределил развитие теории эвристического поиска и эвристического программирования, когда успех решения задачи зависит от совершенства эвристических приёмов отсечения неперспективных и выделения перспективных вариантов достижения цели.
В этом смысле имеет место явная ограниченность лабиринтной модели. Тем не менее лабиринтная модель и теория эвристического поиска остаются мощным средством в руках специалистов по искусственному интеллекту.
Вся проблематика моделирования творческих процессов так или иначе связана с эвристическим поиском решений творческих задач. Для решения этого класса задач характерны символьная обработка информации на ЭВМ и перебор большого количества вариантов. В целях предотвращения комбинаторного взрыва и сокращения перебора при составлении алгоритмов решения задач используются разного рода «находки», т. е. эвристики или эвристические правила. Набор тех или иных эвристик, приводящих к успеху, определяется предметной областью. В связи с этим попытки создать универсальный решатель задач на принципах эвристического программирования Ньюэлом, Шоу и Саймоном [17, 23] и не могли, по нашему мнению, увенчаться полным успехом.
Для работ по искусственному интеллекту в целом и по моделированию творческих процессов в частности типичным является использование эвристик при составлении машинных программ. Однако это характерно и для многих других задач (например, исследование операций, теория расписаний или классические задачи о коммивояжёре), которые являются задачами комбинаторными и без эвристических приёмов не могут быть решены.
Суть другой альтернативы -- семантической модели мышления -- заключается в том, что всякий творческий процесс есть соотнесение структурированных описаний начальной и целевой ситуаций. Соотнесение начальной и целевой ситуаций означает, что по ходу решения задачи создаётся (а не задаётся заранее) тот лабиринт возможностей, в котором лежит искомый путь решения задачи.
Семантическая модель мышления имеет прямое отношение к логико-лингвистическому моделированию и ситуационному управлению [8, 26]. Было подмечено, что всё огромное множество ситуаций, наблюдаемых в какой-либо предметной области, содержит некоторое количество инвариантов и основные структуры переносимы с некоторыми вариациями из одной области в другую. Наличие инвариантов и переносимость структур были установлены экспериментально Д. А. Поспеловым на опыте диспетчерского управления разнообразными объектами (управление морским портом, воздушным движением, уличным перекрёстком, оперативное управление производством и т. п.), Р. X. Зариповым [20] при анализе музыкальных произведений, а также -- много раньше - В. Проппом [21] при анализе структур волшебных сказок.
При анализе текстов и при автоматическом переводе в общем случае приходится решать проблемы формализации морфологии, синтаксиса, семантики и прагматики отдельных предложений. Первые две компоненты можно считать формализованными достаточно строго. Что касается семантики, то здесь можно говорить о поверхностно-семантическом анализе. Прагматика менее всего подготовлена к формализации. Тем не менее модель языка на уже достигнутом уровне формализации позволяет компьютерам «понимать» смысл предложений и тем самым строить эффективные вопросно-ответные системы [9, 25], а также осуществлять пофразный автоматический перевод достаточно высокого качества.
Дальнейшее совершенствование модели языка, выявление глубинного смысла предложения и переход от анализа отдельных предложений к анализу текстов необходимы не только для совершенствования вопросно-ответных систем и систем автоматического перевода, но главным образом для процедур пополнения текстов. Решение этих проблем возможно на пути использования в лингвистике развитых систем логического вывода, что требует тесной совместной работы лингвистов и логиков.
1.6 Диалоговые системы искусственного интеллекта
Появление комплексного диалогового интерфейса (направление В на рис. 1.1) привело к новому стилю использования вычислительной техники, поскольку стало возможным компоновать различные интеллектуальные системы. На рис. 1.8 приведены их основные составляющие. В левой части рисунка перечислены подсистемы, характерные для экспертных систем, а в правой части -- подсистемы, характерные для интеллектуальных пакетов прикладных программ и расчётно-логических систем.
Штриховые стрелки указывают на соответствие подсистем в левой и правой частях рисунка 1.8, из которого можно получить различные варианты систем искусственного интеллекта (в подрисуночной подписи отмечены подсистемы, вхождение которых не является обязательным). Во все виды интеллектуальных систем входит система общения, в общем случае представляющая собой лингвистический процессор в программной или аппаратной реализации, который осуществляет автоматический перевод профессиональных диалектов естественного языка на язык ЭВМ и обратно. Лингвистический процессор работает на основе модели языка (словарь и грамматика) и модели предметной области. В общем случае лингвистический процессор осуществляет морфологический, синтаксический и семантический анализ запросов, и соответственно семантический, синтаксический и морфологический синтез ответов, сформированных с помощью базы данных. При звуковой речи соответственно добавляются фонетический анализ и синтез.
Программно-аппаратные средства логического вывода необходимы для реализации процедур пополнения знаний, их обобщения и проверки на непротиворечивость. Построение системы логического вывода требует, в частности, развития неклассических и так называемых псевдофизических логик. Это даёт пользователю возможность с помощью ЭВМ на основе результатов научных экспериментов устанавливать закономерности, а также выдвигать и проверять гипотезы.
Дадим краткое описание интеллектуальных систем, приведённых на рис. 1.7.
1.6.1 Интеллектуальные информационно-поисковые системы
Как видно из рис. 1.8, основными составляющими интеллектуальных информационно-поисковых систем являются система общения, база знаний и база данных. Эти системы явились самыми первыми системами искусственного интеллекта, и работы над ними начались с развитием вычислительной техники. Интеллектуальные информационно-поисковые системы называют также естественноязыковыми системами общения или ЕЯ-системами. Основой систем общения является лингвистический процессор, осуществляющий анализ фраз естественного языка. Вопросно-ответные системы -- это упрощённый вариант ЕЯ-систем, когда речь идёт в основном об использовании модели языка (словарь и грамматика) и почти не используются знания о предметной области. Системы естественноязыкового общения кроме модели языка содержат базу знаний о предметной области.
1.6.2 Интеллектуальные пакеты прикладных программ
Интеллектуальные пакеты прикладных программ дают возможность конечному пользователю решать задачи по их описаниям и исходным данным без программирования процесса решения задачи -- программирование осуществляется автоматически программой-планировщиком из набора готовых программных модулей, относящихся к данной предметной области.
База знаний реализуется в виде функциональной семантиче-ской сети, представляющей собой в общем случае двудольный помеченный граф с двумя типами вершин. Один тип -- это параметры рассчитываемых задач, в том числе исходные данные. Вершины-параметры дугами связаны с другим типом вершин, которым сопоставлены математические отношения. Функциональная семантическая сеть -- это неориентированный граф, так как только при постановке расчётной задачи станет известно, что является входами, а что выходами данного математического отношения. Как только это становится известно, программа-планировщик вычленяет из неори-ентированного графа ориентированный граф решения задачи. У отношений выявляются входы и выходы, т. е. они пре-образуются в функции. Если тем или иным способом реализо-вать программные модули, отвечающие каждой функции, то образуется ориентированный граф, который предопределит построение цепочки модулей рабочей программы.
Одним из известных интеллектуальных пакетов прикладных систем в СССР является система ПРИЗ. В этой системе функциональная семантическая сеть строится разработчиком или пользователем с помощью специального непроцедурного языка УТО-ПИСТ. На этом же языке (после его предварительного изучения) пользователь формирует свою задачу.
Аналогично функционирует система СПОРА с непродуцированным языком ДЕКАРТ. Поэтому в систему общения обоих этих пакетов входит транслятор с языков УТОПИСТ и ДЕКАРТ соответственно. В системах ПРИЗ и СПОРА автоматизируются функции программиста. Математическая модель в виде функциональной семантической сети по-прежнему строится или разработчиками, или пользователем, освоившими непроцедурные языки программирования.
При использовании таких систем, как ПРИЗ в качестве систем автоматизированного проектирования технических систем блочно-модульного типа, для каждого варианта морфологии системы (состав агрегатов и схема их соединения) необходимо строить свою функциональную семантическую сеть, являющуюся математической моделью проектируемой системы.
В системе МАВР сделан следующий шаг -- автоматизировано построение самой математической модели, т. е. математическая модель автоматически строится по описанию проектируемой системы пользователем на своём языке. Такая возможность открывается благодаря использованию формализмов искусственного интеллекта, в данном случае фреймов, для построения базы знаний на предметном уровне. Это позволяет автоматически переформулировать модель системы на предметном уровне в математическую модель в виде функциональной семантической сети. Система общения в таких случаях обычно строится по упрощённой схеме и представляет собой то, что обычно называют естественноязыковым модулем, состоящим из словаря и формирователя стандартизированных фраз-меню, на которых пользователь в режиме диалога осуществляет описание проектируемой системы и формулирует расчётную задачу.
1.6.3 Расчётно-логические системы
Дальнейшим развитием интеллектуальных пакетов прикладных программ для коллективного распределённого решения задач планирования и проектирования, научных исследований и т. п. являются расчётно-логические системы.
Интеллектуальные пакеты прикладных программ -- класс систем искусственного, интеллекта, который можно назвать моносистемами в том смысле, что здесь один (возможно, групповой) пользователь, и соответственно декларативные и процедурные знания сосредоточены в системе.
Между тем в коллективах, решающих какую-либо общую задачу (например, планирования или проектирования), знания, умение, квалификация, ответственность распределены между специалистами, группами специалистов, организационными подсистемами и т. п. При декомпозиции общей задачи на подзадачи руководящий центр организации руководствуется именно этими особенностями коллективов.
Для успешного решения общей задачи должно быть обеспечено организационное (в смысле иерархической подчинённости) и информационное взаимодействие как между группами специалистов, так и между группами и центром. Таким образом, возникает сложная проблема с далеко идущими социально-психологическими последствиями, когда распределённое решение общей задачи будет происходить на основе включения ЭВМ в коммуникационные отношения внутри коллектива в процессе решения общей задачи.
В этом случае вместо совокупности не связанных между собой моносистем искусственного интеллекта будем иметь мультисистему или расчётно-логическую систему, которую можно назвать системой распределённого искусственного интеллекта. Для распределённого решения общих задач характерным является решение локальных задач на отдельных рабочих местах, а решение общей задачи идёт за счёт координируемого взаимодействия по каналам связи. Заметим, что взаимодействие между подсистемами или отдельными пользователями может быть организовано или на одной ЭВМ, или на сети ЭВМ, при этом компетенция, знания, ответственность рассредоточены по многим подсистемам, взаимосвязанным как по вертикали, так и по горизонтали.
Распределённое решение задач принципиально отличается от широко известной обработки данных на сетях ЭВМ, где имеют дело не с мультисистемой, а по-прежнему с моносистемой, когда для решения большой задачи пользователю не хватает ресурсов своей ЭВМ, включённой в сеть. Тогда из вычислительных машин сети для пользователя образуется виртуальная ЭВМ, превосходящая по производительности собственную ЭВМ пользователя.
Мультисистемы, в том числе системы распределённого искусственного интеллекта, могут представлять собой расчётно-логические системы или быть образованы из экспертных моносистем.
1.6.4 Экспертные системы
Резко возросшая популярность экспертных систем и их актуальность привели к тому, что программы, созданные для разнообразных человеко-машинных систем, их авторы стремятся выдать за экспертные системы. Экспертная система -- это программы ЭВМ, использующие знания и технику рассуждений человека-эксперта. Следует подчеркнуть одну особенность экспертной системы, принципиально отличающую её от других человеко-машинных систем.,-- это наличие в её составе подсистемы объяснения (см. рис. 1.8).
Подсистема объяснения отвечает на вопросы «как» и «почему», система подводит конечного пользователя к тому или иному выводу. Наличие подсистемы объяснения удовлетворяет естественному требованию уверенности пользователя в своих действиях. Без подсистемы объяснения возможны две равно неприемлемые альтернативы:
игнорирование ЭВМ в результате недоверия к полученным результатам;
абсолютная уверенность, что решения, принятые ЭВМ, всегда верны, и, как следствие, перенос ответственности за последствия принятых решений на математиков и ЭВМ.
Обратимся вновь к рис. 1.8. Наличие в правой колонке библиотеки прикладных программ или наборов программных модулей отражает широкое использование в расчётно-логических системах и в интеллектуальных пакетах прикладных программ математического моделирования и вычислительного эксперимента. Имеются в виду модели, основанные на фундаментальных законах физики и механики, оптимизационные модели исследования операций и экономики.
В экспертных системах используются модели, построенные на специальных формализмах искусственного интеллекта, и называемые логико-лингвистическими.
Поскольку экспертные системы ориентированы на знания и манипуляцию с ними, то высказывается мнение, что появился новый вид моделирования -- «моделирование познавательной деятельности» [27], имеющее широкий спектр применения, в том числе в области научных исследований. Укажем на характерные этапы научных исследований [28]:
сбор и обработка исходных эмпирических данных;
математическая и логико-теоретическая обработка данных с целью выявления новых фактов, объективная истинность которых имеет как теоретическое, так и эмпирическое обоснование;
построение на основе обобщения научных фактов новых тео-рий, отображающих фундаментальные отношения и связи иссле-дуемых процессов и явлений.
Если первый этап научных исследований к настоящему времени автоматизирован достаточно полно за счёт применения систем обработки данных, использования банков данных и систем управления базами данных, а также документальных и фактографических информационно-поисковых систем, то с автоматизацией второго и третьего этапов дело обстоит сложнее. Решающее значение при этом имеют математическое моделирование и вычислительный эксперимент. Это относится к наукам, где можно построить математические модели. В таких науках, как медицина, биология, геология, химия и т. д., деятельность учёных на этих этапах остаётся неавтоматизированной.
Вот почему так популярны стали экспертные системы, решающие задачи моделирования познавательной активности именно в таких областях науки.
Познавательная активность предполагает, что люди (эксперты) способны [29]:
1) накапливать знания;
2) обобщать знания;
3) осознавать и выявлять проблемы;
4) применять суждения для решения проблем, делать правдоподобные выводы из неполной информации;
5) оправдывать своё поведение и объяснять свои суждения;
6) взаимодействовать с другими людьми и тем самым накапливать знания;
7) реконструировать и реорганизовывать свои знания;
8) понимать не только букву, но и дух правил, используемых в процессе суждений и поведения (отсюда вытекают использование подчас исключения из правил, их сознательное и бессознательное нарушение);
9) определять, находится ли проблема на границе их компетентности, обязаны они решать ту или иную проблему или нет.
Что из этого списка можно реализовать с помощью экспертных систем? Как системы, ориентированные на знания, экспертные системы в настоящее время способны реализовать первые два свойства, четвёртое свойство реализуется как выдача рекомендаций в диалоговом режиме. Третье свойство -- это прерогатива человека, но в диалоге с экспертной системой эта способность человека существенно интенсифицируется. Пятое свойство реализуется только в экспертной системе подсистемами объяснения и доверия.
Седьмое свойство может быть реализовано разработчиками экспертной системы, а в дальнейшем пользователями.
Экспертные системы могут выполнять следующие функции:
интерпретация данных с целью определения их значения;
диагноз или определение состояния технических и биологических систем (на основе интерпретации зашумленных данных);
контрольное наблюдение (мониторинговые системы) или непрерывная интерпретация данных в реальном масштабе времени критических состояний наблюдаемых объектов (реанимация, ядерные реакторы и т. п.);
предсказание развития будущего на основе моделирования настоящего и прошлого;
планирование и разработка мероприятий и действий для достижения поставленных целей;
проектирование или выработка чётких предписаний по построению объектов, удовлетворяющих поставленным требованиям.
С точки зрения моделирования познавательной активности и теории экспертных систем несколько в ином, более широком аспекте выступает понятие новой информационной технологии [30]. В будущем экспертные системы приведут к массовой электронной технологии представления, накопления, использования и передачи знаний.
Печатные издания, в которых заключён накопленный объём знаний, как системы представления знаний пассивны по своей сути. Прежде чем применить знания, накопленные в книгах, необходимо их сначала найти, проинтерпретировать для решения постоянно возникающих проблем. Крайне негибки книги в смысле обновления и представления новых знаний. Коммуникативные процессы передачи знаний другим людям посредством книг также негибки.
Не следует думать, что электронное представление знаний означает простое переписывание в память ЭВМ текстов из печатных изданий. Прежде чем попасть в пространство памяти ЭВМ, знания из книг и знания экспертов должны быть перекодированы в специальные языки представления знаний. Это языки логического, сетевого и продукционного типов. Разумеется, останутся уникальные тексты, которые в случае необходимости будут записаны в памяти в привычной текстовой форме.
Существующие программные системы негибки и всякое изменение в знаниях, заключённых в программах, приводит к необходимости перепрограммирования. Возможно, здесь сыграет определённую роль так называемое неформальное программирование, основанное на теории продукционных систем [31].
Создание экспертных систем не может идти по обычной схеме заказчик-исполнитель, когда в соответствии с техническим заданием разработчик-исполнитель сдаёт заказчику готовую для эксплуатации систему. Это невозможно потому, что знания, которыми должна быть заполнена конкретная экспертная система, находятся у заказчика, а не у исполнителя.
Организация-исполнитель (разработчик) с помощью специальных инструментальных средств создаёт так называемую пустую экспертную систему, или метасистему, ориентированную на один из классов экспертных систем. Заполнение знаниями «пустой» системы осуществляется непосредственно у заказчика специальными инженерами по знаниям, входящими либо в организацию-разработчик, либо в организацию-заказчик. Инженеры по знаниям должны, с одной стороны, быть вполне компетентными в теории экспертных систем, а с другой -- знать предметную область и уметь работать с экспертами из этой области, чтобы превращать их знания в формализмы данной экспертной системы. Для формализации знаний из текстов и из интервью с экспертами разработаны специальные языки.
Инструментальные системы, в сущности, представляют собой экспертные системы для создания экспертных систем. Естественным расширением этого явилось создание экспертных систем для программирования (системного и прикладного).
Распределённые экспертные системы. Распределённые системы искусственного интеллекта, образованные из отдельных систем, необходимы при многоаспектном диагнозе распознавания свойств сложных объектов, когда важно взаимодействие отдельных специалистов в процессе распознавания и формирования плана действий.
Примерами таких ситуаций могут служить эколого-экономические проблемы, проблема постановки точного диагноза больному на основе результатов комплексного обследования врачами-специалистами. Важное значение распределённые экспертные системы будут иметь для создания больших программных комплексов коллективом программистов. В нашей стране разработана технология коллективного программирования с графическим представлением программ на дисплеях [32].
Распределённые экспертные системы могут быть реализованы на одном многотерминальном вычислительном комплексе или на сетях ЭВМ (например, персональных).
Гибридные экспертные системы. От традиционных экспертных систем, основанных на логико-лингвистических моделях, гибридные экспертные системы отличает широкое использование также и математических моделей.
Традиционно автоматизированные системы проектирования, планирования и научных исследований строятся на математических моделях. Но в них невозможно учесть неформальные специфические знания проектировщиков, плановиков, исследователей и т. д. Поэтому так важно объединение математических моделей с логико-лингвистическими.
При использовании систем ПРИЗ и МАВР, например, в качестве систем автоматизированного проектирования, входом явится сформированный проектировщиком вариант технической модели. При формировании технической модели (осуществляемой вне систем ПРИЗ или МАВР) используются специфические знания и опыт проектировщиков. Создание экспертной подсистемы для формирования технической модели и объединение её с системой автоматизированного проектирования позволит получить гибридную экспертную систему.
Обобщённые прикладные интеллектуальные системы. Обобщённые прикладные интеллектуальные системы можно рассматривать как расчётно-логические системы, дополненные экспертными подсистемами, или как распределённые экспертные системы с сильной вычислительной компонентой.
Все виды интеллектуальных систем могут и должны реализоваться на существующих, в том числе персональных, ЭВМ. Это нужно для получения первоначальных результатов применения интеллектуальных систем и для накопления опыта. Наибольший эффект будет получен при использовании внутренней интеллектуализации ЭВМ (направление С на рис. 1.1).
1.7 Внутренняя интеллектуализация ЭВМ
Целью внутренней интеллектуализации ЭВМ является, с одной стороны, создание ЭВМ такой архитектуры, при которой за счёт распараллеливания обработки информации достигается весьма высокая производительность, а с другой -- осуществляется ориентация на решение специфических задач искусственного интеллекта, в частности на создание высокоэффективных экспертных систем.
1.7.1 Высокопроизводительные ЭВМ
Практически все архитектуры вычислительных систем, имеющие распределённую память и высокопараллельную обработку информации относятся к классу МКМД (Множество потоков Команд -Множество потоков Данных). При разработке этого класса систем возникают три взаимосвязанные проблемы:
модель вычислений;
схема управления в модели вычислений;
конкретная архитектура МКМД.
Модель вычислений определяет принцип отбора исполняемых в данный момент операторов, образующих программу, что позволяет различать следующие модели:
последовательная (по фон Нейману) -- операторы исполняются согласно задаваемому программистом порядку;
потоков данных (каждый оператор исполняется в момент готовности всех аргументов);
редукционная (рекурсивная) -- оператор возбуждается, если некоторый другой оператор требует исполнения данного оператора;
объектно-ориентированная (оператор -- это объект, который возбуждается, когда к нему есть запрос, в этом случае программа -- объединение объектов в некоторую сеть).
Для моделей вычислений используются следующие схемы управления:
управление выполнением операторов (принудительное последовательное или параллельное);
управление от данных (данные определяют функционирование того или иного фрагмента вычислительной модели);
управление запросами (поступающий запрос определяет активность того или иного оператора).
Архитектуры компьютеров МКМД. Можно указать на архитектуры с универсальными и со специальными связями [33, 34]. К первым относятся архитектуры с общей шиной и архитектуры с коммуникационной сетью, обеспечивающие связь между всеми процессорами. К архитектурам со специальными связями относятся древовидные архитектуры типа двумерных, трёхмерных решёток и др. С точки зрения организации связей указанные архитектуры можно было бы подразделить на системы с непосредственными универсальными связями и системы с транзитивными универсальными связями.
Рассмотрим некоторые отечественные проекты с точки зрения классификации моделей вычислений, схем управления и архитектур.
Макроконвейерный вычислительный комплекс. Это многопроцессорная вычислительная система типа МКМД с распределённой памятью и универсальной системой связи (коммутационная сеть, обеспечивающая параллельный обмен информацией «каждый с каждым»). В максимальной конфигурации (256 процессоров с быстродействием 0,5 млн. команд в секунду, памятью 0,5М байт на один процессор) система обладает потенциальной производительностью свыше 100 млн. команд в секунду [34].
Суть макроконвейерных вычислений состоит в том, что при распределении заданий между процессорами каждому из них на очередном шаге вычислений даётся такое задание, которое может загрузить процессор работой, не требующей его взаимодействия с другими процессорами. Макроконвейерная организация вычислений образуется в результате анализа циклической структуры программы, реализующей алгоритм решения задачи.
Циклы и особенно вложенные системы циклов в данном случае -- главный объект распараллеливания программ. При этом организуется передача результатов по обработке циклов от процессора к процессору с перекрытием -- без ожиданий. Таким образом, организация работы представляет собой, по сути, линейный конвейер. Приставка «макро» означает, что речь идёт о распараллеливании внешних циклов, а не внутренних, которые имеют место на уровне микрокоманд.
Распараллеливание двойных или тройных циклов приводит соответственно к организации двумерных или трёхмерных макроконвейерных систем. Управление вычислением в макроконвейер-ном вычислительном комплексе осуществляется распределённой операционной системой, обеспечивающей различные типы организации макроконвейерных вычислений и динамическую реконфигурацию системы в зависимости от решаемой задачи. В состав комплекса входят управляющие процессоры, арифметические процессоры (плавающая запятая разрядности 64 и 128, векторные операции). В дальнейшем предусматриваются процессоры реального времени и процессор логического вывода.
Разработка общесистемных и прикладных программ для макроконвейерного вычислительного комплекса ведётся с использованием специально разработанного языка параллельного программирования МАЯК. Это алгоритмический язык высокого уровня для распределённых многопроцессорных систем, удобно сочетающийся с традиционными языками последовательного программирования (типа ФОРТРАН или ПАСКАЛЬ), которые могут использоваться для разработки программных модулей, исполняемых на отдельных про-цессорах.
Машина с динамической архитектурой. Эта вычислительная структура с высоким уровнем интеллекта [35, 36] с точки зрения модели вычислений относится к классу объектно-ориентированных моделей, в основе которых лежат динамические автоматные сети. Они обеспечивают представление любой задачи в виде динамической структуры, т. е. в виде множества объектов, обменивающихся информацией и связанных между собой определёнными отношениями.
Как объекты, так и отношения сами могут являться структурами. Динамизм структуры заключается в том, что она наделена способностью к автотрансформации, т. е. в состав структуры входят такие элементы, которые способны изменять её. Исходной программе соответствует некоторая начальная структура, к трансформации
Подобные документы
Искусственный интеллект – научное направление, связанное с машинным моделированием человеческих интеллектуальных функций. Черты искусственного интеллекта Развитие искусственного интеллекта, перспективные направления в его исследовании и моделировании.
реферат [70,7 K], добавлен 18.11.2010Эволюция систем искусственного интеллекта. Направления развития систем искусственного интеллекта. Представление знаний - основная проблема систем искусственного интеллекта. Что такое функция принадлежности и где она используется?
реферат [49,0 K], добавлен 19.05.2006Области человеческой деятельности, в которых может применяться искусственный интеллект. Решение проблем искусственного интеллекта в компьютерных науках с применением проектирования баз знаний и экспертных систем. Автоматическое доказательство теорем.
курсовая работа [41,3 K], добавлен 29.08.2013Может ли искусственный интеллект на данном уровне развития техники и технологий превзойти интеллект человека. Может ли человек при контакте распознать искусственный интеллект. Основные возможности практического применения искусственного интеллекта.
презентация [511,2 K], добавлен 04.03.2013История развития искусственного интеллекта в странах дальнего зарубежья, в России и в Республике Казахстан. Разработка проекта эффективного внедрения и адаптации искусственного интеллекта в человеческом социуме. Интеграция искусственного в естественное.
научная работа [255,5 K], добавлен 23.12.2014Начало современного этапа развития систем искусственного интеллекта. Особенности взаимодействия с компьютером. Цель когнитивного моделирования. Перспективы основных направлений современного развития нейрокомпьютерных технологий, моделирование интеллекта.
реферат [24,7 K], добавлен 05.01.2010История развития искусственного интеллекта. Экспертные системы: их типы, назначение и особенности, знания и их представление. Структура идеальной и инструменты построения экспертных систем. Управление системой продукции. Семантические сети и фреймы.
реферат [85,7 K], добавлен 20.12.2011Характеристика сущности искусственного интеллекта. Проблема создания искусственного интеллекта. Базовые положения, методики и подходы построения систем ИИ (логический, структурный, эволюционный, имитационный). Проблемы создания и реализация систем ИИ.
реферат [43,1 K], добавлен 19.07.2010Сущность термина "искусственный интеллект"; история его развития. Наука и технология создания интеллектуальных машин и компьютерных программ. Задача использования компьютеров для понимания человеческого интеллекта. Анализ, синтез и понимание текстов.
дипломная работа [29,4 K], добавлен 17.06.2013Компоненты и архитектура интеллектуального агента, его дополнение средствами обучения. Различные подходы к созданию искусственного интеллекта, перспективы его развития. Этические и моральные последствия разработки интеллектуальных машин и программ.
реферат [708,9 K], добавлен 02.03.2014