Об одном подходе к порождению гипотез в ДСМ-методе
Характеристика подхода к порождению гипотез, предполагающего отделение логической и комбинаторной составляющих ДСМ-метода. Особенность пробуждения сходств определенных и неопределенных примеров. Анализ выполнения в цикле процедур индукции и аналогии.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | статья |
Язык | русский |
Дата добавления | 17.01.2018 |
Размер файла | 25,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
УДК 004.838:004.853:004.855.5
Об одном подходе к порождению гипотез в ДСМ-методе
О.М. Аншаков
В работе описывается подход к порождению гипотез, предполагающий отделение логической и комбинаторной составляющих ДСМ-метода. При таком подходе сначала порождаются сходства определенных и неопределенных примеров, затем в цикле выполняются процедуры индукции и аналогии.
ДСМ-метод автоматического порождения гипотез, предложенный В.К.Финном [Финн, 1983], представляет собой синтез познавательных процедур индукции, аналогии и абдукции [Финн, 1999]. Он может быть сформулирован в виде системы правил и даже представлен в виде программы на языке логического программирования [Виноградов, 1999], [Виноградов, 2001], [Efimova et al, 2006]. Это логико-комбинаторный метод и его алгоритмическая сложность в наихудшем случае является экспоненциальной (от размера данных) [Кузнецов, 1993]. Однако существуют алгоритмы, которые имеют полиномиальную сложность от размера результата (количества порожденных ДСМ-методом гипотез) [Кузнецов, 1993]. Заметим также, что в практических задачах такие данные, которые могут приводить к наихудшему случаю, встречаться просто не могут. На практике с помощью алгоритмов, полиномиальных от размера результата, задача порождения гипотез с помощью ДСМ-метода решается за вполне приемлемое время.
Классическая схема алгоритма ДСМ-метода приведена на рис. 1.
Условие насыщения будет выполнено, если применение процедуры индукции не приводит к порождению новых гипотез. Проверка на каузальную полноту как раз и представляет собой применение некоторого варианта абдукции. Набор данных и вариант стратегии ДСМ-метода удовлетворяют условию каузальной полноты, если все данные о наличии или отсутствии свойств у объектов объясняются с помощью гипотез о возможных причинах наличия или отсутствия свойств, порожденных с помощью процедуры индукции.
Рис. 1. Классическая схема ДСМ-метода
Если условие каузальной полноты не выполнено, то это является основанием для пополнения базы фактов и/или изменения стратегии ДСМ-метода и/или способа представления данных. Все эти операции выполняются при участии человека.
Обсудим более подробно процедуру индукции. Рассмотрим одну из простейших ДСМ-стратегий -- простой ДСМ-метод с запретом на контрпример. Неформально, одно из правил индукции для этой версии ДСМ-метода можно описать следующим образом.
Пусть:
Данные о причинно-следственных отношениях между фрагментом S и множеством свойств P отсутствуют (преамбула).
Фрагмент S является сходством (общей частью) не менее двух положительных примеров - объектов, обладающих множеством свойств P (порождение сходств и верификация).
Фрагмент S не включается ни в один отрицательный пример, т.е. ни в один объект, не обладающий множеством свойств P (фальсификация).
Тогда:
Фрагмент S является возможной причиной (наличия) множества свойств P.
Мы назовем это правило классическим правилом индукции для положительных гипотез и будем обозначать через (C+). Двойственную формулировку имеет правило индукции для отрицательных гипотез (причин отсутствия множества свойств), которое мы будем обозначать через (C-).
В этих правилах в одну посылку объединены два действия - порождение сходств и верификация. При реализации ДСМ-метода с помощью процедурных языков программирования в этом случае получается одна циклическая процедура, в которой происходит порождение общих фрагментов положительных примеров - обычно это сводится к поиску всех пересечений множеств, служащих представлениями объектов.
Автор данной работы предлагает выделить порождение сходств в отдельную посылку и, соответственно, в отдельную процедуру, и обсудить достоинства и недостатки такого подхода.
Модифицированным правилом индукции для положительных гипотез (M+) назовем правило, имеющее следующее неформальное описание.
Пусть:
Данные о причинно-следственных отношениях между фрагментом S и множеством свойств P отсутствуют (преамбула).
Фрагмент S является сходством (общей частью) не менее двух объектов, которые являются положительными или неопределенных примерами: положительные примеры суть объекты, обладающие множеством свойств P, неопределенные примеры - объекты, про которые неизвестно, обладают ли они свойством P (порождение сходств).
Фрагмент S включается не менее, чем в два положительных примера (верификация).
Фрагмент S не включается ни в один отрицательный пример, т.е. ни в один объект, не обладающий множеством свойств P (фальсификация).
Тогда:
Фрагмент S является возможной причиной (наличия) множества свойств P.
Двойственную формулировку имеет правило (M-).
Очевидно, что все гипотезы, которые можно получить с помощью правила (C+) можно получить и с помощью правила (M+). Аналогичное утверждение верно для правил (M-) и (C-). Более того, нетрудно показать, что правило (M+) строго сильнее правила (C+), т.е. в некоторых ситуациях правило (M+) порождает гипотезы, которые нельзя получить с помощью правила (C+). Затем с помощью этих гипотез с помощью правила аналогии можно доопределить существенно больше неопределенных примеров.
Рассмотрим следующий простой пример.
Табл. 1. Пример данных для ДСМ-метода
№ |
Объект |
Множество свойств |
|
1 |
{лук, меч, копье} |
+ |
|
2 |
{лук, арбалет} |
? |
|
3 |
{лук, стрелы} |
? |
|
4 |
{лук, меч, палица} |
+ |
|
5 |
{лук, меч, щит} |
? |
|
6 |
{меч, сабля} |
? |
|
7 |
{меч, огонь} |
? |
|
8 |
{чашка, кружка} |
- |
|
9 |
{чашка, ложка} |
- |
Объектами в данном случае являются множества ключевых слов. Множество свойств состоит из одного элемента «Иметь отношение к оружию». С помощью правила (C+) мы получим одну положительную гипотезу {лук, меч}. Т.е., множество слов {лук, меч} является возможной причиной для того, чтобы отнести объект к описаниям оружия. С помощью правила (C-) мы получим одну отрицательную гипотезу {чашка}.
С помощью же правила (M+) мы получим три положительные гипотезы: {лук, меч}, {лук}, {меч}. С помощью правила (M-) мы получим ту же самую отрицательную гипотезу {чашка}.
Теперь дадим неформальное описание правила аналогии, с помощью которого делается прогноз о наличии (отсутствии) у объектов заданного множества свойств. гипотеза логический индукция аналогия
Пусть:
Нам неизвестно, обладает ли объект O множеством свойств P (преамбула).
Объект O содержит возможную причину наличия множества свойств P.
Объект O не содержит возможную причину отсутствия множества свойств P.
Тогда:
Объект O (возможно) обладает множеством свойств P.
Данное правило будем называть правилом положительной аналогии и обозначать через (A+). Правило отрицательной аналогии (A-) имеет двойственную формулировку.
Итак, с помощью правил (C+) и (C-) мы получили, что фрагмент {лук, меч} является возможной причиной наличия рассматриваемого в примере множества свойств, а фрагмент {чашка} есть возможная причина отсутствия этого множества свойств. Применяя правило аналогии (A+), получим, что объект {лук, меч, щит}, возможно, обладает множеством свойств {«Иметь отношение к оружию»}. Таким образом, рассуждая в классическом стиле, мы смогли доопределить лишь один объект.
С помощью правил (M+) и (M-) мы получим три возможные причины наличия рассматриваемого множества свойств {лук, меч}, {лук} и {меч} и одну причину отсутствия этого множества свойств {чашка}. Применяя правило (A+), получим, что объекты {лук, арбалет}, {лук, стрелы}, {лук, меч, щит}, {меч, сабля}, {меч, огонь}, возможно, обладают упомянутым выше множеством свойств. Таким образом, множество объектов, доопределенных с помощью классической стратегии, является собственным подмножеством множества объектов, доопределенных с помощью модифицированной стратегии.
Обсудим теперь достоинства и недостатки классических и модифицированных правил индукции.
Несомненным достоинством классического подхода является его меньшая вычислительная сложность. Однако этот факт обусловлен тем обстоятельством, что при классическом подходе мы порождаем меньше сходств и поэтому можем породить меньше гипотез и доопределить меньше объектов.
Заметим, что при модифицированном подходе мы, также как при классическом, считаем, что возможная причина наличия множества свойств является сходством (пересечением) не менее двух положительных примеров. Однако мы допускаем, что некоторые из этих положительных примеров могут быть нам неизвестны. Т.е. в исходных данных они помечены как неопределенные. (Аналогичное утверждение верно для отсутствия множества свойств и для отрицательных примеров.)
Соотношение между сложностью алгоритмов классического и модифицированного подхода в наихудшем случае можно определить как 2n/2n+k, где n - количество положительных примеров, k - количество неопределенных примеров (для отрицательных примеров ситуация аналогичная). Следует заметить, что на практике сложность вычислений оказывается существенно меньше.
Пока недостаточно данных, чтобы сравнивать классический и модифицированный подход на реальных задачах, как по времени выполнения, так и предсказательной силе. Для этого, как минимум, необходимо иметь ДСМ-систему, в которой оба подхода реализованы одинаково эффективно.
Отметим следующие два обстоятельства:
· задачи, решаемые с помощью ДСМ-метода, как правило, не являются задачами реального времени,
· каждая новая гипотеза, полученная ДСМ-методом, может иметь очень большую научную и практическую ценность.
Поэтому, даже если вместо долей секунды система будет работать несколько часов, но в результате будет обнаружено хотя бы одно новое лекарство, которое было бы невозможно обнаружить при классическом подходе, игра стоит свеч.
Итак, мы фактически обсудили одно из достоинств модифицированного подхода - возможность порождения более широкого множества гипотез, чем позволяет классический подход. Другим достоинством, по мнению автора, является возможность выделения порождения сходств в отдельную процедуру, выполнение которой предшествует внутреннему циклу алгоритма ДСМ-метода. В этом случае мы отделяем логику от комбинаторики и можем реализовывать логические и комбинаторные процедуры разными средствами.
Процедуру порождения сходств можно реализовать на процедурном языке программирования и вообще постараться достичь максимальной эффективности ее реализации (ключевые операции написать на ассемблере). Логическую же часть можно реализовать с помощью языка логического программирования, например Пролога. В этом случае логическую часть будет легче модифицировать для испытания различных стратегий ДСМ-метода.
Таким образом, модифицированный подход приводит к схеме алгоритма ДСМ-метода, изображенной на рис. 2.
Окончательная редакция правила индукции (M+) будет следующей.
Пусть:
Данные о причинно-следственных отношениях между фрагментом S и множеством свойств P отсутствуют (преамбула).
Фрагмент S включается не менее, чем в два положительных примера (верификация).
Фрагмент S не включается ни в один отрицательный пример, т.е. ни в один объект, не обладающий множеством свойств P (фальсификация).
Тогда:
Фрагмент S является возможной причиной (наличия) множества свойств P.
Рис. 2. Модифицированная схема ДСМ-метода
Т.е., мы удалили из этого правила посылку, соответствующую порождению сходств. Аналогично поступаем и с правилом (M-). Теперь правила (M+) и (M-) несложно записать в виде формул логики предикатов первого порядка и представить на языке логического программирования.
Заметим, что и в классическом случае, как показал Д.В.Виноградов, правило индукции можно представить формулой первого порядка и записать систему правил ДСМ-метода в виде логической программы.
Список литературы
1. [Виноградов, 1999] Виноградов Д. В. Логические программы для квазиаксиоматических теорий // НТИ. Сер 2. 1999. № 1_2.
2. [Виноградов, 2001] Виноградов Д. В. Корректные логические программы для правдоподобных рассуждений // НТИ. Сер. 2. 2001. №5.
3. [Кузнецов, 1993] Кузнецов С.О. Быстрый алгоритм построения всех пересечений объектов из конечной полурешетки// НТИ Сер.2.- 1993, № 1.
4. [Финн, 1983] Финн В.К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Ф.Бэкона -- Д.С.Милля // Семиотика и информатика.-1983.- Вып. 20.
5. [Финн, 1999] Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер. 2.- 1999.- № 1-2.
6. [Efimova et al, 2006] Efimova E., Safronova O., Vinogradov D.A Prototype of JSM-system in Visual Prolog // Proceedings of the First Visual Prolog Applications and Language Conference. Prolog Development Center. 2006.
Размещено на Allbest.ru
Подобные документы
Исследование и принцип работы арифметико-логического устройства для выполнения логических операций. Условно–графическое обозначение микросхемы регистра. Анализ логической схемы регистра, принцип записи, чтения информации. Проектирование сумматора.
курсовая работа [879,6 K], добавлен 23.11.2010Электронные средства базируются на ламповой технике и блочном методе компоновки и монтажа. Системный подход базируется на взаимосвязи с окружающими объектами. Основные положения и принципы системного подхода. Компоновка в радиоэлектронной аппаратуре.
реферат [525,9 K], добавлен 13.09.2010Закон распределения. Распределение Вейбулла. Экспоненциальное распределение вероятности. Определение закона распределения и выбор числа показателей надежности. Выбор числа показателей надежности. Выдвижение гипотез о математических моделях распределения.
реферат [34,7 K], добавлен 28.01.2009В методе непрерывных испытаний осуществляется непрерывный отбор и постановка изделий на испытания в течение контролируемого периода. В графическом методе планирования испытаний используется кривые распределения Пуассона. Испытания на ремонтопригодность.
реферат [145,6 K], добавлен 28.01.2009Частотный метод измерения высоты и составляющих скорости. Канал оценки составляющих скорости. Вычислительные требования к блоку измерителя и модуляции. Разработка схемы электрической принципиальной. Математическое моделирование усилителя ограничителя.
дипломная работа [861,7 K], добавлен 24.03.2014Проектирование в прикладном пакете MATLAB аналогового фильтра Баттерворта верхних частот и произвольного фильтра. Система для метода контурных токов, расчет собственных и взаимных сопротивлений контуров, токов и напряжений в методе контурных токов.
контрольная работа [571,0 K], добавлен 24.04.2009Характерная особенность приемников класса супергетеродинов. Преимущества супергетеродинного метода и недостатки. Основные требования к преобразователям частоты, их назначение, структурная схема, принцип работы, основные показатели и классификация.
курсовая работа [2,1 M], добавлен 15.12.2009Анализ работы мультиплексоров Е1, процедур мультиплексирования и демультиплексирования. Методы стрессового тестирования мультиплексора. Характеристика регенераторов, используемых в системах передачи Е1 для восстановления и усиления цифрового сигнала.
реферат [677,8 K], добавлен 11.11.2010Определение параметров транзистора по его статическим характеристикам. Построение комбинационной логической схемы на электромагнитных реле. Разработка электрических схем параллельного и последовательного суммирующих счётчиков. Состояние триггеров.
курсовая работа [290,5 K], добавлен 13.01.2016Выполнение синтеза логической схемы цифрового устройства по заданным условиям его работы в виде таблицы истинности. Получение минимизированных функций СДНФ, СКНФ с использованием карт Карно. Выбор микросхем для технической реализации полученных функций.
контрольная работа [735,9 K], добавлен 10.06.2011