Разработка технологии и методов общения конечных пользователей с реляционными БД на ограниченном естественном языке

Описание опыта эксплуатации систем, построенных на основе традиционного подхода к построению методов общения конечных пользователей (то есть специалистов в конкретной области знаний) с компьютером на ограниченном естественном языке и с базами данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 19.01.2018
Размер файла 18,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Разработка технологии и методов общения конечных пользователей с реляционными БД на ограниченном естественном языке

Эдуард В. Попов

Российский научно-исследовательский институт информационных технологий и систем автоматизированного проектирования

The traditional approaches to construction of systems of dialogue of the end users with large data bases on the limited natural language are considered. Is shown, that these approaches do not allow to decide a problem of dialogue, as percent of the requests, not understood by a system, reaches up to 80. As alternative the traditional approach the approach based on a dynamic model of the participants of dialogue is considered. Is shown, that the given approach used by the people in dialogue among themselves, can not be realized for want of dialogue of the end users with large data bases, as the existing knowledges of semantics, theory of tutoring and purchase of knowledges are rather far from requests of practical use in systems of dialogue. The new approach is described, which essence is reduced that during dialogue for removal of failures it is offered to train not a system, and user, not requiring from him of detail knowledges of linguistics.

В настоящее время проблема непосредственного общения (т.е. без посредников-программистов) конечных пользователей (КП), т.е. специалистов в конкретной области знаний (как правило, детально не знающих программирования) с компьютером на ограниченном естественном языке (ОЕЯ) является чрезвычайно актуальной, так как накоплены огромные объемы знаний в базах данных (БД) и в Internet.

Традиционные подходы к построению методов и систем общения конечных пользователей с БД сводятся к следующей постановке: а) на входе в систему поступает правильный (т.е. понимаемый системой) конкретное запрос, а не связный текст на ОЕЯ; б) на выходе прямой (не косвенный) ответ на ОЕЯ. Кроме этих ограничений на ОЕЯ (изолированное предложение, а не текст; конкретный запрос, а не абстрактный; прямой ответ, а не косвенный) обычно накладываются и другие как явные ограничения (отсутствие причастных и деепричастных оборотов, отсутствие придаточных предложений и др.), так и не явные, т.е. те, которые объяснить конечному пользователю, не знающему лингвистики, знаний и возможностей системы, не возможно. Однако если эти ограничения не выполняются, то система либо не дает ответа, либо (что хуже) отвечает не совсем о том, о чем спрашивает КП, и таким образом вводит его в заблуждение, чреватое серьезными негативными последствиями.

Опыт эксплуатации систем, построенных на основе традиционного подхода, показал, что в ходе общения с базами данных возникают следующие принципиальные трудности. Во-первых, оказалось, что пользователь не может при общении с системой употреблять только правильные входные предложения (число неправильных предложений при общении с большой БД доходит до 80% от общего числа предложений). Во-вторых, в общем случае пользователь не может выразить свой запрос в виде изолированных входных предложений. Во многих случаях требуется диалог, в результате которого конкретизируется потребность пользователя в рамках знаний и возможностей системы. В-третьих, оказалось, что информационное обеспечение (И0), необходимое для правильного функционирования системы, не может быть зафиксировано на стадии проектирования системы, а должно непрерывно модифицироваться и расширяться в процессе эксплуатации системы. Указанное обстоятельство приводит (в связи с большой трудоемкостью создания непротиворечивого ИО) к необходимости обеспечить автоматизированное централизованное динамическое создание и ведение основного ИО (запрашиваемых пользователем фактов и документов) и вспомогательного ИО (служебной информации, необходимой для правильного функционирования системы общения), что чрезвычайно дорого.

Неудачный опыт использования традиционного подхода привел к подходу, основанному на динамической модели участников общения (КП и системы). Этот подход к построению систем общения теоретически свободен от перечисленных выше недостатков традиционного подхода и в принципе позволяет решить проблему общения пользователей с БД на ОЕЯ. В реальных диалогах между людьми и, тем более, между человеком и ЭВМ неизбежны “неправильные” предложения, т.е. такие высказывания одного из участников, которые другой участник “не понимает”. Причины, приводящие к неправильности фраз при взаимодействии человека с ЭВМ, сводятся в основном к ограниченным возможностям как пользователя, так и системы и на практике не могут быть устранены без диалога. Для достижения взаимопонимания между участниками инициатива в процессе общения (в общем случае) должна переходить от одного участника к другому. Утверждения участника А, имеющего инициативу, выражают не только то, что он хочет сказать, но и его ожидание, касающееся формы ответа участника В. Если ожидания, владеющего инициативой участника А, точно совпадают с тем, что сообщает В (такой ответ называют “прямым” ответом), то инициатива будет всегда оставаться у А. Такая схема диалога возможна только при полной осведомленности А о знаниях, намерениях и желаниях В. Отметим, что данный случай с точки зрения окружающих, подобен общению, при котором участник А обладает телепатией. Если ожидания участника А, выраженные в вопросе, не совпадают (или не точно совпадают) с реакцией В, то такой ответ часто называют “косвенным” или приблизительным ответом. Система, осуществляющая общение с человеком, должна уметь понимать косвенные ответы человека и сама давать такие ответы. Можно сказать, что косвенный ответ является необходимой формой общения в следующих случаях: 1) если прямой ответ на начальный вопрос является бесполезным или неинформативным; 2) при необходимости проинформировать пользователя о структуре и содержании знаний системы; 3) при неудачной попытке системы общения обработать входное предложение. пользователь база компьютер

До недавнего времени при разработках систем предполагалось, что пользователь имеет детальные знания о системе общения (и, естественно, о себе) и это помогает ему понять любые ситуации (в том числе и непредвиденные), возникающие при обработке входного текста. Таким образом, вся ответственность за успешный результат диалога возлагалась только на одного участника общения - на пользователя. Однако, если пользователь не обладает достаточными знаниями о системе, что неизбежно имеет место при большом количестве хранимых системой фактов, то для успешного диалога необходима смешанная инициатива, т.е. инициатива, переходящая от одного участника к другому. Для того чтобы система могла позволить пользователю перехватывать инициативу, она должна иметь динамическую модель себя (модель, изменяющую свои состояния в процессе функционирования системы) как участника общения, обладающую “сознанием” и “самосознанием”. “Сознание” и “самосознание” необходимо для того, чтобы обеспечить взаимопонимание участников путем сообщения одним участником диалога (ЭВМ) в терминах, понятных другому (пользователю) своих затруднений и их причин. Следует подчеркнуть, что указанное требование является следствием не сложности естественного языка, а следствием сложности предметной области, обсуждаемой в процессе общения, и различиями в знаниях участников общения.

Учитывая указанные выше особенности процесса общения, необходимо при разработке систем, осуществляющих взаимодействие пользователей с базами данных на ОЕЯ, использовать следующий подход:

ДАНО: Связный текст на ОЕЯ, состоящий из “правильных” и “неправильных” предложений о предметной области (вопросительных и повествовательных).

ЦЕЛЬ: Разработать систему общения, которая адекватно реагирует на обращение пользователя путем: 1) обработки правильных запросов (по всем видам знаний) в контексте диалога, т.е. их понимание и формирование прямого ответа; 2) обработки неправильных высказываний (вопросительных или повествовательных), т.е. их понимание и формирование косвенных ответов; 3) обработки вводимых пользователем фактов, т.е. создание и ведение ИО.

Существующие до настоящего времени системы были ориентированы, как правило, на выполнение только первой задачи и ограничивались “конкретными” предложениями о предметной области. Причем эти модели базировались только на лингвистических данных и знании о предметной области. Опыт показал, что для решения первой задачи требуется дополнительное привлечение семантики и психолингвистики. Другими словами, необходима рассматривать не только язык и процесс его понимания, но и учитывать возможности и знания участников общения (пользователя и системы).

Для решения второй задачи, традиционно игнорируемой лингвистикой, требуется учет концепций “сознания” и “самосознания”. В настоящее время только психология оперирует с подобными категориями, но ее не достаточно конкретные результаты могут служить только отправной точкой при моделировании процесса получения косвенного ответа. Для решения третьей задачи необходимо смоделировать процесс непротиворечивого расширения и модификации знаний системы общения (абстрактных, конкретных и метазнаний) в ходе диалога на естественном языке. Наиболее тесно данная задача соприкасается с известной проблемой обучения и теорией вывода (дедуктивного и индуктивного).

Необходимо отметить, что, хотя каждая из трех перечисленных выше задач систем общения базируется на весьма солидном фундаменте, включающем результаты лингвистики (психолингвистики) психологии, семантики, теории обучения и теории вывода, степень развития этих дисциплин (за исключением лингвистики) весьма далека от требований практического использования в системах общения. В первую очередь именно это, а не сложность естественного языка (несомненно признаваемая нами) препятствует созданию систем общения, пригодных для взаимодействия КП с БД на ОЕЯ.

На западе наиболее активно в области общения с ЭВМ на ОЕЯ участвуют следующие коллективы: Microsoft продукт English Query; MIT; Университет Южной Каролины; Data Research Group; GTE Laboratories и др.

Однако все эти коллективы за исключением в каком то смысле Microsoft исповедуют либо традиционный подход, либо подход на основе моделей участников общения и как следствие не могут выполнить следующих условий:

- обеспечить высокий процент понимания системой фраз КП;

- обеспечить минимальные затраты на сопровождение ИО;

- для сопровождения ИО не требовать от КП специальных лингвистических знаний;

- процесс освоения (обучения) технологии и методов начинающими КП не должен превышать одной недели.

Только при соблюдении перечисленных выше условий системы обучения будут удобны в использовании и не будут требовать чрезмерных затрат на их сопровождение.

Предлагаемый подход базируется на следующих положениях:

1) Существующие ранее подходы, основывались на посылке, что система должна понимать высказывания пользователя и путем объяснения причин неудач и обучения увеличивать свои возможности. Однако эти подходы оказались непригодны.

2) Необходимо принципиально изменить постановку задачи, а именно обучать не систему, а КП. Дело в том, что хоть КП может быть плохо знаком с лингвистикой, психологией, моделями общения и т.п., но он обладает несоизмеримо более высокими способностями по общим знаниям об окружающем мире, по пониманию и приобретению новых знаний и что очень важно обладает здравым смыслом.

Итак, цель проекта разработать и исследовать технологию и методы, которые позволят с минимальными знаниями о лингвистике и т.п. обучать КП в ходе диалога возможностям, знаниям и ограничениям системы.

Общий план работ:

1. Разработка общей схемы процесса общения КП с реляционными БД.

2. Визуализация структуры реляционной БД на различных уровнях детализации.

3. Визуализация для КП возможностей системы общения.

4. Разработка методов “понимания” запроса КП:

- разбиение запроса на именные группы и предъявление результата КП;

- корректировка (при необходимости) предложенного разбиения КП.

5. Отображение (интерпретация) именных групп запроса на репозиторий (мета модель мира системы) БД и при необходимости корректировка КП запроса;

6. Отображение именных групп запроса на библиотеку SQL процедур обработки, известных системе общения (при необходимости корректировка запроса).

7. Поиск в БД и выдача результата КП (при необходимости корректировка запроса).

Литература

1. Попов Э.В. Общение с ЭВМ на естественном языке. - М.: Наука. Главная редакция физико-математической литературы, 1982.-360 с

2. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных. - М.: Радио и связь, 1988, - 288 с.

3. Попов Э.В., Преображенский А.Б. Особенности реализации ЕЯ систем. Искусственный интеллект. кн. 1 Системы общения и экспертные системы: Справочник/Под ред. Э.В. Попова. - М.: Радио и связь. 1990 г. -с. 9-32.

4. Попов Э.В. Принципы построения систем общения пользователей с базой данных. В сб. Лингвистические процессоры и представление знаний. с. 66 -78. Новосибирск.1981.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.