Разработка технологии и методов общения конечных пользователей с реляционными БД на ограниченном естественном языке
Описание опыта эксплуатации систем, построенных на основе традиционного подхода к построению методов общения конечных пользователей (то есть специалистов в конкретной области знаний) с компьютером на ограниченном естественном языке и с базами данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.01.2018 |
Размер файла | 18,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Разработка технологии и методов общения конечных пользователей с реляционными БД на ограниченном естественном языке
Эдуард В. Попов
Российский научно-исследовательский институт информационных технологий и систем автоматизированного проектирования
The traditional approaches to construction of systems of dialogue of the end users with large data bases on the limited natural language are considered. Is shown, that these approaches do not allow to decide a problem of dialogue, as percent of the requests, not understood by a system, reaches up to 80. As alternative the traditional approach the approach based on a dynamic model of the participants of dialogue is considered. Is shown, that the given approach used by the people in dialogue among themselves, can not be realized for want of dialogue of the end users with large data bases, as the existing knowledges of semantics, theory of tutoring and purchase of knowledges are rather far from requests of practical use in systems of dialogue. The new approach is described, which essence is reduced that during dialogue for removal of failures it is offered to train not a system, and user, not requiring from him of detail knowledges of linguistics.
В настоящее время проблема непосредственного общения (т.е. без посредников-программистов) конечных пользователей (КП), т.е. специалистов в конкретной области знаний (как правило, детально не знающих программирования) с компьютером на ограниченном естественном языке (ОЕЯ) является чрезвычайно актуальной, так как накоплены огромные объемы знаний в базах данных (БД) и в Internet.
Традиционные подходы к построению методов и систем общения конечных пользователей с БД сводятся к следующей постановке: а) на входе в систему поступает правильный (т.е. понимаемый системой) конкретное запрос, а не связный текст на ОЕЯ; б) на выходе прямой (не косвенный) ответ на ОЕЯ. Кроме этих ограничений на ОЕЯ (изолированное предложение, а не текст; конкретный запрос, а не абстрактный; прямой ответ, а не косвенный) обычно накладываются и другие как явные ограничения (отсутствие причастных и деепричастных оборотов, отсутствие придаточных предложений и др.), так и не явные, т.е. те, которые объяснить конечному пользователю, не знающему лингвистики, знаний и возможностей системы, не возможно. Однако если эти ограничения не выполняются, то система либо не дает ответа, либо (что хуже) отвечает не совсем о том, о чем спрашивает КП, и таким образом вводит его в заблуждение, чреватое серьезными негативными последствиями.
Опыт эксплуатации систем, построенных на основе традиционного подхода, показал, что в ходе общения с базами данных возникают следующие принципиальные трудности. Во-первых, оказалось, что пользователь не может при общении с системой употреблять только правильные входные предложения (число неправильных предложений при общении с большой БД доходит до 80% от общего числа предложений). Во-вторых, в общем случае пользователь не может выразить свой запрос в виде изолированных входных предложений. Во многих случаях требуется диалог, в результате которого конкретизируется потребность пользователя в рамках знаний и возможностей системы. В-третьих, оказалось, что информационное обеспечение (И0), необходимое для правильного функционирования системы, не может быть зафиксировано на стадии проектирования системы, а должно непрерывно модифицироваться и расширяться в процессе эксплуатации системы. Указанное обстоятельство приводит (в связи с большой трудоемкостью создания непротиворечивого ИО) к необходимости обеспечить автоматизированное централизованное динамическое создание и ведение основного ИО (запрашиваемых пользователем фактов и документов) и вспомогательного ИО (служебной информации, необходимой для правильного функционирования системы общения), что чрезвычайно дорого.
Неудачный опыт использования традиционного подхода привел к подходу, основанному на динамической модели участников общения (КП и системы). Этот подход к построению систем общения теоретически свободен от перечисленных выше недостатков традиционного подхода и в принципе позволяет решить проблему общения пользователей с БД на ОЕЯ. В реальных диалогах между людьми и, тем более, между человеком и ЭВМ неизбежны “неправильные” предложения, т.е. такие высказывания одного из участников, которые другой участник “не понимает”. Причины, приводящие к неправильности фраз при взаимодействии человека с ЭВМ, сводятся в основном к ограниченным возможностям как пользователя, так и системы и на практике не могут быть устранены без диалога. Для достижения взаимопонимания между участниками инициатива в процессе общения (в общем случае) должна переходить от одного участника к другому. Утверждения участника А, имеющего инициативу, выражают не только то, что он хочет сказать, но и его ожидание, касающееся формы ответа участника В. Если ожидания, владеющего инициативой участника А, точно совпадают с тем, что сообщает В (такой ответ называют “прямым” ответом), то инициатива будет всегда оставаться у А. Такая схема диалога возможна только при полной осведомленности А о знаниях, намерениях и желаниях В. Отметим, что данный случай с точки зрения окружающих, подобен общению, при котором участник А обладает телепатией. Если ожидания участника А, выраженные в вопросе, не совпадают (или не точно совпадают) с реакцией В, то такой ответ часто называют “косвенным” или приблизительным ответом. Система, осуществляющая общение с человеком, должна уметь понимать косвенные ответы человека и сама давать такие ответы. Можно сказать, что косвенный ответ является необходимой формой общения в следующих случаях: 1) если прямой ответ на начальный вопрос является бесполезным или неинформативным; 2) при необходимости проинформировать пользователя о структуре и содержании знаний системы; 3) при неудачной попытке системы общения обработать входное предложение. пользователь база компьютер
До недавнего времени при разработках систем предполагалось, что пользователь имеет детальные знания о системе общения (и, естественно, о себе) и это помогает ему понять любые ситуации (в том числе и непредвиденные), возникающие при обработке входного текста. Таким образом, вся ответственность за успешный результат диалога возлагалась только на одного участника общения - на пользователя. Однако, если пользователь не обладает достаточными знаниями о системе, что неизбежно имеет место при большом количестве хранимых системой фактов, то для успешного диалога необходима смешанная инициатива, т.е. инициатива, переходящая от одного участника к другому. Для того чтобы система могла позволить пользователю перехватывать инициативу, она должна иметь динамическую модель себя (модель, изменяющую свои состояния в процессе функционирования системы) как участника общения, обладающую “сознанием” и “самосознанием”. “Сознание” и “самосознание” необходимо для того, чтобы обеспечить взаимопонимание участников путем сообщения одним участником диалога (ЭВМ) в терминах, понятных другому (пользователю) своих затруднений и их причин. Следует подчеркнуть, что указанное требование является следствием не сложности естественного языка, а следствием сложности предметной области, обсуждаемой в процессе общения, и различиями в знаниях участников общения.
Учитывая указанные выше особенности процесса общения, необходимо при разработке систем, осуществляющих взаимодействие пользователей с базами данных на ОЕЯ, использовать следующий подход:
ДАНО: Связный текст на ОЕЯ, состоящий из “правильных” и “неправильных” предложений о предметной области (вопросительных и повествовательных).
ЦЕЛЬ: Разработать систему общения, которая адекватно реагирует на обращение пользователя путем: 1) обработки правильных запросов (по всем видам знаний) в контексте диалога, т.е. их понимание и формирование прямого ответа; 2) обработки неправильных высказываний (вопросительных или повествовательных), т.е. их понимание и формирование косвенных ответов; 3) обработки вводимых пользователем фактов, т.е. создание и ведение ИО.
Существующие до настоящего времени системы были ориентированы, как правило, на выполнение только первой задачи и ограничивались “конкретными” предложениями о предметной области. Причем эти модели базировались только на лингвистических данных и знании о предметной области. Опыт показал, что для решения первой задачи требуется дополнительное привлечение семантики и психолингвистики. Другими словами, необходима рассматривать не только язык и процесс его понимания, но и учитывать возможности и знания участников общения (пользователя и системы).
Для решения второй задачи, традиционно игнорируемой лингвистикой, требуется учет концепций “сознания” и “самосознания”. В настоящее время только психология оперирует с подобными категориями, но ее не достаточно конкретные результаты могут служить только отправной точкой при моделировании процесса получения косвенного ответа. Для решения третьей задачи необходимо смоделировать процесс непротиворечивого расширения и модификации знаний системы общения (абстрактных, конкретных и метазнаний) в ходе диалога на естественном языке. Наиболее тесно данная задача соприкасается с известной проблемой обучения и теорией вывода (дедуктивного и индуктивного).
Необходимо отметить, что, хотя каждая из трех перечисленных выше задач систем общения базируется на весьма солидном фундаменте, включающем результаты лингвистики (психолингвистики) психологии, семантики, теории обучения и теории вывода, степень развития этих дисциплин (за исключением лингвистики) весьма далека от требований практического использования в системах общения. В первую очередь именно это, а не сложность естественного языка (несомненно признаваемая нами) препятствует созданию систем общения, пригодных для взаимодействия КП с БД на ОЕЯ.
На западе наиболее активно в области общения с ЭВМ на ОЕЯ участвуют следующие коллективы: Microsoft продукт English Query; MIT; Университет Южной Каролины; Data Research Group; GTE Laboratories и др.
Однако все эти коллективы за исключением в каком то смысле Microsoft исповедуют либо традиционный подход, либо подход на основе моделей участников общения и как следствие не могут выполнить следующих условий:
- обеспечить высокий процент понимания системой фраз КП;
- обеспечить минимальные затраты на сопровождение ИО;
- для сопровождения ИО не требовать от КП специальных лингвистических знаний;
- процесс освоения (обучения) технологии и методов начинающими КП не должен превышать одной недели.
Только при соблюдении перечисленных выше условий системы обучения будут удобны в использовании и не будут требовать чрезмерных затрат на их сопровождение.
Предлагаемый подход базируется на следующих положениях:
1) Существующие ранее подходы, основывались на посылке, что система должна понимать высказывания пользователя и путем объяснения причин неудач и обучения увеличивать свои возможности. Однако эти подходы оказались непригодны.
2) Необходимо принципиально изменить постановку задачи, а именно обучать не систему, а КП. Дело в том, что хоть КП может быть плохо знаком с лингвистикой, психологией, моделями общения и т.п., но он обладает несоизмеримо более высокими способностями по общим знаниям об окружающем мире, по пониманию и приобретению новых знаний и что очень важно обладает здравым смыслом.
Итак, цель проекта разработать и исследовать технологию и методы, которые позволят с минимальными знаниями о лингвистике и т.п. обучать КП в ходе диалога возможностям, знаниям и ограничениям системы.
Общий план работ:
1. Разработка общей схемы процесса общения КП с реляционными БД.
2. Визуализация структуры реляционной БД на различных уровнях детализации.
3. Визуализация для КП возможностей системы общения.
4. Разработка методов “понимания” запроса КП:
- разбиение запроса на именные группы и предъявление результата КП;
- корректировка (при необходимости) предложенного разбиения КП.
5. Отображение (интерпретация) именных групп запроса на репозиторий (мета модель мира системы) БД и при необходимости корректировка КП запроса;
6. Отображение именных групп запроса на библиотеку SQL процедур обработки, известных системе общения (при необходимости корректировка запроса).
7. Поиск в БД и выдача результата КП (при необходимости корректировка запроса).
Литература
1. Попов Э.В. Общение с ЭВМ на естественном языке. - М.: Наука. Главная редакция физико-математической литературы, 1982.-360 с
2. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных. - М.: Радио и связь, 1988, - 288 с.
3. Попов Э.В., Преображенский А.Б. Особенности реализации ЕЯ систем. Искусственный интеллект. кн. 1 Системы общения и экспертные системы: Справочник/Под ред. Э.В. Попова. - М.: Радио и связь. 1990 г. -с. 9-32.
4. Попов Э.В. Принципы построения систем общения пользователей с базой данных. В сб. Лингвистические процессоры и представление знаний. с. 66 -78. Новосибирск.1981.
Размещено на Allbest.ru
Подобные документы
Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.
аттестационная работа [4,7 M], добавлен 14.06.2010Разработка предложений по внедрению биометрической аутентификации пользователей линейной вычислительной сети. Сущность и характеристика статических и динамических методов аутентификации пользователей. Методы устранения угроз, параметры службы защиты.
курсовая работа [347,3 K], добавлен 25.04.2014Описание бизнес-процессов предметной области на естественном языке. Объектно-ориентированная модель бизнес-процессов на языке UML. Диаграмма прецедентов (регистрация пациента, запись на прием). Спецификация требований к программному обеспечению.
курсовая работа [787,4 K], добавлен 19.01.2015Проектирование программного обеспечения, позволяющего создавать и вести множество электронных словарей. Обоснование выбора программных средств решения задачи. Разработка формы входных и выходных данных. Описание модулей программы и процесса отладки.
дипломная работа [1007,7 K], добавлен 03.07.2015Игровая программа "шашки" для игры между человеком и компьютером. Разработка алгоритмов, историческая линия развития задач. Различные подходы к построению систем. Сокращенный листинг программы и описание алгоритма. Компоненты искусственного интеллекта.
курсовая работа [196,2 K], добавлен 26.03.2009Развитие русскоязычного Интернета: гендерные и возрастные аспекты. Социально-психологические аспекты общения пользователей Интернет. Причины обращения к Интернету. Критерии Интернет-зависимости. Мотивация пользователей Интернет.
научная работа [21,8 K], добавлен 14.05.2007Создание программы для выполнения простейших математических функций с применением языка программирования ObjectPascal. Проектирование графического интерфейса Калькулятора двоичных и шестнадцатеричных систем. Описание алгоритма на естественном языке.
курсовая работа [115,4 K], добавлен 19.05.2014Основные численные методы моделирования. Понятие метода конечных элементов. Описание основных типов конечных элементов и построение сетки. Реализация модели конструкции в пакете ANSYS, на языке программирования C#. Реализация интерфейса пользователя.
курсовая работа [2,3 M], добавлен 22.01.2016Анализ методов и средств выявления мнений пользователей социальных сетей. Обзор средств мониторинга и анализа, подбор необходимого программного обеспечения и технических средств. Разработка архитектуры базы данных, реализация программных модулей.
дипломная работа [3,7 M], добавлен 19.01.2017Анализ существующего подхода к построению трехмерного изображения данных из симметричных матричных форм. Технические характеристики ПЭВМ, требования к документации. Функции, автоматизирующие процесс взаимодействия пользователей с графической информацией.
дипломная работа [192,8 K], добавлен 05.06.2011