Анализ и исследование методов анализа сообщений пользователя с целью выявления противоречащих фактов

Анализ текстов для выявления информации, необходимой пользователю, в частности для построения онтологической модели фактов и выявления в построенной модели противоречий. Эффективность реализованных алгоритмов системы анализа сообщений пользователя.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 11.03.2019
Размер файла 14,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

АНАЛИЗ И ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗА СООБЩЕНИЙ ПОЛЬЗОВАТЕЛЯ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ ПРОТИВОРЕЧАЩИХ ФАКТОВ

Нестерова Н.А., Научный руководитель Макушкина Л.А.

Волжский политехнический институт (филиал) ФГБОУ ВПО "Волгоградский государственный технический университет" Волжский, Россия

Аннотация

В данной работе рассматриваются существующие анализа текстов для выявления информации, необходимой пользователю, в частности для построения онтологической модели фактов и выявления в построенной модели противоречий

Ключевые слова: методы анализа сообщений, выявление противоречащих фактов

Достаточно объемная часть информационных ресурсов общества уровня развития, располагающихся в компьютерных сетях, представлена в виде текстов на естественно-языке (ЕЯ-текстами). Так как на сегодняшний момент можно наблюдать стремительный рост объемов информации данного типа все большую актуальность получают задачи автоматической обработки текстов (АОТ) на естественном языке, которые затрагивают обширный перечень практических приложений, которые представлены задачами получения знаний из текстов (Text Mining), задачами выполнения автоматической классификации и кластеризации текстовых документов, автоматического индексирования и реферирования, задачами семантического поиска, а также множеством задач подобного типа.

Целью данной работы является: повышение эффективности выявления противоречий в текстовых документах за счет анализа сообщений пользователя и построения семантической сети.

Чтобы достигнуть поставленную цель были решены следующие исследовательские задачи:

- Проведен анализ и исследование методов анализа сообщений пользователя с целью выявления противоречащих фактов.

- Составлено математическое описание системы анализа сообщений пользователя с целью выявления противоречащих фактов.

- Выполнена программную реализацию системы анализа сообщений пользователя с целью выявления противоречащих фактов.

- Проверена эффективность реализованных алгоритмов системы анализа сообщений пользователя с целью выявления противоречащих фактов.

Исследование методов анализа сообщений пользователя с целью выявления противоречащих фактов

В начале исследования были проанализированы следующие методы анализа текста: Интент-анализ, Контент-анализ, Фоносемантический анализ, Дискурс-анализ, Нарративный анализ, Экспертная оценка текста, Графематический анализ, Морфологический анализ, Синтаксический анализ и Семантический анализ.

Каждый из рассмотренных методов обладает своими достоинствами и недостатками и может использоваться для выполнения анализа текста для различных целей.

Важным моментом, объединяющим все рассмотренные методики анализа текста, является тот факт, что в их основе находится представление о единице анализа. Но вне зависимости от типа методики анализа текста ко всем единицам анализа предъявляются два ключевых требования, которые обычно достаточно трудно совместить на практике: единицы контентанализа должны быть однозначно опознаны в тексте и одновременно с этим должны быть значимы для последующей интерпретации.

Был выбран семантический анализ текста, т.к. данный метод, направлен на создание семантической структуры каждого предложения, которая состоит из семантических узлов и семантических отношений. Основой для формулирования гипотез о составе семантических узлов является информация, которая получена в результате выполнения синтаксического анализа текста. Результаты анализа обычно представлен в виде семантического графа, которой строится из ряда этапов (выполнение инициализации семантических узлов и синтаксических вариантов фрагментов текста, выполнение построения множества словарных интерпретаций узлов, выполнение построения групп времени, выполнение построения узлов в кавычках и т. д.).

Также был выполнен анализ встречающихся типов противоречий. Первый тип противоречий - противоречия в понятиях, т.е. в сообщении присутствуем само понятие и его отрицание в явной или неявной форме. Второй тип противоречий - противоречия в предикатах, т.е. формулировка названий функций, выполняемых каким-либо субъектом или объектом противоречит имеющимся законам (физическим или гражданским). В результате анализа типов противоречий было выявлена необходимость задания четких правил классификации и выявления противоречий для корректного функционирования системы.

По выбранной тематике были проанализированы виды семантического анализа, анализ их применения в системах работы с текстом, также был выполнен анализ типов противоречий, которые могут быть обнаружены в тексте.

информация пользователь алгоритм

Библиографический список

1) Андреев А.М., Березкин Д.В., Симаков К.В. Особенности проектирования модели и онтологии предметной области для поиска противоречий в правовых электронных библиотеках

2) Рыбанов А.А. Метод адаптивного тестового контроля знаний на основе поиска по деформируемому симплексу// ОТКРЫТОЕ ОБРАЗОВАНИЕ Издательство: Российский экономический университет имени Г.В. Плеханова (Москва) Номер: 3 Год: 2008 Страницы: 31-36.

Размещено на Allbest.ru


Подобные документы

  • Анализ методов и средств выявления мнений пользователей социальных сетей. Обзор средств мониторинга и анализа, подбор необходимого программного обеспечения и технических средств. Разработка архитектуры базы данных, реализация программных модулей.

    дипломная работа [3,7 M], добавлен 19.01.2017

  • Структура программного комплекса и UML–представление программного обеспечения. Анализ статических нагрузок на пользователя при работе за компьютером. Руководство пользователя, программиста и системного администратора. Ошибки фискальных регистраторов.

    дипломная работа [3,4 M], добавлен 02.09.2013

  • Теория функционирования генных сетей. Разработка алгоритма анализа динамики генной сети с целью выявления всех её стационарных и циклических устойчивых состояний в рамках булевой модели генной сети. Создание программного средства, его реализующего.

    курсовая работа [1,4 M], добавлен 28.02.2012

  • Анализ существующих методов и средств выявления требований. Стадии разработки программного обеспечения. Структуризация требований в базе знаний на основе расширенной классификации. Наблюдение за бизнесом заказчика. Моделирование бизнес-процессов компании.

    диссертация [2,1 M], добавлен 21.02.2016

  • Разработка программы тестирования для выявления акцентуаций типа человека в среде Delphi и Microsoft Access. Проектирование алгоритма реализации модели. Описание программы и модулей, руководство пользователя. Меры обеспечения информационной безопасности.

    дипломная работа [2,7 M], добавлен 15.06.2012

  • Разработка концептуальной модели системы обработки информации для узла коммутации сообщений. Построение структурной и функциональной блок-схем системы. Программирование модели на языке GPSS/PC. Анализ экономической эффективности результатов моделирования.

    курсовая работа [802,8 K], добавлен 04.03.2015

  • Описание проектного решения стратегической системы, этапы объектно-ориентированного анализа и проектирования. Описание связей между объектами. Программная реализация, построение модели состояний объекта. Руководство пользователя и описание программы.

    курсовая работа [388,8 K], добавлен 17.11.2011

  • Выявление сущностей, связей, модели работы магазина и ее предпосылок. Построение модели базы данных, ее внутренняя структура и требования к функциональности. Разработка запросов, осуществляющих поиск и вывод необходимой информации для пользователя.

    отчет по практике [425,9 K], добавлен 11.12.2015

  • Количество информации и ее мера. Определение количества информации, содержащегося в сообщении из ансамбля сообщений источника. Свойства количества информации и энтропии сообщений. Избыточность, информационная характеристика источника дискретных сообщений.

    реферат [41,4 K], добавлен 08.08.2009

  • Современные методы защиты информации средствами стеганографии. Анализ канала передачи сообщений, подходы к реализации стеганографического приложения. Алгоритмы методов последнего бита и передачи сообщений через стегоканал; ограничения его использования.

    курсовая работа [105,7 K], добавлен 05.11.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.