Разработка средств автоматизации расширения онтологии на основе данных интернет-источников
Анализ существующих алгоритмов расширения онтологии. Обоснование необходимости пополнения существующей онтологии, анализ основных методов пополнения онтологии: вручную, интеграция двух существующих онтологий и автоматическое пополнение онтологии.
| Рубрика | Экономико-математическое моделирование |
| Вид | дипломная работа |
| Язык | русский |
| Дата добавления | 28.10.2019 |
| Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Было проведено проектирование данного алгоритма для последующей реализации его в разрабатываемой системе. Наглядное представление работы алгоритма описано диаграммой нотации «Процесс». Для реализации данного алгоритма в разрабатываемой системе была подробно описана структура посредством псевдокода.
Для анализа текста был рассмотрен текущий источник данных для поиска информации по пользовательскому запросу. Выяснилось, что новостной раздел Google изменился и в настоящий момент предоставляет короткую аннотацию статьи, что не позволяет провести подробный анализ текста. В результате анализа источников данных было решено изменить используемый новостной источник и вести работу с сайтом РБК.
Учитывая особенности разрабатываемой системы, отдельно были рассмотрены возможности интегрирования спроектированного алгоритма в разрабатываемую систему.
Были изучены инструменты, позволяющие реализовать алгоритм автоматического пополнения онтологии. В данной работе используются язык программирования JavaScript и WebStorm IDE, поскольку разработка системы мониторинга глобальных процессов прошлого года велась с использованием данных инструментов. Для парсинга данных также используется библиотека NightMare, для SPARQL-запросов - библиотека SPARQL.js. Отдельно была внедрена библиотека для поиска ключевых слов в текстах - retext-keywords. Был разработан алгоритм поиска часто встречаемых ключевых слов в онтологии и проверка наличия данных слов в онтологии.
Разработка алгоритма автоматического пополнения онтологии позволит поддерживать используемую онтологию в актуальном состоянии, благодаря чему система предоставляет пользователю более подробную информацию о процессе.
Библиографический список
Вохминцева Т.В. Именование: нравственно-ценностные аспекты / Т.В. Вохнинцева, А.Е. Зимбули // Общество. Среда. Развитие (Terra Humana). 2014. № 33 (4). C. 135-138.
Ланин В.В. Мониторинг глобальных процессов на основе данных из интернет-новостей / В.В. Ланин, И.М. Шаляева, А.Ю. Скурихина. Пермь: Издательство Пермского государственного национального исследовательского университета, 2017. С. 67-70.
Липкин Ю.Г. Обзор современных поисковых систем: архитектура, инструменты поиска /Ю.Г. Липкин // Врач и информационные технологии. 2009. C. 40-44.
Шаляева И.М. Мониторинг экологических катастроф и их последствий на основе Internet-новостей / И.М. Шаляева. Таганрог: Издательство ЮФУ, 2016. С. 116-123.
Шаляева И.М. О проекте разработки системы мониторинга глобальных процессов на основе Интернет-новостей / И.М. Шаляева, В.В. Ланин, Л.Н. Лядова. Таганрог: Издательство ЮФУ, 2016. С. 166-170.
Hong J.L. Deep web data extraction / J.L. Hong // Systems Man and Cybernetics (SMC). 2010.
Shalyaeva I. Ontology-Driven System for Monitoring Global Processes on Basis of Internet News / I. Shalyaeva, V. Lanin, L. Lyadova // 11th IEEE International Conference on Application of Information and Communication Technologies (AICT), 2017. С. 385-389.
Simon-Nagy G. Ontology Extension for Personalized Accessible Indoor Navigation / G. Simon-Nagy, R. Fleiner // Springer International Publishing, 2018. С. 281-288.
StackOverflow Developer Survey Results [Электронный ресурс]. URL: https://insights.stackoverflow.com/survey/2018 (дата обращения: 03.03.2019).
Lanin V. Intelligent search and automatic document classification and cataloging based on ontology approach / V. Lanin, L. Lyadova // Information Theories & Applications. 2007. (14). C. 25-29.
Zhang D. Ontology Extension Based on Axiomatic Cognitive Model for Ontology Learning / D. Zhang // IEEE International Conference on Computer and Communications. 2016. С. 825-829.
Zhou Y. The Research of Concept Extraction in Ontology Extension Based on Extended Association Rules / Y. Zhou, L. Zhang, and S. Niu // Proceedings of ICOACS. 2016. С. 111-114.
РБК [Электронный ресурс]. URL: https://www.rbc.ru/ (дата обращения: 12.03.2019).
Техноблог [Электронный ресурс]. URL: https://teknoblog.ru/ (дата обращения: 12.03.2019).
Forbes [Электронный ресурс]. URL: https://www.forbes.ru/ (дата обращения: 12.03.2019).
Nighmare [Электронный ресурс]. URL: https://github.com/segmentio/nightmare (дата обращения: 11.03.2018).
Node.js [Электронный ресурс]. URL: https://nodejs.org/en/ (дата обращения: 10.03.2018).
Node-rake [Электронный ресурс]. URL: https://github.com/waseem18/node-rake/ (дата обращения: 25.03.2019).
NPM [Электронный ресурс]. URL: https://www.npmjs.com/ (дата обращения: 10.03.2018).
RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 10.02.2018).
REGNUM [Электронный ресурс]. URL: https://regnum.ru/ (дата обращения: 12.03.2019).
Retext-keywords [Электронный ресурс]. URL: https://github.com/retextjs/retext-keywords (дата обращения: 25.03.2019).
SPARQL.js [Электронный ресурс]. URL: https://github.com/RubenVerborgh/SPARQL.js/ (дата обращения: 11.03.2018).
Visual Studio [Электронный ресурс]. URL: https://www.visualstudio.com/ (дата обращения: 05.03.2018).
WebStorm [Электронный ресурс]. URL: https://www.jetbrains.com/webstorm/ (дата обращения: 05.03.2018).
World Wide Web Consortium (W3C) [Электронный ресурс]. URL: https://www.w3.org/ (дата обращения: 12.03.2019).
Размещено на Allbest.ru
Подобные документы
Обоснование решений в конфликтных ситуациях. Теория игр и статистических решений. Оценка эффективности проекта по критерию ожидаемой среднегодовой прибыли. Определение результирующего ранжирования критериев оценки вариантов приобретения автомобиля.
контрольная работа [99,9 K], добавлен 21.03.2014Разработка и исследование эконометрических методов с учетом специфики экономических данных и в соответствии с потребностями экономической науки и практики. Применение эконометрических методов и моделей для статистического анализа экономических данных.
реферат [43,1 K], добавлен 10.01.2009Подходы к оценке стоимости финансовых активов в рамках линейной и нелинейной парадигмы. Анализ фрактальных свойств американского фондового рынка. Разработка методики расчета параметров модели Веге-Изинга, построенной на основе гипотезы когерентных рынков.
дипломная работа [2,3 M], добавлен 13.12.2010Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.
курсовая работа [363,2 K], добавлен 23.02.2015Изучение существующих исследований по постановке загадки премии по акциям и способам ее решения. Расчет коэффициента неприятия риска и сравнение его значения для США и России. Построение модели с учетом привычки агента и применение к ней метода GMM.
дипломная работа [1,3 M], добавлен 08.02.2017Графический и содержательный анализ данных об объеме рынка бытовой техники на основе методов прогнозирования: сравнение прогнозных и реальных значений, оценка адекватности и точности модели. Построение прогноза на год и расчет прогнозируемого дохода.
курсовая работа [245,2 K], добавлен 29.04.2011Показатели наличия и структуры основных средств, виды их оценки. Показатели состояния и динамики основных производственных фондов. Показатели использования основных средств. Статистический анализ динамики использования основных средств. Индекс Струмилина.
курсовая работа [88,1 K], добавлен 25.02.2013Анализ рентабельности активов как отношения чистой прибыли к среднему значению совокупных активов. Вертикальный анализ актива бухгалтерского баланса ПАО "ВЕРОФАРМ". Тестирование существующих моделей ROA на выборке российских фармацевтических компаний.
дипломная работа [728,1 K], добавлен 09.09.2016Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.
лабораторная работа [258,1 K], добавлен 13.05.2010Исследование детерминированной модели управления запасами без дефицита. Примеры ее реализации. Поиск пополнения и расхода запасов, при которой функция затрат принимает минимальное значение. Информационные технологии для моделирования экономической задачи.
курсовая работа [2,0 M], добавлен 01.06.2010


