Автоматическая информационная система "Библиотека НД"

Изучение автоматизированной информационной системы классификации и поиска документации в крупной библиотеке со свободным доступом с использованием личного кабинета. Расчет необходимого объема внешней памяти, требования к программному обеспечению.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 08.10.2018
Размер файла 3,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки РФ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ»

Кафедра прикладной математики и вычислительной техники

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к выпускной квалификационной работе бакалавра на тему:

Автоматическая информационная система «Библиотека НД»

Осипов Антон

САМАРА-2015

РЕФЕРАТ

Выпускная квалификационная работа.

Пояснительная записка: 64 с., 23 рис., 11 табл., 15 источников, 4 приложения.

АВТОМАТИЗИРОВАННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА, НОРМАТИВНАЯ ДОКУМЕНТАЦИЯ, ГОСТ, УДК, ББК, КЛАССИФИКАТОРЫ, ТЕЗАУРУС.

Объектом проектирования является автоматизированная информационная система классификации и поиска нормативной документации в крупной библиотеке со свободным доступом с использованием личного кабинета.

Разработана модель анализа системы по методологии UML, а такж информационное и программное обеспечение системы. Предложены эффективные методы решения некоторых проблем, характерных для автоматизированных библиотечных систем нормативной документации, в области информационных технологий.

Система реализована средствами CMS WordPress с поддержкой языка программирования PHP.

Внедрение системы производится в научно-технической библиотеке СГАСУ.

  • CОДЕРЖАНИЕ
  • ВВЕДЕНИЕ
  • 1. СИСТЕМОТЕХНИЧЕСКАЯ ЧАСТЬ
  • 1.1 Описание предметной области
  • 1.2 Обзор аналогов
  • 1.3 Алгоритм нечеткого поиска
  • 1.4 Схема наиболее сложного алгоритма
  • 1.5 Модель анализа UML
  • 1.5.1 Диаграмма вариантов использования
  • 1.5.2 Сценарии вариантов использования
  • 1.5.3 Диаграмма граничных классов
  • 1.5.4 Диаграмма сущностных классов
  • 1.5.5 Логическая структура базы данных
  • 2. РЕАЛИЗАЦИЯ ПРОЕКТА СИСТЕМЫ
  • 2.1 Архитектура и платформа реализации
  • 2.2 Физическая структура БД
  • 2.3 Расчет комплекса технических свойств (КТС)
  • 2.3.1 Расчет необходимого объема внешней памяти
  • 2.3.2 Расчет необходимого объема оперативной памяти
  • 2.3.3 Расчет времени реакции системы
  • 2.3.4 Требования к программному обеспечению
  • 2.4 Основные интерфейсы
  • 2.5 Описание программной реализации
  • 2.6 Программа и методика испытаний
  • 2.6.1 Проверка возможности входа в систему
  • 2.6.2 Проверка возможности авторизации в АИС
  • 2.6.3 Возможность просмотра справочника пользователей
  • 2.6.4 Возможность просмотра редактирования справочника классификатора
  • 2.6.5 Возможность редактирования каталога НД
  • 2.6.6 Возможность просмотра каталога НД
  • 2.6.7 Возможность просмотра архива запросов
  • 2.6.8 Возможность работы с тезаурусом
  • 2.7 Контрольный пример
  • 2.7.1 Задача: Вход в систему
  • 2.7.2 Задача: Пройти авторизацию
  • 2.7.3 Задача: Создание личного классификатора
  • 2.8 Руководство пользователя
  • 3. ВНЕДРЕНИЕ И АНАЛИЗ ЭФФЕКТИВНОСТИ
  • 3.1 Описание объекта внедрения
  • 3.2 Описания хода внедрения
  • 3.3 Описание результатов внедрения
  • 3.4 Бизнес-план
  • 3.4.1 Технико-экономическое обоснование внедрения информационной системы сравнительной оценки многокритериальных альтернатив на основе метода уверенных суждений
  • 3.4.2 Расчёт экономического внедрения информационной системы сравнительной оценки многокритериальных альтернатив на основе метода уверенных суждений
  • 3.5 Анализ и выводы
  • 4. ОРГАНИЗАЦИОННАЯ ДЕЯТЕЛЬНОСТЬ И САМОРАЗВИТИЕ
  • 4.1 Сведения о деятельности возглавляемого научного микроколлектива
  • 4.2 Сведения о трудовой деятельности
  • 4.3 Перечень публикаций
  • 4.4 Перечень участия в конференциях
  • 4.5 Перечень выполненных в период обучения курсовых работ и проектов
  • 4.6 Портфолио
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ А
  • ПРИЛОЖЕНИЕ Б
  • ПРИЛОЖЕНИЕ В
  • ПРИЛОЖЕНИЕ Г

ВВЕДЕНИЕ

Автоматизированная информационная система рассматривается как совокупность персонала и программных и аппаратных средств, предназначенных для хранения и (или) управления данными и информацией, а также для производства вычислений. Внедрение компьютерных и телекоммуникационных технологий в работу библиотек является настоятельным требованием, способствующим повышению производительности и качества труда как библиотечно-информационных работников, так и специалистов любого профиля на основе автоматизированного взаимного использования и интеграции электронных ресурсов. Сегодня количество автоматизированных библиотек в Российской Федерации достигло нескольких тысяч.

Появилось множество автоматизированных информационных систем, а также электронно-библиотечных систем, хранящих десятки тысяч электронных экземпляров книг и документов, и позволяющих путём нескольких нажатий клавиш получать интересующие экземпляры.
Основное преимущество автоматизации для данной отрасли заключается в предоставлении читателю более полной и достоверной информации о состоянии библиотечного фонда, возможности быстрой и эффективной ориентации в довольно больших объемах информации. Основным направлением развития автоматизации всех библиотек является разработка электронного каталога библиографических описаний и перевод библиотечных ресурсов в цифровую форму, переход к электронным библиотекам. Как правило, внедрение любой автоматизированной системы влечет за собой изменение существующих организационных структур и методов управления, требует более четкой регламентации документооборота и процедур управления, упорядочения используемых и создание новых нормативов, совершенствование условий труда.

1. СИСТЕМОТЕХНИЧЕСКАЯ ЧАСТЬ

1.1 Описание предметной области

На территории Российской Федерации действуют следующие документы:

- национальные стандарты;

- правила стандартизации, нормы и рекомендации в области стандартизации;

- классификации, общероссийские классификаторы технико-экономической и социальной информации.

Национальные стандарты утверждает Национальный орган Российской Федерации по стандартизации. Разработчиком национального стандарта может быть любое лицо.

В настоящее время фонд национальных стандартов составляет более 20000 стандартов, из них с международными стандартами гармонизировано около 40%. Со дня вступления в силу Федерального закона «О техническом регулировании» национальными стандартами признаются государственные и межгосударственные стандарты, принятые Госстандартом до 1 июля 2003 г.

Рассмотрим обозначение национального стандарта Российской Федерации. Оно состоит из индекса ГОСТ Р, регистрационного номера и отделенных тире двух последних цифр года утверждения. Например: ГОСТ Р 50314-92. С 2000 г. год утверждения указывается четырьмя цифрами. Например: ГОСТ 7.60-2003.

Государственные стандарты бывшего СССР странами СНГ признаются в качестве межгосударственных и действующих на территории государств-членов СНГ, если они не противоречат национальному законодательству. Обозначение межгосударственного стандарта состоит из индекса ГОСТ, регистрационного номера и отделенных от него тире двух последних цифр года. С 2000 г. межгосударственный стандарт также указывается четырьмя цифрами. В обозначении стандартов как межгосударственных, так и государственных РФ, входящих в комплекс стандартов, первые цифры с точкой в их регистрационном номере определяют комплекс стандартов.

В настоящее время проводится работа по гармонизации межгосударственных и национальных стандартов с международными стандартами. Россия активно сотрудничает с международными организациями по стандартизации - Международной электротехнической комиссией (МЭК), Международной организацией по стандартизации (ИСО), Международным союзом электросвязи (МСЭ) и др., - принимая участие в разработке международных стандартов и в обеспечении их применения в народном хозяйстве страны.

Обозначения межгосударственного и национального стандарта РФ, оформленных на основе аутентичных текстов международного стандарта и не содержащих дополнительных требований, состоят из индекса соответственно ГОСТ и ГОСТ Р и обозначения соответствующего международного стандарта и отделенных от него знаком тире года принятия межгосударственного и утверждения государственного стандарта (до 2000 г. - двух цифр года, после 2000 г. - четырех). Например, ГОСТ Р МЭК 536-94. В случае, когда стандарты оформлены на основе аутентичного текста международного стандарта и содержат дополнительные требования, обозначение примененного международного стандарта приводится в скобках, например:

ГОСТ 7.32-91 (ИСО 5966-82) ГОСТ Р 50314-92 (ИСО 7944-84)

В России ежегодно выпускается «Указатель национальных стандартов». В нем содержатся все действующие по состоянию на 1 января текущего года нормативные документы. Стандарты систематизированы по разделам, группам и подгруппам.

С 2001 г. все действующие нормативные документы систематизированы по кодам межгосударственного классификатора стандартов и общероссийского классификатора стандартов.

В библиотечном фонде НТБ СГАСУ представлена научно-техническая документация. Фонд научно-технической документации содержит свыше 20 тыс. документов. Это стандарты, правила, каталоги, справочные пособия, указатели стандартов, классификаторы, периодические издания по вопросам стандартизации, метрологии, сертификации и др. Библиотека получает следующие периодические издания: «Методы менеджмента качества», «Стандарты и качество»: ежемесячные научно-технические журналы об опыте внедрения стандартов менеджмента качества, о проблемах, возникающих при этом, о путях их преодоления. В журналах публикуются материалы о передовых методах управления предприятиями и организациями. В журнале «Сертификация» освещаются вопросы технического регулирования, в том числе подтверждения соответствия продукции нормативным требованиям, разработки и сертификации систем менеджмента, работ в рамках программы премии Правительства РФ по качеству, защиты отечественного потребительского рынка. Журнал выходит с приложением «Менеджмент: горизонты ИСО», которое посвящено вопросам международной стандартизации систем менеджмента (ИСО 9000, ИСО 14000 и др.) и опыту их применения. «Контрольно-измерительные приборы и системы» - «КИПиС» - научно-технический журнал, освещающий состояние дел в области измерительной техники, технического регулирования и метрологии. На страницах журнала публикуются сведения о внесении новых приборов в Государственный реестр средств измерений, теоретические разработки в области метрологии, рекомендации по ремонту и обслуживанию приборов, информация о конференциях и семинарах, посвященных этой проблематике.

Сотрудники абонемента научной литературы дают консультации и тематические справки студентам о наличии действующих стандартов, необходимых при выполнении лабораторных работ, учебно-исследовательской работы, курсового и дипломного проектирования, а также для научных исследований и написания статей. Фонд научно-технической документации - это систематизируемый массив документов, который корректируется на основании официальных сведений об отмене, замене, изменениях и дополнениях.

Тематика нормативно-технической документации:

- терминология, стандартизация, документация;

- математика, естественные науки;

- охрана окружающей среды, защита человека от воздействия окружающей среды, безопасность;

- метрология, измерения, физические явления;

- испытания;

- машиностроение, в т.ч. системы автоматизации производства и их интеграция;

- энергетика и атомная энергетика;

- информационные технологии;

- строительство и архитектура

Справочно-поисковый аппарат фонда содержит:

- нумерационный каталог - библиотечный каталог, в котором библиографические записи располагаются в порядке номеров нормативных документов;

- тематическую картотеку.

Полнотекстовая база данных ГОСТов, действующих на территории РФ (АИС «Техэксперт» и Гарант) установлены в электронном читальном зале. БД содержит более 20 тыс. полнотекстовых документов. База данных содержит все полные тексты ГОСТов, действующих на территории РФ. Отсканированные нормативные документы хранятся в графическом виде в формате PDF. Данные полные тексты нормативных документов имеют статус электронной копии, на машинных носителях. Поиск ведется по тематике стандарта, по КГС (классификатор государственных стандартов) и ОГС (общероссийский классификатор стандартов). В самих системах коды КГС и ОКС не представлены. Найти их можно на сайте ФГУП «СТАНДАРТИНФОРМ». Предварительно можно провести поиск на сайте по кодам КГС и ОГС и тематике, а затем необходимый ГОСТ скачать из БД ГОСТов в библиотеке.

Мировой опыт управления качеством сконцентрирован в пакете международных стандартов ИСО 9000, принятых Межгосударственной организацией по стандартизации (ИСО) в марте 1987 г., в 2000 г. ИСО приняла новую версию этих стандартов - МС ИСО 9000-2000. На сегодняшний день стандарты ИСО серии 9000 признаны практически всеми странами мира, приняты в качестве национальных и внедрены множеством фирм. В России стандарты ИСО 9000-2000 введены в действие в 2001 г. принятием и опубликованием ГОСТ Р ИСО 9000-2001, ГОСТ Р ИСО 9001-2001 и ГОСТ Р ИСО 9004-2001.

Одним из главных недостатков описанных выше систем является жёсткая привязка их к рабочему месту пользователя, расположенному в организации-работодателе или образовательном учреждении - не всегда это является удобным, особенно для преподавательского состава и студентов вузов. Это не позволяет получать необходимую информацию вне рабочего времени. Необходимо создание личного кабинета пользователя. Благодаря этой возможности пользователь может создавать собственные классификаторы, помимо стандартных, которые обычно используются системой (например, УДК и ББК), по которым классифицируются документы в системе и которые могут совершенно не устраивать пользователя-специалиста. Кроме того, обычно пользователя-специалиста интересует узкий круг определённых документов, актуальность и историю которых он может отслеживать лично, снабжая их своими комментариями, так же во время поиска по ключевым словам появляется большой «информационный» шум.

Поэтому как развитие и дополнение к существующим системам, роль которых в комплектовании информационного фонда библиотек исключительно велика, предлагается создать АИС НД (нормативной документации) для конечного пользователя-специалиста данной организации с личным кабинетом с доступом к электронному каталогу и электронным изданиям НД. Услугами этой системы могут пользоваться и библиографы и другие библиотечные сотрудники для формирования электронных каталогов по различным принципам классификации и для отработки информационных запросов на поиск книг и документов по различным условиям.

Предлагаемая система реализуется при помощи языка программирования PHP и HTML, имеет отдельный сервер для базы данных и в дальнейшем будет закреплена за хостингом пользователей, которые могут иметь доступ к книгам и документам с любого компьютера, на котором есть доступ в сеть Интернет. Предусмотрено ведение стандартных (УДК и ББК) классификаторов и личных классификаторов, а также ведение личного тезауруса терминов, слов и словосочетаний для быстрого поиска нужных книг и документов (не обязательно электронных ) в библиотечном фонде. В системе используется СУБД MySQL в качестве программного средства, предназначенного для создания структуры новой базы, хранения системной информации, редактирования содержимого и отбора данных в соответствии с заданными критериями, упорядочения, оформления и последующей выдачи данных на устройства вывода или передачи по каналам связи [4]. При разработке системы был использован CMS WordPress, система управления содержимым сайта с открытым исходным кодом, распространяемая под GNU GPL [5 ].

Система разрабатывается и внедряется в научно-технической библиотеке Самарского государственного архитектурно-строительного университета в первую очередь для работы с нормативной документацией в области информационных технологий и их применения в архитектуре и строительстве.

1.2 Обзор аналогов Техэксперт (Кодекс)

«Техэксперт» (рисунок 1) -- профессиональная справочная система, предоставляющая нормативно-техническую, нормативно-правовую информацию в сегменте b2b[1]. В фонде системы порядка 6 миллионов документов. Компания-изготовитель занимает лидирующие позиции в области нормативной документации для самых разных отраслей. «Техэксперт» включает в себя представительства компании в 150 городах России, система охватывает практически все регионы и является одной из крупнейших российских сетей.

Рисунок 1 - Техэксперт (Кодекс)

Рисунок 2 - Поиск документов в системе

Первая система под брендом «Техэксперт» вышла в 1998 году. Она была предназначена для специалистов строительной отрасли и называлась «Стройэксперт-Кодекс». В 2005 была переименована в «Стройэксперт» и стала первой системой в линейке для строителей. Сейчас она включает в себя 6 продуктов (рисунок 2): обновленный «Стройэксперт», «Стройтехнолог», «Помощник Проектировщика», «ТПД», «Дорожное строительство», «Ценообразование и сметное дело в строительстве».

В дальнейшем были выпущены системы для специалистов других отраслей экономики: тепло- и электроэнергетики, машиностроения, газового комплекса и т. д., а также системы для функциональных служб, отвечающих за охрану труда, промышленную и пожарную безопасность.

Системы «Техэксперт» включают в себя следующие виды информации:

- Нормативно-техническую документацию -- ГОСТ, СНиП, СанПиН, ВСН, РД, РДС, СП, ГЭСН, СТО и др., устанавливающую комплексы норм, правил, требований для определенных областей экономики.

- Нормативно-правовые акты различных органов государственной власти Российской Федерации.

- Технологическую и справочную информацию (типовые технологические карты, типовые проекты производства работ и материалы для разработки собственных проектов, формы строительной документации, словари определений, практику разрешения споров и многое другое).

- В некоторые продукты, помимо вышеперечисленного, включены материалы конференций и семинаров, календари мероприятий, книги или периодические издания.

Недавней разработкой компании является Система управления нормативно-технической документацией. Она позволяет создавать и вести электронную базу внутренних документов предприятия в едином пространстве с документами из фондов «Техэксперт». Также пользователи могут заказывать международные и зарубежные стандарты от ведущих мировых разработчиков и разработку персонального стандарта организации на основе перевода зарубежных документов.

Системы «Техэксперт» ориентированы на руководителей и специалистов производственных подразделений предприятий и организаций всех основных отраслей экономики: энергетика, нефтегазовая промышленность, строительство, машиностроение и другие. У компании также есть продукты для специалистов по охране труда и безопасности на предприятии.

«Техэксперт» является информационной службой комитета по техническому регулированию, стандартизации и оценке соответствия Российского союза промышленников и предпринимателей (РСПП).

«Техэксперт» ведет деятельность в области технического регулирования и стандартизации, одним из результатов которой является электронная система «Реформа технического регулирования», в которой аккумулируется информация по реформе технического регулирования в РФ.

Справочно-правовая система «ГАРАНТ»

Справочно-правовая система «ГАРАНТ» (рисунок 3) имеет возможность поиска документов по заказу и в online режиме, на сайте портала http://www.garant.ru, еще одним вариантом использования этой системы является установка дополнительного программного обеспечения на компьютеры организации-заказчика[2]. Данная система является первой массовой коммерческой справочно-правовой системой в России (выпускается с 1990 года). В дальнейшем состав НД был существенно расширен. Программа и обновления законодательной базы распространяются через компанию-разработчика и через дилерскую сеть из 250 компаний-распространителей в России и СНГ.

Рисунок 3- Справочно-правовая система »ГАРАНТ»

Прототип системы был разработан в 1990 году научным студенческим отрядом (факультет вычислительной математики и кибернетики МГУ) под руководством Дмитрия Першеева для государственной компании «Дальлесспром» и представлял собой компьютерный справочник по Кодексу законов о труде. После реализации проекта разработчики создали на основе прототипа полноценную справочную правовую систему (первоначально включающую менее десятка правовых актов) с регулярным пополнением, первые продажи которой под брендом «ГАРАНТ» (компания использует написание большими буквами) состоялись в декабре того же года.

Рисунок 4 - Поиск в системе «ГАРАНТ»

Система производится в виде информационных блоков -- баз данных, сформированных по тематическому принципу (рисунок 4). Из информационных блоков формируется комплект, который и является конечным продуктом, предлагаемым заказчику. Еженедельное пополнение максимального комплекта составляет около 12 тыс. документов. Система включает все существующие виды правовой информации: акты органов власти, судебная практика, международные договоры, проекты законов, формы (бухгалтерской, налоговой, статистической отчётности, а также бланки, типовые договоры), комментарии, словари и справочники.

Помимо информационного наполнения комплекта заказчик также может выбирать вид доступа (от локальной до многопользовательской сетевой версии), способ обновления (с переносных носителей информации или через Интернет), периодичность обновления (от 1 раза в месяц до ежедневной через Интернет), подключение услуги «правовой консалтинг».

Существует версия на английском языке (Legislation of Russia in English) и некоммерческая версия для студентов, аспирантов и преподавателей («Гарант-Студент»). Совместно с фирмой «1С» выпускается продукт «1С:Гарант Правовая поддержка».

Система поддерживает такие функции, как показ документов по состоянию на заданную дату («машина времени»), визуальное сравнение редакций документа, ведение календаря изменения статусов документов, поиск похожих документов, запрос услуг правовой поддержки через Интернет из интерфейса системы, подгрузку правовых новостей, обмен сообщениями между пользователями.

Система поставляется в виде инсталляционной, портативной (работает с флеш-накопителя без инсталляции) и онлайн-версиях (работает в браузерах). Сетевые версии реализованы на основе клиент-серверной (базовая) и файл-серверной (если сервер находится под управлением операционных систем, отличных от Windows) архитектур. Реализована специальная версия для мобильных устройств (операционные системы iOS и Android), а также интранет-версия. Обновление комплекта производится путём перезаписи базы данных (при способе обновления с переносных носителей) или пакетно (при способе обновления через Интернет). Система сертифицирована на совместимость с Windows XP, Vista, 7, 8. Реализована интеграция с другими программными продуктами: программами пакетов Microsoft Office(Word, Excel, Outlook) и OpenOffice.org (Writer, Calc), а также браузерами.

В системах осуществляется непрерывная поддержка баз данных документов в актуальном состоянии, что требует больших организационных усилий поставщика ресурсов и резко удорожает условия использования систем

Другие АИС библиотеки

Так же был проведен анализ других аналогичных информационно-поисковых систем:

- Mark;

- Ирбис;

- IPR-books;

- e-library;

- ЭБС «Лань».

Сравнительный анализ АИС библиотек НД

Исходя из выполненных пунктов я могу сделать выводы:

Выводы:

На основе суммарных оценок (таблица 1) видно, что лидером по всем найденным объектам можно считать .Ввиду отсутствия некоторых данных по характеристикам объектов, окончательные вывод могут содержать некоторую погрешность (таблица 1). Последний столбец таблицы подтверждает преимущества матричной структуры с достоверностью 79%, в отличие от достоверности этого вывода по всему массиву информации (всего 33% информации).

1.3 Алгоритм нечеткого поиска

Для поиска документов в разрабатываемой АИС используется алгоритм нечеткого поиска, алгоритм которого будет описан ниже.

При поиске в тезаурусе будут соблюдаться все правила и условия нижеописанного метода нечеткого поиска.

Нечеткий поиск является крайне полезной функцией любой поисковой системы. Вместе с тем, его эффективная реализация намного сложнее, чем реализация простого поиска по точному совпадению.

Задачу нечеткого поиска можно сформулировать так:
«По заданному слову найти в тексте или словаре размера n все слова, совпадающие с этим словом (или начинающиеся с этого слова) с учетом k возможных различий».

Например, при запросе «Машина» с учетом двух возможных ошибок, найти слова «Машинка», «Махина», «Малина», «Калина» и так далее.

Алгоритмы нечеткого поиска характеризуются метрикой -- функцией расстояния между двумя словами, позволяющей оценить степень их сходства в данном контексте. Строгое математическое определение метрики включает в себя необходимость соответствия условию неравенства треугольника (X -- множество слов, p -- метрика):

Между тем, в большинстве случаев под метрикой подразумевается более общее понятие, не требующее выполнения такого условия, это понятие можно также назвать расстоянием.

В числе наиболее известных метрик --расстояния Хемминга, Левенштейна и Дамерау-Левенштейна. При этом расстояние Хемминга является метрикой только на множестве слов одинаковой длины, что сильно ограничивает область его применения.

Впрочем, на практике расстояние Хемминга оказывается практически бесполезным, уступая более естественным с точки зрения человека метрикам, о которых и пойдет речь ниже. Наиболее часто применяемой метрикой является расстояние Левенштейна, или расстояние редактирования. Наиболее популярный алгоритм расчета -- метод Вагнера-Фишера.
Исходный вариант этого алгоритма имеет временную сложность O(mn) и потребляет O(mn) памяти, где m и n -- длины сравниваемых строк. Весь процесс можно представить следующей матрицей:

Рисунок 5- Метод Вагнера-Фишера

Если посмотреть на процесс работы алгоритма, несложно заметить, что на каждом шаге используются только две последние строки матрицы, следовательно, потребление памяти можно уменьшить до O(min(m, n)).

Можно дальше оптимизировать алгоритм, если стоит задача нахождения не более k различий. В этом случае нужно вычислять в матрице лишь диагональную полосу шириной 2k+1 (отсечение Укконена), что сводит временную сложность к O(k min(m, n)).

Префиксное расстояние

Также бывает необходимо вычислять расстояние между префиксом-образцом и строкой -- т. е. найти расстояние между заданным префиксом и ближайшим префиксом строки. В этом случае необходимо взять наименьшее из расстояний от префикса-образца до всех префиксов строки. Очевидно, что префиксное расстояние не может считаться метрикой в строгом математическом смысле, что ограничивает его применение.

Зачастую при нечетком поиске важно не столько само значение расстояния, сколько факт того, превышает оно или нет определенную величину.

1.4 Схема наиболее сложного алгоритма

Технология нечеткого поиска позволяет расширять запрос близкими по написанию словами, содержащимися в коллекции документов, по которым ведется поиск. Оригинальный алгоритм способен найти все лексикографически близкие слова, отличающиеся заменами, пропусками и вставками символов.

Нечеткий поиск целесообразно применять при поиске слов с опечатками, а также в тех случаях, когда возникают сомнения в правильном написании - фамилии, названия организации и т.п. Например, запрос "инкомбанк" может быть расширен словами: "инкомбан", "инкобанки", "винкомбанке". А если пользователь забыл точное название медицинского препарата "ипрониазид", то можно задать что-нибудь похожее, например "импронизид" - нужные документы будут найдены.

Уникальные алгоритмы, используемые при реализации нечеткого поиска, основаны на особой системе ассоциативного доступа к словам, содержащимся в текстовом индексе полнотекстового хранилища документов. В качестве единиц поиска используются цепочки составляющих слово букв. Для ускорения поиска предварительно создается специальный индекс, содержащий фрагменты слов со ссылками на слова, в которых эти фрагменты встретились. Алгоритм поиска позволяет быстро отобрать все слова, фрагменты которых совпадают с фрагментами слова в запросе, лежащие в заданной окрестности допустимых искажений. Задавая размер этой окрестности (процент отличающихся фрагментов и допустимые смещения их позиций в слове), можно легко регулировать точность и полноту поиска -- отбирать слова по степени близости к запросу.

Электронные документы, как статические, так и динамические, реализуют метафору классического печатного документа, а порталы являются реализациями метафор классической библиотеки (с каталогами и индексами). В связи с этим в электронных системах реализуются все механизмы навигации, существующие в «бумажных» изданиях. Эффективность электронных реализаций некоторых механизмов оказывается очень высокой, другая часть средств навигации из «бумажного» наследия в электронных системах практически не используется. Электронные реализации предлагают ряд средств навигации, которые в «бумажных» книгах и библиотеках были невозможны. Полнотекстовые БД определяются как БД, в которых хранятся записи полнотекстовых документов или их частей. Полнотекстовые БД значительно расширяют возможности доступа, предоставляя один и тот же текст в различных форматах (ascii text, .html, .sgml, .pdf), включая иллюстрации, графики и таблицы изображения. Технология создания полнотекстовых ресурсов предполагает получение файла полного текста в библиотеке-держателе документа. Это работает не для всех документов, а только для периодических изданий.

1.5 Модель анализа UML

Эта модель позволит понять, как программный комплекс должен быть спроектирован, какие в нем должны быть части и как они должны взаимодействовать между собой. Основное ее назначение - определить направление реализации функциональности, выявленной на этапе сбора требований и сделать набросок архитектуры системы.

В отличие от создаваемой в дальнейшем модели проектирования, модель анализа является в большей степени концептуальной моделью и только приближает разработчиков к классам реализации. Эта модель не должна иметь возможных противоречий.

1.5.1 Диаграмма вариантов использования

Актанты:

«Пользователь» - обобщение для всех видов пользователей. Может смотреть каталог библиотеки НД и скачивать документы.

«Редактор» - пользователь, который имеет доступ к редактированию каталогов АИС НД, добавление документов, описание, создание классификаторов и создание тезауруса.

«Специалистов» - Может создавать собственный классификатор и добавлять в него документа как из каталога самой АИС так и с личного ПК.

«Администратор» - может вести справочную информацию, управлять пользовательскими настройками и встраивать в систему некий набор стандартных данных.

1.5.2 Сценарии вариантов использования

Сценарий - текстовое описание последовательности действий, необходимых для выполнения экземпляра варианта использования. Сценарий пишется по определённому шаблону. При создании сценариев тщательно прорабатывается интерфейс системы, и учитываются отношения между вариантами использования. Для абстрактных вариантов использования, являющихся обобщениями конкретных вариантов, сценарии не пишут.

Вариант использования: Провести анализ по созданию собственного классификатора. Результат, создание собственного классификатора.

Краткое описание. Создается собственный классификаторов с хранящихся с ними документами.

Актант. Автор

Предусловия. Вариант использования «Вход в систему» выполнен с правами Автора. На экране - личный кабинет с пунктами меню, настроенными на права Автора: «Записи», «Медиафайлы», «Страницы», «Комментарии», «Профиль» и «Инструменты» .

Основной поток событий.

1.Специалист выбирает пункт «Страницы»

А1:Все страницы

А2:Добавить

А3:Выход

2.Специалист выбирает пункт «Записи»

А4:Все записи

А5:Добавить новую

А6:Рубрики

А7: Метки

А8:Выход

3.Специалист выбирает пункт «Медиафайлы»

А9:Библиотека

А10:Добавить новый

4.Специалист выбирает пункт «Комментарии»

А11:Добавление комментария

5.Специалист выбирает пункт «Инструменты»

А12:Все инструменты

А13:Экспорт

А14:Импорт

6. Система выводит на экран форму «Добавление страницы». На форме имеются поля для ввода названия классификатора, так же поле для ввода текста, создания ссылок для документов. На форме имеются кнопки: «Сохранить» и «Опубликовать».

7. Специалист заполняет данные в соответствующие поля.

А15.Сохранить

А16.Опубликовать

8. Система проверяет правильность ввода данных и выводит на экран заголовок: «Страница опубликована. Посмотреть». Появляется выпадающий список с настройкой видимости страницы: «Статус», «Видимость» и «Дата публикации» .

9. Специалист просматривает страницу и нажимает «Опубликовать».

10.Система выводит фразу «Страница опубликована. Посмотреть» и выводит на экран главное окно с пунктами меню, настроенными на права Автора. Вариант использования завершается успешно.

11.Верхний уровень классификатора создан и готов к добавлению новых уровней.

Альтернативы

А1: Создание классификатора

А1.1. Специалист выбирает пункт меню «Добавить страницу»

А1.2. Выполняется вариант использования »Создание классификатора»

А2: Справка

А2.1. Специалист выбирает пункт меню «Справка»

А2.2. Система выводит на экран форму «Справка по системе» с кнопкой «ОК».

А2.3. Специалист просматривает справку и щёлкает кнопку «ОК».

А2.4. Система закрывает форму «Справка по системе» и выводит на экран главное окно приложения с пунктами меню, настроенными на права Автора.

А2.5. Выполняется пункт 1 основной последовательности.

А3. Выход

А3.1. Специалист выбирает пункт меню «Выход»

А3.2. Система закрывает главную форму приложения и осуществляет выход в ОС. Вариант использования завершается.

А4. Закрытие формы

А4.1. Специалист нажимает кнопку «Закрыть»

А4.2. Система закрывает форму «Страницы» и выводит на экран главное окно приложения с пунктами меню, настроенными на права Специалист.

А4.4. Выполняется пункт 1 основной последовательности.

1.5.3 Диаграмма граничных классов

Диаграмма граничных классов (рисунок 7) (англ. Static Structure diagram) -- диаграмма, демонстрирующая классы взаимодействия системы с внешним окружением и их основными функциями.

Классы по своей роли в системе делятся на группы. Сам по себе язык UML жестко не оговаривает эти группы, оставляя группировку на усмотрение разработчиков. На основе опыта, накопленного при создании автоматизированных систем, целесообразно выделить следующие группы (категории, стереотипы) классов. Граничные (boundary) классы (): объекты этих классов реализуют интерфейсы системы с внешней средой и различными пользователями (не следует их путать с внутренними интерфейсами взаимодействия классов, упоминавшихся ранее);

1.5.4 Диаграмма сущностных классов

Сущностные (entity) классы (рисунок 8): объекты этих классов представляют собой блоки длительно хранимой информации, используемые для организации баз данных и знаний, файловых систем хранения данных различной логической структуры; в основном в этих классах развит атрибутный раздел, однако имеется небольшое число операций контроля ограничений целостности, как стандартных, так и специфичных для данной предметной области;

Диаграмма классов управления

Классы управления (control) (рисунок 9): объекты этих классов являются активными, берущими на себя управление и организацию вычислительных процессов; чаще всего это стандартные компоненты операционных систем и систем управления базами данных (СУБД), таймеры, координаторы и т.п.;

Рисунок 8 - Диаграмма сущностных классов

Рисунок 9 - Диаграмма классов управления

Размещено на http://www.allbest.ru/

1.5.5 Логическая структура базы данных

Логическая организация БД определяется типом структур данных и видом модели данных, которая поддерживается СУБД. База данных является совокупностью взаимосвязанных массивов данных. Массив БД с простейшей организацией состоит из однотипных записей.

Логическая структура БД информационной системы показана на рисунке 10.

Рисунок 10 - База данных

2. РЕАЛИЗАЦИЯ ПРОЕКТА СИСТЕМЫ

2.1 Архитектура и платформа реализации.

Как развитие и дополнение к существующим системам, роль которых в комплектовании информационного фонда библиотек исключительно велика, предлагается создать АИС НД для конечного пользователя-специалиста данной организации с личным кабинетом с доступом к электронному каталогу и электронным изданиям НД. Услугами этой системы могут пользоваться также библиографы и другие библиотечные сотрудники для формирования электронных каталогов по различным принципам классификации и для отработки информационных запросов на поиск книг и документов по различным условиям.

Предлагаемая система реализуется при помощи языка программирования PHP и HTML, имеет отдельный сервер для базы данных и в дальнейшем будет закреплена за хостингом пользователей, которые могут иметь доступ к книгам и документам с любого компьютера, на котором есть доступ в сеть Интернет. Предусмотрено ведение стандартных (УДК и ББК) классификаторов и личных классификаторов, а также ведение личного тезауруса терминов, слов и словосочетаний для быстрого поиска нужных книг и документов (не обязательно электронных) в библиотечном фонде в том числе с использованием метода нечеткого поиска. В системе применяется СУБД MySQL в качестве программного средства, предназначенного для создания структуры новой базы, хранения системной информации, редактирования содержимого и отбора данных в соответствии с заданными критериями, упорядочения, оформления и последующей выдачи данных на устройства вывода или передачи по каналам связи. При разработке системы был использован CMS WordPress, система управления содержимым сайта с открытым исходным кодом, распространяемая под GNU GPL. Характеристики объекта автоматизации приведены в Таблице 2.

Система разрабатывается и внедряется в научно-технической библиотеке Самарского государственного архитектурно-строительного университета в первую очередь для работы с нормативной документацией в области информационных технологий и их применения в архитектуре и строительстве.

Таблица 2 - Характеристики объекта автоматизации

Тип используемой сети

Вычислительная сеть Интернет с максимальной пропускной способностью 100Мбит/сек

Тип организации взаимодействия

Использование браузера на ЭВМ пользователя подключенной к сети Интернет с созданием личного кабинета

Максимальная интенсивность запросов к серверу

100 ед/сутки

Максимальный объем запроса

1 Кбайт

Объем возвращаемых данных

500 Мбайт

Срок службы АИС

5 лет

2.2 Физическая структура БД

Модель сущность-связь (ER-модель) (рисунок 11) (англ. entity-relationship model, ERM) -- модель данных, позволяющая описывать концептуальные схемы предметной области.

ER-модель используется при высокоуровневом (концептуальном) проектировании баз данных. С её помощью можно выделить ключевые сущности и обозначить связи, которые могут устанавливаться между этими сущностями.

Во время проектирования баз данных происходит преобразование объектной модели в конкретную схему базы данных на основе выбранной модели данных (реляционная).

ER-модель представляет собой формальную конструкцию, которая сама по себе не предписывает никаких графических средств её визуализации. В качестве стандартной графической нотации, с помощью которой можно визуализировать ER-модель, была предложена диаграмма сущность-связь (ER-диаграмма)(англ. entity-relationship diagram, ERD).

Понятия ER-модель и ER-диаграмма часто ошибочно не различают, хотя для визуализации ER-моделей предложены и другие графические нотации.

Таблица 3 - Сущности БД

Сущность на логическом уровне

Таблица на физическом уровне

Документ

wp_doc

Комментарий к документу

Wp_comment

Тезаурус

Wp_tezaurus

Пользователь

Wp_user

Классификатор

Wp_post

Рубрика

Wp_term

Рисунок 11 - Физическая ER-модель данных

2.3 Расчет комплекса технических свойств (КТС)

Для оценки параметров комплекса технических средств, производится
расчет требуемых ресурсов внешней и оперативной памяти и расчет времени
реакции системы.

2.3.1 Расчет необходимого объема внешней памяти

Расчет объема требуемой внешней памяти происходит по формуле

- объем внешней памяти, занимаемы операционной системой, Мб;

- объем внешней памяти, занимаемый СУБД, Мб;

- объем внешней памяти, занимаемый данными, необходимыми для работы системы, Мб;

- объем внешней памяти, занимаемый программными модулями, Мб;

- объем внешней памяти, необходимый для дополнительного ПО, Мб.

Vвп - общий объем внешней памяти, Гбайт.

Расчет необходимого объема внешней памяти

Vос- объем внешней памяти, по паспорту для операционной системы Windows 7 64-бит- 20 гб;

VСУБД - объем внешней памяти, требуемый для хранения файлов СУБД по паспорту для MySQL - 0,04 гб

В таблице 4 показан расчёт максимального объема базы данных.

Таблица 4 - Расчет объёма БД

Таблица БД

Размер записи, байт

Макс. кол-во записей

Размер индекса, Кбайт

Всего, Кбайт

wp_doc

255

15

200

470

Wp_comment

255

20

230

505

Wp_tezaurus

255

5000

9240

14495

Wp_user

255

10

396

661

Wp_post

255

10

284

549

Wp_term

255

100

2350

2705

Итого:

19385

Vданных = 0,02 гб

Vпрограммы - объем внешней памяти, необходимой для хранения текстов и библиотек приложений -0,02 гб

VВП = VОС (20.0) + VСУБД (0,04) + Vданных (0,02) + Vпрограммы (0,02)= 20,08 Гб

2.3.2 Расчет необходимого объема оперативной памяти

Для расчета ОЗУ воспользуемся формулой

,

где VОП - общий объем оперативной памяти, Мбайт;

VОС - объем оперативной памяти, требуемый для установки операционной системы, Мбайт;

VСУБД - объем оперативной памяти, требуемый для установки СУБД, Мбайт;

Vданных - объем оперативной памяти, требуемый для хранения записей

базы данных и результатов выполнения функций, Мбайт;

Vпрограммы - объем оперативной памяти, необходимой для хранения текстов и библиотек приложений, Мбайт.

Расчет необходимого объема оперативной памяти

Vос- по паспорту для операционной системы Windows 7 64 бит- 4096 мб;

VСУБД - по паспорту для Access - 34,76 мб:

V данных - 70 мб (Таблица 3);

V программы -30 мб.

Расчет Vданных произведем на наихудший случай, запрос на максимальное количество таблиц БД. Наиболее сложным запросом является запрос на расчет и формирование отчета «Оптимальный вариант следования товаров», т.к. требует для своего формирования использования наибольшего числа таблиц БД, а именно 7 из 8 возможных. Vданных рассчитывается по таблице 5.

Таблица 5 - Расчет объема буфера оперативной памяти, необходимой для расчета и формирования отчета

Таблица БД

Размер записи, байт

Макс. кол-во записей

Размер индекса, Кбайт

Всего, Кбайт

wp_doc

255

15

200

470

Wp_comment

255

20

230

505

Wp_tezaurus

255

5000

9240

14495

Wp_user

255

10

396

661

Wp_post

255

10

284

549

Wp_term

255

100

2350

2705

Итого:

19385

Суммарный объем ОЗУ, необходимый для функционирования системы:

VОП = VОС (4096) + VСУБД (34,76) + Vданных (70) + Vпрограммы (30)=
=4230,76 Мб

2.3.3 Расчет времени реакции системы

Расчет времени реакции системы должен дать оценку быстродействия системы. Временем реакции системы по какой-либо функции называется время от момента начала запроса на выполнение этой функции от внешнего источника запросов до момента окончания формирования результата по данной функции. Время реакции системы рассчитывается на наихудший случай для самого сложного запроса. Самым сложным запросом является расчет и формирование отчета «ГОСТ 34.321 - 96 взаимосвязь систем».

teeoda - время на ввод входных данных запроса;

kee - коэффициент ошибок при вводе, для расчетов можно принять равным 1.5;

Lсимe - количество символов, вводимых в качестве исходных данных запроса.

Так, как оператор выбирает информацию из списка, будем считать, что Lсимe =2 (открытие списка и выбор из списка)

tсимe - время ввода одного символа, при ручном вводе с клавиатуры в некоторую экранную форму можно принять в среднем равным 2 с;

tсчитывания - время, затрачиваемое на считывание физических блоков при работе с накопителем;

Nбл - количество считываемых физических блоков, зависит от количества обрабатываемых таблиц (файлов) и объема таблиц (файлов);

tпоз=0,006 сек - время позиционирования головок дискового накопителя;

tсч.бл =0,001 сек - время считывания физического блока в дисковом накопителе;

tвычисления - время, затрачиваемое процессором на обработку информации с учетом выполнения циклов;

Nопер = 1000 - количество операций высокого уровня, необходимых для формирования результата;

K1 - среднее количество тактов машинных команд на одну операцию, для большинства случаев можно принять К1 = 60;

f = 1600*106 - тактовая частота процессора, Гц;

Vmaбл = 105000 байт - средний объем таблицы, байт;

Nmaбл = 6 - количество таблиц, обрабатываемых в запросе;

Ублока= 512 байт - объем физического блока носителя, байт;

tвывода - время на вывод результата на устройство вывода или
отображения, для принтера оценивается отдельно. Для дисплея можно принять 0.5 с. (зависит от видеокарты и дисплея).

Полученное время реакции системы соответствует нормам времени для диалогового режима (до 30 с).

2.3.4 Требования к программному обеспечению

Приведем минимальные требования к техническому и программному обеспечению, исходя из расчетов объемов внешней и оперативной памяти, приведенных в п. 2.7. Требования к процессору определяются требованиями ОС.

Минимальные требования к рабочей станции:

- процессор класса Pentium с тактовой частотой 1,6 ГГц и выше;

- объем оперативной памяти не менее 4 Гб;

- объем свободного дискового пространства не менее 22,1 Гб;

- тип операционной системы -Windows 7 64 бит (или вышедшие следом);

- манипулятор типа «мышь»;

- монитор с разрешением 1280x1024.

Программный комплекс должен удовлетворять следующим требованиям:

- функциональный характер -- требования к поведению системы;

- пользовательские требования;

- функциональные требования.

- нефункциональный характер - требования к характеру поведения системы;

- системные требования и ограничения - определения элементарных операций, которые должна иметь система, а также различных условий, которым она может удовлетворять. К системным требованиям и ограничениям относятся:

- ограничения на программные интерфейсы, в том числе к внешним системам;

- требования к атрибутам качества;

- требования к применяемому оборудованию и ПО.

- требования к документированию;

- требования к дизайну и удобности интерфейсов;

- требования к безопасности и надёжности;

- требования к показателям назначения (производительность, устойчивость к сбоям и т.п.);

- требования к эксплуатации и персоналу;

- прочие требования и ограничения (внешние воздействия, мобильность, автономность и т.п.).

2.4 Основные интерфейсы

Ведение классификаторов УДК, ББК и личного классификатора, список классификаторов в системе отображается в виде выпадающего списка, как показано на рисунке 12 где отображены стандартные классификаторы и личные классификаторы пользователей, в зависимости от настроек видимости.

Рисунок 12 - Классификаторы

Поиск документов в библиотеке НД по заголовку, эта функция реализована в системе при помощи CMS WordPress. Поиск производиться по заглавию документа в базе данных (рисунок 13).

Тезаурус составляется сотрудниками библиотеки исходя из описания документа (рисунок 14), поиск по тезаурусу происходит путем введения всего ключевого слова или его части.

Рисунок 13 - Поиск документации в библиотеке НД

Рисунок 14 - Тезаурус АИС «Библиотека НД»

Формирование отчетов посещений АИС и обращений к БД (рисунок 15). Благодаря этой функции можно провести исследование заключающиеся в анализе посещаемости АИС, и удачных «ответов» на запросы пользователей.

Рисунок 15 - Статистика обращений к БД АИС НД

2.5 Описание программной реализации

Диаграмма компонентов (рисунок 16), Component diagram -- статическая структурная диаграмма, показывает разбиение программной системы на структурные компоненты и связи (зависимости) между компонентами. В качестве физических компонентов могут выступать файлы, библиотеки, модули, исполняемые файлы, пакеты и т. п. Описание диаграммы приведено в таблице 5.

Диаграмма развёртывания (рисунок 17), Deployment diagram в UML моделирует физическое развертывание артефактов (таблица 5) на узлах. Например, чтобы описать веб-сайт диаграмма развертывания должна показывать, какие аппаратные компоненты («узлы») существуют (например, веб-сервер, сервер базы данных, сервер приложения), какие программные компоненты («артефакты») работают на каждом узле (например, веб-приложение, база данных), и как различные части этого комплекса соединяются друг с другом (например, JDBC, REST, RMI).


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.