Проектирование структуры хранилища данных и аналитики учета успеваемости студентов

Изучение понятия и архитектуры системы поддержки принятия решений. Анализ сущности и основного назначения olap-систем. Описание моделей существующей и ожидаемой системы учета успеваемости. Разработка проекта оперативного анализа успеваемости студентов.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 23.04.2014
Размер файла 1,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

  • Введение
  • 1. Теоретическая часть
    • 1.1 Хранилища данных
    • 1.1.1 Понятие и архитектура системы поддержки принятия решений
    • 1.1.2 Понятие хранилища данных
    • 1.1.3 Витрины данных
    • 1.2 Понятие и модель данных OLAP
    • 1.2.1 Понятие OLAP
    • 1.2.2 Категории данных в хранилище данных
  • 2. Описание предметной области
  • 3 Описание существующих решений
    • 3.1 Северо-Восточный федеральный университет
    • 3.2 Экономический факультет МГУ имени М.В. Ломоносова
  • 4 Описание архитектуры системы
    • 4.1 Текущее состояние системы
    • 4.2 Ожидаемое состояние подсистемы
  • Заключение
  • Приложение А
  • Приложение Б

Список условных обозначений и сокращений

ПНИПУ - Пермский Национальный Исследовательский Политехнический Университет

ВУЗ - Высшее учебное заведение

АУ - Анализ успеваемости

OLAP - Online Analytical Processing

OLTP - Online Analytical Processing

СППР - Система поддержки принятия решений

ВД - Витрина данных

БД - База данных

ХД - Хранилище данных

Введение

К настоящему времени во многих организациях накоплены значительные объемы данных, на основе которых имеется возможность решения разнообразных аналитических и управленческих задач. Проблемы хранения и обработки аналитической информации становятся все более актуальными и привлекают внимание специалистов и фирм, работающих в области информационных технологий, что привело к формированию полноценного рынка технологий бизнес-анализа.

В идеале работа аналитиков и руководителей различных уровней должна быть организована так, чтобы они могли иметь доступ ко всей интересующей их информации и пользоваться удобными и простыми средствами представления и работы с этой информацией. Именно на достижение этих целей и направлены информационные технологии, объединяющиеся под общим названием хранилищ данных и бизнес-анализа.

Одним из примеров таких организаций является любой ВУЗ. Ведение учета успеваемости учащихся является основной из задач учебного заведения. Поэтому очень важно вести статистические данные об успеваемости, для выявления каких либо отклонений в успеваемости учащихся, с их последующим решением. Создание таких обобщенных данных предусматривает одна из функция бизнес-аналитики.

Целью данной работы является проектирование структуры хранилища данных и аналитики учета успеваемости на основе существующей системы.

Для достижения этой цели необходимо выполнить следующие задачи:

- Проанализировать существующую систему учета успеваемости студентов;

- Описать модель системы в разрезе «как есть»;

- Описать модель системы в разрезе «как будет»;

- Спроектировать структуру хранилища;

- Разработать проект оперативного анализа успеваемости;

- Составить техническое задание на разработку подсистемы

Объект исследования - учебный процесс ВУЗа.

Предмет исследования - информационная система учета успеваемости студентов.

1. Теоретическая часть

1.1 Хранилища данных

проектирование хранилище данные успеваемость

1.1.1 Понятие и архитектура системы поддержки принятия решений

В соответствии с определением Gartner, бизнес-анализ (BI, Business Intelligence) - это категория приложений и технологий для сбора, хранения, анализа и публикации данных, позволяющая корпоративным пользователям принимать лучшие решения. В русскоязычной терминологии подобные системы называются также системами поддержки принятия решений.

Сбор и хранение информации, а также решение задач информационно-поискового запроса эффективно реализуются средствами систем управления базами данных (СУБД). В OLTP (Online Analytical Processing) - подсистемах реализуется транзакционная обработка данных. Непосредственно OLTP-системы не подходят для полноценного анализа информации в силу противоречивости требований, предъявляемых к OLTP-системам и СППР.

Для предоставления необходимой для принятия решений информации обычно приходится собирать данные из нескольких транзакционных баз данных различной структуры и содержания. Основная проблема при этом состоит в несогласованности и противоречивости этих баз-источников, отсутствии единого логического взгляда на корпоративные данные.

Поэтому для объединения в одной системе OLTP и СППР для реализации подсистемы хранения используются концепция хранилищ данных (ХД). В основе концепции хранилищ данных лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа, что позволяет оптимизировать структуры хранения. Хранилище данных позволяет интегрировать ранее разъединенные детализированные данные, содержащиеся в исторических архивах, накапливаемых в традиционных OLTP-системах, поступающих из внешних источников, в единую базу данных, осуществляя их предварительное согласование и, возможно, агрегацию.

Подсистема анализа может быть построена на основе оперативного анализа. Для реализации такой подсистемы применяется технология оперативной аналитической обработки данных OLAP, использующая концепцию многомерного представления данных[1];

1.1.2 Понятие хранилища данных

Технология хранилищ данных предназначена для хранения и анализа больших объемов данных с целью дальнейшего обнаружения в них скрытых закономерностей. Хранилище данных - предметно-ориентированный, интегрированный, редко меняющийся, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений. Предметная ориентация означает, что хранилище данных интегрируют информацию, отражающую различные точки зрения на предметную область. Интеграция предполагает, что данные, хранящиеся в хранилище данных, приводятся к единому формату. Поддержка хронологии означает, что все данные в хранилище данных соответствуют последовательным интервалам времени. Кроме возможности работать с единым источником информации, руководители и аналитики должны иметь удобные средства визуализации данных, агрегирования, поиска тенденций, прогнозирования. Несмотря на многообразие аналитической деятельности можно выделить типовые технологии анализа данных, каждой из которых соответствует определенный набор инструментальных средств. Вместе с хранилищем данных эти средства обеспечивают полное решение для автоматизации аналитической деятельности и создания корпоративной информационно-аналитической системы.

1.1.3 Витрины данных

Сокращение затрат на проектирование и разработку хранилища данных может быть достигнуто путем создания витрин данных (ВД). Витрины данных - это упрощенный вариант хранилище данных, содержащий только тематически объединенные данные.

Витрина данных содержит данные, ориентированные на конкретного пользователя, существенно меньше по объему, и для ее реализации требуется меньше затрат. Витрины данных могут строиться как самостоятельно, так и вместе с хранилищем данных. Витрины данных внедряются гораздо быстрее и быстрее виден эффект от их использования. Недостатками витрин данных является многократное хранение одних и тех же данных в различных витринах данных.

Обычно информация попадает в витрины данных из хранилища данных в этом случае витрины данных называются зависимыми. Возможна также ситуация, когда источником информации для пополнения витрин данных служат непосредственно OLTP-системы. Такие витрины данных, получившие название независимых, как правило, рассматриваются как временное решение, позволяющее достаточно быстро и с небольшими затратами решить наиболее важные задачи, оценить преимущества нового подхода, сформулировать некоторые рекомендации для более масштабного проекта разработки общего хранилища данных. Возможно также совмещение хранилища данных и витрины данных в рамках одной СППР. Хранилища данных в этом случае представляет собой единый источник данных для всей предметной области, а витрины данных являются подмножествами данных из хранилища, организованными для представления информации по тематическим разделам данной области. В том случае, если пользователю, для которого создавалась витрина данных, содержащихся в ней данных недостаточно, то он может обратиться к хранилищу данных.

Достоинствами такого решения являются простота создания и наполнения витрины данных, поскольку наполнение происходит из единого стандартизированного источника очищенных данных - из хранилища данных, простота расширения за счет добавления новых витрин данных, а также снижение нагрузки на основное хранилище данных. Недостатки заключаются в избыточности, так как данные хранятся и в хранилище данных, и в витрине данных, а также дополнительные затраты на разработку СППР с хранилищем данных и витриной данных.

1.2 Понятие и модель данных OLAP

1.2.1 Понятие OLAP

OLAP (Online Analytical Processing) - технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений.

Основное назначение OLAP-систем - поддержка аналитической деятельности, произвольных запросов пользователей - аналитиков. Цель OLAP-анализа - проверка возникающих гипотез.

1.2.2 Категории данных в хранилище данных

Все данные в хранилище данных делятся на три категории:

- детальные данные - данные, переносимые непосредственно из OLTP-подсистем. Соответствуют элементарным событиям, фиксируемым в OLTP-системах. Подразделяются на:

- измерения - наборы данных, необходимые для описания событий (товар, продавец, покупатель, магазин);

- факты - данные, отражающие сущность события (количество проданного товара, сумма продаж);

- агрегированные (обобщенные) данные - данные, получаемые на основании детальных путем суммирования по определенным измерениям;

- метаданные - данные о данных, содержащихся в хранилище данных. Могут описывать:

- объекты предметной области, информация о которых содержится в хранилище данных;

- категории пользователей, использующих данные в хранилище данных;

- места и способы хранения данных;

- действия, выполняемые над данными;

- время выполнения различных действий над данными;

- причины выполнения различных действий над данными.

2. Описание предметной области

Пермский Национальный Исследовательский Политехнический Университет -- один из ведущих и крупнейших технических вузов Российской Федерации, осуществляющий целевую подготовку и переподготовку кадров для высокотехнологичных отраслей экономики, выполнение исследований и разработок по целому ряду направлений науки, техники и технологий.

В настоящее время в вузе ежегодно обучается 25 тысяч студентов, 610 аспирантов и докторантов, 7000 слушателей системы дополнительного профессионального образования. Подготовка кадров ведется по 22 укрупненным группам направлений высшего профессионального образования, в том числе 95 специальностям, 74 направлениям бакалавриата и 25 направлениям магистратуры.

В составе университета 10 факультетов, 64 кафедры, 47 центров дополнительного профессионального образования, факультет повышения квалификации преподавателей, центр довузовской подготовки и другие подразделения образовательной инфраструктуры.

В вузе реализуется программы по 36 направлениям бакалавриата, осуществляется обучение по 22 направлениям подготовки магистров, включающая более 55 программ [2];

За всю историю ВУЗ-а система учета успеваемости студентов менялась неоднократно, претерпевала изменения. В проходящий учебный 2013/2014 год, была введена обновленная автоматизированная система учета успеваемости оценок. Данная система сама формирует ведомости для итоговых испытаний и ведомости для должников. Ведомости выдаются преподавателям для принятия экзаменов. После сдачи ведомостей, все оценки, проставленные в ведомостях, заносятся в автоматизированную систему учета успеваемости, где и ведется контроль итоговых оценок. Также в существующей системе предусмотрена функция выставления оценок, полученных на протяжении семестра, но эта система в настоящее время активно не используется.

3. Описание существующих решений

3.1 Северо-Восточный федеральный университет

Внедрение системы анализа успеваемости произвелась весной 2013 года. Производилась промежуточная аттестация среди нескольких факультетов: естественно-математическому, техническому, гуманитарному. С каждого факультета было выбрано по одной группе для участия в пробном анализе. В результате были выявлены причины, которые негативно сказываются на успеваемости студентов первого курса. К примеру, это недостаточная школьная подготовка, чрезмерный объем нагрузки или несерьезное отношение к учебе.

«По результатам анализа были разработаны конкретные рекомендации для каждого факультета и кафедры, за которой закреплена дисциплина, подвергнутая анализу. О результатах проведенного анализа и подготовленных по его итогам рекомендациях было доложено на Совете по качеству СВФУ», - рассказывает начальник Управления качества Владимир Игнатьев[3].

3.2 Экономический факультет МГУ имени М.В. Ломоносова

Система анализа использует данные каждого студента в отдельности. Для получения данных берется информация о каждом студенте из выбранной группы, его конкретные результаты по дисциплины, и сравнивается с информацией других одногруппников. Так же учитывается успеваемость студента в зависимости от занятий, которые он пропустил[4].

4. Описание архитектуры системы

4.1 Текущее состояние системы

Так как основой объекта исследования является успеваемость студентов, целесообразно выбрать для описания сам процесс учета выставления оценок. Диаграмма вариантов использования существующей системы представлена в приложении Б[5].

В данном 2013/2014 учебном году обновлена автоматизированная система учета успеваемости студентов. На данный момент эта система состоит из базы данных, в которую заносятся результаты итоговых испытаний студентов. Логическая и физическая схемы данных существующей системы представлены в приложении В. В системе предусмотрена возможность внесения оценок студентам на протяжении семестра, но эта система активно не используется. Преподаватели по-прежнему ведут собственные журналы, которые заполняют текущими оценками учащихся за семестр. Исходя из этого, получается, что текущие оценки можно посмотреть только в журнале преподавателя, если таковой имеется. Во время зачетной недели и сессии, преподавателям выдаются специальные ведомости. Итоговые оценки выставляются преподавателем в ведомости, которые сдаются в деканат, после чего ответственное лицо вносит их в автоматизированную систему.

4.2 Ожидаемое состояние подсистемы

После реализации подсистемы анализа успеваемости студентов появится хранилище данных[6], предназначенное для оперативного анализа. Диаграмма вариантов использования спроектированной подсистемы представлена в приложении Б. По данному хранилищу будет построена таблица измерений и фактов, которая станет основой для оперативного анализа данных.

Для пользователей станет доступен просмотр панели индикаторов[7]. Эта панель будет отображать необходимые данные об успеваемости в целом.

Например, можно будет просмотреть успеваемость заданной группы по месяцам. Данный индикатор будет отображать средние оценки, которые получали студенты данной группы по истечении каждого месяца. Благодаря чему, станет возможным наблюдение за процессом успеваемости всей группы. Так же данная функция может помочь с определением какого либо переломного момента в процессе обучения группы: будь то смена куратора группы или старосты, или отчисление некоторых студентов.

Так же можно будет просмотреть оценки, выставленные преподавателем помесячно.

Для более широкого анализа следует повсеместно внедрить выставление преподавателями текущих оценок за семестр в базу данных, посредством онлайн кабинетов.

Заключение

В ходе проделанной работы достигнута поставленная цель: спроектирована подсистема анализа успеваемости на основе существующей системы.

Достигнуты поставленные задачи:

- Проанализирована существующая система учета успеваемости студентов;

- Описаны модели существующей и ожидаемой системы учета успеваемости;

- Составлено техническое задание

Так как в рамках курсового проектирования не рассматриваются задачи реализации и внедрения подсистемы - они будут выполнены в рамках ВКР. Спроектированная система, после операций реализации и внедрения, будет полноценно исполнять возложенные на нее обязательства.

Приложение А

Диаграммы вариантов использования существующей системы и проектируемый подсистемы

Размещено на http://www.allbest.ru/

Рисунок А.1 - Диаграммы вариантов использования существующей системы

Размещено на http://www.allbest.ru/

Рисунок А.2 - Диаграммы вариантов использования проектируемой подсистемы

Приложение Б

Логическая и физическая модели данных существующей системы

Рисунок Б.1 - Физическая модель данных существующей системы

Рисунок Б.2 - Логическая модель данных существующей системы

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.