Моделирование OLAP куба: загрузка данных в гиперкуб

Построение срезов гиперкуба: определение координат для записей таблицы и определение записей, имеющих конкретные координаты. Преобразование данных плоской таблицы к внутреннему представлению. Изучение основы использования и проектирования баз данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 16.04.2022
Размер файла 437,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МОДЕЛИРОВАНИЕ OLAP КУБА: ЗАГРУЗКА ДАННЫХ В ГИПЕРКУБ

Азарян Магдалина Андраниковна, студент магистратуры

курс, институт Цифрового развития Северо-Кавказского федерального университета

Россия, г. Ставрополь Насырова Бахтыгуль Халитовна, студент магистратуры курс, институт Цифрового развития Северо-Кавказского федерального университета

Россия, г. Ставрополь Казарян Джемма Манвеловна, старший преподаватель Северо-Восточного государственного университета

Россия, г. Магадан Таволжанова Олеся Андреевна, студент

курс, институт Цифрового развития Северо-Кавказского федерального университета Россия, г. Ставрополь

Аннотация

В статье рассматривается первый этап моделирования OLAP куба, а именно загрузка данных в гиперкуб. Подробно на примерах описываются все шаги для построения срезов гиперкуба. Также описан механизм объединения элементов разных таблиц между собой.

Ключевые слова: OLAP куб, реляционные базы данных, гиперкуб, преагрегирование данных, факты, измерения.

Annotation

The article deals with the first stage of modeling an OLAP cube, namely, loading data into a hypercube. All the steps for constructing hypercube slices are described in detail with examples. The mechanism for combining elements of different tables with each other is also described.

Key words: OLAP cube, relational databases, hypercube, data preaggregation, facts, dimensions.

При моделировании OLAP куба первым этапом работы системы будет загрузка данных и преобразование их во внутренний формат. Для OLAP системы колонки таблицы могут быть либо фактами, либо измерениями [3]. При этом логика работы с этими колонками будет разная. В гиперкубе измерения фактически являются осями, а значения измерений - координатами на этих осях. При этом куб будет заполнен сильно неравномерно - будут сочетания координат, которым не будут соответствовать никакие записи и будут сочетания, которым соответствует несколько записей в исходной таблице, причем первая ситуация встречается чаще, то есть куб будет похож на вселенную - пустое пространство, в отдельных местах которого встречаются скопления точек (фактов).

Таким образом, если мы при начальной загрузке данных произведем преагрегирование данных, то есть объединим записи, которые имеют одинаковые значения измерений, рассчитав при этом предварительные агрегированные значения фактов, то в дальнейшем нам придется работать с меньшим количеством записей, что повысит скорость работы и уменьшит требования к объему оперативной памяти [4].

Для построения срезов гиперкуба нам необходимы следующие возможности - определение координат (фактически значения измерений) для записей таблицы, а также определение записей, имеющих конкретные координаты (значения измерений) [1]. Рассмотрим каким образом можно реализовать эти возможности.

Для хранения гиперкуба проще всего использовать базу данных своего внутреннего формата. Схематически преобразования можно представить следующим образом:

Рисунок 1. Преобразование данных плоской таблицы к внутреннему представлению

То есть вместо одной таблицы мы получили нормализованную базу данных. Вообще-то нормализация снижает скорость работы системы, могут сказать специалисты по базам данных, и в этом они будут безусловно правы, в случае, когда нам надо получить значения для элементов. Но все дело в том, что нам эти значения на этапе построения среза вообще не нужны. Как уже было сказано выше, нас интересуют только координаты в нашем гиперкубе, поэтому определим координаты для значений измерений. Самым простым будет перенумеровать значения элементов. Для того, чтобы в пределах одного измерения нумерация была однозначной, предварительно отсортируем списки значений измерений в алфавитном порядке. Кроме того, перенумеруем и факты, причем факты преагрегированные. Получим следующую схему:

Рисунок 2. Проиндексированные данные измерений и фактов

Теперь осталось только связать элементы разных таблиц между собой. В теории реляционных баз данных это осуществляется при помощи специальных промежуточных таблиц [2]. Нам достаточно каждой записи в таблицах измерений поставить в соответствие список, элементами которого будут номера фактов, при формировании которых использовались эти измерения (то есть определить все факты, имеющие одинаковое значение координаты, описываемой этим измерением). Для фактов соответственно каждой записи поставим в соответствие значения координат, по которым она расположена в гиперкубе. В дальнейшем везде под координатами записи в гиперкубе будут пониматься номера соответствующих записей в таблицах значений измерений. Тогда для нашего гипотетического примера получим следующий набор, определяющий внутреннее представление гиперкуба:

Рисунок 3. Внутреннее представление гиперкуба

гиперкуб таблица координата проектирование

Такое будет у нас внутреннее представление гиперкуба. Так как мы делаем его не для реляционной базы данных, то в качестве полей связи значений измерений используются просто поля переменной длины (в РБД такое сделать мы бы не смогли, так как там количество колонок таблицы определено заранее).

Использованные источники

1. Илюшечкин В.М., Основы использования и проектирования баз данных / В.М. Илюшечкин. - Москва.: Высшее образование, 2011. - 213 с.

2. Цыганов А.А., Управление данными / А.А. Цыганов, А.В. Кузовкин, Б.А. Щукин. - Москва.: Academia (Академпресс), 2010. - 256 с.

3. Многомерная модель [Электронный ресурс]. (дата обращения 23.01.2022).

4. Словарь поOLAP [Электронный ресурс]. (дата обращения 30.11.2019) (дата обращения 15.01.2022).

Размещено на Allbest.ru


Подобные документы

  • Структура таблицы и типы данных. Ввод данных в ячейки таблицы. Создание запросов на выборку, удаление, обновление и добавление записей, на создание таблицы. Основное различие между отчетами и формами, их назначение. Создание отчетов для базы данных.

    курсовая работа [1,9 M], добавлен 17.06.2014

  • Построение систем анализа данных. Построение алгоритмов проектирования OLAP-куба и создание запросов к построенной сводной таблице. OLAP-технология многомерного анализа данных. Обеспечение пользователей информацией для принятия управленческих решений.

    курсовая работа [1,3 M], добавлен 19.09.2008

  • Проектирование структуры базы данных. Конструирование структуры будущих таблиц баз данных, основные приемы их заполнения и редактирования. Простая сортировка значений таблицы. Поиск записей по образцу. Как правильно сохранить и загрузить базу данных.

    практическая работа [4,4 M], добавлен 02.04.2009

  • Создание базы данных, выполнение поиска, изменение и удаление записей, обработка, проектирование и обмен данными. Определение формул для вычисляемой части базы данных. Заполнение таблицы с помощью Мастера форм. Формы представления и анализ информации.

    учебное пособие [5,0 M], добавлен 12.08.2009

  • Создание базы данных. Поиск, изменение и удаление записей. Обработка и обмен данными. Проектирование базы данных. Определение формул для вычисляемой части базы. Редактирование полей и записей. Формы представления информации, содержащейся в базе данных.

    курсовая работа [67,0 K], добавлен 23.02.2009

  • Одномерные и многомерные массивы, их инициализация. Создание новой базы данных "Пицца". Сортировка записей по стоимости заказа. Сохранение БД во внешний файл. Загрузка данных для принятия их к учету из файла. Редактирование записей в базе данных.

    контрольная работа [1,2 M], добавлен 20.09.2012

  • Синтаксис, типы данных, используемые в базе данных MySQL. Создание и удаление базы данных, создание таблицы и удаление таблицы, изменение ее свойств. Переименование, вставка и удаление столбцов, изменение их свойств. Обновление и поиск записей в таблице.

    лабораторная работа [641,7 K], добавлен 04.03.2010

  • Построение банков данных. Инструментальные средства баз данных Borland. Принцип работы и архитектура баз данных в Delphi. Навигационный способ доступа к базам данных: операции с таблицей, сортировка и перемещение по набору данных, фильтрация записей.

    курсовая работа [642,7 K], добавлен 06.02.2014

  • Основа концепции OLAP (On-Line Analytical Processing) – оперативной аналитической обработки данных, особенности ее использования на клиенте и на сервере. Общие характеристика основных требования к OLAP-системам, а также способов хранения данных в них.

    реферат [24,3 K], добавлен 12.10.2010

  • Назначение языка SQL. Операторы манипулирования данными. Группировка записей, объединение таблиц, многотабличные и вложенные запросы. Добавление, удаление, определение и обновление данных. Типы данных языка SQL. Методики проектирования, ER-моделирование.

    реферат [84,8 K], добавлен 15.12.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.