Характеристика технології оперативного аналітичного оброблення даних OLAP

Вивчення збору, зберігання й аналізу багатовимірних даних з метою підтримки процесів прийняття рішень. Основні засоби адміністрування On-Line Analytical Processing Services. Застосування реляційних систем управління базами даних. Призначення OLAP-систем.

Рубрика Программирование, компьютеры и кибернетика
Вид практическая работа
Язык украинский
Дата добавления 17.12.2014
Размер файла 389,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ЛЬВІВСЬКИЙ ІНСТИТУТ ЕКОНОМІКИ І ТУРИЗМУ

Індивідуальна робота

З дисципліни «Інформаційні системи в готельно-ресторанній справі»

«Характеристика технології оперативного аналітичного оброблення даних OLAP»

Підготувала:

студентка гр.МГРБ-11

Войцішевська Тетяна

Львів 2014

Вступ

Технологію оперативного аналітичного оброблення даних OLAP (OnLine Analytical Processing) було виокремлено як особливий підхід до оброблення даних у зв'язку з появою спеціальних засобів збереження та аналізу нагромаджених облікових даних. OLAP-програми являють собою сукупність засобів багатовимірного аналізу даних, накопичених у сховищі даних. Користувачу OLAP надається інтуїтивно зрозуміла модель даних, організована у вигляді багатовимірних кубів (Cubes). Осями -- вимірами (Dimensions) багатовимірної системи координат слугують основні атрибути аналізованого бізнес-процесу (наприклад, для процесу продажу -- товар, регіон, тип покупця). На перетинах вимірів знаходяться дані, що кількісно характеризують процес, -- міри (Measures) (наприклад, обсяги продажу, витрати). Значення, що відкладаються на осях кубу, називаються членами виміру (members). Члени виміру можуть утворювати ієрархії, що складаються з декількох рівнів. Наприклад, для виміру «Час» ієрархією може бути «Рік, квартали, місяці, тижні, дні».

Основна частина

On-Line Analytical Processing (OLAP) - технологія оперативної аналітичної обробки даних, що використовує методи і засоби для збору, зберігання та аналізу багатовимірних даних з метою підтримки процесів прийняття рішень.

У 1993 p. Е, Кодд опублікував статтю під назвою "OLAP для користувачів-аналітиків: яким він має бути". У цій роботі було запропоновано основні концепції оперативної аналітичної обробки і визначено вимоги, яким мають задовольняти продукти, що дають можливість виконувати оперативну аналітичну обробку. Він сформулював (у 1993 р.) 12 визначальних принципів OLAP. У 1995 р. до них було додано ще 6 принципів.

Усі вони розбиваються на такі групи:

1. Базові характеристики (багатовимірне подання даних, інтуїтивне маніпулювання даними, доступність, пакетне отримання даних, моделі аналізу OLAP, архітектура «клієнт-сервер», прозорість, багатокористувацька підтримка).

2. Спеціальні характеристики (оброблення ненормалізованих даних, збереження результатів OLAP, виокремлення відсутніх значень, ігнорування відсутніх значень у процесі аналізу).

3. Особливості подання звітів (гнучкість формування звітів, стандартна продуктивність, автоматичне налаштовування фізичного рівня).

4. Управління вимірами (універсальність вимірів, необмежена кількість вимірів і рівнів агрегації, необмежені операції між даними вимірів).

У комплект Microsoft SQL Server 7.0 входить повнофункціональний OLAP-сервер -- OLAP Services for SQL Server. Для об-слуговування запитів клієнтів сервер використовує спеціальний протокол взаємодії і мову запитів.

Основним засобом адміністрування OLAP Services є OLAP Manager, за допомогою якого адміністратор може створювати бази даних і будувати куби. У цьому процесі йому допомагає майстер Cube Wizard, що здійснює формування кубів із реляційних баз даних. Вибір технології збереження здійснюється за допомо-гою майстра Storage Designe Wizard. Для кожного куба адміністратор може вибрати будь-яку з трьох технологій збереження -- MOLAP, ROLAP або HOLAP.

MOLAP (Multidimensional OLAP) -- і детальні дані, і їхні агрегати зберігаються у багатовимірній БД. При цьому забезпечується велика продуктивність роботи, але збільшуються витрати пам'яті; MOLAP рекомендується використовувати, коли потрібний швидкий доступ до невеликого або середнього обсягу даних.

ROLAP (Relational OLAP) -- докладні дані зберігаються у реляційній БД; агрегати зберігаються у тій самій БД у спеціально створених службових таблицях. У цьому разі досягається економія пам'яті;

HOLAP (Hybrid OLAP) -- докладні дані зберігаються у реляційній БД, а агрегати -- у багатовимірній БД.

Служба OLAP Services дає змогу управляти правами доступу користувачів до кубів. Користувачі відповідно до їхніх імен ідентифікуються в Windows NT. Права видаються на куб цілком і можуть бути трьох видів: «читання», «читання-запис» та «адміністрування».

Наступна версія продукту Microsoft SQL Server 2000 Analysis Services, крім засобів побудови сховищ даних і OLAP, містить засоби Data Mining, нові засоби управління доступом до даних і безпекою, нові клієнтські утиліти для побудови і адміністрування багатовимірних сховищ і аналізу даних, а також надає можливос-ті для створення і адміністрування розподілених сховищ даних.

У ролі OLAP-клієнта OLAP Services може використовуватися Microsoft Excel 2000.Крім інструментальних OLAP-засобів, розробники пропонують прикладні системи OLAP, які можуть надбудовуватися над існуючими в організації обліковими системами.

Основне призначення OLAP-систем - підтримка аналітичної діяльності, довільних запитів користува-чів-аналітиків. OLAP є аналітичним інструментом і спочатку ґрунтувався на багатовимірних базах даних (ВБД). Вони сконструйовані спеціально для підтримки аналізу кількісних даних з численною кількістю вимірювань, містять дані у багатовимірному вигляді.

OLAP дає змогу організувати вимірювання у вигляді ієрархії. Дані представлені у вигляді гіперкубів (кубів) - логічних і фізичних моделей показників, що спільно використовують вимірювання, а також ієрархії у цих вимірюваннях. Деякі дані заздалегідь агреговані в БД, інші розраховуються відразу.

OLAP-куб містить базові дані та інформацію про вимірювання (агрегати). Куб потенційно містить всю інформацію, потрібну для відповідей на будь-які запити.

Засоби OLAP дають змогу досліджувати дані за різними вимірюваннями. Користувачі можуть вибирати, які показники аналізувати, які вимірювання і як відображати в крос-таблиці, поміняти рядки і стовпці, потім робити зрізи, щоб концентруватися на певній комбінації розмірностей. Можна змінювати деталізацію даних, рухаючись рівнями за допомогою деталізації та збільшення, а також крос-деталізацію через інші вимірювання.

Для підтримки ББД використовуються OLAP-сервери, оптимізовані для багатовимірного аналізу і які поставляються з аналітичними можливостями.

Нині реляційні СУБД застосовуються для емуляції ББД, вони підтримують багатовимірний аналіз.

Причина виникнення OLAP для обробки запитів - це передусім забезпечення швидкості дій. Реляційні БД зберігають сутності в окремих нормалізованих таблицях. Ця структура зручна для операційних БД (систем OLTP), але складні багатотабличні запити в ній виконуються повільно. Зручнішою моделлю для запитів є просторові БД.

Основне призначення OLAP-систем - підтримка інформаційно-аналітичної діяльності, тобто довільних запитів користувачів і аналітиків. Якщо системи регламентованої звітності відповідають на питання типу "Які сумарні витрати до-могосподарств у І кварталі 2007 р. на споживання товарів довготривалого користування?", то OLAP покликаний дати відповіді, скажімо, на питання: ''наскільки треба забезпечити зростання темпів підвищення кінцевих споживчих витрат державного сектору на індивідуальне споживання, щоб перевершити темпи його витрат на колективне споживання у півтора раза?" Мета OLAP-аналізу - перевірка потенційних гіпотез. база даних адміністрування olap

Аналізуючи макропоказник, наприклад, виконання місцевих бюджетів, генерується звіт, що визначає показники конкретного району, регіону у певний момент часу. Таким чином, обсяг даних може бути представлений у вигляді тривимірного куба (Додаток 1), грані якого - це масиви даних за показниками, регіонами і часом.

У процесі аналізу кожний факт розглядають як функцію від його характеристик. Сукупність цих характеристик може бути подана у вигляді моделі даних - багатовимірного куба. Осями багатовимірної системи координат слугують основні атрибути бізнес-процесу, що досліджується. Кожний з масивів даних може містити не просто перелік значень, а набір дерев, або ієрархію значень, де верхнє значення ієрархії розкривається даними, що знаходяться нижче.

За визначенням, запропонованим Б. Коддом, багатовимірне концептуальне представлення (multi-dimensional conceptual view) - це множинна перспектива, що складається з кількох незалежних вимірювань, уздовж яких можуть бути проаналізовані визначені сукупності даних. Одночасний аналіз за кількома вимірюваннями визначається як багатовимірний аналіз.

Кожне вимірювання може бути представлене у вигляді ієрархічної структури, а деякі вимірювання можуть мати декілька видів ієрархічного представлення. На перетинах осей вимірювань (Dimensions) розташовуються дані, що кількісно характеризують аналізовані факти, - міри (Measures).

У кожному кубі обов'язково присутня ієрархія часу. На верхньому рівні розташовані роки, потім - квартали, місяці, Дні.

Користувач може розрізати куб за різними напрямками і отримувати зведені відомості. Значення, щофіксуються вздовж вимірів, називаються членами виміри. Члени виміру використовуються як для розрізування куба, так і для фільтрації даних. Значення членів виміру відображаються у двовимірному представленні куба як заголовки рядків і стовпців.

Над гіперкубом можуть виконуватися такі операції:

o зріз (Slice) - формується підмножина багатовимірного масиву даних. Якщо розглядати термін "зріз" з позиції кінцевого користувача, то найчастіше його роль виконує двовимірна проекція куба;

o обертання (Rotate) - зміна розташування вимірювань, представлених у звіті або на сторінці, що відображається. Операція обертання може полягати в перестановці місцями рядків і стовпців таблиці або переміщенні вимірювань у стовпці чи рядків створюваного звіту, що дозволяє надавати йому бажаного вигляду. Крім того, обертанням куба даних є переміщення вимірювань, які не входять до складу таблиць, на місце вимірювань, представлених на сторінці, що відображається, і навпаки (вимірювання, що не є табличним, стає новим вимірюванням рядка чи вимірюванням стовпця);

o консолідація (Drill Up) і деталізація (Drill Down) - операції, які визначають перехід вгору за напрямом від детального (down) представлення даних до агрегованого (up) і навпаки, відповідно. Напрям деталізації (узагальнення) може бути задано як за ієрархією окремих вимірювань, так і згідно з іншими відношеннями, встановленими у межах вимірювань.

Є 12 правил, що визначають OLAP, згідно із концепцією Б. Кодда.

1. Багато вимірність - OLAP-система на концептуальному рівні має представляти дані у вигляді багатовимірної моделі, що спрощує процеси аналізу і сприйняття інформації.

2. Прозорість - це спосіб організації даних, джерела, засоби обробки і зберігання.

3. Доступність - OLAP-система має надавати користувачу єдину, узгоджену і цілісну модель даних, забезпечуючи доступ до даних незалежно від того, як і де вони зберігаються.

4. Постійна продуктивність при розробленні звітів - продуктивність OLAP-систем не має дуже зменшуватися при збільшені кількості вимірювань, за якими виконується аналіз.

5. Клієнт-серверна архітектура - OLAP-система має бути здатна функціонувати у клієнт-серверному середовищі, оскільки більшість даних, які потрібно обробляти, зберігається децентралізовано. Серверний компонент інструменту OLAP має бути достатньо інтелектуальним і дозволяти будувати загальну концептуальну схему на основі узагальнення й консолідації різних логічних і фізичних схем корпоративних БД для забезпечення ефекту прозорості.

6. Рівноправність вимірювань - OLAP-система має підтримувати багатовимірну модель, в якій усі вимірювання рівноправні. За необхідності додаткові характеристики можуть бути надані окремим вимірюванням, але така можливість має бути надана будь-якому вимірюванню.

7. Динамічне управління розрідженими матрицями - OLAP-система має забезпечувати оптимальну обробку розріджених матриць. Швидкість доступу повинна зберігатися незалежно від розташування осередків даних і бути постійною величиною для моделей, що мають різну кількість вимірювань і різний ступінь розрідженості даних.

8. Підтримка розподіленого режиму доступу - OLAP-система має надавати можливість працювати кільком користувачам спільно з однією аналітичною моделлю або створювати для них різні моделі з єдиних даних. При цьому можливі усі операції.

9. Підтримка перехресних операцій - OLAP-система мас забезпечувати збереження функціональних відношень, описаних за допомогою певної формальної мови між осередками гіперкуба при виконанні будь-яких операцій зрізу, обертання, консолідації або деталізації. Система має автоматично виконувати перетворення встановлених відношень, не вимагаючи від користувача їх перевизначення.

10. Інтуїтивна маніпуляція даними - OLAP-система має надавати спосіб виконання операцій зрізу, обертання, консолідації і деталізації над гіперкубом без необхідності для користувачів здійснювати дії з інтерфейсом. Вимірювання, визначені в аналітичній моделі, мають містити всю необхідну інформацію для виконання операцій.

11. Гнучкі можливості отримання звітів - OLAP-система має підтримувати різні способи візуалізації даних, тобто звіти мають подаватися у будь-якому можливому вигляді.

Подання даних, що завантажуються з реляційної або багатовимірної БД на ПК клієнта (Додаток 2).

JOLAP - колективна OLAP-API-ініціатива, що базується на Java, призначена для створення й управління даними і мета-даними на серверах OLAP.

Висновок

Системи на основі OLAP дають змогу аналітикам і менеджерам, які потребують оперативного прийняття рішень, досягти розуміння процесів, що відбуваються на підприємстві, шляхом швидкого інтерактивного доступу до даних у сховищі і виконання над ними різноманітних аналітичних операцій: зрізів, поворотів, згорток, розгорток, проекцій тощо. OLAP-операції над даними організовано так, щоб відобразити різні аспекти діяльності підприємства, наприклад:

* базовий рівень або зведення даних, наприклад, загальна сума продажу по регіону за певний період;

* зрізи даних, що стосуються певного періоду в минулому і поточного часу;

* агрегування даних за певною ознакою (наприклад, за видами товарів) і можливість у режимі діалогу пересуватися по рівнях агрегації;

* похідні дані, що підраховуються на базі збережуваних даних, (наприклад, різниця між фактичним і запланованим показником).

Список використаної літератури

1. Ситник В.Ф. та ін. Основи інформаційних систем. Навч. посібник / Ситник В.Ф., Писаревська Т.А., Єрьоміна Н.В., Краєва О.С.; за ред. В.Ф. Ситника. К.: КНЕУ, 1997.

2. Скибінський С.В., Іванова Л.О., Моргун О.Ф. Маркетинг готельних послуг. Львів, 2000.

3. Джерела Internet: www.google.com і ін.

Додаток 1

Рис. 1 OLAP-Куб

Додаток 2

Рис. 2 Схема інформаційно-аналітичної системи з OLAP-сервером

Размещено на Allbest.ru


Подобные документы

  • Основа концепции OLAP (On-Line Analytical Processing) – оперативной аналитической обработки данных, особенности ее использования на клиенте и на сервере. Общие характеристика основных требования к OLAP-системам, а также способов хранения данных в них.

    реферат [24,3 K], добавлен 12.10.2010

  • Використання баз даних та інформаційних систем. Поняття реляційної моделі даних. Ключові особливості мови SQL. Агрегатні функції і угрупування даних. Загальний опис бази даних. Застосування технології систем управління базами даних в мережі Інтернет.

    курсовая работа [633,3 K], добавлен 11.07.2015

  • Фундаментальне наукове поняття інформації, опис її форм існування і класифікація за різними критеріями. Наукова обробка документів як сукупність процесів аналізу і синтезу. Огляд поширених систем управління базами даних, їх порівняльна характеристика.

    дипломная работа [2,0 M], добавлен 17.06.2013

  • Поняття бази даних та основне призначення системи управління. Access як справжня реляційна модель баз даних. Можливості DDE і OLE. Модулі: Visual Basic for Applications програмування баз даних. Система управління базами даних Microsoft SQL Server 2000.

    реферат [41,2 K], добавлен 17.04.2010

  • Вечное хранение данных. Сущность и значение средства OLAP (On-line Analytical Processing). Базы и хранилища данных, их характеристика. Структура, архитектура хранения данных, их поставщики. Несколько советов по повышению производительности OLAP-кубов.

    контрольная работа [579,2 K], добавлен 23.10.2010

  • Сущность OnLine Analytical Processing (OLAP). Классификация OLAP-продуктов по способу хранения данных и месту нахождения OLAP-машины. Создание приложения с помощью клиентского инструментального средства. Принципы построения ядра системы анализа данных.

    курсовая работа [275,8 K], добавлен 19.07.2012

  • Порівняльна характеристика систем зберігання даних MaxTronik i Qsan, дослідження їх структури й принципу роботи. Типи носіїв даних. Інтерфейси систем зберігання даних та причини їх втрати. Технологія та рівні RAID. Особливості продуктів MaxTronic та Qsan.

    курсовая работа [1,6 M], добавлен 20.11.2014

  • Області застосування і реалізації інформаційних систем, вимоги до них. Призначення та класифікація систем управління базами даних. Основні достоїнства мови SQL. Програмний код додатку. Створення база даних "Мебельний магазин". Лістинг даної програми.

    курсовая работа [747,0 K], добавлен 19.04.2015

  • Розгляд процесу автоматизації бази даних для довідника астронома. Основи реляційних баз даних для проектування інформаційних систем. Застосування тригерів для забезпечення цілісності даних і реалізації складної бізнес–логіки в системних процедурах.

    курсовая работа [22,3 K], добавлен 12.03.2019

  • Електронна база даних як послідовність даних заданої структури, записана на магнітний диск комп'ютера, її типи, основні та невід'ємні властивості. Призначення та оцінка можливостей системи управління. Моделі даних та головні принципи їх функціонування.

    презентация [352,2 K], добавлен 04.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.