Інформаційна технологія багатоверсійного представлення та керування базами даних інформаційних систем

Вивчення методів підвищення ефективності процесу модернізації інформаційних систем (скорочення простоїв ІС, розміру бази даних, запобігання втраті даних) шляхом розробки моделей керування і інформаційної технології багатоверсійного представлення.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 27.08.2015
Размер файла 49,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ

УДК 004.652:004.658

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ

БАГАТОВЕРСІЙНОГО ПРЕДСТАВЛЕННЯ ТА Керування

Базами ДАНИХ ІНФОРМАЦІЙНИХ систем

05.13.06 -- Інформаційні технології

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

ТРОФИМОВ Борис Федорович

Одеса -- 2009

Дисертацією є рукопис.

Робота виконана в Одеському національному політехнічному університеті Міністерства освіти і науки України.

Науковий керівник кандидат технічних наук, Малахов Євген Валерійович, Одеський національний політехнічний університет, завідувач кафедри інформаційних систем в менеджменті.

Офіційні опоненти: доктор технічних наук, професор Антощук Світлана Григорівна, Одеський національний політехнічний університет, директор інституту комп'ютерних систем, завідувач кафедри інформаційних систем;

доктор технічних наук, професор Філатов Валентин Олександрович, Харківський національний університет радіоелектроніки, професор кафедри штучного інтелекту.

Захист відбудеться 21 січня 2010 року о 1330 на засіданні спеціалізованої вченої ради Д 41.052.01 в Одеському національному політехнічному університеті за адресою 65044, м. Одеса, проспект Шевченка, 1, ауд. 400-А.

З дисертацією можна ознайомитись в бібліотеці Одеського національного політехнічного університету за адресою: м. Одеса, проспект Шевченка, 1.

Автореферат розісланий 19 грудня 2009 р.

Вчений секретар

спеціалізованої вченої ради Ю. С. Ямпольський

АНОТАЦИИ

Трофимов Б.Ф. Інформаційна технологія багатоверсійного представлення та керування базами даних інформаційних систем. -- Рукопис. інформаційний модернізація керування

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 -- Інформаційні технології -- Одеський національний політехнічний університет, Одеса, 2009.

Метою дослідження є підвищення ефективності процесу модернізації ІС (скорочення простоїв ІС, розміру БД, запобігання втраті даних) шляхом розробки моделей, методів і інформаційної технології багатоверсійного представлення та керування БД.

У роботі запропоновані аналітична модель схеми даних; метод визначення коректності схем даних; аналітична модель реляційної бази даних з багатоверсійною структурою; метод представлення даних реляційного відношення в різних версіях БД; методика модернізації ІС, що дозволило вирішити завдання скорочення простоїв ІС, розміру БД, запобігання втраті даних при модернізації ІС. На основі запропонованих моделей і методів побудована технологія багатоверсійного представлення та керування БД. Для оцінки ефективності технології розроблені показники відносних змін розміру БД та сумарної продуктивності ІС. За результатами експериментального оцінювання отримано підтвердження ефективності запропонованої технології на практиці.

Ключові слова: супроводження бази даних, модернізація інформаційних систем, схема даних, багатоверсійні бази даних, реляційні бази даних, реляційна алгебра.

Trofimov B.F. Informational technology for database multi-version presentation and control of informational systems. - Manuscript.

Thesis for obtaining the Candidate of Technical Science degree in specialty 05.13.06. - Informational technologies - Odessa National Polytechnic University, Odessa, 2009.

The goal of this research is to increase efficiency of the process of informational systems (IS) upgrading (reduction of IS down-time and database size, prevention of data loss) by developing models, methods and informational technology of database multi-version presentation and control.

There have been developed the analytical model of data scheme; the method of ascertaining the correctness of data schemes; the analytical model of relational database with multi-version structure; the method of relational data presentation in different database versions; technique of IS upgrading which solves the task of reducing IS downtime, database size, and of preventing data loss in the process of informational systems upgrading. The informational technology of database multi-version presentation and control is based on the models and methods suggested in the thesis. To assess the efficiency of the technology, indexes of relative database size change and relative summary performance have been developed. According to the results of the carried out experiment the suggested technology has been proven effective in practice.

Keywords: database maintenance, upgrading of informational systems, data scheme, multiversion databases , relational databases, relational algebra.

Трофимов Б.Ф. Информационная технология многоверсионного представления и управления базами данных информационных систем. -- Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 -- Информационные технологии -- Одесский национальный политехнический университет, Одесса, 2009.

Целью исследования является повышение эффективности процесса модернизации ИС (сокращение простоев ИС, размера БД, предотвращение потери данных) путем разработки моделей, методов и информационной технологии многоверсионного представления и управления БД.

Для повышения эффективности процесса модернизации ИС предложено использовать многоверсионное представление структуры БД для предоставления доступа к одним и тем же данным в соответствии с особенностями разных версий структуры БД.

Для моделирования версионных структур данных предложены аналитическая модель схемы данных на основе теоретико-множественного подхода, а также сценарии управления моделью. Введено понятие корректности схем и разработан метод определения корректности схем данных на основе анализа ориентированных циклов в орграфе.

Для представления реляционных БД с многоверсионной структурой предложено развитие традиционной модели БД на основе разработанной модели схемы данных. Для управления БД предложены сценарии, включающие модификацию как данных, так и структуры БД. Для разделения данных межу версиями БД разработан метод представления реляционного отношения в разных версиях БД. На основе модели, сценариев и метода представления реляционного отношения предложена методика модернизации ИС, которая позволила достичь сокращения простоев ИС, размера БД, предотвращения потери данных во время модернизации ИС.

На основе разработанных моделей и методов построено алгоритмическое и программное обеспечение информационной технологии многоверсионного представления и управления БД ИС. Предложены показатели относительного изменения размера БД и суммарной производительности ИС.

Теоретические та практические результаты были использованы при разработке и модернизации информационных систем онлайн-торговли на рынке FOREX для дилингового центра «Off-club», что позволило уменьшить размер БД на 50.1 %, повысить производительность работы ИС на 45,8 %, а также торговой сети магазинов одежды «Triumph», что позволило уменьшить размер БД на 49.3 %, сократить время простоев на 29,5 % и повысить производительность работы ИС на 20,3 %.

Ключевые слова: сопровождение базы данных, модернизация информационных систем, схема данных, многоверсионные базы данных, реляционные базы данных, реляционная алгебра.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Під час життєвого циклу інформаційної системи (ІС) вимоги до неї не є постійними, а еволюціонують під впливом змін як у предметній області, так і у вимогах замовника. Тому процес супроводження ІС включає не лише підтримку її працездатності, а і періодичну модернізацію. Складність процесу модернізації обумовлена ризиком нестабільної поведінки нових версій ІС.

Аналіз пов'язаних з модернізацією чинників ризику показав, що внесення до структури бази даних (БД) необоротних змін є основною причиною ускладнень під час впровадження нової версії, або відновлення стабільної версії ІС у разі виявлення критичної помилки. Використання існуючих способів керування БД в рамках технологій автоматизації модернізації ІС призводить до того, що примусове повернення резервної копії БД спричиняє втрату даних, що накопичилися, тоді як запобігання їх втраті призводить до збільшення розміру БД, зниження продуктивності та суттєвого підвищення часу простоїв ІС. Тоді як згідно із статистичним дослідженням американської компанії Infanetics, середній час простою ІС середнього розміру складає 6 % часу її роботи, а за даними компанії мобільного зв'язку «Скай Линк» одна хвилина простою ІС коштує від 7 тис. у.о.

Для підвищення ефективності процесу модернізації, тобто зменшення розміру БД, збільшення продуктивності та скорочення простоїв ІС, запропоновано використовувати багатоверсійне представлення структури БД для надання доступу до одних і тих же даних згідно з особливостями різних версій структури БД. Це дозволить усунути вплив пов'язаних з модернізацією чинників ризику та надасть можливість автоматизувати процес керування БД під час модернізації. Тому розробка моделей, методів, інформаційних технологій багатоверсійного представлення та керування БД є актуальним науково-технічним завданням.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційне дослідження виконано відповідно до планів Міністерства освіти і науки України щодо розробки інформаційних керуючих систем та програмних інформаційних технологій. У рамках цих планів робота виконувалася відповідно до планів НДР № 556-68 «Використання методів та моделей у підтримці прийняття рішень при керуванні виробничо-господарськими об'єктами» та НДР № 626-68 «Дослідження моделей предметних областей в системах управління якістю інтелектуальної продукції» (номер держ. реєстрації 0106U01372).

Мета і задачі дослідження. Метою дослідження є підвищення ефективності процесу модернізації ІС шляхом розробки моделей, методів і інформаційної технології багатоверсійного представлення та керування БД.

Для досягнення поставленої мети необхідно вирішити наступні задачі:

- провести аналіз недоліків існуючих моделей, методів, технологій, пов'язаних з модернізацією ІС, визначити напрями їх усунення;

- розробити аналітичну модель схеми даних для багатоверсійного представлення довільних елементів та функціональних залежностей між ними.

- розробити аналітичну модель багатоверсійної реляційної БД для визначення версій структури реляційної БД;

- розробити метод представлення реляційного відношення в різних версіях БД для визначення методики модернізації ІС;

- розробити інформаційну технологію багатоверсійного представлення та керування базами даних на основі моделі багатоверсійного представлення БД та методів представлення реляційного відношення в різних версіях БД;

- розробити показники оцінки ефективності запропонованої технології.

Об'єктом дослідження є процес модернізації інформаційних систем.

Предмет дослідження - методи, моделі, інформаційні технології багатоверсійного представлення та керування БД.

Методи дослідження - методи загальної теорії задач при аналізі процесу модернізації ІС; методи теорії формальних алгебр, теорії множин - при розробці аналітичної моделі схеми даних; методи теорії графів, математичної логіки - при розробці методу визначення коректності схем даних; методи реляційної алгебри - при розробці аналітичної моделі багатоверсійної БД та методу представлення реляційного відношення між версіями БД; методи об'єктно-орієнтованого моделювання та програмування - при розробці програмного забезпечення запропонованої технології; методи математичної статистики - при розробці показників оцінки ефективності.

Наукова новизна одержаних результатів полягає у розвитку теоретичних основ представлення та керування базами даних. У дисертаційній роботі були отримані наступні нові наукові результати:

- вперше розроблено аналітичну модель схеми даних на основі теоретико-множинного підходу та теорії алгебраїчних систем, яка відрізняється від існуючих моделей багатоверсійним представленням довільних елементів та функціональних залежностей між ними, що дозволило отримати єдиний підхід до представлення різних версій схеми даних;

- вперше розроблено метод визначення коректності схем даних на основі аналізу орієнтованих циклів в орграфі, який забезпечив перевірку можливості обчислення схеми даних за час, пропорційний кількості елементів схеми даних;

- одержала подальший розвиток аналітична модель реляційної бази даних на основі запропонованої моделі схеми даних у поєднанні з реляційною моделлю даних, що дозволило забезпечити багатоверсійне представлення структури БД, а також скоротити удвічі розмір багатоверсійної БД в порівнянні з її представленням у вигляді незалежних версій;

- вперше розроблено метод представлення реляційного відношення у різних версіях БД, що дозволило визначити методику модернізації ІС для скорочення простоїв та запобігання втраті даних БД.

Практичне значення одержаних результатів. У роботі отримано наступні практичні результати:

- на основі розробленої аналітичної моделі схеми даних запропоновано багатоверсійні моделі віртуальних файлових систем, ієрархічних даних на основі мови XML, реляційної БД;

- на основі методу визначення коректності схеми розроблено алгоритм, який забезпечує перевірку коректності схеми даних за час, пропорційний кількості її елементів;

- розроблено методики розділення даних між версіями в реляційній БД, які дозволили вирішити задачу створення та перетворення даних між фізичним та логічним рівнями БД;

- на основі запропонованих моделей, методів і алгоритмів побудовано інформаційну технологію, що дозволила вирішити важливе науково-технічне завдання підвищення ефективності процесу модернізації ІС.

Теоретичні та практичні результати були використані у розробці та модернізації ІС онлайн-торгівлі на ринку FOREX для дилінгового центру «Off-club» (акт впровадження від 08.03.2008р.), що дозволило зменшити розмір БД на 50,1 %, збільшити продуктивність роботи ІС на 45,8 %, а також ІС торговельної мережі магазинів одягу «Triumph» (акт впровадження від 04.07.2008р.), що дозволило зменшити розмір БД на 49,3 %, скоротити час простою на 29,5 % та збільшити продуктивність роботи ІС на 20,3 %.

Особистий внесок здобувача. Основні положення, що виносяться на захист, отримані автором особисто. В роботах, опублікованих у співавторстві, здобувачу належать: у [3,6,7,9] аналітична модель схем даних; у [7,9] - метод визначення коректності схеми даних і метод представлення даних між версіями; у [1,5] - ефективність вживання RPC (Remote Procedure Calling) при роботі із системами управління БД для підвищення швидкості обробки даних; у [2] проведений аналіз технології ORM (Object Relation Mapping) для реалізації програмного забезпечення інформаційної технології; у [8] - модель багатоверсійного представлення структури БД. В [4] здобувачем самостійно запропоновано інформаційну технологію багатоверсійного представлення та керування БД.

Апробація результатів дисертації. Наукові результати і основні положення дисертаційної роботи докладалися і обговорювалися на міжнародних конференціях і семінарах: «Научные исследования и их практическое применение. Современное состояние и пути развития» (Одесса, 23-25 сент. 2006); «Інформаційні технології в навчальному процесі» (Одеса, 17-19 квіт., 2007); «Сучасні інформаційні і електронні технології» (Одеса, 19-23 трав. 2008); «Проблеми й перспективи розвитку IT-індустрії в Україні» (Харків, 18-19 лист. 2009); «Информатика и компьютерные технологии» (Донецк, 24-26 нояб., 2009).

Публікації. За результатами досліджень опубліковано 9 наукових праць, у тому числі чотири статті у виданнях, включених до переліку наукових фахових видань, що затверджує ВАК України, п'ять - у збірниках наукових праць конференцій.

Структура дисертації. Дисертація складається зі вступу, чотирьох розділів, висновків, описаних на 140 сторінках основного машинописного тексту, списку використаних джерел (104 найменування). Робота містить 31 рисунок, 3 таблиці, 4 додатки.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність вибраного напрямку досліджень, сформульовані мета і задачі дослідження, наукова новизна і практична цінність роботи. Вказано дані про особистий внесок автора, апробацію результатів дослідження і зв'язок з науковими програмами.

У першому розділі проведено аналіз ІС та її типових функціональних компонентів, що включають програмний інтерфейс обробки даних (ПІОД), БД та систему управління БД (СУБД).

Проаналізовано основні моделі життєвого циклу ІС. Обґрунтовано важливість і необхідність процесу модернізації ІС як одного з етапів її життєвого циклу.

Розроблено інформаційну модель життєвого циклу модернізації (ЖЦМ) ІС як ітераційного процесу кожна ітерація якого включає в загальному випадку чотири стадії: впровадження нової версії ІС, активне використання нової версії ІС, відновлення до стабільної версії ІС у разі виявлення критичної помилки, активне використання стабільної версії ІС при очікуванні нової версії.

На підставі аналізу існуючих технологій автоматизації модернізації ІС (IBM WebSphere Process Server, Eclipse OSGi framework, Oracle Backup Manager, Handy Backup, та інші) выявлено, що під час третьої стадії ЖЦМ (у разі виявлення помилок в ПІОД чи невідповідності ІС технічному завданню) виникаючі проблеми пов'язані з незворотними змінами у структурі БД. Це затримує прозоре відновлення до попередньої версії БД. Встановлено, що технології автоматизації модернізації ІС у більшості випадків використовують один з двох способів керування БД:

- Спосіб відкоту - перед модернізацією БД зберігається її резервна копія. В разі критичної зупинки ІС відбувається повернення до попередньої версії ПІОД і резервної копії БД. Недоліки: втрата накопичених в новій версії БД даних, зупинки ІС при відновленні втрачених даних, збільшення розміру БД.

- Спосіб розпаралелювання - ведеться синхронна паралельна робота з обома версіями ІС. Всі введені в ІС дані синхронізуються між її версіями вручну. У разі критичної зупинки нової версії ІС робота із її попередньою версією не уривається. Недоліки: необхідність додаткових ресурсів та часу для синхронного введення даних, ризик неузгодженості введених користувачем даних між версіями ІС, збільшення розміру БД.

Для усунення недоліків обох способів запропоновано використовувати багатоверсійне представлення структури БД для надання доступу до тих самих даних згідно з особливостями різних версій структури БД. На підставі аналізу відповідних робіт (Catharine M. Wyss, Claudia Medeiros, Talel Abdessalem, Young-Gook Ra, K. A. Ross та інші) зроблено висновки про відсутність формальної моделі реляційної БД з багатоверсійною структурою та метода представлення реляційного відношення у різних версіях БД. Запропоновано розробити таку модель та такий метод на основі моделі схеми даних.

У другому розділі розроблено моделі і методи представлення та керування схемами даних. Визначено аналітичну модель схеми даних (АМСД), яка встановлює єдиний підхід до багатоверсійного представлення довільних елементів та функціональних залежностей між ними, а також запропоновано сценарії керування схемами даних. Для представлення інформації в схемі даних запропоновано використовувати теоретико-множинний підхід.

Введено наступні позначення: множину параметрів-змінних довільного вираження w позначено через /w/; функцію відображення елементів з деякої множини А в множину C позначено через IA?C, тоді IA?А - тотожна функція відображення з А в А.

Визначення 1. Нехай надано множини елементів Ai та операцій Gi такі, що <Ai, Gi> утворюють алгебри, при i=1..n; I={IАi?Aj}- множина заданих функцій відображення з Ai в Aj. Тоді аналітичною моделлю схеми даних (далі схемою) запропоновано називати кінцеву множину s, таку що:

де <ai,bi> - елемент схеми з ім'ям ai та значенням bi при

ai - довільний ідентифікатор, для якого виконується вимога унікальності: не існує двох елементів в схемі з однаковими ідентифікаторами;

при

vi - константа, vA1An ;

fi - формула, побудована над множиною операцій та функцій відображення IG1...Gn, aij{ a1,…, ad} при j=1..hi, hi - кількість аргументів fi.

Визначення 2. Множина усіх потенційно побудованих схем над зафіксованими параметрами A1...An , G1...Gn , {IAi?Aj} називається класом схем і позначається через:

MS({A1...An},{G1...Gn },{IAi?Aj}).

Визначення 3. Нехай надана довільна множина А. Тоді елементарною схемою називається спеціальний вид схем з класу MS({A},{},{}); клас MS({A}, {},{}) називається класом елементарних схем та позначається через S(A). Кожна елементарна схема має вигляд s={<a1,v1>, <a2,v2>,..., <ad,vd>}, де viА, i=1..d.

Для схеми з (2) запропоновано метод її обчислювання в елементарну схему за деяким предикатом P, заданий у вигляді функції відображення IP,MS?S , яку далі названо функцією інтерпретування.

Визначення 4. Версією елемента а схеми s називається елемент a'?s, у якого a/a'/. Нехай надано a1,...,an ? s, такі, що ai+1 є версія ai. Тоді в схемі s можливо зберігати всю історію змін довільного елемента a1 із значенням v за допомогою деяких функцій перетворення f1 ,.., fn-1 у вигляді його версій:

s={ <a1 , v>, <a2 , f1(a1)>,..., <ai , fi-1(a1 ,...,ai-1)>,..., <an , fn-1(a1 ,...,an-1)>}.

Для оперування елементами класів схем і елементарних схем визначено множини операцій. До операцій F над класом схем належить операція додавання елемента в схему (ADD), операція видалення елемента зі схеми (DEL), операція перейменування елемента (RENAME), операція зміни вираження в елементі схеми (CHANGE). До операцій H над класом елементарних схем належать теоретико-множинні операції об'єднання, пересічення, віднімання, а також операція вибірки елементів з елементарної схеми за деяким предикатом (GET).

Для представлення функціональних залежностей між схемами запропоновано клас схем на основі (2) із зазначеними параметрами:

MS({MS', S'}, {F,H},{IMS'?S'}),

де MS'=MS({A1...An},{G1...Gn },{IAi?Aj}); S'=S(An); A1...An, G1...Gn, {IAi?Aj} - зафіксовані множини. Схеми класу (3) далі називатимуться гіперсхемами, а власно клас (3) - класом гіперсхем.

Для керування АМСД на основі операцій F та H запропоновано наступні сценарії:

- модифікація даних в схемі: додавання, редагування, видалення, скорочення елементів схеми;

- робота з версіями елементів схеми: створення версії, редагування версії, видалення версій елементу, спрощення та скорочення версії.

Визначення моделі АМСД та сценаріїв її керування дозволило представити в аналітичному вигляді схеми даних, історію змін елементів схем даних, залежності між схемами даних за допомогою відповідних операцій.

Визначення 5. Нехай надано гіперсхеми s та s' з (2) для деяких зафіксованих параметрів A1...An , G1...Gn , {IAi?Aj}. Гіперсхема s еквівалентна s' за деяким предикатом P, якщо IP,MS?S(s)=IP,MS?S(s').

Визначення 6. Висотою гіперсхеми s називається довжина максимальної послідовності елементів a1,...,an з s, де ai+1 є версією ai.

Розглянуто підклас гіперсхем з висотою, що дорівнює 2 (дворівневі гіперсхеми). Доведено, що для будь-якої довільної гіперсхеми існує еквівалентна їй дворівнева гіперсхема.

Визначення 7. Функція f(x) називається визначеною для зафіксованого аргументу x, якщо алгоритм її обчислювання завжди завершується за кінцевий час. Функція f(x) називається обчисленою на зафіксованому аргументі x, якщо вона визначена на x та існує її значення на x.

Визначення 8. Схема s називається коректною, якщо функція інтерпретування IP,MS?S обчислена на s. Схема s називається слабо-коректною, якщо функція інтерпретування IP,MS?S визначена на s.

Над множиною слабо-коректних схем побудовано числення схем, в якому кожна схема є теоремою тоді і тільки тоді, коли вона слабо-коректна.

Проведено класифікацію помилок, які є причиною порушення коректності схем з класу (2):

- помилки 1-го роду: для схеми s існує послідовність елементів a1,...,an, таких, що ai є версією a((n+i-2) mod n)+1 ;

- помилки 2-го роду: для схеми s ais такий, що зв'язана з ним формула застосовує операцію з множини {G1...Gn} або функцію інтерпретування з множини {IAi?Aj}, яка не може бути визначена на s;

- помилки 3-го роду: для схеми s ais такий, що формула ai є визначеною при обчислених параметрах з /ai/.

Побудовано метод визначення коректності схем, який базується на зведенні до задачі визначення орцикла в орграфі. Для цього запропоновано методику побудови орграфу для будь-якої схеми з (2). Для визначення орцикла в орграфі <V,E> запропоновано модифікацію метода часового моделювання. У якості вузлової функції вибрана функція кон'юктивності вхідних до вузла xjV сигналів f(eij):

, eijE.

Показано, що відсутність орциклів в орграфі зв'язана с істинністю

де xj - вершини, у яких множина вихідних з вузла ребер пуста.

В рамках методу доведено дві наступні теореми щодо визначення коректності схем.

Теорема 1. Нехай надано підмножину схем S з класу схем (2) із зафіксованими параметрами A1...An , G1...Gn , {IAi?Aj}, у якій будь-яка sS не містить помилок 2-го роду. Схема sS слабо-коректна тоді і тільки тоді, коли не містить помилок 1-го роду.

Наслідок 1. Слабо-коректна схема s?S може містити помилки 3-го роду.

Наслідок 2. Схема sS коректна тоді і тільки тоді, коли вона слабо-коректна і не містить помилок 3-го роду.

Теорема 2. Схема з (2) містить помилку 1-го роду тоді і тільки тоді, коли відповідний їй орграф містить орцикл.

На основі запропонованого методу визначення корректності схеми побудовано алгоритм, час виконання якого пропорційний кількості елементів схеми.

На основі моделі АМСД наведено приклади використання багатоверсійних моделей файлових систем та ієрархічної моделі даних на основі мови XML.

У третьому розділі отримала подальший розвиток аналітична модель реляційної БД із підтримкою багатоверсійного представлення структури БД.

У рамках цієї моделі формули реляційних відношень визначено за допомогою операцій алгебри Кодда:

О={р, у, г, x, б},

де р, у, г, x, б - операції відповідно: проекції, вибірки, групування, агрегації та об'єднання.

Недоліком моделі (4) є неможливість представлення БД з декількома версіями структури . Тому в роботі запропоновано розвиток (4) на основі розробленої моделі АМСД (1).

Введено наступні позначення: SIG - множина усіх потенційних сигнатур реляційних відношень (РВ); R - множина усіх потенційних РВ над SIG; R0 - підмножина РВ R, у яких множина кортежів є пустою; ISIG-R0 : SIG>R0 - функція відображення сигнатури з SIG в елемент з R0.

Запропоновано розширення множини реляційних операцій O (5) над R:

O'={a, u, r, as, us, rs, cs},

де a, u, r, as, us, rs, cs - операції відповідно: додавання кортежу, редагування кортежу, видалення кортежу, додавання поля до сигнатури РВ, перейменування назви поля в сигнатурі РВ, видалення поля з сигнатури РВ, копіювання поля сигнатури з одного РВ в інше.

Версію структури даних БД запропоновано представити у вигляді схеми даних з класу схем (2) з визначеними параметрами R, SIG, O??O', ISIG?R0:

MS'=MS({R,SIG},{O?O'},{ISIG?R0 }).

На основі (5), (6), (7) модель БД із підтримкою багатоверсійної структури БД запропоновано представити у вигляді гіперсхеми з класу гіперсхем (3):

MS''=MS({MS',S'},{F,H},{IP',MS'?S'}),

де S'=S(R), P' - побудований предикат.

У роботі показано, що модель з (8) є розширенням існуючої моделі (4). Показано, що БД на основі (8) погоджена тоді і тільки тоді, коли її гіперсхема є коректною.

Сформульовано принцип ітеративної модифікації БД, відповідно до якого довільну зміну в структурі будь-якої версії БД запропоновано виділяти в окрему версію БД.

В рамках (8) на основі сценаріїв керування АМСД та принципу ітеративної модифікації формалізовано основні сценарії керування БД, такі як: читання даних з БД, модифікація кортежів РВ в БД, модифікація структури БД, робота з версіями БД.

Читання даних з БД. Будь-яка інформація про кортежі РВ в БД b відповідно до визначення представлена у вигляді формул. Для отримання кортежів РВ необхідне інтерпретування b в елементарну схему. Сценарій читання даних для деякого РВ представлено формулою:

b'=GET(IP',MS''?S(S(R))(b),P),

де P - предикат ідентифікації РВ, IP',MS''?S(S(R)) - запропонована функція інтерпретування, b' - елементарна схема, яка містить набір даних для РВ. Для ідентифікації РВ в b' необхідно вказати ідентифікатор версії та ідентифікатор РВ відповідно до побудови S(S(R)).

Модифікація кортежів РВ r в БД b. Сценарій включає наступні команди: додавання, редагування, видалення кортежу h в РВ r в версії БД vm , для яких розроблено відповідно команди INSERT(b,k,m,r,h), EDIT(b,k,m,r,h), DELETE(b,k,m,r,h), де k - номер версії БД, в якої r було створено. Команди INSERT, EDIT, DELETE побудовано рекурентно через операції над H.

Модифікація структури БД b. Сценарій включає наступні команди:

а) додавання, редагування сигнатур РВ r:

CHANGE1(b,gn, r, f(r))=CHANGE'(b, gn , CHAHGE(gn , _r, f(_r))),

де gn - версія БД, яку змінюють, f - формула над as, us, rs, cs , «_» - префікс,CHANGE' - побудована формула на F;

б) видалення РВ r:

CHANGE2(b,gn ,r)=CHANGE'(b, gn , DEL(gn , _r));

в) додавання нового РВ:

CHANGE3(b,gn ,r,s)=CHANGE'(b, gn , ADD(ADD(gn , <_r,s>),

<r,ISIG-R0(_r)>)),

де r - ім'я нового РВ, s - сигнатура нового РВ;

г) додавання нового похідного РВ:

CHANGE4(b,gn ,r,f)=CHANGE'(b, gn , ADD(gn , <r,f>)),

де r - ім'я нового похідного РВ, f - формула реляційної алгебри;

д) видалення похідного РВ r:

CHANGE5(b,gn ,r)=CHANGE'(b, gn , DEL(gn , r)).

Робота з версіями БД. Сценарій включає команди видалення, спрощення та скорочення версій БД.

Показано, що розмір БД, побудованої на основі моделі (8), у середньому вдвічі менше у порівнянні з моделлю (4), представленої у вигляді двох незалежних копій.

Для відображення кортежів РВ в версіях БД запропоновано метод представлення реляційного відношення (ПРВ) в різних версіях БД, який базується на запропонованих командах INSERT, EDIT, DELETE та властивостях операцій з (5) та (6).

Для усунення недоліків способів відкоту та розпаралелювання на основі методу ПРВ та моделі (8) розроблено методику модернізації ІС. Нехай БД ІС побудована на основі багатоверсійної моделі (8). Тоді методика відповідно до ЖЦМ складається з чотирьох стадій:

1. Впровадження нової версії ІС: додавання нової версії БД, установка ПІОД з підключенням до цієї версії та одночасна робота із стабільною версією ІС.

2. Активне використання нової версії ІС: роботу із стабільною версією ІС на цій стадії припинено.

3. Відновлення до стабільної стадії ІС у разі виявлення критичної помилки: перехід до стабільного ПІОД з підключенням до стабільної версії БД.

4. Активне використання стабільної версії ІС в очікуванні нової версії.

Показано, що застосування методики дозволяє виключити простої ІС і запобігти втратам даних.

У четвертому розділі розроблено інформаційну технологію багатоверсійного представлення та керування (ІТБПК) БД.

Вхідними даними технології є запити користувачів до БД. В якості мови запитів користувача запропоновано розширення мови SQL (SQL'), граматика якого доповнена операціями над версіями БД на основі сценаріїв керування моделлю БД (9) - (14). Встановлена повнота граматики SQL' відносно до моделі (8) та сценаріїв керування.

Сформульовано і розв'язано завдання автоматизованого перетворення запитів користувача мовою SQL' в запити мови SQL з використанням ІТБПК БД. Для зберігання інформації використано існуючу реляційну модель БД (4), в якій представлено службові РВ (словник ІТБПК БД), а також РВ для даних користувача. Цей рівень представлення РВ названо фізичним, а схема БД - фізичною схемою БД. Для представлення даних користувача в версіях БД введено РВ логічного рівня, які відрізняються від їх представлення на фізичному рівні. На основі методу ПРВ і сценаріїв керування БД (9) - (14) для створення і перетворення даних між фізичним та логічним рівнями РВ створені методики: додавання нової версії БД, додавання РВ, видалення РВ, модифікації сигнатури РВ, модифікації кортежів РВ, керування версіями БД, читання даних з БД.

Схема роботи ІТБПК БД включає розроблене на основі запропонованих методик, методів та моделей алгоритмічне забезпечення для наступних функціональних блоків:

- отримання списку імен відношень за запитом користувача;

- трансляція в запиті імен логічних РВ в їх фізичні представлення;

- трансляція запиту мовою SQL' до дерева реляційних операцій;

- виконання запиту SQL до СУБД;

- формування запитів модифікації кортежів відношень фізичного рівня мовою SQL;

- верифікація принципу ітеративної модифікації;

- верифікація змін схеми БД;

- формування логічних і фізичних імен відношень;

- генерація списку SQL запитів при видаленні залежних версій;

- генерація запитів згортки;

- перетворення схеми БД в дворівневу гіперсхему.

Для зменшення впливу ІТБПК БД на швидкість обробки даних БД всі запити SQL' умовно поділені на дві категорії: операції над даними БД і операції над версіями БД, кожна із яких виконуються в незалежному відповідному режимі.

На основі режимів виконання SQL' запропоновано схему використання ІТБПК БД в ІС, в якій їх взаємодію розділено на три функціональні компоненти: «Керівник схеми», «Виконавець SQL'», «Модифікатор схеми».

Компонента «Керівник схеми» налаштовує SQL' запити на вибрану користувачем версію БД. Компонента «Виконавець SQL' » транслює запити користувача SQL' в SQL. Для монопольної трансляції всіх запитів ІС через компоненти «Керівник схеми», «Виконавець SQL'» запропоновано їх інтеграцію безпосередньо в ПІОД ІС. Компоненту «Модифікатор схеми» введено для ізольованого внесення змін до структури БД і запропоновано представити у вигляді незалежного ПІОД.

На основі алгоритмічного забезпечення ІТБПК БД розроблено програмне забезпечення, яке реалізовано з використанням технологій програмування засобу Visual Studio C#. Компоненти «Керівник схеми», «Виконавець SQL'» інтегровано в платформу розробки .NET з підтримкою стандартних інтерфейсів для роботи з наборами даних ADO.NET: DbCommand, Connection, Dataset. Для аналізу граматики SQL' було використано інструментальний засіб YAPP за допомогою мов програмування Perl та Python.

Для порівняльної оцінки ефективності ІТБПК БД при модернізації ІС розроблено показники відносних змін розміру БД та сумарної продуктивності ІС.

Для оцінки за розміром БД визначено показник відносної зміни розміру БД EFi:

де Li - кількість ітерацій, Fi,m - розмір БД після завершення другої стадії m-ої ітерації ЖЦМ ІС відповідно до способу відкоту (i=1), розпаралелювання (i=2), ІТБПК БД (i=3), F0 - розмір БД в умовах пасивного супроводження ІС (без модернізації).

Для визначення розміру БД запропоновано співвідношення F:

де n - кількість РВ фізичного рівня, ki - кількість кортежів, li - кількість полів в сигнатурі i-ого РВ, sij - розмір в байтах j-ого поля i-ого РВ.

Проведено експериментальне оцінювання (табл. 1) розміру БД (16) на кожній ітерації ЖЦМ для двох об'єктів впровадження ІТБПК БД - дилінгового центру «Off-club» (спосіб розпаралелювання) та торговельної мережі магазинів «Triumph» (спосіб відкоту) та визначено значення показника (15).

Встановлено, що для останньої ітерації ЖЦМ F3 менше F1, на 49,3 % (для «Triumph») та менше F2 на 50,1 % (для «Off-club»), а значення EF3 більше EF1 на 97,8 % (для «Triumph»), EF3 більше EF2 на 99,8 % (для «Off-club»), що підтверджує перевагу ІТБПК БД щодо показника (15).

Для оцінки за продуктивністю ІС визначено показник відносної зміни сумарної продуктивності ІС EAi:

де Ai - сумарна продуктивність відповідно до способу відкоту (i=1), розпаралелювання (i=2), ІТБПК БД (i=3), А0 - еталонна сумарна продуктивність в умовах пасивного супроводження ІС (без модернізації). Будь-які відхилення від еталонної сумарної продуктивності запропоновано вважати такими, що погіршують продуктивність обробки даних ІС.

Для визначення сумарної продуктивності Ai за тривалість ЖЦМ запропоновано співвідношення:

де Li - кількість ітерацій, Ti,m - тривалість m-ої ітерації ЖЦМ, Pi,m - продуктивність ІС на основі кількості виконаних запитів користувачем ІС в одиницю часу t, t=1 робоча година.

Для визначення часу простою ІС Di за тривалість ЖЦМ запропоновано співвідношення:

при

Проведено експериментальне оцінювання значення продуктивності Pi,m для кожної ітерації m=1..Li ЖЦМ для двох об'єктів впровадження технології - «Off-club» (спосіб розпаралелювання) та «Triumph» (спосіб відкоту), на основі якого було обчислено показник EAi (17) та час простою ІС Di (19).

Встановлено, що значення показника (17) для ІТБПК БД більше на 45,8 % та 20,3 % відповідно до способів розпаралелювання («Off-club») та відкоту («Triumph»). Час простою ІС в порівнянні із способом відкоту було зменшено на 13 год., що встановлює 29,5 % від тривалості ЖЦМ (44 год.).

ВИСНОВКИ

У дисертаційній роботі розроблено і теоретично обґрунтовано нову інформаційну технологію багатоверсійного представлення та керування базами даних при модернізації інформаційних систем. При цьому отримані наступні основні результати:

1. Проаналізовано існуючі інформаційні технології та способи керування БД для підвищення ефективності процесу модернізації ІС. При їх використанні виявлено погіршення наступних показників: значне збільшення розміру БД (близько у 2 рази), зменшення продуктивності ІС, втрата часу у випадках простою ІС (до 30 % від загального часу модернізації ІС), ризик втрати накопичених за модернізацію даних БД. Для підвищення ефективності процесу модернізації ІС запропоновано використовувати багатоверсійне представлення структури БД.

2. Розроблено аналітичну модель схеми даних на основі теоретико-множинного підходу у поєднанні з теорією формальної алгебри, що відрізняється від існуючих моделей багатоверсійним представленням елементів та функціональних залежностей між ними, і яка дозволила отримати єдиний підхід до представлення різних версій схеми даних.

3. Розроблено метод визначення коректності схем даних на основі аналізу орієнтованих циклів в орграфі, у рамках якого запропоновано методику перетворення схем даних в орграфі, запропоновано модифікацію методу тимчасового моделювання для визначення орциклів в орграфі. На основі методу побудовано алгоритм, для якого встановлена пропорційна залежність часу виконання від кількості елементів схеми даних.

4. Вдосконалено аналітичну модель реляційної бази даних на основі аналітичної моделі схеми даних і реляційної моделі даних, що дозволило забезпечити багатоверсійне представлення структури БД, а також зменшити в середньому в два рази розмір багатоверсійної БД в порівнянні з її представленням у вигляді двох незалежних версій.

5. Розроблено метод представлення даних реляційного відношення у різних версіях БД на основі вдосконаленої моделі реляційної БД; побудовано методику модернізації ІС, що дозволило вирішити завдання скорочення простоїв і запобігання втрати даних БД при модернізації ІС.

6. На основі проведених досліджень розроблено інформаційну технологію багатоверсійного представлення та керування БД.

7. Для оцінки ефективності запропонованої технології розроблені показники відносних змін розміру БД та сумарної продуктивності ІС. Порівняльний аналіз показав, що впровадження технології дозволило для дилінгового центру «Off-club» збільшити показники відносних змін розміру БД на 99,8 % (зменшення розміру БД на 50,1 %), а сумарної продуктивності ІС на 45,8 %; для торговельній мережі магазинів одягу «Triumph» збільшити показники відносних змін розміру БД на 97,8 % (зменшення розміру БД на 49.3 %), а сумарної продуктивності ІС на 20,3 % та скоротити час простою на 29,5 %.

Список опублікованих ПРАЦЬ за темою дисертації

1. Малахов, Е.В. Инструмент реализации связей между узлами распределенной системы [Текст] / Е.В. Малахов, Б.Ф. Трофимов // Тр. Одесского политехнического университета. - Одесса : ОНПУ, 2007. - Вып. 1 (27). - С. 114 - 118.

2. Малахов, Е.В. Обзор модели ORM [Текст] / Е.В. Малахов, Б.Ф. Трофимов // Холодильные установки и технологии. - Одесса : ОГАХ, 2007. - Вып. 5(109) - С. 80 - 82.

3. Малахов, Е.В. Модель расширения реляционных схем [Текст] / Е.В. Малахов, Б.Ф. Трофимов // Восточно-европейский журнал передовых технологий. - Харьков : Технол. центр, 2008. - Вып. 3(33). - С. 18 - 20.

4. Трофимов, Б.Ф. Информационная технология сопровождения баз данных в реальном времени с использованием модели расширения реляционных схем [Текст] // Тр. Одесского политехнического университета. - Одесса : ОНПУ, 2008. - Вып. 2 (30). - С. 140 - 144.

5. Трофимов, Б.Ф. Инструмент реализации связей между узлами распределенной системы [Текст] // Научные исследования и их практическое применение. Современное состояние и пути развития : Международная научно-практическая конференция, 23-25 сент., 2006, : сб. науч. тр, Том 2 «Технические науки». - Одесса: Черноморье, 2006. - С. 44 - 45.

6. Трофимов, Б.Ф. Метод виртуальных схем [Текст] / Б.Ф. Трофимов, В.П. Мазуренко, Д.Б. Лобашевский // Інформаційні технології в навчальному процесі : науково-методичний семінар, 17-19 квіт., 2007 : праці. - Одеса, 2007. - С.58 - 59.

7. Малахов, Е.В. Обзор метамодели виртуальных представлений [Текст] / Е.В. Малахов, Б.Ф. Трофимов // Сучасні інформаційні і електронні технології «СІЕТ-2009» : Дев'ята міжнародна науково-практична конференція, 19-23 трав., 2008 : праці. - Одеса : ОНПУ, 2008. - С. 48.

8. Трофимов, Б.Ф. Информационная технология многоверсионного представления и управления базами данных при разработке информационных систем [Текст] / Б.Ф. Трофимов, Е.В. Малахов // Проблеми й перспективи розвитку ІТ-індустрії в Україні : Перша міжнародна науково-практична конференція, 18-19 лист., 2009 : праці. - Харків, 2009. - С. 80-81.

9. Трофимов, Б.Ф. Моделирование версионных структур с помощью аналитической модели схемы данных [Текст] / Б.Ф. Трофимов, Е.В. Малахов // Информатика и компьютерные технологии (ИКТ-2009) : Пятая международная научно-техническая конференция, 24-26 ноября, 2009. - Донецк, 2009 : труды. - С. 494 - 501.

Размещено на Allbest.ru


Подобные документы

  • Використання баз даних та інформаційних систем. Поняття реляційної моделі даних. Ключові особливості мови SQL. Агрегатні функції і угрупування даних. Загальний опис бази даних. Застосування технології систем управління базами даних в мережі Інтернет.

    курсовая работа [633,3 K], добавлен 11.07.2015

  • База даних як сумісно використовуваний набір логічно зв'язаних даних, передбачений для задоволення інформаційних потреб. Програмне забезпечення, яке взаємодіє з прикладними програмами користувачів, апаратне забезпечення, дані, процедури і користувачі.

    реферат [160,9 K], добавлен 20.06.2010

  • Розгляд процесу автоматизації бази даних для довідника астронома. Основи реляційних баз даних для проектування інформаційних систем. Застосування тригерів для забезпечення цілісності даних і реалізації складної бізнес–логіки в системних процедурах.

    курсовая работа [22,3 K], добавлен 12.03.2019

  • Визначення інформаційних систем. Загальна характеристика складових частин внутрішньої інформаційної основи систем. Пристрої перетворення графічної інформації в цифрову. Системи управління базами даних. Технологія створення карт засобами MapInfo.

    реферат [39,4 K], добавлен 05.12.2013

  • Розподілена обробка та розподілені бази даних, їх внутрішня структура та принцип функціонування. Порядок і технологія рішення задач оперативного контролю в умовах роботи та на базі сучасних автоматизованих інформаційних систем, оцінка ефективності.

    контрольная работа [746,0 K], добавлен 18.02.2015

  • Використання баз даних та інформаційних систем у сучасному житті. Основні відомості про реляційні бази даних. Зв'язування відносин. Структурована мова запитів SQL. Сутність та загальний опис бази даних "Архітектурна компанія". Приклад створення таблиці.

    курсовая работа [320,7 K], добавлен 19.06.2015

  • Області застосування і реалізації інформаційних систем, вимоги до них. Призначення та класифікація систем управління базами даних. Основні достоїнства мови SQL. Програмний код додатку. Створення база даних "Мебельний магазин". Лістинг даної програми.

    курсовая работа [747,0 K], добавлен 19.04.2015

  • Склад і зміст робіт на стадії впровадження інформаційних систем. Технологія проектування систем за CASE-методом. Порівняльні характеристики інформаційних систем в менеджменті та СППР. Створення бази моделей. Визначення інформаційних систем управління.

    реферат [44,5 K], добавлен 09.03.2009

  • Проектування інформаційної системи для супроводу баз даних. Моделі запиту даних співробітником автоінспекції та обробки запиту про машини та їх власників. База даних за допомогою SQL-сервер. Реалізація запитів, процедур, тригерів і представлення.

    курсовая работа [1,7 M], добавлен 18.06.2012

  • Внутрішнє представлення в пам’яті комп’ютера даних базових та похідних типів, масивів. Ідентифікатор, зв'язаний з константним виразом та основи представлення даних. Алгоритм представлення цілих, дійсних, логічних і символьних чисел, структур і об’єднань.

    курсовая работа [279,1 K], добавлен 25.08.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.