Алгебраїчний метод побудови та аналізу сткуктурно-логічних моделей предметних областей інформаційних систем
Порівняльний аналіз засобів моделювання інформаційно-логічної структури предметних областей. Метод представлення структурно-логічної моделі напівсхем за допомогою структур даних, що базуються на реляційній моделі даних. Прототип програмного комплексу.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 11.10.2011 |
Размер файла | 112,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Харківський національний університет імені В.Н. Каразіна
Автореферат дисертації на здобуття наукового ступеня
кандидата технічних наук
АЛГЕБРАЇЧНИЙ МЕТОД ПОБУДОВИ ТА АНАЛІЗУ СТРУКТУРНО-ЛОГІЧНИХ МОДЕЛЕЙ ПРЕДМЕТНИХ ОБЛАСТЕЙ ІНФОРМАЦІЙНИХ СИСТЕМ
01.05.02 - математичне моделювання та обчислювальні методи
Семенова Т.В.
Харків-2007
Дисертацією є рукопис. Робота виконана в Харківському національному університеті імені В.Н. Каразіна, Міністерство освіти і науки України.
Науковий керівник доктор технічних наук, професор Жолткевич Григорій Миколайович, Харківський національний університет імені В.Н. Каразіна, завідувач кафедри теоретичної та прикладної інформатики
Офіційні опоненти: доктор технічних наук, професор Шаронова Наталія Валеріївна, Національний технічний університет “Харківський політехнічний інститут”, завідувач кафедри інтелектуальних комп'ютерних систем кандидат технічних наук, доцент Петров Костянтин Едуардович, Харківський національний університет внутрішніх справ, доцент кафедри прикладної математики та аналітичного забезпечення ОВС
Захист відбудеться “ 7 ” листопада 2007 року о 15.30 годині на засіданні спеціалізованої вченої ради К 64.051.09 Харківського національного університету імені В.Н. Каразіна за адресою: 61077, м. Харків, пл. Свободи, 4, ауд. 6-52.
З дисертацією можна ознайомитись у Центральній науковій бібліотеці Харківського національного університету імені В.Н.Каразіна за адресою: 61077, м. Харків, пл. Свободи, 4.
Автореферат розісланий “ 4 ” жовтня 2007 року.
Вчений секретар спеціалізованої вченої ради С.І. Шматков
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
математичне моделювання напівсхема прототип
Актуальність теми дисертаційної роботи. Інформація в сучасному світі є одним з найбільш важливих ресурсів, а інформаційні системи стали необхідним інструментом практично у всіх сферах діяльності. Однак розробка інформаційних систем супроводжується рядом проблем, найпоширеніші з яких - перевищення бюджету та запланованого часу розробки системи. Для вирішення цих проблем існує чимало засобів, серед яких впровадження нових методик розробки програмних систем, використання удосконалених моделей оцінки робіт, виразні мови моделювання тощо. Гострота ситуації стала причиною того, що було проведено декілька досліджень міжнародними організаціями з метою виявлення причин указаних проблем. Дослідження показали, що суттєвою причиною невдалої розробки програмних систем стають помилки, яких розробники припускаються на етапі аналізу предметної області та формуванні вимог до системи. У даний час розроблено досить багато засобів моделювання інформаційно-логічної структури предметних областей - базового процесу, що відбувається на етапі аналізу предметної області та специфікації вимог. Аналіз існуючих засобів показав, що всі вони мають цілий ряд істотних недоліків, які не дозволяють провести аналіз побудованих структурно-логічних моделей повною мірою. Один з найпоширеніших недоліків - відсутність формальних методів аналізу побудованих моделей. На підставі аналізу зроблено висновок про те, що наукова задача, що полягає в удосконаленні засобів математичного моделювання інформаційно-логічної структури предметних областей інформаційних систем є актуальною.
Зв'язок роботи з науковими програмами, планами, темами. Робота над дисертацією проводилася автором на кафедрі теоретичної та прикладної інформатики Харківського національного університету імені В.Н. Каразіна в межах науково-дослідної теми “Розробка евристичних концептуальних моделей адаптаційних механізмів різної природи” (ДР № 0105U000706) та проекту TEMPUS TACIS “UnIT-Net - інформаційні технології в мережі університетського управління” (проект MP-JEP-23010-2002, ДР № 1515).
Мета і задачі дослідження. Мета роботи полягає в підвищенні ефективності розробки програмних систем за рахунок зменшення кількості помилок на етапі аналізу предметної області і специфікації вимог шляхом використання засобів математичного моделювання інформаційно-логічної структури предметних областей.
Об'єктом дослідження є процес математичного моделювання інформаційно-логічної структури предметних областей у процесі розробки інформаційних систем.
Предметом дослідження є алгебраїчний метод представлення й аналізу структурно-логічних моделей предметних областей у процесі розробки інформаційних систем.
Методи досліджень. Теоретичною основою роботи є принципи теорії множин, теорії категорій та функторів, теорії моделювання складних систем, теорії графів, теорії ймовірностей і математична статистика. Для побудови програмних засобів було використано принципи теорії інформаційних систем.
Для досягнення поставленої мети дослідження в роботі сформульовані такі задачі:
- провести порівняльний аналіз існуючих засобів моделювання інформаційно-логічної структури предметних областей;
- розробити математичний апарат моделювання, призначений для формалізації представлення й аналізу структурно-логічних моделей предметних областей;
- розробити метод представлення структурно-логічної моделі предметних областей (напівсхем) за допомогою структур даних, що базуються на реляційній моделі даних;
- формалізувати поняття структурного шаблону і розробити метод виявлення структурних шаблонів у структурно-логічних моделях предметних областей;
- розробити метод генерації схеми бази даних, що відповідає структурно-логічній моделі предметної області;
- розробити прототип програмного комплексу, призначений для підтримки процесу моделювання інформаційно-логічної структури предметних областей.
Наукова новизна отриманих результатів. На основі виконаних теоретичних досліджень та проведених експериментів отримано нове рішення важної науково-прикладної задачі - удосконалення засобів математичного моделювання інформаційно-логічної структури предметних областей інформаційних систем шляхом математичного описання цієї структури в термінах уперше запропонованого алгебраїчного апарата моделювання, призначеного для використання під час аналізу предметної області і специфікації вимог, що дозволяє підвищити ефективність розробки програмних систем.
У межах поставленої задачі одержано наступні наукові результати:
а) вперше на основі теорії множин та теорії категорій і функторів запропоновано нову математичну модель інформаційно-логічної структури (структурно-логічну модель) предметної області інформаційної системи - напівсхему, а також розроблено і математично обґрунтовано сукупність формалізованих операцій її побудови і верифікації, що дозволяє підвищити ефективність розробки інформаційної системи за рахунок зменшення кількості помилок на етапі аналізу її предметної області і специфікації вимог;
б) вперше розроблено метод еквівалентного перетворення напівсхеми в структуру даних, що базується на реляційній моделі, що дозволило застосувати реляційну базу даних як сховище даних напівсхем, а реляційну алгебру - як мову описання алгоритмів верифікації останніх;
в) набуло подальшого розвитку моделювання методом композиції типових моделей завдяки формалізації поняття структурного шаблону в межах інформаційно-логічної структури предметної області, що дозволило підвищити ефективність розробки інформаційних систем за рахунок повторного використання на етапі аналізу предметної області та специфікації вимог заздалегідь спроектованих і верифікованих типових структурно-логічних моделей;
г) вдосконалено процес перетворення структурно-логічної моделі предметної області в модель структури даних сховища інформаційної системи за рахунок розробки і обґрунтування алгоритмічно реалізованих методів відображення напівсхем в схему реляційної бази даних.
Практичне значення отриманих результатів. Запропоновані моделі і методи дозволяють науково обґрунтовано підходити до створення сучасних програмних систем, та у сукупності удосконалюють засоби моделювання інформаційно-логічної структури предметних областей і доповнюють наукові знання в області розробки програмного забезпечення.
Розроблені моделі і методи являють собою науково-методичну основу для створення програмного забезпечення. Методи доведені до рівня використання проектувальниками програмного забезпечення.
Запропоновані моделі і методи можна використовувати як у задачах первинного аналізу предметної області та побудови структурно-логічної моделі предметної області інформаційної системи, так і при розробці однотипних інформаційних систем, а також інформаційних систем з неунормованою понятійною базою.
Розроблено прототип програмного комплексу, що дозволяє виконувати візуальну розбудову структурно-логічної моделі предметної області та її аналіз.
Матеріали дисертаційної роботи використані у навчальному процесі науково-дослідного інституту інформаційних технологій Херсонського державного університету (акт впровадження від 30.04.2006 р.), при розробці програмного забезпечення для Центру комп'ютерних технологій Харківського національного університету імені В.Н. Каразіна (акт впровадження від 15.06.2006), в процесі роботи фірми DBBEST Technologies по розробці програмного забезпечення (акт впровадження від 01.12.2006).
Особистий внесок здобувача. Усі основні наукові положення, результати, висновки та рекомендації дисертаційної роботи отримані автором самостійно. У публікаціях, що написані в співавторстві, здобувачу належать такі результати: дослідження проблеми моделювання предметних областей, а також існуючі методи і засоби їх вирішення [1]; математичний апарат моделювання інформаціно-логічної структури предметних областей [2]; застосування напівсхем для моделювання предметної області процесу розробки програмного забезпечення [3]; метод представлення напівсхем засобами реляційної моделі даних, що дозволяє використовувати реляційні бази даних як сховища метаданих напівсхем [4]; формалізація поняття структурного шаблону і метод виявлення структурних шаблонів в структурно-логічній моделі предметної області [7]; морфізми напівсхем та приклад використання морфізмів для обгрунтування переходу від імітаційної моделі, що розбудована на часових мережах Петрі, до аналітичної моделі, що розбудована на базі ймовірносно-часових графів [6]; метод створення схеми реляційної бази даних, що відповідає структурно-логічній моделі предметної області [8].
Апробація результатів дисертації. Результати дослідження доповідались та обговорювались на науково-технічних конференціях: IV Міжнародна конференція з математичного моделювання (МКММ'2001), Херсонський державний технічний університет (м. Херсон, 2001); VII Міжнародна конференція з математичного моделювання (МКММ'2005), Херсонський державний технічний університет (м. Херсон, 2005); International Conference “Dynamical System Modeling and Stability Investigation” (Kyiv, 2005) та на наукових семінарах кафедри теоретичної та прикладної інформатики Харківського національного університету імені В.Н. Каразіна.
Публікації. За темою дисертації опубліковано 10 друкованих праць, у тому числі - 8 в збірниках наукових праць, що входять до переліку наукових спеціальних видань, затверджених ВАК України (2 з яких - без співавторів), у матеріалах і тезах доповідей всеукраїнських і міжнародних конференцій - 2.
Структура й обсяг дисертації. Робота складається зі вступу, 5-ти розділів, висновків, списку використаних джерел та літератури, 2-х додатків. Повний обсяг дисертації складає 180 сторінок, у тому числі 150 сторінок основного тексту, 61 малюнок, список використаних джерел з 130 найменувань на 12 сторінках.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обґрунтовується актуальність теми дисертаційної роботи, сформульовані мета, задачі дослідження, наукова новизна та практичне значення наукових результатів, зв'язок роботи з науковими програмами та планами.
У першому розділі сформульовані вимоги до засобів моделювання предметних областей інформаційних систем, що використовуються на етапі аналізу предметної області та специфікації вимог при розробці інформаційних систем. Проведений аналіз існуючих засобів моделювання показав, що вони мають цілий ряд суттєвих недоліків: відсутність формальних методів аналізу побудованої моделі; змішення структурної та семантичної складової, що призводить до зайвої на цьому етапі деталізації й необхідності формалізації й осмислення аналітиками великої кількості фактів семантичної природи; використання при побудові моделі вузько спеціалізованих понять, що ускладнюють процес залучення до роботи над моделлю експертів предметної області.
Проведений аналіз дозволив сформулювати вимоги до засобів моделювання предметних областей, а зокрема, до засобів моделювання інформаційно-логічної структури предметних областей, які мають задовольняти наступним вимогам: залучення формальних методів для аналізу коректності побудованої моделі; розділення в моделі структурного й семантичного підрівней; відсутність налаштованості на конкретну технологію проектування чи життєвий цикл розробки програмного забезпечення; використання в моделі зрозумілих для експерта предметної області понять; наочне візуальне представлення побудованої структурно-логічної моделі; забезпечення можливості повторного використання побудованих моделей.
Засоби підтримки процесу моделювання інформаційно-логічної моделі предметних областей мають задовольняти наступним вимогам: наявність зручних засобів побудови та редагування структурно-логічних моделей; інтуїтивно простий та зрозумілий інтерфейс; наявність засобів імпорту та експорту даних моделі.
У другому розділі в рамках рішення загальної задачі розроблено математичний апарат моделювання інформаційно-логічної структури предметних областей.
Основою апарата моделювання є поняття напівсхеми, яке представляє собою трійку множин, що описують поняття предметної області, визначення цих понять та зв'язок між ними. Нехай - множина, елементи якої відповідають іменам понять предметної області, - множина, елементи якої відповідають іменам асоціацій між поняттями. - множина часткових відображень із в . Елементи множини називаються варіантами визначення. - відображення з пустою областю визначення.
Напівсхемою предметної області називається трійка , де , - множини, що описані вище, множина , для якої виконуються наступні умови:
1) для кожного , якщо , то
;
2) для кожного і для любих двох варіантів визначення таких, що , і , де , виконано рівність .
Для представлення напівсхем було розроблено наступну графічну нотацію: прямокутник використовується для відображення поняття, коло використовується для відображення варіанта визначення. Прямокутник і коло з'єднуються прямою в одному з двох випадків: а) варіант визначення асоційовано з даним поняттям; б) поняття використовується в межах варіанта визначення. У другому випадку пряма, що з'єднує, має вигляд стрілки, що має напрямок від варіанта визначення до поняття і має і'мя, що відповідає імені ролі.
Наприклад, поняттю “Учбова дисципліна”, яке визначається кількістю годин, яке вимагається для її викладення, повною назвою дисципліни, а також переліком інших дисциплін, які мають передувати вивченню даної дисципліни, може відповідати напівсхема (графічне представлення наведено на рис. 1), де множини N, R і D мають наступне визначення:
N = {Учбова дисципліна, Список дисциплін, Integer, String, NULL},
R = {Кіл-ть годин, Назва, Базові дисципліни, Наступний, Значення, Нульовий}
D = {(Учбова дисципліна, f), (Список дисциплін, g1), (Список дисциплін, g2)}, де функції f, g1, g2 мають вигляд:
F (Кіл-ть годин) = Integer, f (Назва)=String, f(Базові дисципліни) = Список дисциплін;
g1 (Наступний) = Список дисциплін, g1 (Значення) = Учбова дисципліна, g2 (Нульовий) = NULL.
Умова 2) у визначенні напівсхеми називається властивістю локальної унікальності ролі (ЛУР). Відображення дозволяє говорити про роль кожного поняття у визначенні іншого поняття, не вказуючи варіант визначення. Це можливо завдяки властивості ЛУР, оскільки визначення поняття по ролі є однозначним.
Поняття може визначатися за допомогою інших понятть, які у свою чергу вимагають визначення. Таким чином, в визначенні конкретного поняття бере участь множина понять, що визначають його беспосередньо та через інші поняття. Ця множина називається множиною визначальних понять. Поняття, що визначається, множина визначальних понять і варіанти визначень, що асоційовані з ними, створюють дводольний орієнтований граф з іменованими ребрами. Вершинами такого графа являються поняття і варіанти визначення, а ребрами - ролі і асоціації між поняттями і варіантами визначення. Наведене визначення напівсхеми не заперечує рекурсивне визначення поняття. Таким чином, множина понять, що визначають конкретне поняття, може включати поняття, що визначається. Як наслідок, дводольний орієнтований граф, що відповідають поняттю, що визначається, може мати цикли.
Для поняття, що визначається, однозначне отримання кожного з визначальних понять можливо шляхом переліку всіх іменованих ребер, які треба пройти для досягнення цього визначального поняття в графі. Однозначність отримання визначального поняття по послідовності ролей гарантується властивістю ЛУР в напівсхемі. Таку послідовність ролей називають іменуючим ланцюгом поняття. Формальне визначення наведено нижче.
Нехай - напівсхема. Іменуючим ланцюгом поняття називається пара із множини , яка задовольняє одній з наступних умов: або и , або для в послідовності , , де , усе члени визначено.
Іменуючий ланцюг називається термінальним, якщо - це поняття, яке не має варіантів визначення.
Ключовою одиницею у запропонованому апараті моделювання є зразок поняття, який представляє собою конкретну реалізацію визначення поняття. Зразок визначається як множина усіх термінальних ланцюгів, які присутні у конкретній реалізації поняття. Формальне визначення наведено нижче.
Нехай - напівсхема і задано поняття . Зразком поняття називається скінчена множина термінальних іменуючих ланцюгів цього поняття, яке задовольняє наступній умові: для кожного іменуючого ланцюга і для кожного представлення у вигляді , де , знайдеться єдине відображення , для якого , , і для усіх з знайдеться ланцюг вида для деякого .
Існування зразка пов'язано з питанням коректного визначення поняття. Якщо існує конкретна реалізація поняття (конкретний зразок), то поняття визначено коректно, оскільки поняттю відповідає певна структура даних, яка описується зразком.
Структурно-логічна модель предметної області, що описана в термінах напівсхем, являє собою множину понять та їх визначення. Як наслідок, якщо напівсхема складається тільки з понять, що мають хоча б один зразок, то відповідна структурно-логічна модель предметної області є коректно визначеною. Для введення формального визначення коректності побудованої структурно-логічної моделі предметної області було введено клас напівсхем, елементи якого отримали назву - схеми. Схемою називається напівсхема, яка включає лише такі поняття, що мають коректно визначену структуру.
Поняття, які не задовольняють цій вимозі, названо погано визначеними поняттями. До таких понять, наприклад, можна віднести такі, що в своєму визначенні прямо або через інші поняття посилаються самі на себе і задають циклічне визначення.
Введення класу схем дозволило звести задачу аналізу побудованої структурно-логічної моделі предметної області на коректність до задачі перевірки, чи являється напівсхема, що відповідає структурно-логічній моделі, схемою.
Було розроблено сукупність формалізованих операцій верифікації структурно-логічних моделей предметних областей, описаних у термінах напівсхем, які вміщують алгоритм перевірки властивостей схеми для напівсхеми та пошук погано визначених понять, а також кілька алгоритмів, що дозволять виявити неточності визначень. Зокрема, пошук понять та ролей, які не використовуються у визначеннях жодного іншого поняття; пошук понять, що мають співпадаючі варіанти визначень.
Як засіб представлення напівсхеми обрано реляційну модель даних. Доведено, що відношення реляційної бази даних з певною структурою може використовуватися для збереження даних напівсхеми. Використання реляційної моделі даних дозволило сформулювати алгоритми аналізу напівсхем у термінах реляційної алгебри та реляційного числення.
У розділі описано метод побудови та аналізу структурно-логічної моделі предметної області, де в якості засобу представлення напівсхем використовується реляційна база даних.
У третьому розділі введено новий клас напівсхем - “шаблонні напівсхеми”, за допомогою яких формалізовано поняття структурного шаблону. Крім того, множину напівсхем було розглянуто як єдину структуру, у межах якої визначено операції. Механізм перетворення однієї напівсхеми в іншу реалізовано за допомогою морфізмів теорії категорій.
При багаторазових побудовах структурно-логічних моделей предметних областей актуальною є задача формалізації типових визначальних конструкцій, що дозволять: визначати структурні шаблони на основі існуючої структурно-логічної моделі з метою їх подальшого використання, наприклад, у процесі розробки однотипних структурно-логічних моделей для близьких предметних областей; використовувати заздалегідь спроектовані і верифіковані типові структурно-логічні моделі з метою зниження часових витрат на розробку програмного забезпечення; знаходити типові структурні шаблони в побудованій структурно-логічній моделі з метою систематизації знань, наприклад, під час реінженирингу програмного забезпечення.
Напівсхема називається шаблонною напівсхемою поняття , якщо , де визначено наступним чином:
- множина понять та ролей, відповідно, що використовуються у визначенні поняття k з N;
- підмножина D, що утримує варіанти означень для всіх понять з Nk.
В якості прикладу шаблонної напівсхеми можна розглянути напісхему, що відповідає визначенню поняття “Список елементів” (рис. 2). Список може бути або нульовим, або ні. Якщо список не нульовий, то він визначається як поточний елемент та список елементів, що знаходяться після поточного.
В межах напівсхеми поняття “Елемент” являється абстрактним, але в межах інших напівсхем він отримає конкретне значення, наприклад, “Наукова стаття”. У цьому випадку мова буде йти про список наукових статей деякого автора і поняття “Наукова стаття” буде мати своє визначення. Таким чином, напівсхема, що відповідаю визначенню поняття “Список елементів”, може розглядатися як шаблонна напівсхема.
Використання шаблонних напівсхем у процесі моделювання інформаційно-логічної структури предметних областей схематично представлено на рис. 3.
У розділі введено поняття морфізму на множині напівсхем.
Нехай і - напівсхеми. Морфізмом називається пара відображень таких, що , і для кожного поняття з і для кожного асоційованого з ним варіанта визначення знайдеться такий варіант визначення , асоційований з поняттям , що вірно співвідношення , тобто
.
Нехай напівсхема описує набір понять, пов'язаних з терміном “Наукова стаття”. Стаття характеризується назвою і списком авторів, що брали участь у її створенні (рис. 4).
Нехай напівсхема описує набір понять, що пов'язані з терміном “Список елементів” (приклад наведено вище). Графічне представлення наведено на рис. 2. Можна задати морфізм , що буде діяти з напівсхеми в наступним чином:
, , ,
, , .
Якщо розглядати напівсхему як шаблонну, то побудований морфізм можна інтерпретувати як реалізацію шаблона “Список елементів” в напівсхемі, що вміщує визначення поняття “Наукова стаття”. Таким чином, морфізм задає формалізацію процесу інтерпретації структурного шаблону в моделі предметної області, що розглядається.
Крім того, морфізм може бути використаний для перетворення одної напівсхеми в іншу. В межах розробленого апарата моделювання морфізм розглядається як операція, що визначає відповідність між понятійними базами двох предметних областей.
Досліджено властивості морфізмів напівсхем. Визначено такі важливі класи морфізмів, як епіморфізм, мономорфізм і ізоморфізм. Ізоморфізм напівсхем розглядається як засів перевірки понять та їх визначень із різних структурно-логічних моделей. Наявність ізоморфізму між напівсхемами дозволяє говорити про ізоморфність понятійних баз відповідних предметних областей. Розроблено алгоритм перевірки ізоморфності напівсхем.
На множині напівсхем було визначено наступні операції: слабке та сильне включення та дослідженні їх властивості і взаємозв'язок.
Нехай і - напівсхеми. Напівсхема S2 слабо включає напівсхему S1 (означення ), якщо виконано наступні умови: , та існує морфізм такий, що , де , .
Нехай і - напівсхеми. Напівсхема S2 сильно включає напівсхему S1 (означення ), якщо виконано наступні умови: напівсхема S2 слабо включає напівсхему S1 () і .
Другу умову визначення можна сформулювати наступним чином. Поняття n з N1 та однойменне поняття n з N2 повинні мати однакові варіанти визначення.
Визначені операції використовуються для побудови інтегрованої понятійної бази в задачах розробки програмного забезпечення, що має інтегрувати групу вже існуючих програмних систем, або при розробці корпоративних систем, що включають множину підсистем з різними понятійними базами або понятійними базами, що перетинаються.
Якщо структурно-логічні моделі предметних областей описані в термінах напівсхем , то побудова інтегруючої моделі являє собою задачу побудови такої напівсхеми , що кожна з напівсхем слабо включається в напівсхему і напівсхема мінімальна у тому розумінні, що кожне поняття або роль з представлено у одній з напівсхем . Розроблено алгоритм побудови інтегруючої структурно-логічної моделі.
У четвертому розділі розроблено формальні методи побудови схеми реляційної бази даних по напівсхемі, яка може бути використана як сховище даних інформаційної системи.
Відомо, що інформаційна модель предметної області є основою для схеми реляційної бази даних, яку можна застосовувати в якості сховища даних інформаційної системи. Описання інформаційної моделі в термінах напівсхем дозволяє розробити формальні методи побудови схеми бази даних, що відповідає напівсхемі. У розділі наведено й обґрунтовано методи генерації схеми бази даних на основі структурно-логічної моделі предметної області, яку представлено в термінах напівсхем. Описана задача вирішена не для всієї множини напівсхем, у силу складності такої задачі, а тільки для певного класу напівсхем, що отримали назву нерекурсивні напівсхеми. Напівсхем називається нерекурсивною, якщо вона не вміщує рекурсивно визначені поняття.
В процесі генерації схеми бази даних на основі напівсхеми досліджуються складові напівсхеми (поняття, ролі, варіанти визначень) і у відповідність до них ставляться певні об'єкти реляційної бази даних. Кожному поняттю напівсхеми у відповідність ставиться відношення бази даних чи атрибут відношення. А агрегуючі зв'язки між поняттями перетворюються у зв'язки між відношеннями, що реалізуються за допомогою зовнішніх ключів.
Сформульовано правило побудови схеми реляційної бази даних на основі напівсхеми.
Правило 1. Якщо поняття являється базовим, то будується відношення бази даних Rel_n зі схемою Rel_n (id_n : Integer, atr_n : String), де id_n - штучний ключ відношення.
Правило 2. Якщо поняття має один варіант визначення , то будується відношення з іменем Rel_n, кількість атрибутів якого залежить від функції . Для всіх ролей виконується наступне. Якщо - базове поняття, то до відношення Rel_n додається атрибут з іменем і типом . Якщо не являється базовим поняттям, то до відношення Rel_n додається атрибут з іменем Ref_m, який є посиланням на атрибут id_m відношення Rel_m.
Правило 3. Якщо поняття асоційовано з кількома варіантами визначення, то будується відношення з двома атрибутами Rel_n(id_n, type_n), де атрибут з іменем type_n має тип , і включає в якості значень атрибутів імена варіантів визначення поняття n. Для всіх варіантів визначення таких, що виконується наступне. Будується відношення з іменем Rel_f , у якому принцип формування атрибутів збігається з правилами для понять з одним варіантом визначення.
В якості прикладу можна розглянути поняття “Книга”, що характеризується назвою твору та жанром, до якого вона відноситься. Напівсхема , що утримує визначення поняття “Книга”, може мати вигляд:
N = {Книга, Жанр, String},
R = {Назва_книги, Жанр_книги}
D = {(Книга, f)}, де функція f має наступне визначення: f(Назва_книги)=String, f(Жанр_книги)=Жанр. Графічне представлення напівсхеми наведено на рис. 5.
У відповідності до правил 1 і 2 поняттям “Книга” і “Жанр” будуть відповідати окремі відношення. Поняттю “Жанр” відповідає окреме відношення з наступною структурою:
Rel_Жанр (id_Жанр : Integer, atr_Жанр : String).
У свою чергу поняттю “Книга” ставиться у відповідність відношення Rel_Книга, яке має посилання на відношення Rel_Жанр (Правило 2), тому відношення Rel_Книга має таку структуру:
Rel_Книга (id_Книга : Integer, atr_назва : String, ref_жанр : Integer),
де ref_жанр - посилання на атрибут id_Жанр відношення Rel_Жанр. Розроблено алгоритм, який виконує побудову схеми реляційної бази даних на основі напівсхеми у відповідності до наведених правил.
У п'ятому розділі встановлено, що для використання розробленого математичного апарату моделювання предметних областей необхідна розробка програмного комплексу, призначеного для підтримки процесу моделювання інформаційно-логічної структури предметних областей на етапі аналізу предметної області та специфікації вимог. Установлено вимоги до таких систем і задачі, що вирішуються за їх допомогою. Описано принципи їх реалізації.
Розглянуто структуру та функціональність розробленого автором прототипу програмного комплексу, призначеного для підтримки процесу моделювання інформаційно-логічної структури предметних областей за допомогою напівсхем. У прототипі програмного комплексу реалізовано наступні можливості: побудова напівсхеми (структурно-логічної моделі предметної області) за допомогою графічного інтерфейсу; визначення параметрів структурних одиниць напівсхеми (понять, ролей, варіантів визначення); робота з шаблонними напівсхемами; збереження напівсхеми у форматі XML й в форматі графічного зображення; аналіз напівсхем на коректність й відсутність протиріч з використанням алгоритмів розділу 2; побудова концептуальної схеми реляційної бази даних на основі напівсхеми з використанням алгоритмів розділу 4.
Розроблено й описано порядок використання прототипу програмного комплексу у процесі моделювання інформаційно-логічної структури предметних областей. Проаналізовано помилки, які виникають при побудові напівсхеми, і описано варіанти їх вирішення.
Для оцінки ефективності використання напівсхем у процесі моделювання предметної області на етапі аналізу і специфікації вимог було розглянуто каскадну модель життєвого циклу розробки програмного забезпечення та досліджено два показника: кількість повернень з етапу розробки j на вже закінчений етап i у зв'язку зі знаходженням на етапі j помилки, якої припустилися ще на етапі i; сумарна кількість нормагодин, яку було витрачено на кожному з етапів розробки системи.
Проведений аналіз дозволив стверджувати, що використання розробленого апарату математичного моделювання інформаційно-логічної структури предметних областей сприяє більш повному описанню предметної області та зменшує кількість помилок на етапі аналізу й специфікації вимог.
Під час аналізу першого показника було встановлено, що при використанні напівсхем для побудови й аналізу структурно-логічної моделі на етапі аналізу й специфікації вимог кількість повернень на цей етап зменшується за рахунок якості аналізу побудованої інформаційної моделі.
На рис. 7 наведено порівняльні дані по кількості повернень на етап аналізу предметної області й специфікації вимог з інших етапів у двох групах розробників.
Оцінка другого показника дозволила стверджувати, що використання напівсхем у процесі розробки програмного забезпечення знижає сумарно працеємкість розробки, що вимірюється в нормагодинах, на 25%. Однак, використання напівсхем на етапі концептуального моделювання не зменшує часових витрат на етапі аналізу предметної області й специфікації вимог. Це пов'язано з тим, що в процесі роботи виконуються допоміжні побудови такі, як шаблонні напівсхеми, виконується алгоритми перевірки коректності побудованої моделі та виправляються знайдені помилки й неточності. Зменшення сумарного часу, що витрачається на перший етап, пов'язане зі зменшенням кількості повернень на цей етап.
Це дозволило стверджувати, що побудована й проаналізована за допомогою напівсхем структурно-логічна модель предметної області вміщує менше помилок і неточностей, та не потребує кардинальної перебудови на протязі усіх подальших етапів розробки. Що у свою чергу сприяє зменшенню часових та фінансових витрат на розробку програмних систем.
У додатку А описано прототип програмного комплексу підтримки процесу моделювання інформаційно-логічної структури предметних областей за допомогою напівсхем.
У додатку В наведено приклад використання апарату напівсхем для побудови та аналізу структурно-логічної моделі предметної області інформаційної системи обліку студентів та їх оплат відділу контрактного навчання Харківського національного університету імені В.Н. Каразіна.
ВИСНОВКИ
У дисертації отримано нові науково обгрунтовані результати в області математичного моделювання та обчислювальних методів, що в сукупності вирішують важливу науково-прикладну задачу - удосконалення засобів математичного моделювання інформаційно-логічної структури предметних областей інформаційних систем шляхом математичного описання цієї структури в термінах уперше запропонованого алгебраїчного апарата моделювання, призначеного для використання під час аналізу предметної області і специфікації вимог, що дозволяє підвищити ефективність розробки програмних систем.
В процесі виконання роботи отримано наукові і практичні результати, які полягають у наступному.
1. Сформульовано загальні вимоги до методів та засобів математичного моделювання інформаційно-логічної структури предметних областей. З урахуванням даних вимог проведено аналіз існуючих методів і засобів моделювання предметних областей, який показав, що вони не можуть повною мірою вирішувати задачі, які виникають під час побудови структурно-логічних моделей предметних областей. Це обумовлено тим, що деякі методи не мають формальних засобів аналізу побудованої моделі, а деякі використовують термінологію, яка є складною для експертів предметної області. Проведений аналіз показав, що для найбільш повного аналізу і зменшення кількості помилок побудови, необхідно розробити математичний апарат моделювання інформаційно-логічної структури предметних областей, призначений для побудови і аналізу структурно-логічних моделей предметних областей на етапі аналізу ї специфікації вимог у процесі розробки програмних систем.
2. Розроблено математичний апарат моделювання інформаційно-логічної структури предметних областей. Запропоновано нову математичну модель інформаційно-логічної структури (структурно-логічну модель) предметної області інформаційної системи - напівсхему. Напівсхема визначається як трійка множин, які описують множину понять предметної області та їх визначення. Ключовими мета-даними запропонованого апарату є: поняття, роль і варіант визначення. Поняттям структурно-логічної моделі є любий значимий об'єкт предметної області, процес або явище. Кожне поняття визначається через інше поняття, причому одне поняття може мати декілька варіантів визначення. Роль визначає поіменоване означення одного поняття в межах визначення іншого поняття. При такому засобі визначення понять відношення узагальнення є слідством, що не потребує ручної побудови ієрархії понять.
Визначено та досліджено спеціальний клас напівсхем - схеми. Сформульовано та доведено ключове твердження про те, що якщо напівсхема є схемою, то структурно-логічна модель, яка їй відповідає, є коректно визначеною. Було розроблено метод перевірки властивостей схеми для напівсхеми.
Таким чином, було розроблено апарат напівсхем яз засіб і метод формалізації представлення й аналізу структурно-логічних моделей предметних областей.
3. Розроблено та обґрунтовано метод еквівалентного перетворення напівсхем в структуру даних, що базується на реляційній моделі. Розроблене перетворення дозволило використовувати реляційні бази даних як сховище мета-даних напівсхеми і сформулювати алгоритми аналізу напівсхем у термінах реляційної алгебри та реляційного числення.
4. Формалізовано поняття структурного шаблону в межах структурно-логічної моделі предметної області з метою забезпечення можливості повторного використання заздалегідь спроектованих і верифікованих типових моделей. Розроблено алгоритми визначення структурних шаблонів в межах побудованої структурно-логічної моделі. Формалізація структурного шаблону та розробка алгоритму їх визначення дозволяє проводити додатковий аналіз, у ході якого відокремлюються шаблонні конструкції, які можуть бути використані як під час побудови наступних моделей предметних областей, так і являються засобом систематизації та структуризації знань в межах предметної області.
Для вирішення задач інтеграції понятійних баз предметних областей та їх порівняння на множині напівсхем було визначено морфізм та набір операцій.
5. Розроблено метод генерації схеми бази даних на основі даних напівсхеми. Розроблена таким чином реляційна база даних може використовуватися як сховище даних інформаційної системи, що проектується. У зв'язку зі складністю цю задачу було вирішено тільки для класу не рекурсивних напівсхем.
6. Проведено аналіз ефективності розробленого методу представлення та аналізу структурно-логічних моделей, який показав, що він дає виграш у часі й працеємкості при використанні його на етапі аналізу й специфікації вимог у процесі розробки інформаційної системи в середньому на 25%. Такий виграш досягається завдяки зменшенню кількості повернень на етап аналізу предметної області й специфікації вимог для усунення неточностей і виправлення помилок, яких припустилися під час розробки структурно-логічної моделі.
7. Розроблено прототип програмного комплексу підтримки процесу моделювання інформаційно-логічної структури предметних областей за допомогою напівсхем. Прототип програмного комплексу дозволяє виконувати набір функцій, пов'язаних з побудовою та аналізом структурно-логічних моделей, роботою із шаблонними напівсхемами, генерацією схеми реляційної бази даних на основі напівсхеми.
Таким чином, була досягнута мета дослідження, яка полягає в підвищенні ефективності розробки програмних систем за рахунок зменшення кількості помилок на етапі аналізу предметної області і специфікації вимог шляхом використання засобів математичного моделювання інформаційно-логічної структури предметних областей.
СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ
1. Жолткевич Г.Н., Семенова Т.В. Концептуальное моделирование данных в исследовательских информационных системах средствами реляционных СУБД. // Вестник Херсонского государственного технического университета. - Херсон: ХГТУ, 2002. - Вып. 2(15). - С. 179-183.
2. Жолткевич Г.Н., Семенова Т.В. К проблеме формализации концептуального моделирования информационных систем // Вісник Харківського національного університету. Серія “Математичне моделювання. Інформаційні технології. Автоматизовані системи управління”. - Х.:ХНУ, 2003. - № 605. - С. 33-42.
3. Жолткевич Г.Н., Семенова Т.В., Сергеев Л.Е. Формальная модель процесса компонентной разработки семейства программных продуктов. // Збірник наукових праць. Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова. - Київ, 2003. - Вип. 22. - С. 46-52.
4. Жолткевич Г.Н., Семенова Т.В., Федорченко К.А. Представление полусхем предметных областей информационных систем средствами реляционных баз данных // Вісник Харківського національного університету. Серія “Математичне моделювання. Інформаційні технології. Автоматизовані системи управління”. - Х.:ХНУ, 2004. - № 629. - С. 11-24.
5. Жолткевич Г.Н., Семенова Т.В. Формализация модели содержания XML-документа, основанной на DTD. // Вестник Херсонского государственного технического университета. - Херсон: ХНТУ, 2005. - Вып. 2(22). - С. 134-137.
6. Семенова Т.В. Морфизмы полусхем и их приложения. // Вісник Харківського національного університету. Серія “Математичне моделювання. Інформаційні технології. Автоматизовані системи управління”. - Х.:ХНУ, 2005. - № 703. - С. 198-206.
7. Семенова Т.В. Использование шаблонов полусхем в процессе построения структурно-логической модели предметной области информационной системы. // Вестник НТУ “ХПИ”. Сборник научных трудов. Тематический выпуск “Системный анализ, управление и информационные технологии”. - Харьков: НТУ “ХПИ”, 2006. - №19. - С. 77-86.
8. Житарюк А.Г., Семенова Т.В. Построение схемы реляционной базы данных по нерекурсивной полусхеме. // Вісник Харківського національного університету. Серія “Математичне моделювання. Інформаційні технології. Автоматизовані системи управління”. - Х.:ХНУ, 2006. - № 733. - С. 124-130.
9. Жолткевич Г.Н., Семенова Т.В. Оптимизационная модель базы данных для хранения и обработки результатов исследования в различных областях знания. // Інформатизація освіти України: стан, проблеми, перспективи: Зб. наук. пр. / Херсонський державний педагогічний університет. - Херсон: Айлант, 2001. - 176 с.
10. Жолткевич Г.Н., Семенова Т.В. Концептуальное моделирование информационных систем. // Тезисы конференции “Modelling & Stability”. - Киев, 2005. - С.377.
АНОТАЦІЯ
Семенова Т.В. Алгебраїчний метод побудови та аналізу структурно-логічних моделей предметних областей інформаційних систем. - Рукопис. Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.02 - математичне моделювання та обчислювальні методи. - Харківський національний університет імені В.Н. Каразіна. Харків, 2007.
Дисертація присвячена удосконаленню засобів моделювання предметних областей. Розроблено математичний апарат моделювання інформаційно-логічної структури предметних областей, що здатен підвищити ефективність розробки програмного забезпечення в цілому за рахунок зменшення кількості помилок на етапі аналізу предметної області й специфікації вимог.
Формальне описання структурно-логічної моделі предметної області дозволило вирішити задачу автоматичної генерації схеми реляційної бази даних, яка буде сховищем даних інформаційної системи, що проектується.
Розроблений апарат моделювання інформаційно-логічної структури предметних областей дозволяє науково обґрунтовано підходити до створення сучасного програмного забезпечення. Моделі та методи, що запропоновано, можуть бути використані як у задачах первинного аналізу структурно-логічних моделей предметних областей, так і при розробці однотипних інформаційних систем, а також при проектуванні інформаційних систем з неточною термінологічною базою.
Розроблено прототип програмного комплексу підтримки процесу моделювання інформаційно-логічної структури предметних областей.
Ключові слова: математичне моделювання, структурно-логічна модель предметної області, напівсхема, генерація схеми реляційної бази даних, шаблонна напівсхема.
АННОТАЦИЯ
Семенова Т.В. Алгебраический метод построения и анализа структурно-логических моделей предметных областей информационных систем. - Рукопись. Диссертация на соискание ученой степени кандидата технических наук по специальности 01.05.02 - математическое моделирование и вычислительные методы. - Харьковский национальный университет имени В.Н. Каразина. Харьков, 2007.
Диссертация посвящена усовершенствованию средств моделирования предметных областей. Разработан математический аппарат моделирования информационно-логической структуры предметных областей, способный повысить эффективность разработки программного обеспечения вцелом за счет уменьшения количества ошибок на этапе анализа предметной области и спецификации требований.
Анализ требований к средствам моделирования предметных областей информационных систем показал, что для их наиболее полного удовлетворения разрабатываемый метод должен базироваться на формальных средствах анализа.
Разработан математический аппарат моделирования информационно-логической структуры предметных областей, который предлагается использовать в качестве средства построения и анализа структурно-логических моделей предметных областей (полусхем). Основой аппарата полусхем является понятие полусхемы, которая представляет собой тройку множеств, описывающих понятия предметной области, определения этих понятий и связи между ними. Предлагаемый аппарат интерпретирует полусхему как информационную модель предметной области. Сформулировано понятие схемы и обосновано утверждение о том, что, если полусхема является схемой, то соответствующая структурно-логическая модель является корректно определенной. Разработаны алгоритмы проверки, является ли построенная структурно-логическая модель корректно определенной.
Выделен класс шаблонных полусхем и исследованы его свойства. Показано, что шаблонная полусхема может выступать формализмом понятия структурного шаблона. Описан метод использования шаблонных полусхем в процессе построения структурно-логических моделей предметных областей.
Введение понятия морфизма на множестве полусхем позволило задать способ преобразования одной полусхемы в другую. Одним из приложений морфизма стало его использование в качестве соответствия между понятийными базами двух предметных областей.
Введение операций на множестве полусхем позволило формализовать понятие интегрированной понятийной базы, построение которой требуется в задачах разработки программного обеспечения, которое должно интегрировать в себя группу уже действующих программных систем или при разработке корпоративных систем, включающих множество подсистем с различными или пересекающимися понятийными базами. Разработан алгоритм построения интегрирующей модели данных.
Формальное описание структурно-логической модели предметной области позволило решить задачу автоматической генерации схемы реляционной базы данных, которая будет являться хранилищем данных разрабатываемой информационной системы.
Разработанный математический аппарат моделирования информационно-логической структуры предметных областей позволил научно обоснованно подходить к созданию современного программного обеспечения и дополнил научные знания в области разработки программного обеспечения. Разработанные методы и модели можно использовать как в задачах первичного анализа структурно-логических моделей предметных областей, так и при разработке однотипных информационных систем, а также информационных систем с не устоявшейся терминологической базой.
Для реализации предлагаемого метода построения и анализа структурно-логической модели предметной области разработан прототип программного комплекса, в состав которого входят модули построения и анализа полусхем, модуль генерации схемы реляционной базы данных и модуль работы с шаблонными полусхемами.
Ключевые слова: математическое моделирование, структурно-логическая модель предметной области, полусхема, генерация схемы реляционной базы данных, шаблонная полусхема.
SUMMARY
Semenova T.V. Algebraic approach to developing and analysis of information system concept model. - Manuscript. The thesis on competition of scientific degree of candidate of the technical sciences on a specialty 01.05.02 - mathematical simulation and computational approach. -V.N. Karazin Kharkiv National University. Kharkiv. 2007.
The thesis is dedicated to development of the algebraic method of domain model creating and analysis, which allows put up the programming efficiency due to decreasing of mistake quantity during domain analysis and requirements specification phase.
Software prototype for supporting of method of domain model creating and analysis is designed.
Formal approach to domain modeling allows to solve the problem of automatic generation of relation database scheme as information system data warehouse.
Suggested method of domain model creating and analysis allows science-based approach to developing modern software.
The keywords: mathematical modeling, domain model, semi-scheme, relation database scheme generation, template semi-scheme.
Размещено на Allbest
Подобные документы
Предмет, об'єкт, метод та основні завдання економетрики. Розробка і дослідження эконометричних методів (методів прикладної статистики) з урахуванням специфіки економічних даних. Поняття економетричної моделі і її вибір. Типи економетричних моделей.
контрольная работа [32,8 K], добавлен 18.06.2010Загальна характеристика предметної області. Аналіз методів управління проектами. Розробка детермінованої моделі сітьового графіка. Розробка програмного забезпечення для моделювання детермінованої моделі. Моделювання сітьового графіка.
курсовая работа [1,0 M], добавлен 18.06.2007Процедури та моделювання систем зв’язку, формальний опис та оцінювання ефективності. Специфіка цифрового зображення сигналів. Особливості та методи побудови математичних моделей систем та мереж зв'язку. Математичні моделі на рівні функціональних ланок.
реферат [120,1 K], добавлен 19.02.2011Альтернативою підходу Койка до дистрибутивно-лагових моделей є поліноміальна дистрибутивно-лагова модель Ш. Альмона. Моделі виявилися дуже корисними в емпіричній економіці, тому що можуть перетворювати моделі на динамічні, за допомогою фактору часу.
контрольная работа [35,8 K], добавлен 12.04.2009Теоретичні основи методів аналізу фінансових даних. Формалізований опис емпіричних закономірностей фінансових часових рядів. Розробка алгоритмів оцінювання параметрів волатильності і комплексу стохастичних моделей прогнозування фінансових індексів.
курсовая работа [1,4 M], добавлен 05.05.2015Основа методології побудови інноваційних систем. Когнітивні (синтелектуальні) підходи до побудови моделей інноваційного розвитку соціально-економічних систем. Основнi сфери організаційної діяльності. Мета логістики, управління матеріальними потоками.
реферат [662,8 K], добавлен 26.11.2010Особливості побудови математичної моделі економічного явища. Множинна лінійна регресія в стандартизованому масштабі. Множинна нелінійна регресія, комп’ютерна реалізація методу Брандона. Моделювання для підприємств аграрно-промислового комплексу.
курсовая работа [1,9 M], добавлен 29.04.2010Поняття реклами, ефективності рекламної діяльності та проблеми її моделювання. Види емпіричних моделей для оцінки рекламного бюджету. Ідеї для побудови економіко-математичної моделі організації рекламної діяльності. Застосування диференціальних рівнянь.
дипломная работа [793,8 K], добавлен 24.09.2016Моделювання як наука. Типові математичні схеми моделювання систем. Статистичне моделювання систем на ЕОМ. Технології та мови моделювання. Методи імітаційного моделювання із застосуванням пакета GPSS World. Ідентифікація параметрів математичної моделі.
курс лекций [1,4 M], добавлен 01.12.2011Основні цілі створення моделі, її властивості та функції. Поняття інформації. Класифікація моделей по способі моделювання, призначенню, типі мови опису, залежності від просторових координат та здатності використовувати інформацію. Етапи створення моделі.
реферат [37,8 K], добавлен 16.01.2011