Моделювання первинних даних та процесу їх накопичення у ході науково–дослідних і проектних робіт

Модель сховища даних, яка дозволяє враховувати виявлені структурні обмеження. Побудування моделі поведінки учасників процесу реєстрації даних з метою мінімізації затрат на контрольні процедури. Контроль коректності структури даних при виконанні операцій.

Рубрика Экономико-математическое моделирование
Вид автореферат
Язык украинский
Дата добавления 24.08.2015
Размер файла 178,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Харківський національний університет імені В. Н. Каразіна

01.05.02 - Математичне моделювання та розрахункові методи

Автореферат

дисертації на здобуття наукового ступеня кандидата технічних наук

Моделювання первинних даних та процесу їх накопичення у ході науково-дослідних і проектних робіт

Ахмад Юсеф Ібрахім Ібрахім

Харків - 2009

Дисертацією є рукопис.

Робота виконана у Харківському національному університеті імені В. Н. Каразіна Міністерства освіти і науки України, м. Харків

Науковий керівник - доктор технічних наук, професор

Жолткевич Григорій Миколайович,

Харківський національний університет імені В. Н. Каразіна, завідувач кафедри теоретичної та прикладної інформатики

Офіційні опоненти:доктор технічних наук, професор

Філатов Валентин Олександрович,

Харківський національний університет радіоелектроніки, професор кафедри штучного інтелекту

кандидат технічних наук,

Терновой Максим Юрійович,

Національний технічний університет України

«Київський політехнічний інститут»,

доцент кафедри інформаційно-телекомунікаційних мереж

Захист відбудеться «___» ______________ 2009 року о 15 годині на засіданні спеціалізованої вченої ради К 64.051.09 у Харківському національному університеті імені В. Н. Каразіна за адресою: 61077, м. Харків, пл. Свободи, 4.

З дисертацією можна ознайомитися у Центральній науковій бібліотеці Харківського національного університету імені В. Н. Каразіна за адресою: 61077, м. Харків, пл. Свободи, 4, ауд. ____.

Автореферат розісланий «___» ____________ 2009 р.

Вчений секретар спеціалізованої вченої ради С. І. Шматков

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. В даний час проведення науково-дослідних та проектних робіт базується на широкому використанні сучасних інформаційних технологій. Як приклад можна навести системи автоматизації проектних робіт у різних галузях інженерної діяльності, а також системи очистки та аналізу даних. При цьому ключовою залишається проблема забезпечення якості первинної інформації, з якою оперують як дослідники, так і проектувальники. Саме якість первинної інформації визначає достовірність результатів у процесі наукових досліджень і якість проектних робіт. Слід зазначити, що проблемі якості первинної інформації приділяється значна увага у контексті прийняття економічних рішень. В той же час проблемі забезпечення якості первинної інформації, що використовується у наукових дослідженнях і проектних роботах, увага приділяється недостатня. У роботах Г. Шпура, Ф.-Л. Краузе, А. Г. Раковича, Л. С. Глоби, Г. М. Жолткевича, Т. В. Семенової та ін. досліджувалась специфіка даних, що використовуються в системах інформаційної підтримки проектних робіт, і даних, що реєструються при дослідженні складних систем (зокрема, біологічних і соціальних). Ці дослідження показали, що, на відміну від економічних даних, дані, які вивчаються у дисертаційній роботі - які реєструються в ході наукових досліджень або використовуються при проведенні проектних робіт - мають складну неоднорідну структуру, яка визначається різними, дуже часто рекурсивними, зв'язками. Наявність таких зв'язків приводить до того, що традиційні підходи до моделювання інформаційних структур даних приводять до аномальних баз даних, що характеризується низьким значенням відношення обсягу даних до обсягу метаданих. Таким чином, метадані втрачають статичність і, отже, з'являється необхідність у спеціальних процедурах контролю коректності структури даних, які не зводяться до використання простих типів даних та фільтрів. Розробка таких процедур контролю повинна базуватись на формально певній математичній структурі, у термінах якої можуть бути описані семантичні властивості даних, що підлягають верифікації.

Необхідно звернути увагу ще на один аспект процесу накопичення первинних даних: процес має, крім інформаційної, ще й організаційну складову, а тому поведінка учасників цього процесу впливає на якість первинних даних. Зважаючи на це, необхідним є створення умов, які забезпечують визначну, що забезпечує необхідний рівень якості, поведінку учасників процесу реєстрації первинних даних.

Таким чином, розробка моделей та обчислювальних методів, які дозволяють забезпечити якість первинних даних, як на рівні верифікації їх логічної структури, так і на рівні організації процесу їх накопичення, для подальшого використання в ході науково-дослідних і проектних робіт є актуальною.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконана відповідно до плану науково-дослідних робіт Харківського національного університету імені В. Н. Каразіна: в рамках держбюджетної теми «Розробка евристичних концептуальних моделей адаптаційних механізмів різної природи» (номер державної реєстрації 0105U000706) і міжнародного проекту TEMPUS TACIS “UnIT-Net - інформаційні технології в мережі університетського управління” (проект MP-JEP-23010-2002, номер державної реєстрації 1515).

Мета і задача дослідження. Метою дослідження є підвищення якості первинної інформації, що використовується в ході науково-дослідних і проектних робіт, шляхом побудови та аналізу моделей даних і процесу їх накопичення, що дозволяє розробити методи верифікації операцій створення та зміни даних, а також виявити умови узгодженої поведінки учасників процесу реєстрації первинних даних. Для досягнення цієї мети в роботі поставлені та вирішені такі задачі:

? дослідити особливості процесу реєстрації первинних даних для подальшого використання в ході науково-дослідних і проектних робіт;

? побудувати модель даних, які відповідають структурно-логічній моделі предметної галузі, представленої засобами підходящої математичної структури;

? дослідити інваріанти множини даних з метою формулювання в термінах цих інваріантів обмежень цілісності, забезпечивши, тим самим, контроль коректності структури даних при виконанні операцій їх реєстрації та модифікації; сховище дані затрата контрольний

? розробити та реалізувати модель сховища даних, яка дозволяє враховувати виявлені структурні обмеження;

? розробити метод відображення об'єктної моделі даних у реаляційну і назад;

? побудувати модель поведінки учасників процесу реєстрації даних з метою мінімізації затрат на контрольні процедури;

? розробити та реалізувати обчислювальні методи, що забезпечують аналіз моделі поведінки учасників процесу реєстрації даних.

Об'єкт дослідження ? процес накопичення первинної інформації в ході науково-дослідних і проектних робіт.

Предмет дослідження - моделі представлення і накопичення первинних даних у ході науково-дослідних і проектних робіт.

Наукова новизна результатів дисертаційної роботи. Наукова новизна отриманих результатів у тому, що в роботі

1)уперше запропонована та обґрунтована графова модель зразка півсхеми за рахунок встановлення взаємнооднозначної відповідності між зразками і маркованими деревами, що дозволило

? дослідити математичну структуру множини зразків схеми і, внаслідок цього, визначити інваріанти цієї структури та сформулювати в термінах отриманих інваріантів обмеження цілісності для множини зразків схеми,

? розробити формальні процедури контролю коректності структури даних при їх реєстрації та модифікації,

? створити комп'ютерну реалізацію моделі зразка схеми у вигляді структури даних «марковане дерево»;

2)отримав подальший розвиток метод об'єктно-реляційного відображення для випадку множини зразків схеми, що дозволило побудувати реляційну модель сховища зразків та на її основі розробити розрахункові методи:

? пошуку даних у сховищі,

? серіалізації та десеріалізації зразків схеми;

3)отримала подальший розвиток модель теорії ігор у застосуванні до опису взаємодії учасників процесу реєстрації первинних даних, що дозволило шляхом постановки і розв'язання зворотної задачі

? визначити умови, які забезпечують необхідну для підвищення якості реєстрації інформації поведінку учасників цього процесу, і

? розробити розрахунковий метод задоволення обмежень для розв'язання зворотної задачі теорії ігор.

Практичне значення одержаних результатів. Практична цінність роботи складається у тому, що усі теоретичні розробки автором доведені до конкретних інженерних методик, алгоритмів і реалізовані у вигляді прототипів програмних засобів, які базуються на результатах дослідження побудованих у роботі математичних моделей та використанні розроблених розрахункових методів. Зокрема, реалізований прототип сховища зразків схем на основі систем управління реляційними базами даних, прототип утиліти пошуку зразка і доступу до його компонентів, прототип додатку, призначеного для розв'язку зворотної задачі теорії ігор на основі розробленого в роботі методу. Практична цінність роботи підтверджується також упровадженням її результатів в Інституті інформаційних технологій Херсонського державного університету і компанії DBBEST Technology. Акти про впровадження наведені у додатках до роботи.

Особистий внесок здобувача. Усі результати дисертаційної роботи отримані автором самостійно. У публікаціях, які вийшли з друку у співавторстві, автору належать такі результати: запропонована модель представлення об'єктів і знань [1], побудована ігрова модель поведінки операторів інформаційних систем [3], запропоновано метод моделювання зразків схем маркованими деревами [4], поставлена зворотна задача теорії ігор [5], побудовано об'єктно-реляційне відображення для зразків схеми [6], побудована реляційна модель сховища зразків схем [7].

Апробація результатів досліджень. Основні результати дисертації доповідалися на

? V-й Міжнародній науково-практичній конференції «Аерокосмічні системи моніторингу і управління» (Київ, 2003 рік),

? Міжнародній науково-практичній конференції «Сучасні інформаційні технології в управлінні та професійній підготовці операторів складних систем» (Кіровоград, 2003 рік),

? ІІІ-й Міжнародній науково-практичній конференції «Динаміка наукових досліджень» (Дніпропетровськ, 2004 рік),

? ІІ-й науково-практичній міжнародній конференції «Інформаційні технології в управлінні вищими навчальними закладами» (Херсон, 2005 рік),

? VI-й Всеукраїнській науково-практичній конференції «Комп'ютерне моделювання та інформаційні технології в науці, економіці й освіті» (Кривий Ріг, 2005 рік),

? XIV-й Міжнародній науково-практичній конференції «Інформаційні технології: наука, техніка, освіта, здоров'я» (Харків, 2006 рік).

Публікації. За результатами наукових досліджень опубліковано 7 наукових робіт. Усі публікації у виданнях, які входять до переліку видань, затверджених ВАК України.

Структура і обсяг роботи. Дисертаційна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел і додатків. Повний обсяг дисертації складає ___ стор. Вона містить __ рисунків, __ таблиць, список використаних джерел із ___ назв на __ сторінках, додатки на __ сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтована тема дисертації, показаний її зв'язок з науковими темами, які виконуються у Харківському національному університеті імені В. Н. Каразіна, визначені мета і задачі дослідження, сформульовані наукова новизна і практична цінність отриманих результатів.

У першому розділі проаналізовані роботи, присвячені проблемі якості даних. На основі узагальнення результатів цих робіт запропоновано склад характеристик якості інформаційної системи (ІС) (рис. 1).

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Наведені на рис. 1 характеристики визначаються наступним чином:

точність даних ІС - ступінь відповідності запису бази даних ІС фактам, які вони представляють;

повнота даних ІС - ступінь представлення в базі даних ІС фактів предметної області;

несуперечливість даних ІС ? ступінь відповідності поточного стану бази даних ІС обмеженням цілісності;

актуальність даних ІС - ступінь відповідності поточного стану бази даних ІС системі фактів предметної області в поточний момент часу;

зміна даних ІС ? період часу, на протязі якого дані зберігають свою актуальність;

простежуємість даних ІС - властивість інформаційної системи фіксувати у базі даних не тільки актуальні факти про об'єкт предметної галузі, але й історію їх зміни.

Виходячи з залежності визначення характеристик від фактору часу, зроблено висновок про те, що якість первинної інформації визначається в першу чергу точністю, повнотою та несуперечливістю первинних даних.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

З метою подальшого визначення напрямів дослідження в першому розділі побудована модель процесу накопичення первинних даних (рис. 2) в ході науково-дослідних і проектних робіт. Її аналіз призводить до двох основних напрямків досліджень:

по-перше, побудові моделей структур даних з метою виявлення інваріантів, що визначають структурну цілісність інформації про предметну галузь дослідження або проекту і розробці розрахункових методів аналізу контролю цих варіантів у процесі реєстрації інформації,

по-друге, побудові моделей поведінки оператора в процесі реєстрації даних в інформаційній системі та розробці розрахункових методів пошуку умов, що забезпечують оптимальну поведінку реєстратора первинних даних.

Для ІС підтримки науково-дослідних і проектних робіт.

Другий розділ дисертації присвячено побудові та аналізу моделі первинних даних, які використовуються в наукових дослідженнях і проектних роботах. Наявність у таких даних складної, часто, рекурсивної структури не дозволяє безпосередньо використовувати реляційну модель. Розв'язок проблеми може бути отриманий шляхом уведення допоміжного логічного рівня в модель даних (рис. 3).

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

У роботі уведення допоміжного рівня забезпечується за рахунок використання для опису предметних галузей ІС формальної мови теорії півсхем, вибір якої обґрунтовується у другому розділі. Застосування цієї мови дозволяє

? описати основні властивості та зв'язки моделі даних, які не залежать від предметної області дослідження або проекту, що відповідає рівню метаметаданих;

? зафіксувати поняття (концепти) і структурні зв'язки між ними (виражені через варіанти визначення і ролі), що характерні для конкретної предметної області ? рівень метаданих;

? реєструвати факти предметної області дослідження або проекту як зразки відповідних концептів, що відповідає рівню даних.

У розділі наведено огляд теорії півсхем з коригуванням визначень основних об'єктів теорії так, щоб забезпечити природність поняття зразка, не вплинувши при цьому на основні результати.

Клас півсхем являє собою клас трійок , в кожній з яких - кінцева множина, що відповідає іменам понять (концептів) предметної галузі, - кінцева множина, що відповідає іменам ролей (локальним іменам компонентів концепту в контексті цього концепту), - множина пар , де , а - частково визначене відображення на зі значеннями в з не порожньою областю визначення, що зветься варіантом визначення (їх множина позначається далі ) і визначає типи компонентів концепту за локальними іменами останніх, для яких виконана аксіома локальної унікальності ролі:

(ЛУР)

Сама множина визначає можливість визначення концепти за допомогою варіанту визначення .

Концепт півсхеми є атомарним, якщо . Множина таких концептів позначається .

Фундаментальним поняттям теорії півсхем є поняття зразка, яке дозволяє формально визначати множини несуперечливих концептів. Це поняття вводиться в два етапи.

Спочатку визначається поняття форми як маркованого орієнтованого дерева, листя якого помічені елементами , інші вершини - елементами множини , а ребра - елементами множини , при цьому виконуються умови:

1.якщо вершина помічена , то вихідні з неї ребра знаходяться у взаємно однозначній відповідності з множиною і помічені її елементами;

2.якщо вершина помічена , вихідне з неї ребро - , то мітка сина вершини, відповідного ребру з міткою , співпаде з

2.1., якщо син є листком дерева;

2.2. і , якщо син не є листком дерева.

Форма відповідає концепту , якщо її корінь помічений (тобто дерево складається з однієї вершини), або якщо корінь помічений , то виконується .

Після цього визначається зразок (у граф-представленні), як форма, у якої всі листя відповідного маркованого дерева помічені елементами з . Зразок відповідає концепту , якщо він відповідає концепту як форма.

Півсхема зветься схемою, якщо кожен її концепт має хоча б один зразок.

У попередніх роботах з теорії півсхем поняття зразка уводиться іншим способом.

Спочатку визначається часткове відображення :

, тоді і тільки тоді, коли

визначено і

існує таке, що і

.

Коректність визначення забезпечується аксіомою локальної унікальності ролі.

На наступному кроці визначається іменуюча нитка концепту : іменуючою ниткою концепту зветься будь-яка пара , яка лежить в області визначення відображення . Іменуюча нитка концепту , у якій , зветься термінальною. Термінальні іменуючі нитки, таким чином, можуть бути охарактеризовані як іменуючі нитки, які не можуть бути продовжені.

І, нарешті, зразками (в теоретико-множинному представленні) називають кінцеві множини термінальних ниток , які мають наступну властивість: якщо для будь-якого - префікса будь-якої нитки з знайдеться , таке що , то є множиною всіх префіксів ниток з , для яких є префіксом.

Основний теоретичний результат другого розділу дає наступне твердження.

Теорема про еквівалентність. Існує конструктивне (що алгоритмічно реалізується) взаємно-однозначне перетворення теоретико-множинного представлення зразка у граф-представлення.

Цей основний результат дозволяє перейти від достатньо від теоретико-множинного визначення зразка до зразків у граф-представленні, яким відповідає добре визначена з точки зору інформатики структура даних «марковане дерево».

Виходячи з такого представлення зразків, які є інформаційними моделями фактів предметної області, у роботі побудоване реляційне сховище зразків схеми. Сховище відповідно до рис. 2 представлено трьома рівнями: рівнем метаметаданих, рівнем метаданих і рівнем даних. Аксіоматика цих рівней, яка визначає інваріанти відповідних структур даних, виражена в термінах півсхем (рівень метаметаданих).

Рівень метаметаданих:

- схема відношення, що визначає зв'язок між концептами і можливими для них варіантами визначення:, де - ім'я концепту; - ім'я варіанта визначення;

- схема відношення, що задає варіанти визначення, де - ім'я ролі; - посилання на ім'я концепту, що бере участь у визначенні в заданій ролі;

- схема відношення, що класифікує зразки, де - ідентифікатор зразка; - ім'я концепта, якому відповідає зразок;

- схема відношення, що специфікує зразки, де - ідентифікатор зразка; - ім'я варіанта визначення за допомогою якого визначається зразок;

- схема відношення, що визначає склад зразка, де - ім'я ролі варіанту визначення, якому відповідає зразок; - ідентифікатор компоненту зразка, що відповідає ролі;

обмеження цілісності - кожний варіант визначення є відображенням: якщо , то у виконується ;

обмеження цілісності - роль є унікальним посиланням, що визначає компонент у контексті концепта: якщо і , то в виконується ;

обмеження цілісності - вариант визначення однозначно задається своїм ім'ям: якщо , то для виконується

;

обмеження цілісності - структура зразка концепта може визначатись тільки варіантом визначення, що відповідає цьому концепту: якщо , і , то виконується

;

обмеження цілісності - концепт і варіант визначення зразка для останнього єдині: якщо і , то для виконується ;

обмеження цілісності - у зразку повинні бути присутні посилання тільки на існуючі зразки: якщо , і , то виконується

;

обмеження цілісності - структура зразка не повинна суперечити способам опису, що задаються варіантами визначення і відповідністю між концептами і варіантами визначення: якщо , , , і , то виконується

Рівень метаданих:

відношення зі схемою , що визначає відповідність між концептами і варіантами визначення конкретної схеми;

відношення зі схемою , що визначає варіанти визначення конкретної схеми;

умова коректності - виконані обмеження цілісності 6 - 8.

Рівень даних:

відношення зі схемою , що визначає відповідність між концептами та їх зразками;

відношення зі схемою , що задає спосіб визначення кожного із зразків;

відношення зі схемою , що визначає структуру зразків;

умова коректності - виконані обмеження цілісності 9 - 12.

В останньому підрозділі розділу 2 наводяться алгоритми, що визначають об'єктно-реляційне відображення множини зразків схеми у реляційне сховище даних, а також операції, які не порушують наведених вище інваріантів.

Об'єктно-реляційне відображення визначається двома операціями:

Операція десеріалізації зразка.

Призначення:

відновлення зразка зі сховища за ідентифікатором зразка.

Операція серіалізації зразка.

Призначення:

збереження в сховищі інформації, що необхідна для відновлення зразка.

Крім того, дано визначення та приведено обґрунтування коректності наступних операцій:

Операція створення зразка.

Призначення:

вставка нового зразка поняття у відповідності із заданим варіантом визначення із заданих компонентів.

Операція видалення зразка.

Призначення:

видалення запису, який відповідає зразку поняття зі сховища зразків, а також записів, які прямо або опосередковано на неї посилаються.

Операція пошуку зразків за формою.

Призначення:

формування підмножини зразків, які продовжують задану форму.

Алгоритми методів, що описані у другому розділі, доведені до програмної реалізації засобами мови програмування PROLOGу вигляді прототипів утиліт операцій над сховищем.

Третій розділ дисертаційної роботи присвячено моделюванню поведінки оператора у процесі реєстрації даних в інформаційній системі. При аналізі поведінки оператора, відповідно до моделі процесу реєстрації даних (рис. 2) розглядаються наступні учасники процесу: реєстратор (оператор) і адміністратор (дослідник). У рамках згаданої моделі етап реєстрації даних складається з двох підетапів: по-перше, введення даних і, по-друге, перевірки введених даних. Перевірка введених даних, як відомо, дозволяє розпізнати до 65% помилок введення, що суттєво підвищує якість даних. Моделювання поведінки оператора і дослідника базується на ігровому підході в рамках теорії безкоаліційних ігор двох осіб. У теорії ігор розв'язується задача пошуку оптимальних стратегій для учасників гри при заданій системі платіжних функцій. У роботі пропонується розв'язувати зворотну задачу - за заданою системою стратегій (ситуації) для учасників гри побудувати такі платіжні функції, для яких вихідна система стратегій є оптимальною. Оптимальність залежно від умов розуміється в одному із наступних понять: оптимальність за домінуванням, стійкість по Нешу, стійкість по Парето.

Рішення задачі в такій постановці забезпечує відповідь на наступне запитання: «Як необхідно організувати стимулювання учасників гри, щоб їх оптимальна поведінка відповідала заданим стратегіям?». Задача у такій постановці є окремим випадком задачі, що характерна для мультиагентного підходу в області штучного інтелекту та відомої як задача синтезу механізму взаємодії.

У роботі запропонована модифікація стандартної моделі гри у розгорнутій формі. Метою модифікації моделі гри є зменшення обсягу інформації, що необхідна для представлення гри і забезпечує можливості перетворення, які необхідні для рішення задачі синтезу взаємодії.

У пропонованій моделі гравці представляються кінцевою множиною з двома виділеними елементами і , при цьому і .

Поточним позиціям гри відповідають елементи кінцевої множини , в якій виділена початкова позиція .

Черговість ходів задається функцією , що визначає для кожної позиції гри гравця, який має прийняти рішення, при цьому .

Гра, для якої , називається грою без випадкових ходів, а гра, для якої - грою з випадковими ходами.

Будемо використовувати позначення , де .

Правила гри задаються відношенням , при цьому записується у вигляді , де - кінцева множина імен ходів гри. Для цього відношення виконуються наступні аксіоми:

- аксіома однозначності ходу;

- аксіома термінальності ходу ;

- аксіома необхідності прийняття рішення гравцем.

Визначимо , тоді в силу аксіоми термінальності ходу .

Партією гри називається слово в алфавіті , для якого існує послідовність елементів , що задовольняє умовам і .

Твердження. Послідовність однозначно визначається партією .

Послідовність називається траєкторією, що відповідає партії , і в силу єдності траєкторії партію з траєкторією можна позначати так:

.

Неповнота інформації, яку має гравець під час вибору варіанта ходу, моделюється відношенням еквівалентності на множині , що задовольняє умовам:

;

;

;

;

ніяка траєкторія не проходить через еквівалентні стани.

Стратегією гравця називається відображення , яке задовольняє умовам:

;

.

Множину стратегій гравця позначимо через .

Відображення називається ігровою ситуацією, якщо . Множину ігрових ситуацій позначимо через .

Прийняття рішень в позиціях з відбувається у відповідності до випадкового механізму, який визначається шляхом задання для кожного розподілу ймовірностей на . У цьому випадку для партії імовірність її реалізації визначається формулою:

.(1)

Кожній ситуації можна поставити у відповідність партію, однозначно, якщо гра є грою без випадкових ходів, або випадково, якщо гра є грою з випадковими ходами відповідно до наступного алгоритму:

procedure ( - ситуація)

while Do

If Then

вибрати з випадково відповідно

до розподілу

еlse

еnd If

визначити так, щоб

еnd do

return

end proc

Множина всіх партій, що генеруються наведеним алгоритмом для ситуації , є імовірнісним простором, якщо постачити його імовірнісною мірою відповідно до формули (1).

Функція називається функцією платежу гравцю .

Виграшем гравця в ситуації назвемо:

,

де - партія, що генерується за , яка закінчується в позиції .

Зворотна задача теорії безкоаліційних ігор тепер може бути формально поставлена таким чином: для заданої гри і ситуації знайти таку систему платіжних функцій , відносно яких поведінка заданої ситуації є розв'язком гри або в смислі домінування, або в смислі рівноваги Неша, або в смислі Парето.

У роботі вказана задача в рамках синтезу поведінки реєстратора даних і дослідника розв'язувалась у наступній постановці:

вибиралася ситуація, в якій реєстратор проводив контроль даних, а адміністратор виконував адміністративний контроль як можна рідше;

гра розв'язувалась в смислі домінування.

Для розв'язку задачі використовувався метод логічного програмування в обмеженнях для задачі задоволення обмежень, який був модифікований з метою забезпечення автоматичної генерації обмежень на основі опису гри та вибраного критерію оптимальності.

При численному аналізі поведінки оператора ставилась задача синтезу таких платіжних функцій, які забезпечують оптимальність сумлінної поведінки реєстратора - виконання процедури контролю завжди, за виключенням переходу на режим вибіркового контролю внаслідок дефіциту часу.

При аналізі розглядались два типи поведінки реєстратора:

- тип реєстратора з сумлінною поведінкою, який характеризується відсутністю для нього вигоди від навмисного ухиляння від процедури контролю даних;

- тип реєстратора з несумлінною поведінкою, який характеризується наявністю для нього вигоди від навмисного ухиляння від процедури контролю даних.

Інтерпретація результатів численного аналізу наведені в таблиці.

Таблиця

Залежність характеру платіжних функцій від типу поведінки оператора

Характеристика типу

поведінки реєстратора

Характеристика платіжних функцій

сумлінний

платіжні функції не повинні передбачати штраф за несвоєчасне виконання робіт

несумлінний

платіжні функції повинні передбачати штраф за несвоєчасне виконання робіт

Програмний додаток, призначений для реалізації методу синтезу платіжних функцій, реалізований на мові PROLOG (версія SWI) з використанням стандартних бібліотек логічного програмування в обмеженнях.

Четвертий розділ присвячено оцінці підвищення якості первинної інформації. Оцінка проводилася шляхом порівняння результатів контролю інформації, введеної з використанням методів, запропонованих у роботі, і введеної традиційним способом у процесі роботи над проектом PIKABA,, що реалізований компанією DBBEST Technology. Показники якості визначались для двох незалежних груп реєстраторів: незалежність була забезпечена за рахунок ізольованості цих груп: перша - досліджу вальна група працювала в Україні, друга - контрольна в США. На протязі трьох місяців були проведені порівняння показників якості введених обома групами даних - їх відмінність не перевищувала 6%. Після упровадження результатів роботи для досліджувальної групи показники якості даних, що нею вводились, контролювались і порівнювались з показниками контрольної групи на протязі семи місяців. У результаті було зафіксовано поліпшення показників якості даних, що вводились досліджувальною групою, у порівнянні з контрольною групою, яке склало:

- за точністю даних - 15%;

- за повнотою даних - 10%;

- за суперечністю даних - 17%.

Таким чином, зафіксовано поліпшення усіх показників якості, що характерні для ІС підтримки науково-дослідних і проектних робіт, що дозволяє зробити висновок про досягнення мети, що поставлена у роботі.

ВИСНОВКИ

У дисертаційній роботі шляхом математичного моделювання даних і процесу їх накопичення вирішена актуальна науково-прикладна задача підвищення якості первинної інформації, яка використовується в ході науково-дослідних і проектних робіт, що дозволяє удосконалити інформаційні системи підтримки наукових досліджень і проектування. Основні результати, які були отримані в роботі, складаються в наступному:

уточнено поняття півсхеми предметної області, що дозволило спростити визначення поняття зразок півсхеми;

побудована математична модель даних, яка відповідає структурно-логічній моделі предметної області, що описана засобами теорії півсхем, яка базується на структурі даних «марковане дерево»;

визначені та досліджені інваріанти множини зразків схеми, що дозволило сформулювати в термінах цих інваріантів структурні обмеження, які забезпечують контроль коректності структури даних під час виконання операцій їх реєстрації і модифікації;

розроблена реляційна модель сховища зразків схеми, яка враховує знайдені структурні обмеження, що дозволило побудувати на її основі спеціальне об'єктно-реляційне відображення, а також реалізувати сховище зразків схеми засобами систем управління реляційними базами даних;

побудована та досліджена ігрова модель поведінки учасників процесу реєстрації даних, в результаті чого встановлено, що забезпечити необхідну поведінку учасників процесу можна за рахунок підбору платіжних функцій гри;

поставлена зворотна задача теорії ігор, яка полягає в пошуку платіжних функцій, що забезпечують оптимальність наперед заданої поведінки учасників гри;

розроблено розрахунковий метод розв'язання зворотної задачі теорії ігор, який базується на методі задоволення обмежень засобами логічного програмування;

на основі отриманих у роботі теоретичних результатів програмно реалізовані прототипи:

- сховища зразків схем на основі систем управління реляційними базами даних,

- утиліти серіалізації, десеріалізації, пошуку зразків і доступу до їх компонентів,

- додатка, що призначений для розв'язання зворотної задачі теорії ігор на основі розробленого розрахункового методу.

СПИСОК ОПУБЛІКОВАНИХ РОБІТ З ТЕМИ ДИСЕРТАЦІЇ

Ахмад Юсеф Ибрахим Ибрахим. Представление объектов и знаний в информационной среде «Система анализа форм отчетности» / С. Н. Богомолов, Ахмад Юсеф Ибрахим Ибрахим, П. А. Иващенко // Математичне моделювання. Інформаційні технології. Автоматизовані системи управління: вісн. Харк. нац. ун-та. - Вип. 703(5). - Х., 2005. - С. 42 - 49.

Ахмад Юсеф Ибрахим Ибрахим. Об одной модели поведения операторов информационных систем / Ахмад Юсеф Ибрахим Ибрахим // Зб. наук. праць Харк. ун-ту ПС. - Вип. 1(7). - Х., 2006. - С. 85 - 89.

Ахмад Юсеф Ибрахим Ибрахим. О моделировании одного из факторов качества информации в информационных системах / Ахмад Юсеф Ибрахим Ибрахим, Г. Н. Жолткевич // Системи обробки інформації: зб. наук. праць Харк. ун-ту ПС. - Вип. 1 (50). - Х., 2006. - С. 48 - 54.

Ахмад Юсеф Ибрахим Ибрахим. О возможности представления образцов понятий полусхем маркированными деревьями / Ахмад Юсеф Ибрахим Ибрахим, Г. Н. Жолткевич // Системи обробки інформації: зб. наук. праць Харк. ун-ту ПС. - Вип. 2 (51). - Х., 2006. - С. 20 - 26.

Ахмад Юсеф Ибрахим Ибрахим. Об одной модели поведения субъектов процесса формирования и обработки отчетной информации / Ахмад Юсеф Ибрахим Ибрахим, Г. Н. Жолткевич // Радіоелектронні і комп'ютерні системи. - №1, 2006. - С. 87 - 91.

Ахмад Юсеф Ибрахим Ибрахим. Модель хранения образцов полусхем средствами реляционных баз данных / Ахмад Юсеф Ибрахим Ибрахим, Г. Н. Жолткевич // Вест. нац. техн. ун-та «ХПИ». - Вып. 19. -Х., 2006. - С. 71 - 76.

Ахмад Юсеф Ибрахим Ибрахим. Организация хранилища образцов понятий схемы для представления сложных структурированных данных / Ахмад Юсеф Ибрахим Ибрахим, Г. Н. Жолткевич // Радіоелектронні і комп'ютерні системи. - №2, 2006. - С. 67 - 72.

АНОТАЦІЯ

Ахмад Юсеф Ібрахім Ібрахім. Моделювання первинних даних та процесу їх накопичення у ході науково-дослідних і проектних робіт. - Рукопис.

Моделювання первинних даних та процесу їх накопичення в ході науково-дослідних та проектних робіт.

Дисертаційна робота присвячена розв'язанню актуальної науково-прикладної задачі - підвищення якості первинної інформації, що використовується під час науково-дослідних та проектних робіт, шляхом побудови й аналізу математичних моделей структур даних і математичних моделей поведінки учасників процесу реєстрації даних. Це дозволяє удосконалювати інформаційні системи підтримки наукових досліджень та проектних робіт.

У роботі запропоновані два підходи до підвищення якості первинних даних. Перший з них полягає в математичному моделюванні структур даних, досліджені інваріантів цих моделей і розробці обчислювальних методів контролю відповідності даних, що вводяться, знайденим інваріантам. Другий - у побудові та аналізі математичної моделі поведінки осіб, які беруть участь у процесі реєстрації даних, для з'ясування умов, що сприяють виконанню учасниками процесу необхідних процедур, спрямованих на забезпечення якості даних.

На основі теоретичних результатів, отриманих в роботі, розроблені прототипи програмного забезпечення, що дозволяє розв'язувати практичні задачі підвищення якості даних в процесі їх реєстрації.

Ключові слова: інформаційна система, дані, якість даних, структурно-логічна модель, інваріант, гра, стратегія, ситуація, оптимальність.

АННОТАЦИЯ

Ахмад Юсеф Ибрахим Ибрахим. Моделирование первичных данных и процесса их накопления в ходе научно-исследовательских и проектных работ. - Рукопись.

Моделирование первичных данных и процесса их накопления в ходе научно-исследовательских и проектных работ.

Диссертационная работа посвящена решению актуальной научно-прикладной задачи - повышение качества первичной информации, которая используется в ходе научно-исследовательских и проектных работ, путем построения и анализа математических моделей структур данных и математических моделей поведения участников процесса регистрации данных. Это позволяет усовершенствовать информационные системы поддержки научных исследований и проектных работ.

Решению указанной задачи в работе предшествует анализ современных подходов к определению и обеспечению качества данных для информационных систем. На основании этого анализа и анализа модели процесса регистрации данных установлены характеристики, определяющие качество первичных данных, используемых в ходе научно-исследовательских и проектных работ. Кроме указанных характеристик предложены два подхода к повышению качества первичных данных. Первый из них состоит в математическом моделировании структур данных, исследовании инвариантов этих моделей и разработки вычислительных методов контроля соответствия вводимых данных выявленным инвариантам. Второй - в построении и анализе математической модели поведения лиц, которые участвуют в процессе регистрации данных, для выявления условий, способствующих выполнению участниками процесса необходимых процедур, направленных на обеспечение качества данных.

Реализация первого из подходов потребовала выбора математического формализма, который позволяет описывать модели и структуры данных, а также сами данные. В качестве такого формализма выбрана теория полусхем. На основании сделанного выбора в работе уточнено понятие полусхемы предметной области, что позволило упростить определение понятия образец полусхемы. Построена математическая модель данных, которая соответствует структурно-логической модели предметной области, описанной средствами теории полусхем, базирующейся на структуре данных «маркированное дерево». Определены и исследованы инварианты множества образцов схемы, что позволило сформулировать в терминах этих инвариантов структурные ограничения, обеспечивающие контроль корректности структуры данных во время выполнения операций их регистрации и модификации. Разработана реляционная модель хранилища образцов схемы, которая учитывает найденные структурные ограничения, что позволило построить на ее основе специальное объектно-реляционное отображение, а также реализовать хранилище образцов схемы средствами систем управления реляционными базами данных.

Реализация второго из подходов привела к построению и исследованию игровой модели поведения участников процесса регистрации данных. В результате исследования установлено, что обеспечить необходимое поведение участников процесса можно за счет подбора платежных функций игры. Поставлена обратная задача теории игр, которая состоит в поиске платежных функций, обеспечивающих оптимальность наперед заданного поведения участников игры. Разработан вычислительный метод решения обратной задачи теории игр, который базируется на методе удовлетворения ограничений средствами логического программирования.

На основе полученных в работе теоретических результатов программно реализованы прототипы хранилища образцов схем на основе систем управления реляционными базами данных, утилит сериализации, десериализации, поиска образцов и доступа к их компонентам, приложения, предназначенного для решения обратной задачи теории игр на основе разработанного вычислительного метода.

Ключевые слова: информационная система, данные, качество данных, структурно-логическая модель, инвариант, игра, стратегия, ситуация, оптимальность

SUMMARY

Ahmad Yosef Ibrahim Ibrahim. Modelling of a primary data and a process of data storage in the course of research works and developments. - Manuscript.

Modelling of a primary data and a process of data storage in the course of research works and developments

The principal purpose of the thesis is solving of the topical problem. The problem is improvement of data quality for data used in the course of research works and developments. The path of problem solution is based on mathematical model of data structures formulation and them investigation and mathematical model of data registration process formulation and investigation. Results of models analysis are used for R&D works supporting information systems improving.

Two main approaches to data improvement are described in the thesis. The first deals with mathematical modelling of data structures, identifying and studying of the invariants and developing computing methods for check input data conformity with data integrity constraints. The second deals with behaviour of data registration process subjects model formulation and analysis to identification conditions for process subjects efforts to improve data quality.

Software prototypes for real-world problem of data quality improving are developed on the base of thesis theoretical results.

Key words: information systems, data, data quality, structural-logical model, invariant, game, strategy, situation, optimality

Размещено на Allbest.ru


Подобные документы

  • Загальний аналіз ризиків. Види несанкціонованого проникнення та загрози онлайн-платежів, їх сутність. Аутентифікація та електронно-цифровий підпис. Аналіз статистичних даних і побудова моделі злочинів інтернет-банкінгу. Практична реалізація моделі.

    курсовая работа [1,8 M], добавлен 13.04.2013

  • Теоретичні дослідження моделювання виробничого процесу виробництва. Програмне забезпечення моделювання процесу виробництва. Комп’ютерні технології розв’язання моделей. Практичне використання теми в економіці.

    реферат [22,4 K], добавлен 18.04.2007

  • Статистичний і економічний зміст коефіцієнтів кореляції і детермінації. Економічне тлумачення довірчих інтервалів коефіцієнтів моделі, точкового значення прогнозу. Форма відображення статистичних даних моделі. Параметри стандартного відхилення асиметрії.

    контрольная работа [20,1 K], добавлен 03.08.2010

  • Побудова, дослідження емпіричної лінійки економетричної моделі залежності обсягу виробництва фірми від витрат на заробітну платню персоналу й вартості основних фондів. Складання матриці вихідних даних. Прогноз середньорічного обсягу виробництва для фірми.

    контрольная работа [167,5 K], добавлен 07.11.2010

  • Побудова економетричної моделі парної регресії. На основі даних про витрати обігу (залежна змінна) і вантажообігу (незалежна змінна) побудувати економетричну модель. Рівняння регресії. Коефіцієнт парної детермінації та кореляції. Перевірка надійності.

    задача [563,6 K], добавлен 28.12.2008

  • Перевірка макроекономічних показників Австрії на стаціонарність даних. Побудова економетричної моделі впливу показників інфляції, кількості зайнятих та безробітних на приріст валового внутрішнього продукту. Аналіз скоригованого коефіцієнту детермінації.

    контрольная работа [35,0 K], добавлен 05.01.2014

  • Зміст методики перевірки статистичної вибірки на розподіл за нормальним законом. Формування рандомізованого плану проведення спостережень за обсягами перевезень, поняття регресійної моделі та коефіцієнтів детермінації і кореляції, виявлення помилок.

    контрольная работа [77,8 K], добавлен 18.05.2011

  • Предмет, об'єкт, метод та основні завдання економетрики. Розробка і дослідження эконометричних методів (методів прикладної статистики) з урахуванням специфіки економічних даних. Поняття економетричної моделі і її вибір. Типи економетричних моделей.

    контрольная работа [32,8 K], добавлен 18.06.2010

  • Моделювання як наука. Типові математичні схеми моделювання систем. Статистичне моделювання систем на ЕОМ. Технології та мови моделювання. Методи імітаційного моделювання із застосуванням пакета GPSS World. Ідентифікація параметрів математичної моделі.

    курс лекций [1,4 M], добавлен 01.12.2011

  • Теоретичні основи методів аналізу фінансових даних. Формалізований опис емпіричних закономірностей фінансових часових рядів. Розробка алгоритмів оцінювання параметрів волатильності і комплексу стохастичних моделей прогнозування фінансових індексів.

    курсовая работа [1,4 M], добавлен 05.05.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.