Методи та засоби персоніфікації інформаційного наповнення у глобальній системі World Wide Web
Проблема поліпшення якості інформаційного наповнення (ІН) у глобальній системі World Wide Web (WWW) за допомогою розроблення нових науково обґрунтованих методів та засобів персоніфікації ІН. Упровадження розроблених методів в українському сегменті WWW.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 29.07.2015 |
Размер файла | 2,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Національний університет "Львівська політехніка”
АВТОРЕФЕРАТ
дисертації на здобуття наукового ступеня
кандидата технічних наук
Методи та засоби персоніфікації інформаційного наповнення у глобальній системі World Wide Web
Спеціальність 01.05.03 - математичне та програмне забезпечення обчислювальних машин і систем
Березко Олександр Леонідович
Львів - 2011
Дисертацією є рукопис.
Робота виконана у Національному університеті "Львівська політехніка" Міністерства освіти і науки, молоді та спорту України.
Науковий керівник - |
доктор технічних наук, доцент Пелещишин Андрій Миколайович, Національний університет "Львівська політехніка”, професор кафедри інформаційних систем та мереж |
|
Офіційні опоненти - |
доктор фізико-математичних наук, професор Цегелик Григорій Григорович, Львівський національний університет імені Івана Франка, завідувач кафедри математичного моделювання соціально-економічних процесів |
|
кандидат технічних наук, доцент Пастух Олег Анатолійович, Тернопільська філія Приватного вищого навчального закладу "Європейський університет”, завідувач кафедри математичних дисциплін та інформатики |
Захист відбудеться 9 червня 2011 р. о 16 00 годині на засіданні спеціалізованої вченої ради Д 35.052.05 у Національному університеті "Львівська політехніка" (79013, м. Львів, вул. С. Бандери, 12).
З дисертацією можна ознайомитися у науково-технічній бібліотеці Національного університету "Львівська політехніка" (79013, м. Львів, вул. Професорська, 1).
Автореферат розісланий "__” _________ 2011 р.
Вчений секретар спеціалізованої вченої ради, доктор технічних наук, професор Р.А. Бунь.
Загальна характеристика роботи
Актуальність теми. Упродовж останніх років, у зв'язку з появою нових тенденцій, які набули поширення у World Wide Web і отримали спільну назву Веб 2.0, стрімко зростають обсяги інформаційного наповнення (ІН) у цій глобальній системі. Це зумовлено активністю користувачів WWW у межах різноманітних веб-сайтів із соціальною складовою та веб-спільнот.
Ефективне опрацювання ІН у системі WWW спільнотою її користувачів є однією із засад розвитку інформаційного суспільства. Організація Об'єднаних Націй визначила інформаційне суспільство пріоритетним орієнтиром розвитку людства.
Актуальні наукові дослідження опрацювання ІН у WWW охоплюють чотири напрями.
Перший напрям - організація опрацювання ІН - охоплює різноманітні методи індивідуального та колаборативного опрацювання ІН у WWW кінцевими користувачами цієї системи (W. Cunningham, A. Mathes), а також розвиток програмних засобів управління ІН (Ch. Anderson, T. O'Reilly).
Пошук та видобування даних - у цьому напрямі ведуться дослідження, націлені на пошук серед ІН у WWW (L. Page, R. Baeza-Yates, М. Маслов) та видобування з нього даних, зокрема з використанням засобів штучного інтелекту (B. Mobasher, R. Kosala).
Позиціонування ІН - цей напрям охоплює дослідження, пов'язані з визначенням, формуванням та підвищенням ефективності позиції ІН веб-сайтів, окремих веб-сторінок та дописів користувачів WWW (І. Ашманов, А. Пелещишин); структуруванням їхнього ІН за семантичними ознаками (T. Berners-Lee, J. Hendler, G. Antoniou, I. Horrocks).
Підвищення якості ІН - метою досліджень цього напряму є створення та вдосконалення стандартів для ІН у WWW (T. Berners-Lee; колективи міжнародних спеціалізованих організацій: W3C - www.w3.org; IETF - www.ietf.org; WaSP - webstandarts.org тощо); визначення критеріїв якості ІН (M. Parker); підвищення якості (зокрема встановлення достовірності) ІН завдяки розробленню нових користувацько-орієнтованих методів та засобів опрацювання ІН.
Нині особливу увагу привертає саме дослідження і розвиток методів та засобів підвищення якості ІН у WWW. Пояснюється це тим, що вкрай необхідно поліпшити якість величезних обсягів користувацького інформаційного наповнення (КІН) як окремих веб-спільнот, так і цілих сегментів глобальної системи WWW (зокрема українського сегмента).
Важливою складовою якості ІН є його достовірність. КІН характеризується низькою достовірністю порівняно з ІН у WWW, створеним фахівцями. Цей недолік КІН сьогодні ускладнює комунікативні процеси у межах веб-спільнот, суттєво погіршує загальну якість ІН у WWW та гальмує розвиток інформаційного суспільства. Загалом, низька достовірність КІН нівелює усі його інші позитивні характеристики.
Достовірність КІН повністю визначається тим, чи можна довіряти його автору. Тому, актуалізується фіксація авторства КІН та формування відкритої репутації користувачів WWW.
Попри важливість, цей напрям досліджень розвинений порівняно мало, наявні методи та засоби є некомплексними. Істотним їхнім недоліком є те, що не створено додаткових мотивувальних факторів для кінцевих користувачів.
Для виправлення ситуації у дисертаційній роботі запропоновано використати персоніфікацію ІН у WWW - процес встановлення та оприлюднення зв'язків між ІН та його авторами (користувачами WWW). Принциповою перевагою персоніфікації є можливість формувати погляд на ІН у WWW як на множину інформаційних відображень користувачів WWW (веб-особистостей). Персоніфіковане КІН користується довірою користувачів WWW (анонімне КІН є завідомо недостовірним) і впливає на репутацію його авторів.
Використання персоніфікації дає змогу забезпечити комплексний підхід до фіксації авторства та формування відкритої репутації авторів. Тому актуальним є розроблення методів та засобів персоніфікації ІН у WWW.
Зв'язок роботи з науковими програмами, планами, темами. Дисертаційну роботу виконано у межах пріоритетного наукового напряму, який затвердило Міністерство освіти і науки України, - "Нові комп'ютерні засоби та технології інформатизації суспільства" за темами: ДБ/Ізоморф "Розробка методів і засобів побудови інтелектуальних інформаційних систем на основі часових реляційних баз даних" (номер державної реєстрації 0104U002299); ДБ/Бізнес "Моделі та методи побудови інтелектуальних систем бізнес-аналітики на основі інтегрованих інформаційних ресурсів” (номер державної реєстрації 0110U001102); та відповідно до тематики ІСМ-1 кафедри інформаційних систем та мереж Національного університету "Львівська політехніка" "Розробка методів і засобів реалізації соціальних систем в мережі Інтернет в умовах розвитку інформаційного суспільства" (номер державної реєстрації 0110U005019).
Дисертаційна робота відповідає загальному напряму досліджень з використання WWW як інфраструктури інформаційного суспільства, яке визначено пріоритетним напрямом розвитку цивілізації у резолюції 60-ї сесії Генеральної Асамблеї ООН.
Мета і завдання дослідження. Метою дисертаційної роботи є поліпшення якості ІН у WWW за допомогою розроблення нових науково обґрунтованих методів та засобів персоніфікації ІН та упровадження цих методів в українському сегменті WWW.
Задля досягнення мети, у дисертаційній роботі поставлено такі завдання:
Проаналізувати процес опрацювання ІН у глобальній системі World Wide Web її користувачами, щоб виконати моделювання цього процесу та КІН у WWW.
інформаційне наповнення world wide web
Розробити формальну персоніфікаційну модель ІН у WWW, частиною якої є система формальних показників веб-сайтів, веб-сторінок та дописів, яка дасть змогу розробити їх спеціалізовані класифікації.
Розробити методи та алгоритми персоніфікації ІН у WWW через каталогізацію веб-особистостей та їхніх елементів, агрегацію персоніфікаційних зв'язків за допомогою множини суспільних акцій у WWW, колаборативного формування ІН у межах wiki-спільнот.
Апробувати результати дисертаційних досліджень, розробивши програмний комплекс на основі побудованих алгоритмів, та упровадити експериментальну систему персоніфікації для перевірки сформульованих теоретичних засад.
Об'єктом дослідження є процеси формування ІН у глобальній системі WWW.
Предметом дослідження є методи та засоби підвищення рівня персоніфікованості ІН у глобальній системі WWW.
Методи дослідження. Дослідження, виконані під час роботи над дисертацією, ґрунтуються на: теоретико-множинних підходах, теорії відношень, апараті теорії реляційної алгебри та баз даних, структурній методології аналізу та проектування інформаційних систем, сучасних веб-технологіях.
Наукова новизна одержаних результатів полягає в науковому обґрунтуванні та розробленні нових методів та засобів розв'язання задачі персоніфікації інформаційного наповнення у WWW. Отримано такі наукові результати:
уперше побудовано спеціальну персоніфікаційну модель ІН у WWW шляхом формального опису характеристик КІН та процесу його створення користувачами WWW, що дало змогу формалізувати задачу персоніфікації ІН у WWW та покладено в основу методів персоніфікації;
уперше розроблено систему формальних показників веб-сайтів, веб-сторінок та дописів у результаті системного аналізу WWW та персоніфікаційних характеристик ІН та веб-сайтів, що дало змогу удосконалити класифікацію веб-сайтів та їхніх компонент для персоніфікації ІН у WWW;
удосконалено метод активної персоніфікації ІН у WWW завдяки використанню користувацько-орієнтованого підходу під час організації суспільних акцій у WWW для створення персоніфікаційних зв'язків, що дало змогу створити мотивувальні фактори для персоніфікації ІН у WWW та використати особливості популярних систем управління ІН для персоніфікації;
удосконалено метод пасивної персоніфікації ІН у WWW із застосуванням каталогізації веб-особистостей та їхніх елементів, що дало змогу описувати веб-особистості та їхні елементи, зокрема декларувати їхню тематичну, регіональну та мовну приналежність;
розроблено новий користувацько-орієнтований метод змішаної персоніфікації ІН у WWW, в якому застосовано колаборативний принцип wiki до створення персоніфікаційних зв'язків, що уможливило використання wiki-спільнот для персоніфікації ІН у WWW.
Практичне значення одержаних результатів. Практичне значення наукових результатів дисертаційної роботи зумовлено тим, що вони допомагають суттєво підвищити рівень персоніфікованості ІН веб-спільнот. Зокрема, практично цінними є результати, що полягають у розробленні:
групи алгоритмів пасивної віддаленої персоніфікації: алгоритму персоніфікації з каталогізацією елементів веб-особистостей і алгоритму створення та опису персоніфікаційного зв'язку в каталозі веб-особистостей, що дає змогу агрегувати персоніфіковані дані та достовірно оприлюднювати встановлені персоніфікаційні зв'язки в межах каталогу веб-особистостей;
групи алгоритмів агрегації персоніфікованих даних у глобальній системі WWW за допомогою wiki-систем з використанням нових шаблонів ІН для популярної системи управління ІН MediaWiki, що допомагає залучити глобальну веб-спільноту до персоніфікації ІН у межах wiki-спільнот;
групи алгоритмів активної персоніфікації: алгоритмів ініціювання суспільних акцій, створення персоніфікаційної вставки, активної реферальної персоніфікації, оброблення запиту на одержання персоніфікаційної вставки, фільтрування некоректних персоніфікаційних зв'язків, що дає змогу ефективно окреслювати окіл веб-особистостей та здійснювати моніторинг їхньої активності;
архітектури та технологічних рішень компонент комплексу програмного забезпечення персоніфікації ІН; упроваджена і діє експериментальна система персоніфікації для перевірки одержаних теоретичних результатів.
Практичне значення дисертаційної роботи підтверджено застосуванням розроблених теоретичних засад під час персоніфікації ІН веб-спільнот. Результати дисертаційних досліджень впроваджено у таких державних та громадських проектах:
у Львівській обласній державній адміністрації - комплексний веб-сайт етнофестивалю "Підкамінь”;
у Золочівській районній державній адміністрації - комплексний веб-сайт Міжнародного екологічного етнофестивалю "Верхобуж”;
у Первинній профспілковій організації студентів і аспірантів Національного університету "Львівська політехніка" - комплексний веб-сайт організації.
Результати дисертаційних досліджень використано також у Міністерстві економіки України як консультативний та методичний матеріал:
під час підготовки пропозицій щодо розроблення та виконання Постанови Кабінету Міністрів України "Про затвердження Державної цільової програми розвитку системи інформаційно-аналітичного забезпечення реалізації державної інноваційної політики та моніторингу стану інноваційного розвитку економіки" від 7 травня 2008 р. за № 439;
у ході підготовки та реалізації розпорядження Кабінету Міністрів України "Про схвалення Концепції розвитку національної інноваційної системи" від 17 червня 2009 р. за № 680-р;
для формування окремих напрямів інноваційного розвитку економіки України впродовж 2008-2009 рр.
Особистий внесок здобувача. Усі наукові результати дисертаційної роботи автор отримав самостійно. У друкованих працях, опублікованих у співавторстві, здобувачеві належать:
[8] - формальний опис веб-особистості; [9] - аналіз концепції Веб 2.0; [10] - опис поняття "веб-особистість”, методи фіксації авторства; [15] - визначення суспільної акції у WWW; [20] - формальний опис місця веб-особистості у системі WWW; [21] - порівняння концепцій Вебу 2.0 та семантичного вебу; [22] - метод фіксації авторства.
Апробація результатів дисертації. Основні результати наукових досліджень неодноразово обговорювались на міжнародних та університетських наукових конференціях, зокрема: Second International Conference "Advanced Computer Systems and Networks: Design and Application (ACSN-2005) ” (Львів, 2005); Міжнародній науково-практичній конференції студентів, аспірантів та молодих вчених "Шевченківська весна" (Київ, 2006); першій, другій, третій та четвертій міжнародних конференціях молодих вчених "Комп'ютерні науки та інженерія (CSE) ” (Львів, 2006, 2007, 2009, 2010); 63-й та 64-й студентських науково-технічних конференціях Національного університету "Львівська політехніка" (Львів, 2006, 2007); 12-му та 13-му міжнародних молодіжних форумах "Радіоелектроніка і молодь в ХХІ ст." (Харків, 2008, 2009); третій, четвертій та п'ятій міжнародних конференціях "Комп'ютерні науки та інформаційні технології (CSIT) ” (Львів, 2008, 2009, 2010); Міжнародній науково-практичній конференції "Математичне та програмне забезпечення інтелектуальних систем (MPZIS-2008) ” (Дніпропетровськ, 2008); XI Міжнародній науково-технічній конференції "Системний аналіз та інформаційні технології (САІТ-2009) ” (Київ, 2009).
Про результати дисертаційних досліджень автор регулярно доповідав на наукових семінарах кафедри інформаційних систем та мереж Національного університету "Львівська політехніка" (2006-2010).
Публікації. За результатами дисертаційних досліджень опубліковано 25 наукових праць, з них 10 статей у фахових наукових виданнях, що входять до переліку, затвердженого ВАК України; 15 публікацій у працях наукових конференцій.
Структура та обсяг дисертації. Дисертаційна робота складається зі вступу, чотирьох розділів, висновків, списку літератури з 163 найменувань та додатка. Загальний обсяг дисертації - 196 сторінок, з них 147 сторінок основного тексту, який містить 35 рисунків та 6 таблиць.
Основний зміст роботи
У вступі обґрунтовано актуальність теми, сформульовано мету та основні завдання досліджень, показано зв'язок із науковими програмами, планами, темами, визначено наукову новизну. Розглянуто практичну цінність, реалізацію і впровадження результатів роботи. Наведено дані про особистий внесок здобувача, апробацію роботи та публікації.
У першому розділі охарактеризовано актуальні тенденції опрацювання інформаційного наповнення у глобальній системі World Wide Web (WWW) спільнотою її користувачів.
Проаналізовано актуальну концепцію розвитку WWW - "Веб 2.0”, визначено її основні положення: мобільність ІН, гнучкість веб-додатків та розвиток веб-спільнот.
Під час дослідження встановлено, що найпопулярнішими типами веб-спільнот є: форуми, соціальні мережі, особисті та колективні блоги, мультимедійні веб-спільноти, ринкові веб-спільноти, промоційні веб-спільноти, wiki-спільноти, оцінкові веб-спільноти. Автор проаналізував усі типи веб-спільнот, а також принципи опрацювання ІН користувачами в їх межах. Наведено приклади реальних веб-спільнот для кожного з типів.
Упродовж останніх років завдяки активності учасників веб-спільнот у WWW з'явились величезні обсяги КІН. Здобувач проаналізував означення КІН у WWW, які існують, і виявив, що вони є вузькоспеціалізованими та взаємо суперечливими. Запропоновано нове концептуальне означення: КІН - це ІН, яке створили користувачі веб-сайта, що не є представниками його організації-власника, і розмістили у WWW в межах креативного, комунікативного, промоційного чи іншого процесу без попереднього професійного редагування.
За результатами аналізу автор здійснив формальний опис ІН веб-сторінки з погляду структури та типів:
, (1)
де Text - текстове ІН; Multimedia - різноманітне "нетекстове” ІН (Image - статичні зображення, gif-анімації; Video - відео; Audio - аудіо); File - файли різних типів, не призначені для опрацювання користувачами у браузері; InteractPage - інтерактивне ІН для роботи в межах веб-сторінки; InteractRel - інтерактивне ІН для взаємодії з оточенням веб-сторінки; Structure - HTML-розмітка веб-сторінки, коментарі, метадані, стилі, сценарії тощо.
Якість КІН у роботі розглянуто в контексті ширшого поняття якості інформації. Для цього вивчено існуючі підходи до визначення критеріїв якості КІН та виконано порівняльний аналіз якості КІН та ІН професійних онлайн-видань за такими ознаками: доречність, достовірність, доступність, зрозумілість, об'єктивність, повнота, релевантність, репрезентативність, реферативність, своєчасність, точність.
Аналіз показав, що КІН загалом менш об'єктивне та менш достовірне порівняно з офіційним та професійним ІН. І якщо суб'єктивність є невід'ємною рисою КІН, то низька достовірність КІН сьогодні істотно погіршує якість ІН у WWW в цілому та гальмує розвиток інформаційного суспільства.
Аналізуючи достовірність КІН, здобувач опрацював результати відомих досліджень і дійшов висновку, що достовірність КІН повністю визначається довірою до його автора.
Зважаючи на це, підвищенню достовірності КІН сприятимуть:
· фіксація авторства КІН на рівні реальної особи;
· агрегація даних про авторів;
· формування відкритої репутації авторів.
Опрацювавши результати дослідження, можна зробити висновок, що створено багато методів фіксації авторства ІН та формування відкритої репутації авторів. Проте жоден із них не забезпечує комплексного підходу, який би одночасно передбачав:
можливість залучити усю глобальну веб-спільноту до опрацювання ІН;
додаткове мотивування користувачів WWW до опрацювання ІН;
можливість фіксувати авторство на будь-якому рівні (веб-сайта, допису тощо);
повноцінну крос-сайтовість.
Задля поліпшення ситуації здобувач запропонував використати персоніфікацію ІН у WWW - процес встановлення та оприлюднення зв'язків між ІН та його авторами (користувачами WWW). Персоніфікація полягає у:
виявленні відповідностей між користувачем WWW та множиною його псевдонімів, якими він послуговується для авторизації на множині веб-сайтів;
встановленні зв'язків типу "автор-твір” між користувачами WWW та ІН;
достовірному оприлюдненні створених зв'язків.
Основною особливістю персоніфікації є те, що вона уможливлює принципово інший погляд на ІН у WWW - не як на множину документів, з'єднаних гіперпосиланнями, а як на множину інформаційних відображень користувачів WWW (веб-особистостей), зв'язками між якими слугують особисті контакти, цитати, приналежність до однієї веб-спільноти тощо.
Використання персоніфікації забезпечує комплексний підхід до фіксації авторства та формування відкритої репутації авторів. Тому актуалізується розроблення методів та засобів персоніфікації ІН у WWW.
Другий розділ містить загальний опис структури та особливостей ІН у WWW з погляду персоніфікації ІН. Побудовано формальну модель структури ІН у WWW, яка відображає загальну структуру, характерну для ІН усіх типів веб-сайтів, та формальну модель історії КІН у WWW, в якій втілено загальні принципи опрацювання ІН веб-сайтів їхніми користувачами. На основі цих моделей, з урахуванням персоніфікаційних характеристик ІН та веб-сайтів, розроблено персоніфікаційну класифікацію ІН у WWW та формальну модель веб-особистості.
У роботі структура ІН моделюється на трьох ієрархічних рівнях: веб-сайта, веб-сторінки та допису (Post) - рис.1.
За походженням ІН веб-сторінки описано таким виразом:
, (2)
де ContUser - КІН; ContAux - ІН, що виконує допоміжну функцію; ContImport - ІН, яке веб-сторінка запозичує у інших веб-сайтів. Особливою підкатегорією ContImport є ІН, запозичене у інших сторінок того самого веб-сайта - ContImportWebsite.
Рис. 1. Ієрархічна структура ІН веб-сайта
Приклад розташування ІН різних типів у межах однієї веб-сторінки наведено на рис.2.
Автор ввів та формалізував поняття допису. Допис (Post) - це компонента ІН веб-сторінки, яку створив конкретний користувач певного веб-сайта під час однієї транзакції.
Допис як компоненту ІН веб-сторінки у роботі описано у такому вигляді:
, (3)
де PostId - ідентифікатор допису; User - користувач-автор допису; t - час створення допису; tLast - час внесення останніх змін у допис; Ref - вказівник на інший допис, у відповідь на який створено аналізований допис; PostContent - ІН допису; Teaser - частина ІН допису, що використовують як анонс; PostRel - оточення допису. Стосовно структури та типів PostContent містить категорії, аналогічні до PageContent (1).
Контекст допису (Context (Post)) - частина ІН веб-сторінки, яка дає змогу користувачу повноцінно сприйняти зміст допису. Context (Post) - це кортеж, першою компонентою якого є допис Post, а решта компонент є батьківськими дописами для своїх попередників - Parent (Post) (рис.2):
. (4)
Рис. 2. Типові блоки ІН сторінки веб-сайта другого покоління
У роботі КІН веб-сторінки подано як множину дописів. З урахуванням цього веб-сторінку формально описано так:
, (5)
де URI - унікальний ідентифікатор; PostStart - перший допис веб-сторінки (має особливе значення для формування ІН); - множина дописів веб-сторінки (окрім першого); Npost - кількість дописів у поточний момент часу; PageRelPage - частина оточення веб-сторінки, яке не пов'язана з конкретним дописом чи дописами, а лише з веб-сторінкою загалом.
Своєю чергою, з погляду персоніфікації ІН у WWW веб-сайт у будь-який момент свого існування є формально описаним у такий спосіб:
, (6)
де - множина сторінок веб-сайта; PageN - кількість сторінок веб-сайта у заданий момент часу; - множина користувачів-авторів інформаційного наповнення веб-сайта; UserN - кількість користувачів-авторів веб-сайта; Aud - аудиторія веб-сайта (група користувачів WWW, які його відвідують), UserGoal - типові цілі, яких досягають користувачі в межах веб-сайта; RuleAuthen - правила аутентифікації користувачів веб-сайта; RuleWork - правила створення та роботи з ІН; ContFeat - особливості ІН веб-сайта.
У дисертаційній роботі розроблено формальну модель історії КІН у WWW.
Історію КІН автор розглядає як історію процесу його створення користувачами відповідного веб-сайта (вона є частиною історії користувача веб-сайта).
Історію користувача веб-сайта (SUTH) доцільно описати як історію його транзакцій (Tr) у межах цього веб-сайта:
(7)
,
де та - моменти початку та завершення транзакції; IdTr - унікальний ідентифікатор транзакції; - записи в історії навігації користувача, які входять до цієї транзакції; NQTr - кількість записів, які входять до цієї транзакції.
Кожну конкретну транзакцію ідентифікувати складно. Проте транзакції, які передбачають зміну ІН веб-сторінки (креативні транзакції - CrTr), можна ідентифікувати за результатами їхнього виконання:
, (8)
де URI та PostId - ідентифікатори веб-сторінки та допису, над яким виконує дію користувач User; та - стани ІН перед початком та після завершення CrTr.
Історію допису (PostH), за умови, що стан його оточення фіксується у момент закінчення креативних транзакцій, опишемо так:
, (9)
де NCrTr - кількість креативних транзакцій, які стосуються цього допису.
Тоді історія ІН веб-сторінки (PCH) набуде вигляду:
, (10)
а історія ІН веб-сайта (WCH):
. (11)
Здобувач розробив систему формальних показників веб-сайтів, веб-сторінок та дописів. Це дало змогу створити спеціалізовану персоніфікаційну класифікацію ІН у WWW для точнішого опису процесу створення ІН користувачами WWW та результатів їхньої активності. До її складу входять класифікації:
дописів (сформовано 18 показників, виділено 27 категорій дописів);
веб-сторінок (11 показників 46 категорій);
веб-сайтів (20 показників, 31 категорія).
Розробляючи систему показників та класифікацію автор вивчив 9312 веб-сайтів. Ці класифікації є достатньо повними, оскільки понад 98% проаналізованих дописів, веб-сторінок та веб-сайтів можна зарахувати до однієї з виділених категорій. Решта - винятки, для яких існують унікальні набори значень показників.
У повному обсязі всі класифікації наведено у дисертації.
Автор запропонував модель веб-особистості (Wp), що подається як множина результатів активності особи-користувача WWW (Person):
, (12)
де - множина крос-сайтових користувачів, що належать Person; - їхня кількість; - множина користувачів веб-сайтів, що належать Person; - їхня кількість; - множина веб-сайтів, що належать Person; - їхня кількість; - множина веб-сторінок авторства Person; - їхня кількість; - множина дописів авторства Person; - їхня кількість; - множина тематичних категорій Person; - їхня кількість; - множина регіонів Person; - їхня кількість; - множина мов, якими дописує Person у WWW; - їхня кількість; - множина зв'язків з іншими веб-особистостями; - їхня кількість; Contacts - контактна інформація Person.
У другому розділі наведено розроблений метод оцінювання рівня персоніфікованості інформаційного наповнення веб-сайта. У ході досліджень встановлено, що веб-сайти характеризуються такими показниками персоніфікованості:
UserN - кількість користувачів-авторів ІН;
PostN - кількість дописів;
UserP - кількість користувачів-авторів, ІН яких є персоніфікованим;
PostP - кількість персоніфікованих дописів.
Проте на практиці доцільно коригувати ці показники: , , , , де CP та CU - коригувальні коефіцієнти, що визначають міру важливості UserP та PostP для конкретного веб-сайта.
Обсяг веб-сайта (n) описано як вектор:
. (13)
Аналогічно подано обсяг персоніфікованої частини веб-сайта (p):
. (14)
Введено коефіцієнт персоніфікованості (KP) - числовий показник рівня персоніфікованості ІН веб-сайта. KP визначено як відношення модулів векторів персоніфікованої частини веб-сайта та його обсягу:
. (15)
У третьому розділі подано розроблені автором методи персоніфікації ІН у WWW, які автор розробив на основі моделей, побудованих у другому розділі.
Актуальні типи персоніфікації за ознакою збирання даних поділяються на: активну, яку виконують самі автори ІН; пасивну, яку здійснюють інші користувачі WWW; змішану, яку здійснюють усі користувачі WWW.
За ознакою зміни ІН, що персоніфікується, виокремлено: віддалену, що не передбачає змін; зі змінами, що передбачає додавання до ІН певної частини - персоніфікаційної вставки (її підвидом є реферальна персоніфікація, яка передбачає посилання у персоніфікаційній вставці).
Аналіз цих типів методів показав, що найперспективнішим є застосування активної реферальної персоніфікації.
Здобувач розробив метод активної персоніфікації з використанням суспільних акцій у WWW.Основою методу є суспільні акції у WWW - добровільна організована агітація чи пропаганда певної думки групою користувачів WWW, яка полягає у розміщенні такого ІН у WWW, що сприяє досягненню мети акції.
Виділено два типи суспільних акцій: децентралізовані акції та акції із визначеним центром (ним є веб-сайт або веб-сторінка). Останні мають низку переваг, тому саме їх взято за основу під час розроблення цього методу. На рис.3 проілюстровано створення та поширення суспільної акції із визначеним центром.
Рис. 3. Схема створення та поширення суспільної акції із визначеним центром
Розроблений метод полягає у використанні персоніфікаційних вставок як агітаційного ІН. Це дає змогу фіксувати авторство КІН та вести моніторинг активності учасників суспільних акцій у WWW.Особливістю методу є те, що персоніфікаційними вставками слугують графічні позначки. Основні їхні переваги - простота розміщення та відсутність обмежень на використання.
Для реалізації методу автор розробив групу алгоритмів, зокрема алгоритм активної реферальної персоніфікації. Частина кроків цього алгоритму виконується в центрі суспільної акції, інша частина - в межах веб-сайтів, ІН яких персоніфікується. На рис. 4 наведено блок-схему цього алгоритму. Важливою його частиною є обробка запитів на одержання персоніфікаційних вставок від околу акції. Її у дисертації розглянуто окремо.
Рис. 4. Блок-схема алгоритму активної реферальної персоніфікації
Використовуючи метод суспільних акцій, можна ефективно створювати персоніфікаційні зв'язки, проте він не дає змоги описувати веб-особистості та їхні елементи.
Третій розділ містить також розроблений автором метод пасивної віддаленої персоніфікації ІН у WWW, який полягає у каталогізації веб-особистостей у межах спеціалізованого веб-каталогу. Передбачено опис тематики, вказання регіональної та мовної приналежності веб-особистостей.
Здобувач розробив також метод змішаної віддаленої персоніфікації, описаний у третьому розділі. Він полягає у колаборативному описі веб-особистостей та їхніх елементів у межах wiki-спільноти. Для стандартизації описів використано спеціалізовані wiki-шаблони, які розробив автор.
У четвертому розділі дисертаційної роботи розглянуто програмні, алгоритмічні та інформаційні засоби комплексу персоніфікації ІН у WWW, охарактеризовано основні компоненти комплексу, їхні функції та технічні аспекти реалізації. Архітектуру і компоненти комплексу наведено на рис. 5.
Рис. 5. Архітектура комплексу програмних засобів персоніфікації ІН у WWW
Комплекс програмних засобів побудований на основі запропонованих методів та алгоритмів персоніфікації ІН і функціонує у розподіленому середовищі WWW.Компоненти комплексу розроблено засобами сучасних технологій open source.
Наведено описання веб-спільнот, у яких використовується комплекс програмних засобів персоніфікації ІН у WWW, що розробив здобувач.
Веб-спільнота "Політех" (http://politeh. ridne.net) - почала функціонувати у березні 2007 року; рівень персоніфікованості ІН проаналізовано з серпня 2007 року; станом на квітень 2010 року UserN = 821, PostN = 2064.
Веб-спільнота "Підкамінь" (http://pidkamin. ridne.net) - виникла у червні 2007 року; рівень персоніфікованості ІН вивчено з серпня 2007 року; станом на квітень 2010 року UserN = 507, PostN = 1331.
Веб-спільнота "Верхобуж” (http://zolochiv. ridne.net) - створена у лютому 2008 року; рівень персоніфікованості ІН досліджено з червня 2008 року; станом на квітень 2010 року UserN = 311, PostN = 1288.
Для цих веб-спільнот обчислено показники персоніфікованості ІН та на підставі (15) визначено динаміку рівня персоніфікованості (рис.6). Наші розрахунки показали, що ІН цих веб-спільнот характеризується високим рівнем персоніфікованості; виявлено позитивну динаміку його зміни. Також визначено динаміку середніх значень рівнів персоніфікованості ІН низки популярних веб-сайтів, що використовують існуючі крос-сайтові засоби фіксації авторства (А), або не використовують жодних (B). Порівняння цих динамік підтверджує ефективність методів та засобів персоніфікації ІН у WWW, які запропонував автор.
Рис. 6. Динаміка рівня персоніфікованості ІН веб-спільнот
Основні результати та висновки
У дисертаційній роботі розв'язано важливу наукову задачу, яка полягає у підвищенні рівня персоніфікованості ІН у WWW.Для цього автор використав розроблені ним теоретичні засади та комплекс програмних засобів, який уможливлює ефективну персоніфікацію ІН у WWW на тривалу перспективу.
У роботі отримано такі основні наукові та практичні результати:
Проаналізовано актуальні тенденції розвитку WWW та особливості КІН у цій глобальній системі. Дослідження підтвердило, що підвищення рівня персоніфікованості ІН у WWW є актуальною науковою задачею.
Побудовано спеціальну персоніфікаційну модель ІН у WWW за допомогою формального опису характеристик ІН та процесу його створення користувачами WWW, що дало змогу формалізувати задачу персоніфікації ІН у WWW та стало основою методів персоніфікації.
Розроблено систему формальних показників веб-сайтів, веб-сторінок та дописів з уведенням у розгляд персоніфікаційних характеристик ІН та веб-сайтів, що уможливило вдосконалення класифікації ІН у WWW для формального описання особливостей елементів ІН під час їхньої персоніфікації.
Удосконалено метод активної персоніфікації ІН у WWW із застосуванням користувацько-орієнтованого підходу до організації суспільних акцій у WWW для створення персоніфікаційних зв'язків. Це дало змогу створити мотивувальні фактори для персоніфікації ІН у WWW та використати особливості популярних систем управління ІН для персоніфікації.
Удосконалено метод пасивної персоніфікації ІН у WWW із застосуванням каталогізації веб-особистостей та їхніх елементів. Завдяки цьому можна описувати веб-особистості та їхні елементи, зокрема декларувати їхню тематичну, регіональну та мовну приналежність.
Розроблено новий користувацько-орієнтований метод змішаної персоніфікації ІН у WWW, що ґрунтується на колаборативному принципі wiki до створення персоніфікаційних зв'язків, що дало змогу використовувати wiki-спільноти для персоніфікації ІН у WWW.
Розроблено архітектуру та технологічні рішення компонент комплексу програмного забезпечення персоніфікації ІН, який упроваджено у низці веб-спільнот. Експериментальні дослідження упродовж двох років підтвердили коректність формулювання задачі, достовірність побудованих формальних моделей та ефективність запропонованих методів та засобів персоніфікації ІН у WWW. Упровадження комплексу програмного забезпечення підвищило рівень персоніфікованості ІН охоплених веб-спільнот.
Список опублікованих праць за темою дисертації
1. Березко О.Л. Каталог Веб-особистостей / О.Л. Березко // Вісник Національного університету "Львівська політехніка”: Комп'ютерні системи та мережі. - Львів: Видавництво Львівської політехніки, 2008. - № 630. - C.12-16.
2. Березко О.Л. Персоніфікаційна класифікація Веб-сайтів / О.Л. Березко // Східно-Європейський журнал передових технологій. - Харків: Технологічний центр, 2009. - № 4/2 (40). - С.27-32.
3. Березко О.Л. Алгоритм активної реферальної персоніфікації інформаційного наповнення World Wide Web / О.Л. Березко // Науковий вісник Національного лісотехнічного університету України: зб. наук. - техн. праць. - Львів: РВВ НЛТУ України, 2010. - Вип. 20.4. - С.281-285.
4. Березко О.Л. Особливості використання персоніфікаційних вставок під час проведення суспільних акцій у World Wide Web / О.Л. Березко // Вісник Національного університету "Львівська політехніка”: Інформаційні системи та мережі. - Львів: Видавництво Львівської політехніки, 2010. - № 673. - С.32-40.
5. Березко О.Л. Використання wiki-засобів для персоніфікації інформаційного наповнення World Wide Web / О.Л. Березко // Вісник Національного університету "Львівська політехніка”: Інформаційні системи та мережі - Львів: Видавництво Львівської політехніки, 2008. - № 631. - С.11-18.
6. Березко О.Л. Формальні моделі Веб-сторінки та історії її інформаційного наповнення / О.Л. Березко // Східно-Європейський журнал передових технологій. - Харків: Технологічний центр, 2009. - № 5/2 (41). - С.26-32.
7. Березко О.Л. Суспільні акції як метод активної персоніфікації інформаційного наповнення у World Wide Web / О.Л. Березко // Вісник Кременчуцького державного університету ім. Михайла Остроградського. - Кременчук: КДУ, 2010. - Вип.1/2010 (60), Ч.1. - С.34-39.
8. Пелещишин А.М. Формальні аспекти ідентифікації особистості у WWW / А.М. Пелещишин, О.Л. Березко // Вісник Національного університету "Львівська політехніка”: Комп'ютерні системи та мережі. - Львів: Видавництво Львівської політехніки, 2005. - № 546. - С.126-131.
9. Пелещишин А.М. Веб 2.0 та Семантичний Веб: порівняльний аналіз перспективних тенденцій розвитку WWW / А.М. Пелещишин, О.Л. Березко // Східно-Європейський журнал передових технологій. - Харків: Технологічний центр, 2006. - № 6/2 (24). - С.43-51.
10. Пелещишин А.М. Інтелектуальна система ідентифікації особистості у WWW / А.М. Пелещишин, О.Л. Березко // Вісник Національного університету "Львівська політехніка”: Інформаційні системи та мережі. - Львів: Видавництво Львівської політехніки, 2005. - № 549. - C.148-157.
11. Березко О. Каталог Веб-особистостей - засіб персоніфікації інформаційного наповнення глобальної системи World Wide Web / Олександр Березко // Комп'ютерні науки та інформаційні технології (CSIT'2008): матеріали ІІІ Міжнар. конф., 25-28 вер. 2008 р. - Львів: Видавництво ПП "Вежа і Ко”, 2008. - С. 204-207.
12. Berezko O. Using Web Badges as Personifying Inserts in Web-oriented Public Actions / Oleksandr Berezko // Комп'ютерні науки та інформаційні технології (CSIT'2010): матеріали V Міжнар. наук. - техн. конф. - Львів: Видавництво ПП "Вежа і Ко”, 2010. - C.55.
13. Березко О. Оцінка рівня персоніфікованості користувацького інформаційного наповнення / Олександр Березко // Комп'ютерні науки та інженерія (CSE-2010): матеріали ІV Міжнар. конф. мол. вчених, 25-27 лист. 2010. - Львів: Видавництво Львівської політехніки, 2010. - С.398-399.
14. Березко О.Л. Аналіз динаміки Веб-орієнтованої соціальної акції "Спілкуйся рідною!" / О.Л. Березко // Системний аналіз та інформаційні технології (САІТ-2009): матеріали XI Міжнар. наук. - техн. конф., 26-30 трав. 2009 р. - К.: ННК "ІПСА” НТУУ "КПІ”, 2009. - С.459.
15. Березко О.Л. Соціальні акції в середовищі Веб 2.0. / О.Л. Березко, А.М. Пелещишин // 12-й Міжнар. мол. форум "Радіоелектроніка і молодь в ХХІ ст. ”: зб. матеріалів форуму. - Харків: ХНУРЕ, 2008. - Ч.2. - С.499.
16. Березко О. Використання шаблонів для агрегації персоніфікованих даних в межах вікі-проекту / О. Березко // VI Міжнар. наук. - практ. конф. "Математичне та програмне забезпечення інтелектуальних систем” (MPZIS-2008): зб. тез доп., 12-14 лист. 2008 р. - Дніпропетровськ: ДНУ ім.О. Гончара, 2008. - С.38-39.
17. Березко О. Персоніфікаційна класифікація Веб-ресурсів / Олександр Березко // Комп'ютерні науки та інженерія (CSE-2009): матеріали ІІІ Міжнар. конф. мол. вчених. - Львів: Видавництво Львівської політехніки, 2009. - С.40-41.
18. Березко О.Л. Класифікація Веб-ресурсів та типів інформаційного наповнення WWW з точки зору його персоніфікації / О.Л. Березко // 13-й Міжнар. молодіжний форум "Радіоелектроніка і молодь в ХХІ ст. ”: Зб. матеріалів форуму. - Харків: ХНУРЕ, 2009. - Ч.2. - С.419.
19. Березко О. Опис структури інформаційного наповнення Веб-сторінки / Олександр Березко / Комп'ютерні науки та інформаційні технології (CSIT'2009): матеріали IV Міжнар. наук. - техн. конф. - Львів: Видавництво ПП "Вежа і Ко”, 2009. - С.248-252.
20. Березко О. WWW як соціальна мережа / Олександр Березко, Андрій Пелещишин // Комп'ютерні науки та інженерія (CSE-2007): матеріали 2-ї Міжнар. конф. мол. науковців, 4-6 жовт. 2007 р. - Львів: Видавництво Львівської політехніки, 2007. - С.30-32.
21. Березко О. Особливості сучасних концепцій розвитку Вебу / Олександр Березко, Андрій Пелещишин / Комп'ютерні науки та інженерія (CSE-2006): матеріали I Міжнар. конф. мол. науковців. - Львів: Видавництво Львівської політехніки, 2006. - С.9-12.
22. Berezko О. Intellectual monitoring means of the WWW user networking / Oleksandr Berezko, Leonid Berezko, Andriy Peleschyshyn // Advanced Computer Systems and Networks - Design and Application (ACSN-2005): proceedings of the 2nd International Conference. - Lviv: Publishing House of Lviv Polytechnic National University, 2005. - P.46-47.
23. Березко О. Аналіз Веб 2.0 як актуальної концепції розвитку глобального середовища WWW / О. Березко // 64-та студентська наук. - техн. конф: зб. тез доповідей, лист. - груд. 2006 р. - Львів: Видавництво Львівської політехніки, 2007. - С.130-132.
24. Березко О. Способи реалізації ідентифікації особистості у WWW / Олександр Березко // Шевченківська весна: матеріали міжнар. наук. - практ. конф. студентів, аспірантів та молодих вчених, 2-3 бер. 2006 р. - К.: Логос, 2006. - Вип. IV: у 3 ч. - Ч.1. - С.277-278.
25. Березко О. Інтелектуальні засоби ідентифікації особистості у WWW / О. Березко // 63-тя студентська наук. - техн. конф.: зб. тез доповідей, лист. - груд. 2005 р. - Львів: Видавництво Львівської політехніки, 2006. - С.136-138.
Анотації
Березко О.Л. Методи та засоби персоніфікації інформаційного наповнення у глобальній системі World Wide Web. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.03 - математичне та програмне забезпечення обчислювальних машин і систем. - Національний університет "Львівська політехніка”, Львів, 2011.
У дисертації розроблено методи та засоби персоніфікації інформаційного наповнення у глобальній системі World Wide Web. Побудовано спеціальні персоніфікаційні моделі структури та історії інформаційного наповнення у WWW; запропоновано систему формальних показників веб-сайтів, веб-сторінок та дописів. Розроблено метод активної реферальної персоніфікації із використанням суспільних акцій у WWW, що дає змогу ефективно створювати персоніфікаційні зв'язки; метод пасивної віддаленої персоніфікації із застосуванням спеціалізованого веб-каталогу та метод змішаної віддаленої персоніфікації з використанням wiki-спільнот, за допомогою яких можна описувати веб-особистості та їхні елементи. Розроблено комплекс програмних засобів персоніфікації інформаційного наповнення, який дає змогу залучати глобальну веб-спільноту до процесу персоніфікації та підвищує її ефективність.
Ключові слова: Інтернет, World Wide Web, інформаційне наповнення, персоніфікація, веб-спільнота.
Берёзко А.Л. Методы и средства персонификации информационного наполнения в глобальной системе World Wide Web. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 01.05.03 - математическое и программное обеспечение вычислительных машин и систем. - Национальный университет "Львивська политэхника”, Львов, 2011.
В диссертации разработано методы и средства персонификации информационного наполнения в глобальной системе World Wide Web. Построены специальные персонификационные модели структуры и истории информационного наполнения в WWW; создана система формальных показателей сайтов, веб-страниц и сообщений. Разработан метод активной реферальной персонификации с использованием общественных акций в WWW, что позволяет эффективно создавать персонификационные связи, а также метод пассивной удаленной персонификации с введением специализированного веб-каталога. Предложен метод смешанной удаленной персонификации с использованием wiki-сообществ, с помощью которых можно описывать веб-личности и их элементы. Разработан комплекс программных средств персонификации информационного наполнения, позволяющий привлекать глобальное веб-сообщество к процессу персонификации и повышать ее эффективность.
Ключевые слова: Интернет, World Wide Web, информационное наполнение, персонификация, веб-сообщество.
Berezko O.L. Means and tools of World Wide Web content personification. - Manuscript.
Ph. D. thesis on technical sciences in speciality 01.05.03 - mathematical and software support of computer machines and systems. - Lviv Polytechnic National University, Lviv, 2011.
The thesis deals with solving an important scientific task of developing methods and means of WWW content personification. In the thesis special personification models of structure and history of web content as well as a system of formal indexes of websites, web pages and posts were developed. Means of active referral personification by means of web-oriented public actions, passive remote personification through the use of specialized web directory and mixed remote personification by means of wikis were suggested. Software which allows to involve global web community in the process of web content personification and improves personification efficiency was developed.
In the first chapter current tendencies of WWW development, particularly the concept of Web 2.0, were analyzed. Main types of web communities as well as peculiarities of their users' creative activity and user-generated content in general were analyzed. Besides, the analysis of web content personification in comparison with other digital online identity and WWW user reputation means was carried out. This part of the research formed the basis for web content modeling and further work.
In the second chapter the general description of user-generated content from the point of view of personification was made. Formal model of web content which includes model of web content structure based on the analysis of modern web communities' content hierarchy and model of web content history based on the analysis of WWW users' networking was developed. In addition, a special set of formal indexes of websites, web pages and posts was presented. These indexes enabled improving of the web content classification, which is used for describing parts of web content. Further in this chapter the concept of "web personality" was defined and formalized and method of website's content personification level assessment was suggested. The research results presented in this chapter were used as a theoretical background for further development of means and tools of web content personification.
Подобные документы
Всемирная паутина World Wide Web, основные принципы ее работы. Характеристика технологий и компонентов WWW. Создание таблицы "Расход продуктов", расчет стоимости выпеченных изделий. Сводная таблица и графическое представление результатов вычислений.
контрольная работа [579,9 K], добавлен 23.04.2013Розробка методів та моделей формування єдиного інформаційного простору (ЄІП) для підтримки процесів розроблення виробів авіаційної техніки. Удосконалення методу оцінювання якості засобів інформаційної підтримки. Аналіз складу програмного забезпечення ЄІП.
автореферат [506,3 K], добавлен 24.02.2015История появления и развития сети Интернет, особенности ее гуманитарной и технической стороны. Применение системы World Wide Web - "Всемирная паутина". Ключевые аспекты WWW-технологии, специфика ее использования для создания образовательных ресурсов.
реферат [19,3 K], добавлен 26.03.2011Поняття контролю та якості в управлінні проектами інформатизації. Планування якісного інформаційного проекту. Дотримання стандартів якості. Методи та засоби для планування та контролю якості. План реалізації й технологічна документація як форми контролю.
контрольная работа [1,1 M], добавлен 26.11.2009Создание World Wide Web как единства информационных ресурсов. Разработка и внедрение технологических стандартов для Интернета и Всемирной паутины. Применение гипертекста для построения информационной среды. Использование специальной программы браузеры.
презентация [652,5 K], добавлен 09.10.2014Система World Wide Web: структура, принципы, технологии, история разработки и перспективы развития. Способы активного отображения информации во Всемирной паутине. Электронная реклама с использованием E-mail. Поисковая оптимизация, доска объявлений.
реферат [47,6 K], добавлен 22.01.2011Электронная почта (E-Mail) и ее основные компоненты: информационный ресурс, почтовый сервер, клиент и протоколы их взаимодействия. Сравнительная характеристика протоколов SMTP, POP3 и IMAP4. Телеконференции, файловые архивы FTP, Telnet, World Wide Web.
контрольная работа [152,9 K], добавлен 19.01.2011Электронная почта и технология World-Wide Web. Поисковые системы и каталоги Интернет. Компьютерные телеконференции и электронные библиотеки. Желательные компоненты системы сетевого образования. Образовательные порталы и дистанционное образование.
реферат [256,2 K], добавлен 12.11.2014Вибір моделі задачі інформаційної підтримки сучасних автопаркінгів. Постановка задачі та вибір структур даних. Здійснення замовлень в системі. Перевірка замовлених місць на парковці. Специфікація системи інформаційного обслуговування автопаркінгу.
дипломная работа [2,5 M], добавлен 13.07.2014Ознайомлення з системами CMS. Розділення інформаційного наповнення, структура та дизайн. Призначення СMS typo3, режими роботи, базові модулі. Можливості BackEnd для адміністраторів сайту. Робота з шаблонізатором TemplaVoila. Створення форми авторизації.
курсовая работа [6,5 M], добавлен 02.02.2016