Модель інформаційного сховища в Інтранет-середовищі

Створення корпоративної бази знань із використанням у якості базового компонента документоорієнтованого інформаційного сховища. Нарощення можливостей доступу користувачів до бази знань із мінімальними витратами. Аналіз застосування файлової системи.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 29.01.2019
Размер файла 133,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В. В. Хаджинов, І. О. Храмова

Размещено на http://www.allbest.ru/

110

Системи збереження

і масового розповсюдження даних

104

УДК 681.3

Інститут проблем реєстрації інформації НАН України

Модель інформаційного сховища в Інтранет-середовищі

B.B. Хаджинов

І.О. Храмова

Управління корпоративними знаннями передбачає ефективне використання наявної інформації та доступу до неї, витяг потрібних знань, створення нових знань та прийняття оптимальних рішень, як результат цих дій.

Для представлення корпоративних знань використовуються предметні області знань (ПОЗ), що складаються з об'єктів знань (ОЗ). Кожна з ПОЗ має свого власника та споживача (споживачів). Об'єктами знань на сучасному етапі розвитку інформаційних технологій виступає також електронна інформація. Предметними областями знань можна вважати корпоративні інформаційні системи, під якими розуміються системи, що забезпечують у тій чи іншій формі зберігання, перетворення та доступ користувачів до інформаційних об'єктів, наданих в електронній формі, та задовольняє потребам колективної діяльності. Джерелом електронної інформації можуть бути:

-- надіслані та отримані повідомлення електронної пошти разом із прикріпленими до них файлами;

-- документи (звіти), що були створені функціонуючими програмними додатками або за їх допомогою власними фахівцями та зовнішніми експертами;

-- перетворені на електронні копії факсимільні та паперові документи, які ще складають значну частину в інформаційному просторі.

Загальною властивістю такої інформації є те, що вона тісно пов'язана з життєдіяльністю корпорації, має попит різних робочих груп та може бути неодноразово використаною.

Електронна складова корпоративної інформаційної бази зараз найчастіше являє собою сукупність фізичних файлів довільного типу, структурованих засобами файлової системи операційного оточення.

Застосування файлової системи виключає можливість перетворення інформаційного об'єкта на ОЗ, що передбачає супроводження інформації додатковими ознаками. Також у цьому випадку некерованим стає процес продукування версій оригінальної інформації, що може привести до фальсифікації ОЗ та дискредитації рішень, які на ньому грунтуються.

Менш поширеним підходом є застосування системи управління документами (СУД), що є складовою деяких функціонально-спрямованих інтегрованих програмних систем, орієнтованих на роботу з документами. Серед таких виділимо системи документообігу [1-3]; системи підтримки колективної роботи [4, 5]; електронні архіви [6, 7]. Усі ці засоби вирішують серед інших задачу збору, зберігання та надання колективного доступу до інформаційних об'єктів, виходячи з абстрактного поняття документа як облікової одиниці даних користувача, що має довільний формат та понятійний зміст і має певну завершеність та самостійність. Надана класифікація програмних систем є значною мірою умовною і скоріше відображає їх переважне функціональне спрямування.

Використання інтегрованих рішень стримується значною вартістю та необхідністю переходу на запропоновану виробником технологію, яка може значно відрізнятися від звичної, що вже набула сталого вигляду.

Пропонується створення програмної системи, призначеної безпосередньо для накопичення та класифікації електронної інформації у вигляді електронних документів як базового компонента корпоративної бази знань. Така система може бути використана як автономний компонент, а також у комплексі з іншими програмними системами, спрямованими на роботу з електронними документами.

У роботі розглядаються структура та приклад реалізації основних компонентів такої системи.

Аналіз підходів до побудови корпоративного інформаційного сховища

Головними завданнями, що вирішуються під час побудови корпоративного сховища знань є наступні.

Реєстрація інформаційного об'єкта як ОЗ із заповненням необхідних супроводжуючих атрибутів.

За звичай ділові процеси використовують різноманітну за форматом інформацію, що має як структурований, так і неструктурований вигляд. При цьому важливо знати, до якої категорії чи предметної області відноситься інформація, із яких джерел вона надійшла і т.ін. Найкраще, коли інформаційний об'єкт при завантаженні до інформаційного сховища супроводжується реєстраційною карткою, атрибути якої вміщують необхідну інформацію.

Забезпечення збереження ОЗ.

Реєстраційна картка здебільшого зберігається у БД. Контекст інформаційного об'єкта може зберігатися у файловій системі або у БД. При цьому перевага, на наш, погляд належить саме файловій системі. Однак у цьому випадку існує небезпека втрати синхронізації внаслідок видалення або переміщення файлу. Існує позитивна практика організації кількарівневого сховища, де найменше вживані та некритичні для ділових процесів інформаційні об'єкти витісняються з БД до файлової системи. При цьому можливе використання як автоматичного, так і налаштованого користувачем режиму переносу ОЗ з одного на інший рівень зберігання.

Організація спільної роботи з ОЗ.

Сюди відноситься встановлення режиму «тільки для читання» для загального доступу за умовчуванням, функції блокування одночасного редагування атрибутів ОЗ кількома уповноваженими користувачами. На відміну від систем управління документами з реєстрацією ОЗ набуває чинності факту, який не може мати версій. Тому інша версія інформаційного об'єкта або заміщує існуючу, або розглядається як інший ОЗ (факт).

Підтримка операцій резервування, відновлення, копіювання, видалення ОЗ.

Підтримка індексування для здійснення пошуку потрібної інформації.

Використовуються повнотекстова та атрибутивна індексації. Здебільшого для сучасних ділових процесів достатньою й ефективною є індексація за атрибутами ОЗ. Особливо, якщо є можливість занурення в атрибутивну систему результатів семантичного аналізу змісту ОЗ у вигляді сукупності ключових слів і виразів та рефератів.

Наявність механізму визначення інтенсивності звернень до (використання) ОЗ.

На відміну від сховищ даних, інформаційні сховища, орієнтовані на зберігання знань, поновлюються та ревізуються в залежності від запитів користувачів.

Контроль повноважень доступу до ОЗ під час здійснення операцій перегляду, завантаження, редагування, копіювання та знищення ОЗ.

На сьогодні можна виділити декілька підходів до побудови корпоративного інформаційного сховища.

Використання файлової системи операційного оточення.

Переваги -- використання стандартних засобів із складу операційного оточення, зрозумілі звичні технології ведення документальних баз, наявність великої кількості готових компонентів (бібліотек) підтримки файлових операцій, найдешевше рішення.

Недоліки -- вузькі можливості супроводження документів класифікаційними метаданими, що надали б інформацію про час створення, джерело виникнення та сукупність понять, яких торкається документ. Неможливість підтримки складних операцій з інформаційним сховищем на зразок трансакцій. Найнижчий рівень підтримки цілісності інформаційних ресурсів. корпоративний документоорієнтований інформаційний файловий

Використання документальних баз даних (на зразок Lotus Notus).

Переваги -- надширокі функціональні можливості (щоправда, більшість із яких на сучасному рівні діловодства в нашій країні ніколи не використовується), повнотекстова індексація і, завдяки цьому, швидкий пошук.

Недоліки -- необхідність роботи у середовищі документальних баз під час створення додатків, що використовують документи, надто вузькі можливості або недоступність специфікацій API інтерфейсу, а також значне транспортне запізнення під час оперативного доступу до документа, особливо якщо розміри сховища документів стають значними. Часто повнотекстова індексація, що потребує чималих ресурсів, формує надмірну кількість пошукових контекстів, яка значно перевищує понятійний словник, що задовольнив би бізнес потребам користувачів.

Створення клієнт-серверних додатків разом із промисловими СУБД, частіше реляційними, для зберігання взаємовідносин між інформаційними сутностями документів і, власне, самих документів. При цьому сьогодні використовуються наступні технології реалізації:

1) розробка клієнт-серверного додатку у одному з мовних середовищ 4-ї генерації (VB, Java, VFoxPro, Delphi, PowerBuilder та ін.).

Переваги -- підвищення швидкості реалізації за рахунок застосування готових компонентів для найбільш поширених функцій програмних додатків.

Недоліки -- необхідність програмування як клієнтської, так і серверної частин системи. В тому разі, якщо клієнтів достатньо багато, з'являються певні незручності з інсталяцією та подальшим супроводом програмного забезпечення клієнтської частини;

2) створення Java-аплетів.

Цей варіант може бути взятий до уваги, якщо виключена необхідність збереження інформації на боці клієнта, що пов'язане із забороною системи безпеки аплетів відносно переносу документів на клієнтську станцію;

3) використання технології активних серверних сторінок (на зразок ASP) для інтерфейсу з клієнтом, транспорту інформації із сервера, формування копії документа на боці будь-якого клієнта.

Останній підхід, на наш погляд, є найбільш перспективним для застосування.

Структура моделі інформаційного сховища

Загальна архітектура корпоративного інформаційного сховища з оглядом на вищезгаданий підхід до реалізації представлена на рис. 1.

При цьому, звичайно, деякі з елементів структури можуть бути об'єднані (наприклад, сховище реєстраційних даних та сховище файлів документів) або відсутні (ввід документів із паперових носіїв або архів документів 2 рівня на Raid-масивах).

Стисло принципи функціонування такої системи можуть бути описані наступним чином.

Завантаження первинних інформаційних ресурсів до корпоративного архіву відбувається у формі електронного документа, який складається з одного або декількох первинних файлів, що інтерпретуються як окремий факт та супроводжується метаданими, які дозволяють віднести цей факт до якогось із фреймів корпоративної бази знань.

Рис. 1

Сукупність фреймів та їх структура відображається структурою рубрикатора архіву.

Встановлення взаємних зв'язків між фактами відбувається за допомогою знаходження спільних понять із сукупності понять, властивих для контексту кожного факту.

Система понять будується як словник ключових слів та виразів

Концептуально модель інформаційного сховища, що підтримує наведену схе-му функціонування, в загальному вигляді описується схемою, що показана на рис. 2.

Нижче наведене призначення сутностей концептуальної схеми.

Сутність

Призначення

Рубрики

Перелік та взаємозв'язок рубрик

Документи

Реєстраційні картки документів

Джерела документів

Джерела надходження документів

Файли

Характеристики файлів, що включені до електронних документів

Шаблони

Шаблони реквізитів документів за умовчуванням для завантаження регламентних документів

Ключові слова

Колекція ключових слів та виразів

Контекст файлів

Вміщує зміст файлів (або посилання на фізичний файл) первинних електронних документів

Рис. 2

Базовий склад режимів функціонування додатка,

що реалізує модель інформаційного сховища

Система складається з таких частин:

реляційної СУБД та схеми БД, що забезпечує технологію завантаження та роботи з об'єктами корпоративного електронного архіву;

клієнтського додатка «Робоче місце референта (реєстратора) документів», побудованого як «товстий» клієнт;

серверних компонентів «Інтерфейс користувача», які підтримують функціонування «тонкого» клієнта на станціях користувачів, що підключені до мережі Intranet, за допомогою стандартних програм-оглядячів на зразок Microsoft Internet Explorer. Згадані компоненти забезпечують навігацію у системі фреймів, пошук та доступ користувачів до документів корпоративного архіву з метою отримання контексту електронного документа для перегляду чи створення копії.

«Робоче місце референта (реєстратора) документів» надає можливість виконання наступних дій:

-- ведення рубрикатора та довідників;

-- реєстрації та завантаження електронного документа до БД;

-- редагування метаданих електронного документа;

-- застосування шаблонів;

-- перегляд файлу перед завантаженням;

-- вивантаження електронних документів з БД до архіву 2 рівня (у файлову систему) за запитом, по закінченні терміну зберігання, або за певним правилом, що базується на показниках релевантності документа.

Серверні сторінки додатку «Робоче місце користувача» забезпечують перегляд структури архіву та вмісту рубрик, які можуть бути відфільтровані за рубриками та (або) критеріями часу реєстрації документів. Також надаються можливості:

-- перегляду надходжень до архіву за останню добу;

-- пошуку за рубрикатором або назвою документа;

-- розширеного пошуку за критеріями часу та ключовими словами;

-- отримання документів з електронного архіву для перегляду.

Висновки

Вагомі переваги викладеного підходу до реалізації моделі інформаційного сховища можна викласти наступним чином.

Реалізація функцій роботи з документами у середовищах Інтранет та реляційної СУБД надає системі властивостей масштабування та збереження інформаційної цілісності.

Серверний додаток, побудований, наприклад, за технологією ASP, набуває повноцінних багатопотокових властивостей та має високу гнучкість, що дозволяє легко пристосовуватися до вимог користувача, які змінюються.

Заміна клієнтського додатку стандартним броузером полегшує супровід та використання системи.

Література

1. Гленн У., Инглиш Б. Microsoft Exchange 2000 Server. Справочник администратора // Эком. -- 2001. -- 720 с.

2. Линд Д., Керн С. Lotus Notes и Domino R5 // Энциклопедия пользователя. -- К.: Диасофт. -- 2000. -- 656 с.

3. Баласанян В. Концепция системы автоматизации отечественного документооборота // Открытые системы. -- 1997. -- № 1.

4. Жучков K. Microsoft Content Management Server и SharePoint Portal Server в корпоративных Web-решениях. -- М.: «BYTE/Россия». -- 2002. -- № 6.

Анотація

Розглянуто підхід до створення корпоративної бази знань із використанням у якості базового компонента документоорієнтованого інформаційного сховища. Визначено функціональні вимоги, проаналізовано існуючі підходи до створення подібних інформаційних систем та технології, які для цього використовуються. Запропоновано використання змішаної технології, що дозволяє нарощувати можливості доступу користувачів до бази знань із мінімальними витратами, з одного боку, та вжити керовані процеси наповнення інформаційного сховища й класифікації інформаційного вмісту з іншого. Наведено структуру основних компонентів подібної системи, яку вже реалізовано.

Ключові слова: корпоративна база знань, електронний документ, інформаційне сховище, інформаційна технологія.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.