Роль бібліотечних класифікацій в організації знань

Розкриття суті інформаційних технологій і визначення місця організованих бібліотек в сучасному інформаційному середовищі. Вивчення систем тематичного і алфавітного пошуку бібліотек. Проблема розвитку електронних бібліотек і їх роль в організації знань.

Рубрика Педагогика
Вид статья
Язык украинский
Дата добавления 10.09.2013
Размер файла 22,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

10

Роль бібліотечних класифікацій в організації знань

Катерина Лобузіна

Конвергенція (взаємопроникнення) бібліотечних та інформаційних технологій відбувається не тільки з боку освоєння бібліотеками нового інформаційного середовища, а й усвідомлення спеціалістами з інформаційних технологій того факту, що засоби організації знань необхідно шукати саме у бібліотеках. Про наявність таких інформаційних процесів свідчать, зокрема, концепції «системи організації знань» та «Семантичний Веб», що виникли у відповідь на недосконалість машинних методів пошуку інформації.

Ще у 1998 р. учасники конференції Association for Computing Machinery (ACM) (Міжнародна асоціація обчислювальної техніки) в Пітсбурзі [14], підбиваючи підсумки своєї роботи, вказали на необхідність розроблення та підтримки систем організації знань (СОЗ) (knowledge organization systems (KOS)), котрі позначають усі типи схем, що сприяють організації, керуванню, представленню, розкриттю та пошуку інформації (вони включають авторитетні файли контрольованої підтримки ключової інформації: класифікаційні схеми, тезауруси, семантичні мережі та онтології). Згадані системи мають потенціал для опису, представлення, розкриття та пошуку гетерогенних інформаційних ресурсів Інтернету та створення єдиної інфраструктури розкриття знань. Вони призначені для організації пошуку інформації та обслуговування колекцій електронних документів. СОЗ виконують роль моста між користувачем, який веде пошук інформації, та матеріалами колекції, вони забезпечують можливість знайти необхідні користувачеві інформаційні джерела без попереднього знання про їх існування.

Семантичний веб (Semantic WEB (SW)) - концепція, розроблена Тімом Бернерсом-Лі (Tim Berners-Lee) [10] винахідником World Wide Web (WWW), URIs, HTTP та HTML. Його дослідник визначив як розширення (надбудову) існуючої Всесвітньої павутини з метою представлення інформації у вигляді, що дасть змогу краще розуміти її людям та комп'ютерам. Семантичний веб розглядався Т. Бернерсом-Лі в контексті розвитку Всесвітньої павутини, як WWW другого покоління, що зорієнтований на автоматизовану інтерпретацію та оброблення інформаційних ресурсів. Він підтримується Міжнародним консорціумом «W3C» (The World Wide Web Consortium) [20]. Першим серйозним та популярним проектом, заснованим на принципах семантичної павутини, став проект метаданих «Дублінського ядра» (Dublin Core Metadata Initiative, DCMI) [13].

Важливу роль у концепції метаданих DCMI відіграють контрольовані словники - значення для відповідного поля метаописів обираються із фіксованої множини слів або кодів, котра обмежена набором ретельно підібраних пошукових термінів [1]. Це покращує можливості автоматичного оброблення метао- писів, а також підвищує якість результатів пошуку. Крім уточнення самих елементів кваліфікований формат DC дає змогу уточнювати типи значень елементів. Це робиться через схеми кодування. Останні або уточнюють словник значень, з яких можна вибирати потрібні, або фіксують певний формат, у якому має бути представлений рядок-значення. Для елемента метаопису DC : Subject - предмет (тема), DC рекомендує схеми кодування, що ґрунтуються на відомих бібліотечно-бібліографічних класифікаційних системах: DDC (Dewey Decimal Classification - Десяткова класифікація Дьюї, http://www.oclc.org/dewey/); LCC (Library of Congress Classification - Класифікація Бібліотеки Конгресу, http://www.loc.gov/ catdir/cpso/lcco/); LCSH (Library of Congress Subject Headings - Предметні рубрики Бібліотеки Конгресу, http://www.loc.gov/cds/lcsh.html); MeSH (Medical Subject Headings - Предметні рубрики в галузі медицини, http://www.nlm.nih.gov/mesh/); UDC (Universal Decimal Classifiction - Універсальна десяткова класифікація, http://www.udcc.org/).

Створення ефективних інструментів тематичного пошуку є складною, тирвалою та коштовною справою, тому реаліям сьогодення більше відповідає наслідування та удосконалення попередніх досягнень цієї галузі бібліотечно-інформаційної діяльності. Така спадкоємність у технології аналітичного опрацювання електронних документів зумовлена тим, що вони представляють ті ж знання, що й традиційні інформаційні джерела - книги, журнали, реферативні видання тощо - тільки у більш зручному, загальнодоступному, гнучкому вигляді [2].

Бібліотечна спільнота накопичила значний досвід зі створення та підтримки класифікаційних схем, який зберігає свою актуальність і для нової технології. Представити класифікаційні схеми на основі нової технології прагнуть усі провідні бібліотечно-інформаційні центри. Сьогодні розгорнуто міжнародні та національні програми з розкриття та каталогізації ресурсів Інтернету, котрі передбачають використання традиційних бібліотечних класифікацій [17].

На підставі результатів дослідження використання універсальних бібліотечних класифікацій сучасними інформаційними сервісами можна зробити висновок: розвиток нової інформаційної технології електронної бібліотеки відновив інтерес до бібліотечних класифікацій, вони відіграють суттєву роль у представленні, упорядкуванні та розкритті інформаційних ресурсів електронних бібліотек, Інтернету. Аналіз використання традиційних бібліотечних універсальних класифікаційних схем в Інтернеті (17 інформаційних служб) [3] та електронних бібліотеках свідчить про те, що багатогалузеві класифікаційні схеми мають низку переваг при розкритті та представленні електронних інформаційних ресурсів. А саме, вони: більше ніж інші типи класифікацій відомі загалу користувачів; підтримуються великими бібліотечними центрами, мають добре розроблені методичні засади для підтримки в актуальному стані; охоплюють усі галузі знання та надають можливість обмежувати сферу пошуку, виділяти необхідну тематичну частину великої колекції. Все це створює передумови широкого застосування універсальних бібліотечних класифікацій для представлення та упорядкування електронних бібліотечно- інформаційних ресурсів різного характеру (реферативно-бібліографічні БД, електронні колекції, каталоги ресурсів Інтернету). Вирішального значення для організації доступу до електронних інформаційних ресурсів набуває створення програмного забезпечення для підтримки класифікаційних схем та авторитетних файлів класифікаційних даних.

У 1998 р. Керівною групою IFLA з розроблення формату авторитетних / нормативних записів було започатковано проект формату UNIMARC авторитетних записів для класифікаційних даних, який безпосередньо пов'язаний із форматом UNIMARC для обміну бібліографічними даними. Зусилля фахівців у цьому напрямі мали на меті представити таблиці різних класифікаційних систем в уніфікованому машиночитаному вигляді, автоматично прив'язати їх як пошуковий інструмент до бібліотечних баз даних, представлених у форматі UNIMARC. Формат UNIMARC для класифікаційних даних побудовано відповідно до структури формату USMARC для класифікаційних даних [18], розробленого у 1991 р. Бібліотекою Конгресу США. Наприклад, база даних програмного продукту Dewey for Windows організована відповідно до формату USMARC для класифікаційних даних [6; 12]. Відповідним чином структуровані записи і еталонного файлу УДК, котрий розповсюджується Консорціумом УДК у середовищі CDS/ISIS. Кожний запис, що відповідає певному індексу УДК, містить 30 полів, згрупованих у дві категорії. Перші двадцять полів описові і представляють фактичний зміст таблиць УДК, подальші десять - надають адміністративно-управлінську інформацію [16].

Лінгвістичні бази даних, які використовуються у бібліотечній практиці (словники предметних рубрик, класифікатори і рубрикатори), забезпечують встановлення зв'язків між авторською термінологією (документами), термінологією інформаційно-пошукової системи (ІПС) та термінологією споживачів (професійною термінологією). Авторитетні файли лінгвістичних даних є основним семантичним засобом бібліотечних ІПС, вони створюють передумови реалізації інтелектуального тематичного пошуку, перетворюють бібліотечно-бібліографічні та повноте- кстові бази даних у бази знань. Для організації такої семантичної навігації у бібліотечних інформаційних ресурсах необхідно використовувати відповідні структури представлення лінгвістичних даних в електронному вигляді. Як відомо, найбільш просту і зрозумілу для користувача реалізацію представлення знань забезпечує семантична мережа [7, 19].

За означенням, семантична мережа (СМ) є графом, вершини якого відповідають об'єктам (поняттям), а дуги - зв'язкам між цими об'єктами (поняттями). Загалом СМ має забезпечувати [5]: зберігання відомостей про об'єкти (поняття) та про зв'язки між ними; пошук об'єктів (понять) за заданими характеристиками (за зв'язками з іншими об'єктами, поняттями); поповнення і коригування знань системи в процесі навчання (введення нових об'єктів чи понять, встановлення нових зв'язків, вилучення з системи об'єктів, понять, зв'язків); умови здійснення процедур узагальнення і конкретизації знань, а саме, СМ має надавати відповідь на поставлене запитання, знаходити фрагменти СМ (підмережі), що відповідають поставленому завданню. Саме за принципом семантичної мережі сьогодні реалізуються структури для представлення лінгвістичних даних в авторитетних файлах автоматизованих бібліотечних інформаційно-пошукових систем.

В ідеалі класифікаційна схема має забезпечувати оптимальний перехід від одного поняття до іншого, від рубрики до супровідної інформації, від неї до суміжних рубрик. Тобто, правильно і послідовно розроблена класифікаційна схема представляє такий рівень узагальнення знання, який, з одного боку, підпорядкований «логіці світу», а з другого - логіці пошуку [15]. Відповідно, структура представлення класифікаційних даних (формальна модель класифікації) має задовольняти такі основні вимоги: бути зручною для представлення даних у комп'ютері; адекватно відображати будову терміносистеми предметної галузі; створювати умови для повноцінної та своєчасної актуалізації класифікаційних даних; забезпечувати гнучкі сценарії пошуку та зручний пошуковий користувацький інтерфейс.

Для вирішення окресленого кола завдань фахівці розробили формальну модель класифікації у вигляді графа, вершинами якого є фрейми, що описують окремі рубрики класифікатора, об'єднані в ієрархічну семантичну мережу [3]. Семантична мережа є статичним компонентом моделі, що репрезентує концепцію знань, прийняту в інформаційній системі, а фрейми рубрик представляють динамічний термінологічний компонент моделі, котрий може ситуативно поповнюватись новими термінами та термінологічними зв'язками. Для динамічної актуалізації класифікаційної схеми фрейми рубрик розширено елементами тезауруса, що враховують нечіткість лінгвістичних об'єктів (умовні синоніми, терміни- еквіваленти, синоніми іншою мовою) [4]. Така організація класифікаційних даних дає змогу, з одного боку, реалізувати основну перевагу класифікаційної схеми - систематичний тематичний пошук, а з другого - здійснювати актуальний предметний доступ до інформаційних ресурсів (у т. ч. багатомовний).

Загалом авторитетний запис у базі даних є фреймом-контейнером, де зосереджена вся інформація про те, за якими пошуковими запитами можна знайти потрібне поняття. Так, поняття «Нейрокомп'юте- ри» в Рубрикаторі НБУВ оточене цілою множиною термінів з позначенням взаємовідносин між ними:

Запропоновану модель класифікації було реалізовано в НБУВ на платформі САБ «ІРБІС-64» у вигляді спеціалізованого авторитетного файлу класифікації. За основу представлення інформації в авторитетному файлі взято скорочений варіант полів та підполів «UNIMARC Classification Format» [11], що реалізує структуру фреймів класифікаційних рубрик. Навігаційні засоби системи створюють передумови для укладання міжпредметних зв'язків на основі встановлення асоціативних відношень між поняттями. Розроблена модель та впроваджені технологічні рішення лягли в основу підготовки друкованого та електронного варіанта підрозділів Рубрикатора НБУВ «381 Кібернетика», «397 Інформаційна та обчислювальна техніка» [3, 8], що значно розширило пошукові можливості електронного каталогу НБУВ у галузі комп'ютерних наук та інформатики. Впровадження електронного варіанта Рубрикатора НБУВ на «Шляху документа» дало змогу реалізувати значні переваги класифікаційної схеми для представлення знань у бібліотечному фонді. Можливості системи забезпечують механізми, необхідні для професійної підтримки рубрикатора бібліотеки в актуальному стані (кумуляція нових термінів, фіксування методичних рішень, введення нових рубрик, встановлення синонімічних та асоціативних відношень). Поповнення рубрикатора у відділі систематизації налаштовано таким чином, що внесені доповнення і зміни, редакційні правки автоматично відображаються у пошуковому інтерфейсі електронного каталогу.

Особливі переваги для користувачів надають навігаційні та лінгвістичні засоби онлайнового електронного каталогу. Веб-інтерфейс рубрикатора дає змогу шукати рубрики за ключовими словами, пересуватися вгору і вниз тематичним деревом рубрикатора, переходити до суміжних розділів знання. Однак, як з'ясувалося, що лише незначна кількість користувачів (1-2 %) надають перевагу пошуку за рубрикатором. Набагато популярнішим виявився інтерфейс бібліографічних описів, у якому замість класифікаційних індексів виводяться тематичні рубрики у вигляді гіпертекстових посилань, що дають змогу за одним натисканням отримати відповідну тематичну добірку. Цей інтерфейс використовує кожен 3-4 користувач, який надсилає запит до електронного каталогу.

Завдяки лінгвістичним перевагам тематичний пошуковий інтерфейс дає змогу безкоштовно користуватися сервісом Google Translate, який пропонує швидкий автоматичний переклад веб-сторінок багатьма мовами світу. Користувач, вводячи свій запит англійською або російською мовою, може знайти лише частину інформації мовою запиту. Так, за запитом російською мовою «Библия» або англійською «Bible» у полі назва користувач отримує також посилання на тематичну рубрику «Тексти Біблії» (рос. «Тексты Библии», англ. «Bible Texts»), а натиснувши це посилання на знайомій йому мові він отримує добірку всіх біблійних текстів всіма мовами, що зберігаються у фонді НБУВ (українською, російською, англійською, німецькою, польською, французькою тощо). Таку сервісну можливість надає пошук за класифікаційним індексом, бо саме він зберігається у записах і є лінгвістично незалежним.

Аналогічно реалізовано пошук за географічними рубриками відповідно до таблиць територіальних типових поділів (ТТП) Рубрикатора НБУВ [9], електронний варіант яких підключено для здійснення пошуку в онлайновому каталозі та у спеціалізованих базах даних сектора картографії. Наприклад, для того, щоб знайти документи стосовно Австрії, користувачам Австрійської бібліотеки достатньо натиснути рубрику «Австрія» (в перекладі німецькою - «Osterreich») і у автоматичному режимі отримати добірку необхідної літератури всіма мовами із фонду НБУВ, надалі є можливість уточнити запит - шукати у знайденому.

Таблиці територіальних типових поділів становлять також основу систематизації картографічного фонду. Для полегшення роботи та інтеграції баз даних картографічного фонду до загальної пошукової системи бібліотеки автоматизоване робоче місце бібліографа було забезпечене багатомовним електронним варіантом таблиць ТТП (українська, російська, англійська мови). На основі конвертованих таблиць організували авторитетний файл «Алфавітно-предметний покажчик ТТП». В електронному алфавітно-предметному покажчику забезпечено можливість багатомовного пошуку та розширений формат перегляду авторитетних записів. Авторитетний файл підключено до робочого аркуша каталогізатора як довідковий засіб та засіб введення класифікаційних індексів, він також доступний каталогізаторам для оперативного редагування, поповнення і прийняття методичних рішень.

Тематичний рубрикатор став зручним інструментом для створення комплексних інформаційних бібліотечних сервісів з єдиною концепцією представлення знань, де за натисканням гіперпосилання тематичного розділу (категорії) можна отримати тематичну добірку інформаційних джерел одразу із всіх баз даних (електронного каталогу, електронної бібліотеки, Інтернет-навігатора, бібліографічної довідки). Всі інформаційні продукти представлені в єдиному вікні створюються багатьма структурними підрозділами бібліотеки. Для тематичного упорядкування потоку надходжень до фонду електронних інформаційних ресурсів (повнотекстові версії видань) було організовано їх індексацію професійними систематизаторами, аналогічно «Шляху документа НБУВ» для паперових документів. Класифікаційними індексами також наділяються каталогізовані інформаційні ресурси Інтернету. Інтеграція комплексного інформаційного продукту відбувається завдяки використанню єдиного стандарту упорядкування знань - тематичного рубрикатора бібліотеки. Такий комплексний інформаційний сервіс на платформі інформаційних продуктів ІРБІС пройшов успішне тестування на порталі НБУВ (irbis-nbuv.gov.ua) і активно використовується користувачами (наприклад упродовж 2011 р. у середньому 400 користувачів щодоби).

Використання інструментарію тематичної фільтрації (заданої добірки класифікаційних індексів певної тематики) дало змогу організувати спеціалізовані бібліотеки, де на кожний запит користувача накладається тематичний фільтр, який обмежує відповіді на запит заданою предметною галуззю. За такими принципами працюють онлайнові спеціалізовані бібліотеки «Юридичні інформаційні ресурси» (http://irbis-nbuv.gov.ua/info_law.html) та «Філософська бібліотека» (http://irbis-nbuv.gov.ua/info_ph.html), пошуковий інтерфейс яких супроводжує профільна частина тематичного рубрикатора (для юридичних інформаційних ресурсів - розділ Х «Державо і право. Юридичні науки»).

Подальшим розвитком спеціалізованих бібліотек може бути інтеграція у комплексний пошуковий інтерфейс інших електронних інформаційних ресурсів НБУВ. Використання рубрикатора для систематизації цифрових копій видань НБУВ в електронному фонді дасть змогу гнучко упорядковувати тематичні електронні колекції відповідно до вимог визначеної у бібліотеці концепції представлення знань.

інформаційне середовище пошук електронна бібліотека

Список використаних джерел

1. Волохін О. МКаталогізація цифрових ресурсів Інтернет : Дублінське ядро метаданих : посіб. - Кіровоград, 2003. - 70 с.

2. Захаров В. П.; Масевич А. Ц. Актуальные проблемы лингвистического обеспечения автоматизированных систем крупных библиотек России // Информационное обеспечение науки : новые технологии. - М. : Б-ка по естест. наукам, 1997. - С. 143-150.

3. Лобузіна К. Бібліотечні класифікації в сучасних інформаційних сервісах / К. В. Лобузіна; НАН України, Нац. б- ка України ім. В. І. Вернадського. - К., 2010. - 132 с.

4. Лобузіна К. Класифікаційні схеми як засіб представлення знань в електронних бібліотеках / К. В. Ло- бузіна // Реєстрація, зберігання і обробка даних. - 2006.

5. Любарский Ю. Я. Интеллектуальные системы. - М. : Наука, 1990. - 232 с.

6. Митчелл Д. Десятичная классификация Дьюи: средство организации знаний для следующего века // Библиотеки и ассоциации в меняющемся мире: V Междунар. конф. «Крым-95» : материалы конф. - 1998. - Т. 2.

7. Организация знаний: лингвистические аспекты : прогр. и тез. докл. конф. [ИСКО], Москва, 16-18 мая 1995 г. / Междунар. о-во по орг. знаний, Рос. секция, Рос. гос. б-ка. - М. : Рос. секция ИСКО, 1995. - 31 с.

8. Рубрикатор Національної бібліотеки України імені В. І. Вернадського. Розділ «3 Енергетика. Радіоелектроніка». Підрозділи «381 Кібернетика», «397 Інформаційна та обчислювальна техніка» / Нац. акад. наук України, Нац. б-ка України ім. В. І. Вернадського - К., 2010. - 249 с.

9. Рубрикатор Національної бібліотеки України ім. В. І. Вернадського. Таблиці територіальних типових поділів / І. І. Багрій [та ін.] ; НАН України, Нац. б-ка України ім. В. І. Вернадського. - К., 2004. - 768 с.

10. Berners-Lee T., Hendler J., Lassila O. The Semantic Web : A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities [Electronic resource] // Scientific American. - 2001. - URL : http://www.sciam.com. - Last revised : May 17, 2001.

11. Concise UNIMARC Classification Format (20001031) // International Federation of Library Associations and Institutions (IFLA) [Електронний ресурс] / Way of access : URL : http://www.ifla.org/W3/p1996-1/concise.htm. - Last revised: November 24, 2000.

12. DDC database // Classification research for knowledge representation and organization : Proceedings of the 5th international study conference on classification research, Toronto, Canada, 24-28 June 1991 / edited by N. J. Williamson and M. Hudon. - New York : Elsevier, 1991. - Р. 29-37.

13. Dublin Core Metadata Initiative [Electronic resource]. - URL : http://dublincore.org.

14. Hodge G. Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority Files. - Washington : The Digital Library Federation Council on Library and Information Resources, 2000. - 43 p.

15. Lancaster F. W. Vocabulary control for information retrieval. - Washington, D. C. : Inf. Resources Press, 1972. - 233 p.

16. Master Reference File // UDC Consortium [Electronic resource]. - Way of access : URL : http://www.udcc.org/mrf.htm.

17. The Role of classification schemes in Internet resource description and discovery // Work Package 3 of Telematics for Research project DESIRE (RE 1004) [Electronic resource]. - URL : http://www.ukoln.ac.uk/metadata/ esire/classification/. - Last revised : Jan 28, 1999.

18. USMARC format for classification data : including guidelines for content designation. - Washington, D. C. : Library of Congress Cataloging Distribution Service, 1991.

19. Wang J. A. Knowledge Network Constructed by Integrating Classification, Thesaurus, and Metadata in Digital Library // Intl. Inform. & Libr. Rev. - 2003.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.