Інформаційна технологія природномовного контролю знань

Аналіз існуючих автоматизованих систем контролю знань, обробки природномовної інформації. Дослідження лінгвістичних моделей подання знань з урахуванням синонімії понять. Розробка алгоритму обробки текстової відповіді та його комп’ютерна реалізація.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 24.08.2015
Размер файла 618,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

БУДІВНИЦТВА і АРХІТЕКТУРИ

УДК 004.415:378.147/(042.3)

Автореферат дисертації на здобуття наукового ступеня

кандидата технічних наук

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ПРИРОДНОМОВНОГО КОНТРОЛЮ ЗНАНЬ

05.13.06 - інформаційні технології

БАДЬОРІНА Любов Миколаївна

Київ - 2009

Дисертацією є рукопис.

Робота виконана на кафедрі комп'ютеризованих систем управління Національного авіаційного університету Міністерства освіти і науки України.

Науковий керівник: доктор технічних наук, професор Литвиненко Олександр Євгеніович, завідувач кафедри комп'ютеризованих систем управління Національного авіаційного університету Міністерства освіти і науки України (м. Київ)

Офіційні опоненти:

доктор технічних наук, професор Міхайленко Віктор Мефодійович, професор кафедри прикладної математики Київського національного університету будівництва і архітектури Міністерства освіти і науки України (м. Київ)

кандидат фізико-математичних наук Пашко Анатолій Олексійович, старший науковий співробітник, завідувач кафедри інформаційних систем та технологій Європейського університету Міністерства освіти і науки України (м. Київ)

Захист відбудеться “23квітня 2009 р. о 12 годині на засіданні спеціалізованої вченої ради Д 26.056.01 при Київському національному університеті будівництва і архітектури за адресою: 03680, м. Київ-037, пр. Повітрофлотський, 31, КНУБА.

З дисертацією можна ознайомитись у бібліотеці НАУ за адресою: 03680, м. Київ пр. Повітрофлотський, 31, КНУБА.

Автореферат розісланий “ 22 ” __березня_ 2009 р.

Вчений секретар спеціалізованої вченої ради

доктор технічних наук, професор С. В. Цюцюра

Загальна характеристика роботи

Актуальність теми досліджень. Інтеграційні процеси, притаманні сучасному етапу розвитку суспільства, створення новітніх технологій, ускладнення технічних систем та інше потребує підвищення якості підготовки фахівців для народного господарства України. Одним із засобів досягнення високого рівня цієї підготовки є розробка та впровадження систем автоматизованого контролю знань, здатних обробляти та оцінювати природномовні відповіді тих, кого навчають, подані у довільній формі.

Реалізація такої здатності може бути здійснена шляхом змістовного порівняння двох визначень одного терміну предметної галузі: еталонного, який зберігається в базі знань системи, та введеного ззовні тим, кого навчають, поданого природною мовою з довільною семантичною структурою та кількістю слів. Це потребує застосування моделей представлення знань предметної галузі, розробки методів аналізу природномовних відповідей з урахуванням синонімії понять, алгоритмів оцінювання ступеня змістовної близькості довільної відповіді до еталонного визначення.

Застосування системи автоматизованого контролю знань, яка пропонується, сприятиме підвищенню об'єктивності і достовірності оцінювання знань тих, кого навчають, поліпшенню методологічних та дидактичних характеристик навчального процесу, проводженню детального аналізу засвоєння навчального матеріалу, обґрунтованому коригуванню структури і змісту навчального курсу. Саме це обумовлює актуальність теми даного дослідження, спрямованого на створення інформаційної технології контролю та оцінювання знань при природномовних довільних відповідях тих, кого навчають, на завдання відкритого типу.

Зв'язок роботи з науковими програмами, планами, темами. Основні дослідження з теми дисертації викладені в межах науково-дослідних робіт Національного авіаційного університету за темами: № 111-ДБ03 “Дослідження та аналіз методів і засобів побудови інформаційно-комп'ютерних систем на основі Інтранет-технологій” (номер державної реєстрації 0103U000692); № 6/У2П-3 “Автоматизована система ведення навчальних карток студентів”; № 23-Ф4/К43-2003 „Дослідження та розробка моделей і алгоритмів прийняття рішень при плануванні навчального процесу”; № 23-Ф4/К43-05 „Дослідження і розробка методів та засобів порівняльного аналізу електронних текстових документів”; № 389-ДБ07 “Методи та засоби визначення атак на комп'ютерні системи на базі аналізу та прогнозу трафіку як динамічної хаотичної послідовності в тензоровому нейромережевому базисі” (номер державної реєстрації 0107U002816).

Мета і завдання досліджень. Метою дисертаційного дослідження є розробка моделей аналізу відповідей до завдання відкритого типу та методів підвищення ефективності контролю та оцінювання знань термінології предметної галузі на основі сучасних інформаційних технологій.

В напрямку цього в роботі вирішуються наступні завдання:

проаналізувати існуючі автоматизовані системи контролю та оцінювання знань тих, кого навчають, а також системи автоматизованої обробки природномовної інформації, яка має формат відкритого типу;

побудувати лінгвістичні моделі подання знань з урахуванням синонімії понять;

розробити метод і алгоритми обробки текстової відповіді на основі словника синонімів та здійснити їх комп'ютерну реалізацію;

розробити методику розрахунку синонімічної близькості текстових висловів природною мовою; - спроектувати комп'ютерну систему контролю та оцінювання знань тих, кого навчають.

Об'єктом дослідження є процес контролю та оцінювання знань тих, кого навчають при довільних відповідях на тестові запитання в межах інформаційних технологій.

Предметом дослідження є моделі та методи природномовного контролю знань на основі сучасних інформаційних технологій.

Методи дослідження. В процесі досліджень були використані методи теорії множин, системного аналізу, математичної статистики, семантичного аналізу тексту і побудови синонімічних рядів, об'єктно-орієнтоване програмування та розроблення автоматизованих систем обробки природномовної інформації.

Наукова новизна отриманих результатів. У результаті вирішення поставлених задач у дисертаційній роботі, автором отримані наступні результати:

вперше:

запропоновано багатофункціональну лінгвістичну модель, яка дозволяє порівнювати різні текстові визначення предметної галузі з урахуванням синонімії понять.

розроблено метод змістовного аналізу відповідей тих, кого навчають у просторі термінів предметної галузі.

дістало подальшого розвитку

елементи методології та теорії обчислення ступеня змістової близькості різних текстових висловлень в процесі обробки природномовної інформації.

Практичне значення отриманих результатів.

Запропонована інформаційна технологія дозволить:

обчислювати ступень змістовної близькості двох текстових природномовних висловів;

підвищити рівень об'єктивності та достовірності оцінювання знань предметної галузі тих, кого навчають;

за результатами тестування надавати підставу для обґрунтованого коригування структури і змісту дидактичного матеріалу, що сприятиме підвищенню якості підготовки фахівців.

Практична значимість наукових розробок підтверджена актами впровадження в Національному авіаційному університеті, Київському національному університеті культури та мистецтв, Європейському університеті.

Результати дисертаційного дослідження реалізовувались під час вирішення практичного завдання - проведення тестування студентів на знання предметної галузі. Створено і впроваджено прикладні програми для проведення тестування, обробки даних тестування й організації семантичних баз знань - синонімічних рядів і числових показників синонімії для частин термінів конкретної предметної галузі.

Особистий внесок здобувача. Основні наукові і практичні положення та результати одержані особисто авторкою дисертаційного дослідження. Їх висвітлено у наукових працях [1-8].

Апробація результатів дисертації. Основні результати роботи доповідалися й обговорювалися на наукових семінарах і конференціях:Міжнародній науково-теоретичній конференції “Актуальні проблеми державного управління та документо-інформаційного забезпечення апарату влади” КНУКІМ, 2006; Першій науково-практичній конференції з міжнародною участю “Математичне та імітаційне моделювання систем МОДС `2006” , ІПММС НАН України; Науково-практична конференція “Комп'ютерні системи і мережні технології”, НАУ, 2007; на всеукраїнській науково-теоретичній конференції “Трансформаційні процеси в сучасній Українській культурі” КНУКІМ, 2007; на міжнародній науково-технічній конференції “Системний аналіз та інформаційні технології САІТ-2008”, 2008; на науково-практичній конференції з міжнародною участю “Системи підтримки прийняття рішень СППР'2008”, ІПММС НАН України; на міжнародній науково-технічній конференції Інтелектуальні технології лінгвістичного аналізу “ІТЛА-2008”, 2008.

Публікації. За результатами дисертаційної роботи опубліковано 18 праць, з них 7 статей у фахових виданнях.

Структура та обсяг роботи. Дисертація написана на 170 сторінках складається зі вступу, трьох розділів, висновку, списку використаних джерел з 120 найменувань, на 10 сторінках додатки, на 5 сторінках 12 рисунків і 15 таблиць.

ОСНОВНИЙ ЗМІСТ

У вступі обґрунтовується актуальність теми дисертаційної роботи, формулюється мета і завдання дослідження, визначається наукова новизна і практична значимість отриманих результатів.

У першому розділі наведено способи та методи використання знань в сучасних інформаційних системах. Використання знань здійснюється в переважній більшості в інформаційних системах з застосуванням www-сервісів (браузерів), що мають стандартний інтерфейс користувача, однотипну методику роботи і найширший набір відображення інформації (знань). автоматизований природномовний лінгвістичний комп'ютерний

Існуючі комп'ютерні системи контролю та оцінювання знань використовують методи оброблення текстової інформації, які не передбачають можливість поелементного аналізу даних і накладають обмеження на формат завдання відкритого типу.

Для реалізації автоматизованої системи контролю знань, яка має можливість аналізувати відповіді на завдання відкритого типу, потрібно врахувати синонімію понять, що обумовлює необхідність розробки словників синонімів з предметних галузей.

У другому розділі запропоновано багатофункціональну лінгвістичну модель подання та контролю знань на основі синонімії термінів предметної галузі, яка дозволить оцінювати релевантність двох речень, поданих у вигляді природного тексту з довільної кількості слів. Розроблено алгоритм обробки текстової відповіді того, кого навчають на завдання відкритого типу, який дозволяє установлювати змістовну відповідність між термінами предметної галузі.

Для представлення знань пропонуються наступні лінгвістичні моделі:

= х11 x22 q-1xq ; (1)

=(х1; x2; ;xq) ; (2)

=(х1; xі2; ;x іn) ; (3)

= R3zq = (с(х1); с(xі2); ; с(x іn)) ; (4)

= {zq; zq}; (5)

= R 5zq = {R zq; R zq} ; ; … . xі V, (6)

де - довільна лексема, яка з урахуванням її словозмінних класів може бути представлена змінною і незмінною компонентою;

с(х) - частина лексеми (квазіоснова) ;

с(х1), - змінні частини слова у граматичному значенні; ;

V={x} - клас елементарних інформаційних одиниць (поняття предметної галузі);

і - знак пунктуації , пробіл; ;

- довжина ланцюжка;

Z - сукупності певних ланцюжків елементів інформаційних одиниць;

R - відображення ланцюжків, які порівнюються;

X - сукупність ланцюжків визначеної довжини.

Модель (1) збігається з представленням терміна його текстовою формою.

У моделі (2) термін представляється послідовністю термів, що його складають.

У моделі (3) термін представляється неупорядкованою множиною слів, що містяться у множині (х1; x2; ;xq). Це означає, що кожне слово з послідовності (х1; x2; ;xq) входить у цю модель з кратністю не більше 1.

Модель (4) будується з моделі (3) заміною xі на с(xі) або Х на Х R.

У моделі (5) термін представляється двома компонентами, де визначається згідно з моделлю (3), а - згідно з моделлю (1). При цьому враховується той факт, що деякі складні терміни можуть містити словосполучення, які для адекватного врахування семантики потребують збереження семантико-синтаксичної та граматичної структури, що має матеріальне вираження в будові конкретних складових-словоформ та роздільників .

Модель (6) вдержується з моделі (5) застосуванням до неї оператора R (або, що те саме, заміною Х на Х R).

Набір лексикографічних моделей, які специфікують терміни предметної галузі через елементарні терми - елементи відповідної Г-системи, також специфікують дефініції зазначених термів. Зазначені моделі використовуються при побудові тезаурусної системи [Z].

Відношення синонімії між мовними одиницями х та у, яке задається умовою близькості їхніх семантичних станів с (х) - с (у) , , підлягає кількісній оцінці = 1 - , за допомогою процедури експертизи словника синонімів, в якому подано лексикографічний опис синонімічних рядів. Тут - синонімічний ряд (сінсет).

Відношення синонімії, поширене на складові тезаурусу предметної галузі [Z], визначається на множині дефініцій термінів:

C(z) ={C(z)z(z)}= {{C1(z); C2(z); …; Cl (z)(z)} z(z)},

де C(z) - скінчена множина визначень терміна.

На множині C(z) вводиться відношення релевантності REL, яке є кількісною мірою змістової (семантичної) близькості двох ланцюжків А=zM та В=zN (довжиною M та N, відповідно):

REL: C(z) C(z) ,

де - підмножина множини невід'ємних чисел. При цьому вважається, що ланцюжок В є релевантним ланцюжкові А, тобто А REL В , тоді і тільки тоді, коли значення функції REL (А,В) не менше якогось певного : REL (А,В) , вибір якого залежить від специфіки предметної галузі та конкретних завдань дослідження та оцінювання.

Кількісне значення релевантності двох висловлень А і В обчислюється за формулою:

REL (А,В)=,

де: - функція числових значень показника синонімії термів, що входять до А та В, тобто функція елементів матриці синонімії К (х у); - функція довжин ланцюжків А та В (тобто M та N).

Функція має такі властивості:

1) тоді і тільки тоді, коли ;

Так само очевидно, що функція є симетричною по змінних M та N, отже вона є симетричною відносно свого максимального значення. З цього випливає друга властивість :

2) (M , N) = (N , M) і симетрична відносно значення max.

Найпростішою функцією з такими властивостями є функція =M - N.

Очевидно, що якщо ланцюжки А та В сильно відрізняються за довжиною (тобто за кількістю значущих термів), то вони не можуть бути релевантними, оскільки кожний терм, відсутній в одному ланцюжкові, вносить свій внесок у семантику іншого ланцюжка і, з урахуванням кожного такого терму, різниця в семантиці ланцюжків стає все більшою, а їх взаємна релевантність - меншою.

У третьому розділі наведений опис експериментального макету тестової системи, яка реалізує основні положення дисертаційного дослідження.

Запропонована схема тестової системи відповідає принципам інформаційного пошуку й обробки текстових даних та реалізує механізм стемінга, змістової конкатенації термів, ранжування мір близькості за класами належності понять предметної галузі.

У процесі досліджень було висунуто гіпотезу про формулювання знання термінології предметної галузі (термінів) з використанням слів-синонімів зі словникового запасу тих, кого навчають, з певної предметної галузі.

Для доведення цієї гіпотези розроблено способи реєстрації синонімів, методика формування міри близькості фактичних і еталонних визначень термінів предметної галузі, запропоновано відповідні алгоритми реалізації і розроблено прикладний програмний засіб.

Результати дослідження були апробовані при проведенні тестування студентів зі знань термінології предметної навчальної дисципліни “Інформатика та програмування” як найбільш близької до професійної діяльності здобувача. Тестування проводилося після теоретичного і практичного вивчення студентами основного матеріалу вказаної дисципліни.

За умовами тестування кожен тестований був повинен дати визначення (формулювання) кожного із шести термінів: алгоритм, команда, оператор, операція, програма та мова програмування, заздалегідь уведених у базу знань автоматизованої системи контролю і оцінювання знань.

Результати тестування експериментальної групи з 10 студентів у вигляді обчислених мір близькості фактичних формулювань до еталонних визначень термінів наведено в табл. 1.

Таблиця 1. Міри близькості відповідей до еталонних визначень

Номер

тестованого

Алгоритм

Команда

Операція

Оператор

Мова програмування

Програма

1

0,6

0,975

0,5814

0,5522

0,7107

0,814

2

0,58

0,525

0,1938

0,7537

0,3973

0,1507

3

0,9473

0,745

0,457

0,6784

0,5784

0,6413

4

0,745

0,4256

0,87

0,7623

0,9112

0,5674

5

0,3784

0,5786

0,7412

0,247

0,1874

0,512

6

0,1974

0,425

0,2578

0,3105

0,128

0,4039

7

0,9211

0,7412

0,6742

0,874

0,6891

0,9571

8

1

0,4785

0,6871

0,397

0,5679

0,741

9

0,347

0,6278

0,58

0,6971

0,4712

0,672

10

0,8714

0,385

0,2461

0,4590

0,5121

0,3473

Графічна ілюстрація мір близькості, отриманих в ході експерименту, за даними табл. 1 для десяти тестованих і шести термінів з тезауруса предметної галузі зображена на рис. 1.

Рис. 1. Карта результатів тестування (мір близькості)

Функціонування автоматизованої системи контролю і оцінювання знань ілюструється таким прикладом.

Нехай еталонним визначенням терміну “Програма” є таке: “Програма - це дані, призначені для керування конкретними компонентами системи обробки інформації з метою реалізації певного алгоритму”. Припустимо, тестований ввів до системи таку відповідь: “Програма - це сукупність даних і послідовність операцій над ними, яка потрібна для обробки інформації і реалізації визначеного алгоритму”. Тоді після попередньої обробки еталонного і фактичного визначень (вилучення стоп-слів, виключення з розгляду загальновживаних слів, що не стосується розглянутої предметної галузі) одержуємо таку послідовність термів:

- для еталонного визначення: дан, управлін, компонент, систем, обробк, інформаци, цілий, реаліз, визначн, алгоритм;

- для фактичного визначення: сукупн, дан, послідовн, операци, обробк, інформаци, реаліз, визначен, алгоритм.

Конкатенація окремих фрагментів слів для даного прикладу наведена у табл. 2, а числові показники синонімічної релевантності відповідей - у табл. 3.

Таблиця 2. Конкатенація окремих фрагментів слів

a1 = дан

a 6 = інформац

b1 = сукупн

b5 = обробк

a2 = керуван

a 7 = цілий

b2 = дан

b6= інформац

a 3 = компонентів

a 8 = реаліз

b3 = послідовн

b7 = реаліз

a 4 = систем

а 9 = визначен

b4= операци

b8 =визначен

а 5 = обробк

а 10 = алгоритм

b9 = алгоритм

Терми еталонного і фактичного визначень: {дан, дан}, {дан, інформац}, {управл, обробк}, {компонент, дан}, {систем, сукупн}, {систем, послідовн}, {систем, алгоритм}, {обробк, обробк}, {обробк, реалізац}, {інформац, дан}, {інформац, інформац}, {реалізац, обробк}, {реалізац, реалізац}, {визначен, визначен}, {алгоритм, алгоритм}.

Таблиця 3. Числові показники синонімічної релевантності відповідей

Значущі частини слів еталонного визначення

Значущі частини слів фактичного

визначення

Дан

Керуван

Компонент

Систем

Обробк

Інформац

Цілий

Реалізац

Визначен

Алгоритм

Сукупн

0,8

Дан

1

0,5

0,7

Послідовн

0,2

Операц

0,2

0,6

Обробк

0,8

1

0,3

Інформац

0,7

1

Реалізац

0,5

1

Визначен

1

Алгоритм

0,6

1

Аналіз отриманих результатів тестування дозволяє зробити висновки як про ступінь підготовки студентів, так і про дидактичні характеристики навчального матеріалу.

ВИСНОВКИ

В процесі дисертаційного дослідження отримані такі наукові і практичні результати.

1. Проаналізовані існуючі автоматизовані системи контролю та оцінювання знань тих, кого навчають, а також системи автоматизованої обробки природномовної інформації, яка має формат відкритого типу. Аналіз показав, що існуючі комп'ютерні системи контролю та оцінювання знань використовують методи оброблення текстової інформації, які не передбачають можливість поелементного аналізу даних і накладають обмеження на формат завдання відкритого типу. У межах семантичного підходу до текстової інформації запропоновано визначати зміст тексту за допомогою синонімічної близькості слів.

2. Запропонована багатофункціональна лінгвістична модель подання та контролю знань на основі синонімії термінів предметної галузі, яка дозволяє вирішити завдання обчислення релевантності двох речень природною мовою, поданих у вигляді тексту з довільної кількості слів.

3. Розроблено метод обробки текстових визначень на основі словника синонімів, який дозволяє встановити відповідність між термінами еталонного визначення і відповіді.

4. Розроблено методику розрахунку синонімічної близькості текстових висловлень на основі словників синонімів.

5. Запропонований метод обчислення показника релевантності відповідей до завдання відкритого типу й еталонних відповідей на основі кількісних показників синонімії термів предметної галузі.

6. Розроблено експериментальну систему контролю та оцінювання знань для автоматизації процесів тестування студентів вищого навчального закладу з термінології предметної галузі на основі сучасних інформаційних технологій.

7. Моделі, засоби та методологічні положення дисертаційної роботи впроваджені в навчальний процес, що підтверджено актами впровадження.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

Статті у фахових виданнях :

1. Бадьоріна Л. М. Метод оцінювання довільних відповідей у комп'ютерних системах тестування знань / Л. М. Бадьоріна // Математичні машини і системи. - 2006. - № 4. - С. 138-144.

2. Бадёрина Л. Н. Метод нормализации текстового ответа в компьютерных системах тестирования знаний / Л. Н. Бадёрина // Проблеми інформатизації і управління. - 2006. - № 18. - С. 28-32

3. Бадьоріна Л. М. Аналітична модель синонімічної релевантності текстових відповідей у комп'ютерних тестових системах / Л. М. Бадьоріна // Вісник НАУ. - 2006. - № 4. - С. 60-63.

4. Бадёрина Л. Н. Обработка текстовых данных в автоматизированной обучающей системе / Л. Н. Бадёрина // Зб. наук. праць Київ. нац. ун-ту культури і мистецтв; ф-т державного управління. - К., 2007. - С. 130-133.

5. Бадьоріна Л. М. Кількісна оцінка значеннєвої близькості довільних та еталонних текстових визначень у комп'ютерних системах тестування знань / Л. М. Бадьоріна // Проблеми інформатизації і управління. - 2007. - № 19. - С. 32-36.

6. Badorina L. N. Method of the relevance degree estimation of the text answer in computer training systems / L. N. Badorina // Вісн. НАУ. - 2007. - № 1. - С. 80-84.

7. Бадёрина Л. Н. Метатекстовые модели в интегрированных информационных системах / Л. Н. Бадёрина // Зб. наук. праць Київ. нац. ун-ту культури і мистецтв; ф-т державного управління. - К., 2007. - С. 105-108.

8. Badorina L. N. Definition of relevance of text expressions in information systems / L. N. Badorina // Проблеми інформатизації і управління. - 2008. - № 22. - С. 5-8.

Друковані праці наукових конференцій:

9. Бадьоріна Л. М. Метод оцінювання довільних відповідей у комп'ютерних системах тестування знань / Л. М. Бадьоріна // Математичне та імітаційне моделювання систем : міжнар. наук.-практ. конф. (Київ, 26-30 червня 2006 р.). - К. : ІПММС НАН України, 2006. - С. 115.

10. Бадьоріна Л. М. Кількісна оцінка змістової близькості текстових визначень в комп'ютерних навчальних системах / Л. М. Бадьоріна // Матеріали наук.-практ. конф. “Інтегровані інформаційні технології та системи” “ІІТС-2007”. - К. : НАУ, 2007. - С. 9-13.

11. Бадёрина Л. Н. Метод сравнительного анализа текстового ответа в компьютерных системах тестирования / Л. Н. Бадёрина // Міжнар. наук.-практ. конф. (Київ, 7 червня 2007 р.). - К. : ІПММС НАН України, 2007. - С. 114-118.

12. Бадёрина Л. Н. Обработка текстовых данных в автоматизированной обучающей системе / Л. Н. Бадёрина // Термінологія документознавства та суміжних галузей знань : зб. наук. праць. - К. : Нац. ун-т культури і мистецтв; ф-т державного управління, 2007. - С. 130-133.

13. Бадьоріна Л. М. Визначення релевантності текстових виразів в інформаційних системах / Л. М. Бадьоріна // Трансформаційні процеси в сучасній українській культурі : матеріали наук.-теор. конф. - К. : КНУКІМ, 2007. - С. 328-330.

14. Badorina L. N. Method of the relevance degree estimation of the text answer in computer training systems / L. N. Badorina // Матеріали VIII міжнар. наук.-тех. конф. “АВІА-2007”. - К. : НАУ, 2007. - Т. 1. - С. 13.39-13.52.

15. Бадьоріна Л. М. Метатекстовые модели в интегрированных информационных системах / Л. М. Бадьоріна // Матеріали міжнар. наук.-тех. конф. “Системний аналіз та інформаційні технології” “САІТ-2008”. - К. : ІПСА НТУУ “КПІ”, 2008. - С. 169.

16. Бадьоріна Л. М. Формальні моделі мовленевих структур в автоматизованих системах освітнього призначення / Л. М. Бадьоріна // Матеріали наук.-практ. конф. з міжнар. участю “Інтегровані інформаційні технології та системи” “СППР-2008”. - К. : ІПММС НАН України, 2008. - С. 164-166.

17. Бадьоріна Л. М. Комунікативні технології у сфері дозвілля: лінгвістичний аспект / Л. М. Бадьоріна // Фундаментальні і прикладні дослідження рекреаційно-дозвіллєвої сфери в контексті Євроінтеграційних процесів : міжнар. наук.-практ. конф. (Київ, 12-13 травня 2008 р.). - К. : КНУКІМ, 2008.- C. 8.

18. Широков В. А. Лінгвістична технологія оцінювання знань / В. А. Широков, Л. М. Бадьоріна // Інтелектуальні технології лінгвістичного аналізу : міжнар. наук.-тех. конф. (Київ, 6-8 жовтня 2008 р.).- К. : НАУ, 2008. - C. 6.

АНОТАЦІЯ

Бадьоріна Л. М. Інформаційна технологія природномовного контролю знань. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06. - інформаційні технології. - Київський національний університет будівництва і архітектури Міністерства освіти і науки України, Київ, 2009.

Дисертація присвячена вирішенню задачі підвищення об'єктивності контролю та достовірності оцінювання знань термінології предметної галузі на основі сучасних інформаційних технологій.

Запропонована багатофункціональна лінгвістична модель подання та контролю знань на основі синонімії термінів предметної галузі, яка дозволяє вирішити завдання обчислення релевантності двох речень природною мовою, поданих у вигляді тексту з довільної кількості слів. Розроблено метод обробки текстових визначень на основі словника синонімів, який дозволяє встановити відповідність між термінами еталонного визначення і відповіді. Розроблено методику розрахунку синонімічної близькості текстових висловлень на основі словників синонімів. Запропонований метод обчислення показника релевантності відповідей до завдання відкритого типу й еталонних відповідей на основі кількісних показників синонімії термів предметної галузі. Розроблено експериментальну систему контролю та оцінювання знань для автоматизації процесів тестування студентів вищого навчального закладу з термінології предметної галузі на основі сучасних інформаційних технологій. Моделі, засоби та методологічні положення дисертаційної роботи впроваджені в навчальний процес, що підтверджено актами впровадження.

Ключові слова: інформаційна технологія, контроль знань, природномовні тексти, лінгвістичні моделі, довільні відповіді.

АННОТАЦИЯ

Бадёрина Л. Н. Информационная технология естественноязыкового контроля знаний. - Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06. - информационные технологии. - Киевский национальный университет строительства и архитектуры Министерства образования и науки Украины, Киев, 2009.

Диссертация посвящена решению задачи повышения объективности контроля и достоверности оценивания знаний терминологии предметной отрасли на основе современных информационных технологий.

Предложена многофункциональная лингвистическая модель представления и контроля знаний на основе синонимии терминов предметной области, которая позволяет вычислять релевантность двух предложений естественного языка, представленных в виде текста из произвольного количества слов. Разработан метод обработки текстовых определений на основе словаря синонимов, который позволяет установить соответствие между терминами эталонного определения и ответа. Разработана методика расчета синонимической близости текстовых высказываний на основе словарей синонимов. Предложен метод вычисления показателя релевантности ответов на задания открытого типа и эталонных определений на основе количественных показателей синонимии термов предметной области. Разработана экспериментальная система контроля и оценивания знаний для автоматизации процессов тестирования студентов высшего учебного заведения на знания терминологии предметной области на основе современных информационных технологий. Используются и прикладные продукты синтаксического, грамматического, орфографического анализа текстов в качестве первичного средства контроля ответа. Этим достигается универсальность и, в определенной мере, стандартизация, заключающаяся в отсутствии необходимости разработки специальных средств первичного разбора текста. В практическом плане это достигается использованием программных библиотек текстовых процессоров, например, MS Word. При вводе текстового ответа (фактической формулировки) тестируемый может наглядно убедиться в соблюдении правил языка при построении фразы, выражения. Такой подход позволяет в методическом плане одновременно реализовать и обучающую составляющую (корректирующую знания) процесса контроля и оценивания знаний, и оперативной корректировки набранного им текста, в случае необходимости замены отдельных слов либо исключения речевой и синтаксической несогласованности в выражении, фразе. Использование семантического анализа позволят оценить корректность текстового ответа обучаемого на поставленный вопрос и вычислить меру близости семантики введенного текста к семантике задаваемого вопроса.

Модели, средства и методологические положения диссертационной работы внедрены в учебный процесс, что подтверждено актами внедрения.

Ключевые слова: информационная технология, контроль знаний, естественноязыковые тексты, лингвистические модели, произвольные ответы.

ANNOTATION

Badiorina L. M. The information technology of the native language control of knowledges. - Manuscript.

Thesis is submitted for the candidate's degree in the field of technical science in specialty 05.13.06 - Information technology. - Kyiv National University Civil Building and Architecture Ukrainian Ministry of Education and Science, Kyiv, 2009.

The thesis is connected with development of multifunctional models and methods studying text answers with the purpose to determine their coincidence. Author proposes the linguistic multifunctional model that connects the terms of the subject sphere. The studying of text answers to determine semantic coincidence with the help of the proposed method is used.

The procedure of testing provides a developed answer in any form, that is with his or her own words in natural language. In the latter case it is possible to appreciate the student's knowledge only by comparative text analysis of the answer with the set standard reference text and to assess their relevance. All word-forms, terms of the subject domain and grammatical structures of the statement should be considered and assessed with the use of all possible synonyms.

Key words: information technologies, natural language, multifunctional model, linguistic multifunctional model, semantic coincidence, automated educational systems.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.