Формальні моделі та методи синтезу швидкодіючих багатозначних структур мовних систем
Розробка теоретичних та методологічних засобів опису лінгвістичних зв’язків української мови у вигляді рівнянь алгебри предикатів. Побудова математичних моделей акцентних характеристик і букво-фонемних відношень для голосних та приголосних звуків.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 29.07.2014 |
Размер файла | 105,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Ф33ГЛУХ=G11ГЛУХpUф> pфqт~ х1к? х1в? х1х? х1ф; Ф34ГЛУХ=G11ГЛУХpUп> (pпqт~ (х1т? х1д));
Ф35ГЛУХ=(pUт? pUч)qUм> (pтqм~ (х1т ? х1д)); Ф36ГЛУХ=G11ГЛУХpUч> (pкqт~ (х1к ? х1г));
Ф37ГЛУХ=G11ГЛУХpUш> (pшqт~ (х1ш? х1ж)); Ф38 ГЛУХ=(pUк ? pUц) qт > (pcqт (х1c ? х1з));
Ф39ГЛУХ =(pUкqUт ? pUцqUм) > (pcqм (х1c ? х1з)); Ф310 ГЛУХ = puп quт > pпqтх1п;
Ф311ГЛУХ = puф quт > pфqтх1ф; Ф312ГЛУХ = puд quт > pдqтх1д; Ф313ГЛУХ = puт > pтx1т;
Ф314ГЛУХ = (puс ? puв ? puф ? puп ? puм ? puт ? puх) > pcqтx1с;
Ф315г = (puф ? puп ? puс) > pсqмx1с; Ф316 ГЛУХ = puч > pхqтx1г;
Ф317 ГЛУХ = puж > pжqтx1ж ; Ф318 ГЛУХ = puш > pшqтx1ш.
- склад предикату Ф4дз (X, Y, Z) (звук [у] перебуває у фонетичній позиції перед дзвінкими шумовими приголосними):
Ф41дз = pвqт (pUг ~ x1ф)(pUг ~ x1в); Ф42дз = (pUв ? pUб) qUм > pвqмx1в;
Ф43дз = (qтG12дзpuд ? qмpuдquм) > (pд~ (x1д ? x1т)); Ф44дз = puб ~ x1дрдqм;
Ф45дз = (puб ? puд ? puз? puг)quм ~ pзqт (x1з ? x1c);
Ф46дз = (puб quм ? puдquт ? puтquм ) ~ pзqм (x1з ? x1c);
Ф47дз=G12дз > pГqт(x1г ? x1х); Ф48дз=pб ~ x1б.
Наведена вище система рівнянь є формальним еквівалентом зв'язків, що існують між звуками сонорних, парних і позапарних дзвінких та глухих приголосних і графічними еквівалентами мови, що їм відповідають.
З допомогою запропонованого опису букво-фонемних зв'язків у вигляді системи рівнянь алгебри предикатів можна здійснити формальний перехід від фонетичного запису слова до його графічного подання (задача аналізу), за заданим орфографічним текстом отримувати його фонетичну транскрипцію (задача синтезу).
Отримані формальні моделі наглядно показуть, що математичний апарат алгебри скінчених предикатів й вибрана методика формального опису дозволяє отримати їх компактний формальний опис, а також опис акцентних характеристик відмінюваних і дієвідмінюваних частин української мови. Такі моделі задовольняють двом основним вимогам формалізації, а саме: достатньо точно описуть вихідний мовний об'єкт та можуть бути реалізовані засобами обчислювальної техніки. Розроблений формальний опис акцентних залежностей мови можна використати для економного запису словарних структур природної мови в лексикографічних базах даних.
У четвертому розділі висвітлено шляхи математичного моделювання морфологічного рівня української мови. Об'єктом формального опису є письмова, тобто орфографічна, а не фонематична реалізація словоформ української мови. При цьому, окремою словоформою є відтинок тексту між двома проміжками.
Особливу роль під час словозміни відіграють закінчення словоформ (флексії), що передають, як правило, граматичні значення в українських словах. У морфології української мови існує певна залежність (відношення) між флексією та оточуючим її текстом. Завдання полягає в математичному описі існуючої залежності, тобто у формалізації поняття флексії. Текст, що охоплює закінчення, є неоднорідним щодо нього. Розрізняємо найближчий текст, що межує безпосередньо з закінченням у словоформі і подальший текст, що межує з словоформою, у якій перебуває закінчення, а також зосередимо подальший розгляд на методиці формального опису процесів зміни слів за допомогою флексій, що можна застосувати й до інших лінгвістичних одиниць тексту.
Дію тексту, що оточує закінчення (як ближчого, так і подальшого), замінимо уведенням набору ознак, який проінтерпретуємо як смисл закінчення. Під смислом будемо розуміти набір проміжних змінних, що зв'язують рівняння, які описують закінчення, з рівняннями, що описують решту частини тексту. Набір значень цих змінних будемо інтерпретувати як значення смислу. Смисл розглядається як змінний вектор Х = (x1, x2 ,…, xm), де m - число компонентів вектора смислу, а змінні x1, x2 ,…, xm - компоненти смислу.
Переважна більшість закінчень містить одно-, дво-, трибуквені закінчення та нулеву флексію. Це дало підставу для формального подання закінчення у вигляді трикомпонентного вектора Y = (y1, y2, y3), де y1, y2, y3 - літери, що стоять зліва направо на першому, другому та третьому місцях закінчення відповідно.
Для того, щоб отримати компактний та повний опис фрагментного морфологічного відношення L (X, Y), необхідно вибрати компоненти вектора Х з урахуванням внутрішньої структури мови. Через те, що об'єкт, який моделюється, є достатньо складною для математичного опису системою, зручно розбити його на ряд підсистем, які будемо надалі називати “мовними блоками”, що пізніше об'єднаються теоремою про розкладання в алгебрі скінчених предикатів.
Для кожного мовного блоку фіксують значення деяких із компонентів смислу, які ми назвемо обмеженими. Другу групу ознак, що служать безпосередньо для вибору закінчення всередині деякого мовного блока, назвемо змінними. Обмежувальним ознакам поставимо у відповідність змінну , а змінним - X. Таким чином, маємо можливість уточнити структуру вектора смислу X= (, X) =(1, 2, …, k, x1, x2, …, xm), де k, m - число обмежувальних та змінних компонентів вектора смислу відповідно.
Змінні ознаки в свою чергу неоднорідні щодо закінчення. Впливові ближнього тексту на закінчення будуть відповідати лексичні ознаки, а подальшого - синтаксичні.
Отже, завдання полягає у формальному описі засобами АСП фрагментарного морфологічного відношення L = (1, 2,..., k, x1, x2,…, xm, y1, y2, …, yn), що буде моделлю флексійного оброблення українських словоформ. Морфологічне відношення визначається своєю характеристичною функцією L (X, Y).
Звуження обсягу математичного опису здійснено уведенням шести граматичних ознак. Найперше уведено ознаку 1 виду морфеми з значеннями: закінчення (з), не закінчення (н) (префікс, корінь, суфікс тощо).
Ознака змінюваності слова, експлікована змінною 2 може приймати одне з двох значень - змінюване (зм), незмінюване (нзм).
Уведення змінної 3, що відповідає ознаці типу словозміни, дозволило окремо описувати відмінювання іменних частин мови (3 = і ) та відмінювання дієслів (3 = д).
Іменні частини мови розрізняються за ознакою типу відмінювання (змінна 4). Змінна 4 визначена на множині значень: субстантивна (с), ад'єктивна (а), займенникова (з) та числівникова (ч).
Уведемо граматичну ознаку змінної іменної частини мови (5). що може приймати одне з таких значень: іменник (і), прикметник (п), займенник (з), числівник (ч), дієприкметник (дп).
Шоста граматична ознака, що забезпечує звуження об'єкту математичного моделювання 6 - вид словоформи з значеннями регулярна (р), нерегулярна (н).
Проведені лінгвістичні дослідження показали, що необхідно увести дев'ятнадцять граматичних ознак: x1 - відмінок з значеннями: називний (н), родовий (р), давальний (д), знахідний (з), орудний (о), місцевий (м), кличний (кл); x2 - рід з значеннями: чоловічий (ч), жіночий (ж), середній (с); x3 - число з значеннями: однина (о), множина (м); x4 - ознака одухотвореності з значеннями: одухотворена (о), не одухотворена (н); x5 - варіант закінчення з значеннями: архаїчне (а), сучасне (с); x6 - ознака наголошеності закінчення з значеннями: наголошене(н),ненаголошене (н-); x7 - остання буква основи з значеннями, заданими на множині букв та знаків українського алфавіту; x8 - вид основи з значеннями: тверда (т), м'яка (м); x9 - вимога встановлення знака “над буквою” ї з значеннями: ставити (с), не ставити (н); x10 - повнота словоформи з значеннями: повна (п), коротка (к); x11 - ознака репрезентації з значеннями: інфінітив (і), особова форма (о); x12 - спосіб з значеннями: дійсна (д), наказова (н); x13 - часу з значеннями: минуле (м). не минуле (м -з); x14 - особи з значеннями: перша (1), друга (2), третя (3); x15 - тип впливу дієслівної основи з значеннями: перший (1), другий (2); x16 - відмінювання з значеннями: перше (1), друге (2); x17 - ознака наявності частки "ви" з значеннями: так (т). ні (н); x18 - передостання буква основи з значеннями, заданими на множині більшості букв українського алфавіту; x19 - наявність нормативних обмежень з значеннями: так (т), ні (н).
Лінгвістичні дослідження формальних моделей словозміни української мови виявили специфічний характер індивідуального морфологічного предиката Li(Х,Y), який можна зобразити у вигляді кон'юнкції двох предикатів, що залежать від меншого числа змінних. Лінгвістичною основою такого зображення предикату Li(Х,Y) є різна природа змінних ознак X, що відповідають двом механізмам: синтаксичного впливу тексту та впливу закінчень основ.
Предикати Li1 та Li2 змістовно інтерпретуються як таблиці впливу основ та парадигматичні таблиці синтаксичного впливу відповідно. Функція уj = F(Х), , що відповідає предикатові Li(Х,Y) та задана на декартовому добутку АґВ значеннями в М у вигляді
Yj = ц(t, s),
t = h(ХI), s = m(ХII); А = ХI О {х1, х2, ..., х5, х10, х11, ..., х14}; В = ХII О {х6, х7, х8, х15, х1б, ..., х19}.
Для отримання функцій s = m(ХII) та t = h(ХI) розроблено відповідні алгоритми. Множина цих номерів прийнята як області значення функції s'=m--(XІІ):
s1 = ПРГ (х7) х8т ? ЗЯЗ(х7) ? ГОЛ (х7) ? х7ц; s2 = ПРГ (х7) х8м; s3 = ГОЛ (х7) ? х7й.
Отримано два класи суміжності, перенумеровані довільно та прийняті як значення функції t'=h (ХІ):
t1 = (х1н ? х1о ? х4н ) х2м х3о; t 2 = (х1p ? х1з ? х4о ) х2м х3о.
Предикат L14(X, Y) відповідає функції уj = Fi(X), що відображає залежність закінчень регулярних словоформ іменних частин мови ад'єктивного відмінювання від смислу. Подамо цю функцію у вигляді
уj = ц1 (s1, t1), де s1 = m1 (ХII), t1 = h1 (ХI);
ХI = { х1, х2, х3, х4, х5, х10 }, ХII = { х6, х7, х8}.
Парадигматична таблиця ад'єктивного відмінювання є квадратною матрицею, а таблиця впливу основ - прямокутною. У парадигматичній таблиці класи суміжності результуючого розбиття Q1' перенумеровані довільним чином.
Способи впливу подальшого тексту на закінчення регулярних словоформ за числом класів суміжності:
t11 = (х1н ? х1з х4н) х2ч х3о х10п ; t12 = ((х1p ? х1з х4о) ? х2ч х3о ? х1р х2с х3о) х10п ;
t13 = x1д(x2ч ? x2с) x3о x10п ; t14 = (x1о ( x2ч ? x2с) x3о x10п ;
t15 = x1м(x2ч ? x2с) x3о x10п ; t16 = x1н x2ж x3о x10п ;
t17 = (x1p ? x1д ? x1о x5а ? x1м ) x2ж x3о x10п ; t18 = x1з x2ж x3о x10п ;
t19 = x1о x2ж x3о x5с x10п ; t110 = (x1н ? x1з) x2с x3о x10п ; t111 = (x1н ? x1з x4н) x3м x10п;
t112 = (x1p ? x1а x4о ? x1м) x3м x10п ; t113 = x1о x3м x10к ; t114 = x2ч x3о x10к ;
t115 = x2с x3о x10к ; t116 = x2с x3о x10к ; t117 = х3м х10к ,
t11 > (у1и ? у1і ? у1о) у2й у3И; t12 > (у1a ? у1я) у2м у3и; t13 > (y1о ? y1є) y2в y3і;
t14 > (у1и ? у1і) у2м у3И; t15 > (y1о ? y1є) y2м y3И; t16 > (y1в ? y1я) y2И y3м;
t17 > (y1И ? y1і) y2й y3И; t18 > (y1о ? y1є) y2И y3ю; t19 > (y1о ? y1в) y2И y3ю;
t110 > (y1a ? y1я) y2И y3х; t111 > (y1a ? y1е) y2И y3р; t112 > (y1a ? y1я) y2т y3И;
t113 > (y1и ? y1і)y2мy3и; t114> (у1И(у2И(у3И ? у3ь) ? у2Иу3ю; t115 > (y1ay1я)y2Иy3И;
t116 > (у1о ? у1е) у2? у3?; t117 > (y1і y1я) y2И y3И.
Способи впливу ближчого тексту на закінчення регулярних словоформ
за числом класів суміжності:
s11 = ПРГ(х7) x6н- х8т; s12 = ПРГ (х7) x6н- х8м; s13 = ЗЯЗ(х7) x6н-;
s14 = ШИП(х7) x6н-;s15 = x6н- х8ц; s16=х6н(ПРГ (х7) х7ц ГОЛ (х7) х7и);
s17 = х6н (ЗЯЗ(х7) ШИП(х7); s18 = x6н- ( ГОЛ (х7) х7и)
Функція уj = ц1(s1, t1) відповідності структури закінчення (предикатові L14):
- для першої букви закінчення:
у1а = (t16 ? t115)(s11 ? s13 ? s14 ? s15 ? s16 ? s17); y1я = (t16? t115)(s12? s18);
y1и = (t14? t111? t112? t113? t117 )(s11? s15? s16)? t11 (s11? s15);
y1і = (t14? t111? t112? t113? t117)(s12? s13? s14? s17? s18)? t11(s12? s13? s14? s18);
y1о = (t12? t13? t15? t17? t19? t110? t116)(s11? s13? s16? s17)? t11(s16? s17);
y1е = (t12? t13? t15? t17? t19? t110? t116 )(s12? s14? s15? s18 );
y1у = t18 (s11? s13? s14? s15? s16? s17); y1ю = t18 (s12? s18); y1? = t114( s11? s14? s15);
- для другої букви закінчення:
y2м = t13 ? t14 ? t15 ? t113; y2й = t11 ? t17 ? t114 & s18 ; y2х = t112; y2г = t12;
у2И= t16t18? t19? t110? t111? t114(s11? s12? ... ? s17) ? t115? t116? t117;
- для третьої букви закінчення:
y3и = t113; y3ю = t18 ? t19; y3я = t16; y3е = t110 ? t111; y3ь = s12 & t114; y3o = t12; y3y = t13;
у3И = t11? t14? t15? t17? t112? t114(s11? s13? s14? ... ? s18) ? t115? t116? t117.
Формалізація нерегулярних словоформ з нестандартним закінченнями
де - деяке слово з словника системи, - зображення слова зі словника, <у1, у2, у3> - закінчення слова, - означає логічну суму всіх елементів словника, найдовше слово якого містить не більше двадцяти букв.
П'ятий розділ присвячений аналізу специфіки процесу розпаралелювання процедури розв'язання систем лінгвістичних рівнянь шляхом програмного моделювання запропонованих алгоритмів для досягнення граничної структурної швидкодії при їхній апраратній реалізації. На прикладі морфологічного аналізу показана можливість машинної реалізації відношень природної мови, описаних у вигляді таких рівнянь. Їхнє затосування та моделювання дозволяє провести (здійснити) такі машинні експерименти, що виявляють неточності у математичному опису.
Шостий розділ присвячено аналізу та розробці технології побудови нового класу моделей багатозначних апаратних засобів - АСП-структур третього роду на базі універсальних функціональних перетворювачів просторового типу.
Мета шостого розділу досягається шляхом декомпозиції багатозначних структур на дискретно-аналогові та цифрові субблоки, особливо у частині їх проміжного просторового перетворення інформації. Вперше запропоновано вирішення низки підзадач аналізу та синтезу АСП-структур третього
роду на основі універсальних функціональних перетворювачів просторового типу, зокрема у випадку, коли значність дорівнює трьом та десяти для одно- та двоходового варіанту.
В узагальненому вигляді одно- та двовходовий універсальний багатозначний функціональний перетворювач (УБФП) містять: елемент розпізнавання k-значної змінної, що утворює паралельний аналого-цифровий перетворювач разом із просторовим дешифратором, матричний селектор, комутатор, блок керування, паралельний цифро-аналоговий перетворювач.
У задачах оброблення природної мови уже на рівні фонетики необхідно розпізнавати й опрацьовувати 32 букви української мови. Отже, починаючи із задач фонетичного оброблення, збільшення значності є неуникною задачею подальших досліджень. Очевидно, що розгляд такого підходу й дослідження проблем створення й побудови УБФП необхідно розширити з точки зору наростання значності структурного алфавіту, тобто коли значність k>3.
Оскільки перетворювач є універсальним, то потужність множини функцій, що реалізуються одновходовим універсальним функціональним перетворювачем дорівнює N=kk. Нарощування значності структурного алфавіту (числа паралельних каскадів ЦАП та ЦАП) з 3 до 10 дозволяє підвищити функціональні можливості щодо реалізації множини логічних функцій однієї змінної в 1010/33 разів.
Таким чином уведення в двовходовий УФП однотипних за принципом дії та побудовою дешифраторів, матричного селектора та комутатора, а також виконання дешифратора, селектора та комутатора на елементах кон'юнкції, що утворюють у просторі АСП-структуру паралельного типу з просторовим k-значним кодуванням, реалізованим у вигляді збуджених двійкових станів просторових полюсів, дозволило забезпечити однотипність й однорідність її внутрішньої структури, а також підвищити швидкодію за рахунок мінімальної затримки в усіх її ланках. В АСП-структурі та принципі її дії використовуються логічні, а не обчислювальні методи проміжних перетворень з застосуванням концепції уніфікації дво- та k-значного кодування, що дозволяє спростити технічну реалізацію АСП-структур і, як наслідок, веде до їх граничного паралелізму та зменшення затримок під час перетворень, а також спрощення структури проміжних субблоків.
Сьомий розділ присвячений застосуванню та модифікації методів синтезу k-значних оборотних неоднорідних логічних елементів та модулів для автоматизованої обробки мовної інформації. Сформульовані основні вимоги, що дозволяють ураховувати обставини практики, які визначають той чи інший варіант синтезу оборотних модулів: АСП-структур другого роду.
Апаратура, що синтезована за допомогою запропанованих методів, здобуває цілий ряд важливих властивостей, у тому числі властивості прямого і зворотного перетворення інформації, часткового і повного відновлення вхідних (початково-вихідних) послідовностей даних по наявним вихідним (початково-вихідним), а також виявлення заборонених наборів даних і діагностики відмовлень.
При побудові таких структур будемо вважати, якщо значення будь-яких змінних вихідного предикатного рівняння не задані, то на відповідні вхідні шини АСП-структури треба подати значення логічної одиниці. Цим допускається будь-яке значення даної змінної з області її визначення. Помітимо, що поява логічного нуля на усіх входах (виходах) однієї чи декількох змінних треба вважати “помилковим”, тобто дана ситуація, з погляду діагностики, сигналізує про збій у роботі тієї чи іншої ділянки АСП-структури. У свою чергу, відмінним моментом є властивість дублювання відомих змінних свого значення на вихідних шинах синтезованої структури. Це, з одного боку, підвищує її надійність з погляду одиночного моделювання несправностей, коли по одиночній константній несправності (поява комбінації “0” на всіх шинах тієї чи іншої шуканої вихідної змінної) можливо локалізувати місце і причини дефекту, а з іншого боку, є відповідно неявним тестовим діагностуванням - реалізує процес визначення технічного стану структури за станом інформації на вихідних шинах відомих (вихідних) змінних. Аналогічно можуть бути апаратурно реалізовані (у вигляді АСП-структури першого роду) і відношення кон'юнкції, що містять більш трьох змінних різної значності. Останнє ствердження повною мірою відноситься і до відношення диз'юнкції.
Таким чином, у нашому арсеналі з'являється певний набір АСП-структур першого роду, що реалізують наступні предикатні рівняння y = a * b; y = a * b * c; y = a * b * c * d і т. п., де число змінних n < 8 ё 10 при їхньої різної значності, а також - набір АСП-структур, що реалізують предикатні рівняння у вигляді y = a ? b; y = a ? b ? c; y = a ? b ? c ? d і т.п., де число змінних n < 8 ё 10 при їхньої різної значності. Маючи такий набір АСП-структур першого роду для зняття обмеження на число змінних у вихідному предикатному рівнянні при “підвищеній” (k і 6) значності більшості його змінних, переходимо до побудови АСП-структур другого роду. Запропоновані також модіфіковані таблиці істинності, які є відправним моментом при їх побудові.
У роботі запропоновано методологію проектування лінгвістичних об'єктів на базі k-значних оборотних АСП-структур просторового типу. Наведено приклад реалізації морфологічного аналізу на базі універсальних багатозначних функціональних перетворювачів просторового типу (АСП-структур третього роду).
На практиці для апаратної реалізації алгоритму, що надано на прикладі морфологічного аналізу (МА), найближчим підходом є застосування неоднорідних систем типу “'базова машина + функціонально орієнтований процесор” (БМ+ФОП). Очевидно, що в основі апаратної побудови проблемно орієнтованої системи для нашого випадку буде лежати структура “базова машина + програмований ФОП на базі двоходового десятизначного УФП (АСП-структури)”.
Оскільки алгоритм МА передбачає ряд кроків автоматичного перебору, порівняння та покрокового аналізу результатів обчислень, до апаратних засобів БМ відносяться: пам'ять словників основ та закінчень, а також оперативну пам'ять припустимих основ, припустимих закінчень та припустимої морфологічної інформації, оперативна пам'ять налагоджень універсального елемента на виконання певної логічної функції - у нашому прикладі це функція вибору максимального з двох значень. Стикування десятизначного елемента з БМ, яка є на сьогоднішній день двозначною, вимагає наявності перетворювачів кодів (ПК) з двозначного коду в десятизначний та навпаки (ПК 2>10 та ПК 10>2). Процедура морфологічного аналізу вимагає також окремого лічильника на п'ять кроків для перевірки даних на сумісність.
Аналіз результатів впровадження дисертаційних досліджень показує, що з'являється можливість створювати спеціалізовану апаратуру прямої і зворотної дії та підвищеної надійності, що суттєво при рішенні багатьох прикладних задач штучного інтелекту та інших суміжних областей, зокрема, при рішенні лінгвістичних задач граматичної обробки слів.
Висновки
У дисертації сформульовано та вирішено важливу для теорії та практики мовних систем штучного інтелекту наукову проблему - досягнення високорівневої технології обробки інформації на основі розвитку концепції уніфікації та розробки методів синтезу швидкодіючих багатозначних структур мовних систем. При проведенні дисертаційних досліджень отримані такі основні результати.
1. Показано, що людська мова, як явище дискретне, повинна описуватись засобами дискретної математики. Встановлено, що досить універсальним у концептуальному та прикладному аспекті є підхід, заснований на моделюванні природної мови засобами апарату багатозначної (k-значної) логіки, оскільки природна мова багатозначна, зокрема засобами алгебри скінченних предикатів.
2. На підставі вивчення даних фонетики та орфографії української мови розроблені системи фонетичних ознак і отримані предикати їх формального опису; розроблена методика формального опису букво-фонемних відношень; побудовані математичні моделі відношень голосних, приголосних звуків та акцентних характеристик української мови, на основі яких формалізуються фонетичні закономірності, що дозволяє здійснювати їх автоматичне оброблення.
3. На підставі вивчення основних характеристик морфології української мови, як об'єкту моделювання, встановлено теоретичну залежність (відношення) між флексією та оточуючим її текстом. Формалізовано поняття флексії, а також визначені предикати математичних моделей словозміни іменних частин мови, що забезпечує автоматичне оброблення (аналіз, синтез, нормалізація та корегування помилок) мови.
4. Проведено аналіз алгебро-логічної структури природної мови, а також алгебро-логічних засобів її моделювання. Концептуально-методологічний підхід до мови людини (з математичної точки зору) дозволяє сприймати її як деяку алгебру, а її тексти - як формули цієї алгебри. Раніше алгебра скінченних предикатів була спрямована на формульний опис функцій (алфавітних операторів). Тепер область її рекомендованого застосування поширена та охоплює довільні відношення.
5. Дослідження з нарощування значності структурного алфавіту від 3 до 10 показує, що в універсальних k-значних просторових структурах забезпечується підвищення функціональних можливостей щодо реалізації множини логічних функцій однієї змінної в 1010/33 разів; інший шлях підвищення функціональних можливостей під час моделювання мовних процесів є нарощування числа входів.
6. Запропоновано модифікацію традиційних таблиць істинності для багатозначних неоднорідних кодів, що дозволяє представляти їх у більш компактній формі. Число елементів модифікованої таблиці зменшується в 3 p разів, де p- глибина декомпозиції.
7. Уперше розроблені методи синтезу і здійснено аналіз базових модулів у вигляді багатозначних оборотних неоднорідних логічних елементів. Показано можливість ефективної побудови на їх основі оборотних АСП-структур просторового типу за рахунок варіювання базових модулів. Запропоновано методику проектування лінгвістичних об'єктів (на прикладі задачі морфологічного аналізу) на базі k-значних оборотних неоднорідних логічних елементів та модулів просторового типу (АСП-структур першого - третього роду) та наведено тематичну інтерпретацію процесу їх функціонування.
8. Розроблені просторові універсальні k-значні структури забезпечують: скорочення числа виводів, що дає повністю очевидний ефект спрощення складного монтажу; скорочення числа різнотипних модулів та апаратних затрат; підвищення регулярності їх внутрішньої структури.
9. Теоретичні і практичні результати дисертаційних досліджень впроваджені в ряді програмно-апаратних систем, що у тій чи інший формі використовують процедури обробки мовної інформації: формальних моделей мови у вигляді систем лінгвістичних рівнянь алгебри скінченних предикатів. Новизна та оригінальність технічних реалізацій підтверджена трьома патентами України та Російської Федерації на винахід.
Список опублікованих праць за темою дисертації
1. Бондаренко М.Ф., Коноплянко З.Д., Четвериков Г.Г. Основи теорії синтезу надшвидкодіючих структур мовних систем штучного інтелекту - К.: ІЗМН, 1997.- 264 с.
2. Бондаренко М. Ф., Коноплянко З.Д., Четвериков Г.Г. Основи теорії багатозначних структур і кодування в системах штучного інтелекту.- Харків: Фактор-друк, 2003.- 336 с.
3. Малий тлумачний словник з інтелектуальних систем: Навчальний посібник / Г.Г. Четвериков. - К.: ІЗМН, 1997.- 64 с.
4. Малий тлумачний словник з інтелектуальних систем (доповнення): Навчальний посібник / Г.Г. Четвериков.- Харків: ХТУРЕ, 1999.- 56 с.
5. Четвериков Г.Г. Многозначные структуры (анализ, сравнение, синтез, обобщение). - Ч.1: Учебное пособие. - К.: ИСМО, 1997. - 192 с.
6. Четвериков Г.Г. Формалізація принципів побудови універсальних k-значних структур мовних систем штучного інтелекту // Доповіді НАН України. - 2001.- №1 (41). - C. 76-79.
7. Четвериков Г.Г. Концепция построения сверхбыстродействующих многозначных структур языковых систем искусственного интеллекта // Автоматизация производственных процессов. - 1996. - №2. - С. 89-94.
8. Четвериков Г.Г. Математичні моделі акцентних характеристик української мови // Праці УНДІРТ. - 1996. - №2(6). - С. 88-92.
9. Четвериков Г.Г. Лінгвістичний комп'ютер підвищеного інтелекту та швидкодії // Искусственный интеллект. - 1997. - №1/2. - С. 51-56.
10. Четвериков Г.Г. Концептуальна структурно-функціональна модель гомеостатичного модуля мовних систем штучного інтелекту // Вестник Херсонского государственного технического университета. - 1999. - №5. - C.54-57.
11. Четвериков Г.Г. Десятичный функциональный преобразователь пространственного типа // Вестник Херсонского государственного университета.- 1999. - №5. - С. 57-61.
12. Четвериков Г.Г. Аналіз нових шляхів побудови швидкодіючих універсальних k-значних структур для систем штучного інтелекту // АСУ и приборы автоматики. -Харьков: ХТУРЭ. - 2001. - №114. - С. 39-42.
13. Четвериков Г.Г. Синтез просторових структур мовних систем (на прикладі української мови) // Проблемы бионики. - Харьков: ХТУРЭ. - 1999. - Вып.50. - С.112-119.
14. Четвериков Г.Г. Структурный синтез проблемно-орієнтованих засобів для автоматизованої обробки текстової інформації // Искусственный интеллект. - 2001. - №3. - С. 165-173.
15. Четвериков Г.Г. Практичні аспекти теорії статичних просторових k-значних структур у методології проектування ергатичних систем // Искусственный интеллект. - 2002. - №3. - С. 123-126.
16. Четвериков Г.Г. Алгебро-логічні засоби моделювання природної мови. Повідомлення 1 // Бионика интеллекта. - 2004. - №1(61). - С.42-45.
17. Четвериков Г.Г. Алгебро-логічні засоби моделювання природної мови. Повідомлення 2 // Бионика интеллекта. - 2005. - №2(62). - С.12-19.
18. Бондаренко М.Ф., Четвериков Г.Г. Алгебро-логический подход к построению структур лингвистических объектов // Искусственный интеллект. - 2001. - №1. - C.24-28.
19. Бондаренко М.Ф., Четвериков Г.Г. Особливості архітектурних побудов просторових k-значних структур мовних систем штучного інтелекту // Проблемы бионики. - Харьков: ХНУРЭ. - 2002. - Вып.56. - С.3-9.
20. Мурашко А.Г., Герасин С.Н., Четвериков Г.Г. Организация структуры вычислительного процесса в неоднородной вычислительной среде // Электронное моделирование. - 1997. - №6. - С. 38-44.
21. Коноплянко З.Д., Четвериков Г.Г. Проблеми інтелектуалізації та українізації цифрових систем та мереж телекомунікацій // Труды УНИИРТ. - 1995. - №4. - С.72-81.
22. Четвериков Г.Г., Ревенчук И.А., Стороженко А.В., Бавыкин В.Н. Принципы построения отдельных компонентов k-значных структур искусственного интеллекта // Радиоэлектроника и информатика. - 1998. - №2(03). - C.88-90.
23. Коноплянко З.Д., Четвериков Г.Г. Аналіз лінгвістичних зв'язків елементів фонетичного рівня української мови // Праці УНДІРТ. - 1996. - №1(5). - С.70-77.
24. Четвериков Г.Г., Коноплянко З.Д., Ревенчук И.А., Ляховец С.В. Аналіз та дослідження букво-фонемних відношень голосних української мови // Праці УНДІРТ. - 2000. - №1(21). - С. 60-65.
25. Четвериков Г.Г., Ляховец С.В., Коноплянко З.Д., Колесник А.С. Побудова математичної моделі букво-фонемних відношень для приголосних звуків української мови // Праці УНДІРТ. - 2001. - №1(25). - С.21-28.
26. Ревенчук І.А., Четвериков Г.Г. Про методику вибору структури векторів закінчення та смислу // АСУ и приборы автоматики. - Харьков: ХТУРЭ. - 1997. - Вып. 104. - С. 128-132.
27. Бавыкин В.Н., Четвериков Г.Г. Моделирование гибридных многозначных структур средствами предикатно-гибридной логики // Радиоэлектроника и информатика. - 2001. - №2(11). - С.102-105.
28. Бондаренко М.Ф., Бавыкин В.Н., Герасин С.Н., Четвериков Г.Г. Структурный синтез неоднородных модулей в интеллектуальных системах // Искусственный интеллект. - 2001. - №3. - С. 23-26.
29. Четвериков Г.Г., Бавыкин В.Н., Ревенчук И.А. Модификация средств построения k-значных обратимых переключательных цепей второго рода // Искусственный интеллект. - 2003. - №3. - С.111-117.
30. Бондаренко М.Ф., Гусятин Е.М., Четвериков Г.Г., Рябчинская Е.А. Методы решения предикатных уравнений // Компьютерные интеллектуальные модели и системы. - Харьков: ХАИ. - 1993. - С.22-27.
31. Пат. 14935 А. Україна, МКВ Н 03 К 19/08. Функціональний перетворювач / М.Ф.Бондаренко, З.Д. Коноплянко, Г.Г.Четвериков (Україна). - №96010250; Дата подання 22.01.96; Опубл. 30.06.97, Бюл. №3. - 4c.
32. Пат. 20462 А. Україна, МКВ Н 03 К 19/02. Двовходовий багатозначний логічний елемент / М.Ф.Бондаренко, З.Д. Коноплянко, Г.Г.Четвериков (Україна). - №97031289; Дата подання 20.03.97; Опубл. 15.07.97, Бюл. №3. - 4c.
33. Пат. 2147789 РФ, МКВ Н 03 К 19/02, Н 03 М 1/00. Функциональный преобразователь с многозначным кодированием / М.Ф.Бондаренко, З.Д. Коноплянко, Г.Г.Четвериков (Україна). - №97101717/09; Заявл. 04.02.97; Опубл. 24.04.2000, Бюл.№11.- 6c.
34. Четвериков Г.Г. Синтез широкопаралельних багатозначних перемикальних структур // Праці 2-ої Української конф. з автоматичного керування (“Автоматика-95”). - Т. 1. - Львів: ФМІ НАН України. - 1995. - С.134-135.
35. Четвериков Г.Г. Применение средств ИИ для автоматического анализа и синтеза лингвистической информации // Праці 3-ої Української конф. з автоматичного керування (“Автоматика-96”). - Т. 2. - Севастополь: СевГТУ. - 1996. - С.47-48.
36. Четвериков Г.Г. Общие принципы и методы построения многозначных неоднородных структур // Труды 2-ой Междунар. конф. “Теория и техника передачи, приёма и обработки информации”. - Т. 2. - Харьков-Туапсе: ХГТУРЭ. - 1996. - С. 214.
37. Четвериков Г.Г. Модульный принцип организации многозначных пространственных структур систем ИИ // Труды 4-ой Междунар. конф. “Теория и техника передачи, приёма и обработки информации” (“Новые информационные технологии”). - Харьков-Туапсе: ХГТУРЭ. - 1998. - С. 253.
38. Бондаренко М., Бавикін В., Коноплянко З., Стороженко А., Четвериков Г. Моделювання лінгвістичних зв'язків елементів фонетичного та морфологічного рівня української мови в системах автоматичного розпізнавання сигналіву // 3-я Всеукраїнська Міжнар. конф. “Оброблення сигналів і зображень та розпізнавання сигналів (Signal/Image Processing and Pattern Recognition)” (УкрОбраз'96). - Київ: УА з ОІ та РО. - 1996. - С.116-117.
39. Бондаренко М.Ф., Ревенчук И.А., Четвериков Г.Г. Синтез швидкодіючих багатозначних структур мовних систем штучного інтелекту // 4-та Всеукраїнська Міжнар. конф. “Оброблення сигналів і зображень та розпізнавання сигналів (Signal/Image Processing and Pattern Recognition)” (УкрОбраз'98). - Київ: УА з ОІ та РО. - 1998. - С.61-62.
40. Бондаренко М.Ф., Четвериков Г.Г., Ревенчук И.А. Формализация принципа симбиоза многозначных структур интеллектуальных систем // Труды Междунар. научной конф. “Интеллектуализация обработки информации” (ИОИ 2000). - Симферополь: Крымский научный центр НАН Украины. - 2000. - С.15-16.
41. Бондаренко М.Ф., Карпухин А.В., Четвериков Г.Г. Анализ проблемы создания новых технических средств для реализации лингвистического интерфейса // Proc. of the X-th International Conf. “Knowledge-Dialog-Solution” (KDS-2003) .- Varna (Bulgaria). - 2003. - С.3-15.
42. Бондаренко М.Ф., Четвериков Г.Г. Проблема інтелектуалізації та українізації мовних систем штучного інтелекту // Труды 6-ой Междунар. конф. “Знания-Диалог-Решение” (KDS-97). - К.: ИК НАН Украины. - 1997. - С.68-76.
43. Бондаренко М.Ф., Ляховец С.В., Карпухин А.В., Четвериков Г.Г. Синтез швидкодіючих структур лінгвістичних об'єктів // Труды 9-ой Междунар. научно-практической конф. “Знания-Диалог-Решение” (KDS-2001). - К.: ИК НАН Украины. - 2001. - С.42-49.
44. Четвериков Г.Г. Природна мова як об'єкт математичного опису // Материалы 5-ой Междунар. научно-технич. конф. “Искусственный интеллект. Интеллектуальные и многопроцессорные системы - 2004”. - Т. 2. - Таганрог-Донецк: ТРТИ. - 2004. - С.41-43.
45. Bondarenko M., Chetverikov G., Karpuhin A., Roshka S., Deyneko Zh. Synthesis Methods of Multiple-valued Structures of Language Systems // Proc. of the Third International Conf. “Information Reseach, Applications and Education” (i.TECH 2005).- Varna (Bulgaria).- 2005.- P. 102-107.
46. Bondarenko M., Bavykin V., Revenchuk I., Chetverikov G. Modeling of Universal Multiple-Valued Structures of Atificical Intelligence Systems // Proc. of the 6-th International Conf. “Mixed design of integrated circuits and systems” (MIXDES'99). - Krakow (Polska). - 1999. - P. 131-133.
47. Bondarenko M., Karpuhin A., Chetverikov G. Application of a numerically -analytical method for Simulation of Non-Linear Resonant Circuits // Proc. of the 10-th International Conf. “Mixed design of integrated circuits and systems” (MIXDES 2003), Lodz (Polska). - 2003. - P. 399-402.
48. Bondarenko M., Karpuhin A., Chetverikov G., Leshchinsky V. Synthesis Methods of Multiple-valued Structures of Bilogical Networks // Proc. of the 12-th International Conf. “Mixed design of integrated circuits and systems” (MIXDES 2005), Krakow (Polska). - 2005. - P. 201-204.
49. Bondarenko M., Chetverikov G., Karpuhin A. Structural Synthesis of Universal Multiple-Valued Structures of Artificial Intelligence Systems // Proc. of the 9th World Multi-Conference in Systemics, Cybernetics and Informatics (WMSCI 2005).- Orlando, Florida (USA).- 2005. - Vol. VII. - P. 127-130.
Подобные документы
Практичні прийоми відтворення на ЕОМ математичних моделей типових нелінійностей. Параметри блоків Sine Wave, XY Graph та Saturation. Побудова статичних і динамічних характеристик математичних моделей. Визначення кроку та інтервалу часу моделювання.
лабораторная работа [1,5 M], добавлен 17.05.2012Огляд переваг та недоліків мови Пролог, історія її створення. Числення предикатів як математична основа її функціонування. Порівняльна характеристика середовищ програмування Prolog. Алгоритми розв’язування математичних задач за допомогою цієї мови.
курсовая работа [504,5 K], добавлен 23.12.2014Графічний, матричний та алгебраїчний способи задання топологій. Методи виявлення та перетворення топологічних структур. Перевага аналітичних способів задання топологій систем у теоретичних дослідженнях - компактність запису у вигляді системи формул.
курсовая работа [1,7 M], добавлен 28.05.2009Модель аналізу-синтезу компіляції. Формальний опис вхідної мови програмування. Вибір технології програмування, проектування таблиць транслятора та вибір структур даних. Опис програми реалізації лексичного аналізатора. Розробка дерев граматичного розбору.
курсовая работа [75,8 K], добавлен 26.12.2009Статистичний огляд ринку праці в ІТ-галузі в Україні. Математичні, економетричні методи, моделі в аналізу ІТ-ринку праці. Оцінка людського капіталу. Динаміка оплати праці за декілька останніх років. Структура вакансій розробників програмного забезпечення.
дипломная работа [457,3 K], добавлен 12.10.2015Побудова моделі процесів системи. Відображення користувачів і їхніх функцій, підметів автоматизації в прив'язці до структури системи. Відображення структури інформаційних та фізичних об'єктів системи та їх взаємозв’язків. Побудова моделі станів системи.
курсовая работа [125,2 K], добавлен 03.10.2008Специфікація вимог для кожного з двох користувачів. Концептуальне проектування бази даних. Визначення типів сутностей та зв’язків, доменів. Перетворення концептуальної моделі даних у логічну, визначення набору відношень, підтримки цілісності даних.
курсовая работа [55,1 K], добавлен 15.03.2015Створення системи експериментального дослідження математичних моделей оптимізації обслуговування складних систем. Визначення критеріїв оптимізації обслуговуваних систем та надання рекомендацій щодо часу проведення попереджувальної профілактики.
дипломная работа [3,0 M], добавлен 22.10.2012Структура захищених систем і їх характеристики. Моделі елементів захищених систем. Оцінка стійкості криптографічних протоколів на основі імовірнісних моделей. Нормативно-правова база розробки, впровадження захищених систем.
дипломная работа [332,1 K], добавлен 28.06.2007Структурна схема моделі (пакет MATLAB) та її описання. Математична модель у вигляді передавальних функцій, у вигляді диференційного рівняння. Алгоритм рішення (рекурентне співвідношення) та його програмна реалізація. Системи диференційних рівнянь.
курсовая работа [551,8 K], добавлен 14.02.2009