Структурно-семантичні та функціональні характеристики міжчастиномовної морфологічної омонімії сучасної української мови
Дослідження морфологічної омонімії як одного із різновидів мовної неоднозначності. Формування реєстру типів та моделей міжчастиномовних морфологічних омонімів української мови. Контекстні умови актуалізації конкретних значень омонімічних одиниць у тексті.
Рубрика | Иностранные языки и языкознание |
Вид | автореферат |
Язык | украинский |
Дата добавления | 29.10.2013 |
Размер файла | 67,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Національна академія наук України
Інститут мовознавства ім. О.О. Потебні
Автореферат
дисертації на здобуття наукового ступеня кандидата філологічних наук
10.02.01 - українська мова
Структурно-семантичні та функціональні характеристики міжчастиномовної морфологічної омонімії сучасної української мови
Шипнівська Ольга Олександрівна
Київ - 2007
Дисертацією є рукопис.
Роботу виконано у відділі лінгвістики Українського мовно-інформаційного фонду НАН України.
Науковий керівник - кандидат філологічних наук, старший науковий співробітник Грязнухіна Тетяна Олександрівна, Український мовно-інформаційний фонд НАН України, старший науковий співробітник відділу лінгвістики.
Офіційні опоненти:
доктор філологічних наук, професор Лучик Алла Анатоліївна, Національний університет “Києво-Могилянська академія”, професор кафедри загального і слов'янського мовознавства;
кандидат філологічних наук Романюк Юлія Віталіївна, Інститут мовознавства ім. О.О. Потебні НАН України, науковий співробітник відділу структурно-математичної лінгвістики.
Учений секретар спеціалізованої вченої ради кандидат філологічних наук Т.Я. Марченко
Анотація
Шипнівська О.О. Структурно-семантичні та функціональні характеристики міжчастиномовної морфологічної омонімії сучасної української мови. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата філологічних наук за спеціальністю 10.02.01 - українська мова. - Інститут мовознавства ім. О.О. Потебні НАН України, Київ, 2007.
У дисертації описано результати аналізу структурно-семантичних та функціональних характеристик міжчастиномовних морфологічних омонімів сучасної української мови, здійсненого на основі розробленої спеціальної методики виявлення омографів.
На основі виявлених структурно-семантичних особливостей омонімів з погляду морфологічної характеристики та функціонально-стилістичної приналежності компонентів їхніх моделей встановлено продуктивні типи міжчастиномовних морфологічних омонімів сучасної української мови.
Аналіз функціонування міжчастиномовних омонімів у текстах трьох стилів показав, що в них частка аналізованих одиниць становить близько 61 %.
Побудований на основі сформованих баз даних електронний словник міжчастиномовних морфологічних омонімів обсягом близько 11 300 є інформаційною лексикографічною системою, розрахованою на широке коло запитів.
На основі створеної бази даних діагностувальних контекстів було розроблено загальні принципи формування правил автоматичного усунення омонімії.
Встановлені в процесі дисертаційного дослідження методи формування лінгвістичних баз даних представляють досить універсальний лінгвістичний інструментарій, який може використовуватися у вирішенні багатьох лінгвістичних проблем.
Ключові слова: міжчастиномовні морфологічні омоніми, омонімічний ряд, тип міжчастиномовних морфологічних омонімів, модель міжчастиномовних морфологічних омонімів, автоматичний морфологічний аналіз, словник словоформ, лінгвістична база даних, контекстний аналіз, автоматичне усунення омонімії, Український національний корпус текстів.
Аннотация
Шипновская О.А. Структурно-семантические и функциональные характеристики межчастеречных морфологических омонимов современного украинского языка. - Рукопись.
Диссертация на соискание ученой степени кандидата филологических наук по специальности 10.02.01 - украинский язык. - Институт языковедения им. А.А. Потебни НАН Украины, Киев, 2007.
В диссертации описаны результаты анализа структурно-семантических и функциональных характеристик межчастеречных морфологических омонимов (ММО) современного украинского языка. Анализ был проведен на основе разработанной специальной методики выявления омографов, которая позволила определить максимально полный реестр структурных моделей объемом 1486 единиц, которые представляют 610 612 омографов. С помощью специальной методики из общего списка был выделен реестр межчастеречных морфологических омонимов - 10 203 омонима.
Анализ омонимов многочисленных структурных моделей, представляющих омонимию полнозначных частей речи, показал, что 75,24 % всех омонимов составляют межчастеречные морфологические омонимы, между компонентами которых существует семантическая связь: семантическая близость определяется значениями исходных форм компонентов омонимов, связанных между собой словообразовательными отношениями.
На основе выделенных структурно-семантических особенностей омонимов с точки зрения морфологических характеристик и функционально-стилистической принадлежности компонентов их моделей были определены продуктивные типы межчастеречных морфологических омонимов современного украинского языка.
Полученные в результате исследования данные о распределении типов и моделей межчастеречных омонимов по количеству компонентов продемонстрировали действие законов простоты и преимущества, согласно которым превалируют простые структуры: как на уровне типов, так и на уровне моделей доминируют двух-, трёхкомпонентные единицы. Разработанная в работе формальная классификация структурных моделей межчастеречных морфологических омонимов может быть применена для сравнительно-типологического анализа морфологических омонимов других флективных языков.
На основе полученного списка межчастеречных морфологических омонимов была сформирована многопараметрическая база данных, которая оказалась эффективным инструментом для исследования омонимии украинского языка, и может рассматриваться как новый этап в развитии лингвистических технологий. Сформированная база данных межчастеречных морфологических омонимов является основой для более глубокого исследования омонимических отношений на морфологическом уровне, например, в аспекте исследования омонимичности определенных грамматических форм.
Анализ функционирования омонимов в текстах научного, публицистического и художественного стилей показал, что общая часть морфологических омонимов в текстах украинского языка составляет около 61 %. В результате анализа было определено, что количество реализованных в текстах разных омонимов составляет 11,88 % от их общей суммы - 610 612, из 10 203 межчастеречных омонимов в текстах реализовано около 62 % омонимов. Из 81 выделенных типов ММО в текстах зафиксировано 95 %.
Проведенный анализ употребления межчастеречных омонимов в текстах показал, что рассчитанные коэффициенты расхождения между полученными показателями частоты употребления межчастеречных морфологических омонимов при попарном сравнении выборок существенны в текстах трёх стилей, что даёт основание говорить о правомерности применения этих статистических параметров для разграничения стилей.
Автоматически построенный на основе сформированных баз данных электронный словарь межчастеречных морфологических омонимов, содержащий около 11 300 омонимов, служит исследователям лексикографической информационной системой, которая рассчитана на широкий круг запросов относительно различных аспектов омонимии в грамматической системе украинского языка.
Разработанная структура базы данных лингвистических контекстов дала возможность сформировать списки диагностических контекстов, которые являются материалом исследования контекстной реализации омонимов в речи и эффективным инструментом для построения алгоритма автоматического устранения межчастеречной морфологической омонимии. На основе созданной базы данных были разработаны общие принципы формирования правил автоматического снятия омонимии.
Сформированная лингвистическая база данных позволила определить диагностическую силу грамматических, лексико-грамматических и лексических контекстов относительно их возможности устанавливать конкретное грамматическое значение межчастеречных морфологических омонимов в тексте: 98 % правил основываются на грамматической информации контекстов.
Созданные в процессе диссертационного исследования средства и методы формирования лингвистических баз данных представляют универсальный лингвистический инструментарий, который может быть использован при решении многих языковедческих проблем.
Ключевые слова: межчастеречная морфологическая омонимия, морфологический ряд, тип межчастеречных морфологических омонимов, модель межчастеречных морфологических омонимов, автоматический морфологический анализ, словарь словоформ, лингвистическая база данных, контекстный анализ, автоматическое устранение омонимии, Украинский национальный лингвистический корпус текстов.
Abstract
Shypnivska O.A. The structural-semantic and functional characteristics of the morphological homonyms belonging to different part-of-speech in the contemporary Ukrainian language. - Manuscript.
The dissertation is submitted for obtaining the scientific degree of candidate of the philological sciences on speciality 10.02.01 - the Ukrainian language. - O.O. Potebnia Institute of Linguistics of the Ukrainian National Academy of Sciences, Kyiv, 2003.
The theses represent the results of realized the structural-semantic and functional characteristics of the morphological homonyms of the contemporary Ukrainian language. The methodological principles of the developed research tools have allowed to form a list of morphological homonyms in Ukrainian.
In the course of the research a new formal classification of the morphological homonyms according to different types and patterns is obtained, frequency dependence of morphological homonyms types from number of components and grammar properties of the components is analyzed.
The study provides a number of linguistic databases of morphological homonyms as a research environment and effective instrumental apparatus. Their use allows us to determine the qualitative and quantitative description of types and patterns of the morphological homonyms in contemporary Ukrainian language presented both in the dictionary of the word forms and in the stylistic differentiated texts corpus.
Principles, structure and the main goal of linguistic databases of the electronic dictionary of morphological homonyms are described. Besides, the algorithmic rules of morphological disambiguation that are used in context processing are developed.
Key words: morphological homonyms, linguistic database, type of morphological homonyms, pattern of morphological homonyms, the dictionary of word forms, the electronic dictionary of morphological homonyms, context processing, morphological disambiguation.
1. Загальна характеристика роботи
омонімія міжчастиномовний морфологічний
Розвиток інформаційного суспільства та суспільства знань викликав бурхливий прогрес у галузі комп'ютерних технологій опрацювання природної мови, який поставив нові завдання перед лінгвістичною наукою стосовно вивчення різних властивостей мовної системи. Завдання, які стоять у цій царині перед усіма ділянками мовознавства, тепер потребують вивчення різнопланових мовних явищ, структур, одиниць, відношень тощо не на окремих, хоча й показових, прикладах, а в їх повному, репрезентативному обсязі. Зрозуміло, що така постановка завдань потребує застосування спеціального комп'ютерного інструментарію дослідження, зокрема залучення методів корпусної лінгвістики Широков В.А. та ін. Корпусна лінгвістика. - К.: Довіра, 2005. - 471 с..
Серед вивчення різноманітних властивостей лексичної системи особливо актуальним на сучасному етапі є дослідження різних типів неоднозначності, притаманних їй, та розробка на цій основі ефективних формалізованих методів їх аналізу та усунення. Адже без цього неможлива побудова формальних моделей розуміння текстів з урахуванням вказаної фундаментальної семіотичної властивості мовного знака - здатності в одному означальному поєднувати декілька означуваних, одним із типів якої є граматична омонімія, зокрема морфологічна. Як показують результати проведеного нами аналізу, в тексті понад 60 % словоформ є омонімічними.
Проблема морфологічної неоднозначності не є новою: питання, що стосуються морфологічної неоднозначності словоформ, розглядалися багатьма лінгвістами як на теоретичному, так і на практичному рівнях. У теоретичному аспекті морфологічна омонімія досліджувалася здебільшого в контексті загальних проблем мовної неоднозначності, омонімії та полісемії, зумовлених потребами лексикографії, лексикології та граматики, в працях О. Потебні, В. Виноградова, Ю. Апресяна, О. Ахманової, О. Смирницького, Г. Уфімцевої, Д. Шмельова, В. Русанівського, Н. Клименко, М. Кочергана, О. Тараненка, М. Муравицької, Л. Авксентьєва, Г. Гнатюк, Л. Лисиченко, А. Лучик, О. Демської та інших дослідників.
На практичному рівні проблема неоднозначності вивчається у дослідженнях, присвячених автоматичній ідентифікації текстових словоформ (машинний переклад, автоматичне коригування тексту тощо). У наукових студіях Р. Піотровського, Ю. Марчука, Т. Аполлонської, С. Білокриницької, Т. Молошної, Т. Грязнухіної, О. Невзорової, Ю. Орєхова головна увага зосереджується на розгляді принципу контекстної зумовленості конкретного граматичного значення слова в тексті. Дослідження, які здійснювалися для української мови, здебільшого орієнтовані на аналіз конкретних підмов (як правило, йдеться про тексти наукового стилю), із залученням статистико-дистрибутивного методу Грязнухіна Т.О., Братищенко Л.Г., Дарчук Н.П., Критська В.І., Пуздирєва Т.К., Орлова Л.В. Шляхи уникнення омонімії в системі автоматичного морфологічного аналізу // Мовознавство. - 1989. - № 5. - С. 3-12..
Актуальність теми дисертації. Проблема морфологічної омонімії потребує нагального розв'язання на сучасному етапі розвитку корпусної лінгвістики, коли до уваги дослідників потрапляють корпуси текстів, обсяги яких вже сьогодні досягають 100 млн словоформ Британський національний корпус містить понад 100 млн. слововживань [http://www.natcorp.ox.ac.uk], Корпус іспанської мови містить 100 млн. слововживань [http://www.corpusdelespanol.org/], Український національний лінгвістичний корпус містить понад 42 млн. слововживань, Національний корпус російської мови містить понад 35 млн. слововживань [http://ruscorpora.ru/corpora_stat.html], Корпус польської мови Наукового видавництва містить близько 40 млн. слововживань [http://www.korpus.pwn.pl].. А тому питання їх автоматичної розмітки, зокрема морфологічної, є обов'язковою умовою ефективності функціонування таких текстових корпусів. Морфологічне маркування тексту, яке полягає у визначенні граматичного значення текстових одиниць, неможливе без автоматичного усунення граматичної омонімії останніх, особливо для флективних мов, до яких належить українська.
Вирішення цієї проблеми передбачає обов'язкове здійснення повного структурно-семантичного аналізу типів морфологічних омонімів як у мові, так і в мовленні та побудови на основі цього аналізу алгоритму усунення граматичної неоднозначності словоформ.
Зв'язок дисертації з науковими темами. Дисертаційна праця виконана в межах наукових тем Українського мовно-інформаційного фонду НАНУ: “Теоретико-лінгвістичні та інформаційні засади автоматизованої обробки природної мови” (0198v003516), “Лексикографічні системи в інтелектуальному опрацюванні природної мови” (0102U003220), “Дослідження мовно-інформаційних процесів та розподілених систем національної словникової бази” (0102U003221).
Метою дослідження є структурно-семантичний і функціональний опис міжчастиномовних морфологічних омонімів сучасної української мови на репрезентативному обсязі лексики (понад 42 млн словоформ), який слугує основою розробки алгоритмів автоматичного усунення міжчастиномовної морфологічної омонімії в текстах.
Реалізація поставленої мети передбачає розв'язання таких завдань:
визначення теоретичних засад дослідження морфологічної омонімії як одного із різновидів мовної неоднозначності;
формування повного реєстру типів та моделей міжчастиномовних морфологічних омонімів української мови;
створення лінгвістичної бази даних міжчастиномовних морфологічних омонімів як головного інструмента для опису типів та моделей міжчастиномовних морфологічних омонімів у мові;
опис функціонування визначених для української мови типів та моделей міжчастиномовних морфологічних омонімів у текстах різних стилів;
формування лінгвістичної бази даних контекстних оточень міжчастиномовних морфологічних омонімів на текстах Українського національного лінгвістичного корпусу;
визначення принципів побудови правил автоматичного усунення міжчастиномовної морфологічної омонімії в системах автоматичної обробки текстів;
створення словника міжчастиномовних морфологічних омонімів сучасної української мови.
Об'єктом дослідження дисертаційної роботи є явище морфологічної омонімії.
Предметом дослідження є типи та моделі міжчастиномовних морфологічних омонімів, виявлених у мовній системі та в текстах сучасної української мови.
Джерельною базою дисертаційної роботи є електронний словник словоформ, сформований на основі створеної в Українському мовно-інформаційному фонді НАН України (УМІФ) граматичної лексикографічної системи, та стилістично диференційований Український національний лінгвістичний корпус (УНЛК) обсягом понад 42 млн словоформ.
Методи дослідження. Для реалізації поставленої мети в дисертаційному дослідженні використовуються описовий метод, метод лінгвістичного моделювання, статистичний метод, статистико-дистрибутивний метод.
Наукова новизна отриманих результатів дисертації. Вперше в україністиці на основі запропонованої методики було визначено повний список теоретично можливих та реалізованих типів та моделей міжчастиномовних морфологічних омонімів сучасної української мови. Здійснено всебічний аналіз структурних типів та моделей міжчастиномовних морфологічних омонімів у мові та в стилістично диференційованому корпусі текстів. Розроблено принципи побудови лінгвістичної бази даних міжчастиномовних морфологічних омонімів як інструмента лінгвістичного аналізу. Створено електронний словник міжчастиномовних морфологічних омонімів сучасної української мови, який може слугувати базою дослідження морфологічної омонімії, зокрема для зіставно-типологічного вивчення мов.
Практичне значення отриманих результатів полягає в тому, що вперше в україністиці визначено повний список типів та моделей міжчастиномовних морфологічних омонімів письмового варіанта мови. Сформовано на текстах трьох стилів (наукового, художнього, публіцистичного) лексикографічні бази даних (ЛБД) міжчастиномовних морфологічних омонімів. Створено лінгвістичну базу даних для дослідження контекстних умов актуалізації конкретних значень омонімічних одиниць у тексті. Побудована база даних контекстів є основою для розробки правил автоматичного усунення міжчастиномовної морфологічної омонімії.
Особистий внесок здобувача. Результати дисертації, які подано на захист, одержані дисертанткою одноосібно. У публікаціях, написаних у співавторстві з О.Г. Рабульцем та С.В. Стариковим, нам належать усі теоретичні засади та концептуальні лінгвістичні моделі.
Публікації з теми дисертації. Результати дисертаційного дослідження висвітлено в дванадцяти наукових працях, шість із яких - одноосібні статті у фахових журналах, що входять до переліку ВАК України; три праці написані в співавторстві; дві праці опубліковані в збірниках тез міжнародних наукових конференцій. Дисертантка є співавтором колективної монографії “Корпусна лінгвістика”.
Апробація результатів дисертації. Основні положення здійсненого дослідження обговорено на міжнародних наукових конференціях: “Мови і культури національних меншин у контексті процесів демократизації й глобалізації” (Київ, 2002); “Проблеми зіставної семантики” (Київ, 2003); “Проблеми прикладної лінгвістики” (Одеса, 2003); “Філологія в Київському університеті: історія та сучасність”, присвячена 200-річчю від дня народження М.О. Максимовича (Київ, 2004); “Современные проблемы лексикографии” (Гродно, 2005); “MEGALING' 2005. Прикладная лингвистика в поисках новых путей” (Крим, 2005); “Міжнародна конференція з прикладної лінгвістики” (Київ, 2006); “Міжнародна наукова конференція, присвячена 100-річчю від дня народження академіка І. К. Білодіда” (Київ, 2006); “MEGALING' 2006. Горизонти прикладної лінгвістики та лінгвістичних технологій” (Крим, 2006); на всеукраїнській конференції “Функціональний простір української мови” (Київ, 2007); а також у роботі круглих столів Міжнародної школи гуманітарних наук Центральної і Східної Європи, що проводилася в рамках сесії “Корпуси текстів у лексикографічних дослідженнях” (Варшава, 2004); на засіданнях ученої ради та наукових семінарах Українського мовно-інформаційного фонду НАН України.
Обсяг і структура дисертації. Дисертація складається зі вступу, чотирьох розділів, висновків, додатків та списку використаної літератури, який містить 280 найменувань. Обсяг дисертації без списку використаної літератури становить 176 сторінок. Загальний обсяг дисертації - 238 сторінок.
2. Основний зміст
У Вступі обґрунтовано актуальність теми, окреслено об'єкт і предмет дослідження, сформульовано мету та завдання роботи, подано відомості про наукову новизну отриманих результатів та їх практичне застосування.
Перший розділ “Теоретичні засади вивчення міжчастиномовної морфологічної омонімії як одного із типів мовної неоднозначності” присвячено аналізу природи морфологічної омонімії як одного із типів мовної неоднозначності. Неоднозначність мовних одиниць розглянуто в площині проблеми асиметрії мовного знака, проблеми “розуміння тексту” як людиною, так і комп'ютером. У розділі подано огляд існуючих підходів до виділення та класифікації омонімів. Розкрито недостатність та суперечливість поглядів стосовно вивчення омографів. Обґрунтовано закономірності мовної природи явища морфологічної омонімії. Проаналізовано головні принципи контекстного аналізу як способу автоматичного усунення міжчастиномовної морфологічної омонімії текстових одиниць.
Однією з визначальних властивостей мови як знакової системи є те, що більш місткий за обсягом і багатовимірний за структурною організацією план змісту не має однозначного відповідника в плані вираження. У сучасному мовознавстві неоднозначність розглядається як абсолютна лінгвістична універсалія, яка проявляється на всіх мовних рівнях: фонетичному, лексичному, граматичному і, відповідно, може бути властивою всім мовним одиницям.
Об'єктом даного дослідження, як зазначалося, є графічно тотожні словоформи, які мають різне морфологічне значення. Тотожність омографів у формальному (графемному) аспекті та відмінності їх у змістовому (граматичному чи лексичному) відображають знакову природу писемної форми мови - невідповідність плану вираження й плану змісту мовних одиниць.
Дефініцію “морфологічні” вживаємо для експліцитного розмежування серед граматичних омонімів синтаксичних та морфологічних, що відповідає виділенню двох відповідних різновидів граматичної семантики. Морфологічний компонент значення таких одиниць розглядаємо в двох площинах: як загальне лексико-граматичне значення та як значення граматичних категорій у межах однієї частини мови.
Різні за своїм граматичним значенням, графемно тотожні словоформи в науковій літературі кваліфікуються по-різному: як омографи Мельникова А.И. К вопросу о русских омографах // Русский язык в школе. - 1974. - № 4. - С. 80-84.; Сучасна українська лiтературна мова. Лексика і фразеологія / За заг. ред. І.К. Білодіда. - К.: Наук. думка, 1969. - С. 45-58., омоформи Виноградов В.В. Проблемы морфематической структуры слова и явления омонимии в славянских языках // Славян. языкознание. - VI Международный съезд славистов. Доклады советск. делегации. - М., 1968. - С. 53-120., міжпарадигматичні омоніми Awramiuk E. Systemowoњж polskiej homonimii miкdzyparadygmatycznej. - Biaіystok: Wyd. Uniwer-tu w Biaіymstoku, 1999. - 242 s.. Непослідовність у трактуванні омонімічних одиниць, проблеми розмежування системної та текстової омонімії, повної та часткової, зумовлюються розбіжністю підходів до аналізу явища та неоднозначністю термінів, якими послуговуються для їх визначення, - слово, словоформа, значення.
З огляду на рівноправність в плані вираження графемної та звукової форми представлення, що відповідає різним формам існування мови - писемній та усній, а в плані значення - розмежування лексичного й граматичного значень, вважаємо доцільним виділення в межах омонімії мови морфологічних омонімів як окремого закономірного мовного явища. Специфіка предмета дослідження потребує розробки відповідних методик та прийомів його вивчення.
У другому розділі “Кількісні та якісні характеристики типів та моделей міжчастиномовних морфологічних омонімів сучасної української мови” запропоновано та реалізовано спеціальну методику виділення омонімів за словником словоформ, сформованим на базі граматичної ЛБД УМІФу НАНУ. Описано принципи формування лінгвістичної бази міжчастиномовних морфологічних омонімів (ММО) на основі попередньо визначеного списку. У розділі здійснено класифікацію досліджуваних омонімів за їхніми структурними характеристиками, представленими у відповідних моделях. Оцінено продуктивність встановлених типів та моделей ММО.
Зважаючи на те, що омографи, які репрезентують омонімію форм всередині парадигми, омонімію між формами різних лексем, не фіксуються, та й не можуть фіксуватися в словниках, оскільки словники зорієнтовані на подання в них вихідної форми, формування реєстру міжчастиномовних морфологічних омонімів вимагає розробки спеціальної методики. У нашій роботі для укладання повного реєстру міжчастиномовних морфологічних омонімів української мови запропоновано методику виділення омонімів за словником словоформ.
Базою побудови словника словоформ є розроблена в УМІФі граматична ЛБД, реєстр якої сягає 171 620 лексем (без урахування власних назв), автоматично маркована в кодах граматичних класів та підкласів Програма автоматичного морфологічного аналізу (АМА) та синтезу словозмінних парадигм є частиною програмного забезпечення системи автоматичної обробки текстової інформації УМІФу.. За допомогою програми синтезу парадигм Шевченко І.В. Алгоритмічна словозмінна класифікація української лексики // Мовознавство. - 1996. - № 4-5. - С. 40-44. її було розгорнуто в список обсягом 3 094 174 словоформи, який вважається достатньо репрезентативним для вирішення поставленого завдання. Для кожної із словоформ списку поставлено відповідні їй граматичні коди, тобто позначення словозмінних частиномовних характеристик слів.
Для омонімічних одиниць списку системою автоматичного морфологічного аналізу проставлено двосимвольні коди, що відповідають усім теоретично можливим граматичним значенням омонімічної словоформи, які можуть реалізуватися нею в тексті. Наприклад, словоформі мати за цим принципом відповідатиме ланцюжок <ГФЙАЙУЙШКИКК>, що тлумачиться як: іменник чоловічого роду називного відмінка множини іменника мат (ЙА в ланцюжку), іменник чоловічого роду знахідного відмінка множини іменника мат (ЙУ), іменник чоловічого роду кличного відмінка множини іменника мат (ЙШ), іменник жіночого роду називного відмінка однини від іменника мати (КИ), іменник жіночого роду кличного відмінка однини від іменника мати (КК) та дієслово в неозначеній формі мати (ГФ).
Обчислювальний експеримент виявив, що зі списку 3 094 174 словоформ 1 539 802 словоформи є однозначними, а для решти - 1 554 372 словоформ - одержано відповідні омонімічні коди. Представлена двосимвольними кодами граматична семантика кожної словоформи показує здатність омоніма виражати певну кількість граматичних значень. Наприклад, 6 двокомпонентних кодів наведеної вище словоформи мати свідчать про те, що ця словоформа в тексті може реалізувати значення двох граматичних класів (дієслова, іменника).
Визначаючи основним структурним елементом омонімічної системи мови омонімічний ряд як “сукупність слів або словоформ однієї мови в один і той же період її існування, що тотожні в плані вираження, але істотно різняться між собою в плані змісту” Малаховский Л.В. Теория лексической и грамматической омонимии. - Ленинград: Наука, 1990. - С. 46., під час опису підсистеми морфологічних омонімів ми розглядаємо поняття тотожності в плані вираження як однаковий графемний склад морфологічних омонімів, а різницю в плані змісту - як відмінності в їхньому граматичному значенні. Таким чином, під омонімічним рядом розуміємо сукупність морфологічно неоднозначних, графічно тотожних одиниць, об'єднаних однією формою.
Реєстр омонімічних рядів - 610 612 одиниць, представлених у словнику словоформ, одержано шляхом зведення в отриманому списку графічно тотожних словоформ. Отже, представленням ОР у нашому дослідженні є словоформа з визначеним для неї омонімічним кодом, тобто кодом, довжина якого більша або дорівнює двом двосимвольним кодам. Так, омонімічний ряд {поверх - ім., чол. р., З. в., одн. (ЙВ), поверх - ім., чол. р., Н. в., одн. (ЙИ), поверх - присл., (НО), поверх - прийм. (ПР)} у списку подається як поверх <ЙВЙИН0ПР>.
Омонімічні коди, поставлені у відповідність до ОР, є формальним представленням структурних моделей морфологічних омонімів, тобто модель репрезентує усі морфологічні функції, які можуть реалізувати в тексті елементи відповідного омонімічного ряду.
Список моделей морфологічних омонімів, представлених у словнику словоформ, формувався за списком попередньо виділених ОР шляхом зведення до однієї моделі тих ОР, що мають однакові омонімічні коди. У результаті було одержано список з 1486 різних структурних моделей ММО української мови.
Поняття типу ММО введено нами для розрізнення міжчастиномовних морфологічних омонімів і тих, що представляють омонімію форм у парадигмі слова в межах одного граматичного класу. Омонімічний тип у даному випадку відображає збіг граматичних властивостей лише на рівні морфологічних класів, функцію яких може виконувати омонім, без урахування конкретного граматичного значення. Формальною процедурою виділення ТММО є перетворення омонімічного ланцюжка кодів, яким представлена модель омографа, в ланцюжок на позначення граматичних класів, які й репрезентують можливості омоніма щодо актуалізації ним у тексті його частиномовних значень.
Так, за словником словоформ, дві моделі - ГЬЙВЙИСП (наказ. спосіб, дієсл. недок. в., одн.; іменн., З. в., чол. р., одн.; іменн., Н. в., одн.; сполучн.) та ГЬКЕСПґЬ (наказ. спосіб дієсл. док. та недок. в., одн.; іменн., жін. р., З. в., множ.; сполучн.), представляють омонімічні ряди словоформ ніж та мов, що репрезентують один тип міжчастиномовних морфологічних омонімів дієслово/іменник/сполучник (ДІС).
Для аналізу ММО в мові була сформована спеціальна лінгвістична база даних, яка представляє:
реєстр міжчастиномовних морфологічних омонімів сучасної української мови;
моделі та типи міжчастиномовних морфологічних омонімів, яким відповідають конкретні словоформи.
Як показали результати аналізу ЛБД з погляду співвідношення кількості ММО та морфологічних омонімів всередині одного граматичного класу, перші становлять 2 % (10 203) від загальної кількості реєстрових одиниць. Решта 98 % (600 409) - це омоніми всередині парадигми окремих граматичних класів.
Виділена група міжчастиномовних омонімів розподіляється за 81 омонімічним типом та 820 моделями, які репрезентують існуючі в українській мові омонімічні відношення між різними лексико-граматичними класами слів. Шість із них охоплюють 95 % усіх міжчастиномовних омонімів (9667 омографів). До них належать типи: ад'єктив / іменник (5670 омографів) `вартові, наречені', дієслово / іменник (2406) `коти, лови', ад'єктив / дієслово (588) `бадьорим, білим', дієслово / прислівник (389) `значимо, мислимо', іменник / прислівник (342) `візаві, ажур', ад'єктив / прислівник (272) `балакуче, благословенно'. Саме вони й можуть уважатися ядром ММО української мови.
У результаті аналізу всіх типів ММО, виділених за базою даних, було встановлено, що у відношення міжчастиномовної морфологічної омонімії вступають усі одинадцять граматичних класів, виділених за прийнятою нами класифікацією: іменник, дієслово, ад'єктив, прислівник, сполучник, числівник, займенник-іменник, займенник-прикметник, прийменник, вигук, частка. Прийменник вступає в омонімічні відношення з найменшою кількістю лексико-граматичних класів (5). З найбільшою кількістю лексико-граматичних класів взаємодіють дієслово, прислівник та іменник.
Аналіз омонімічних типів з погляду їхнього кількісного компонентного складу показав, що довжина омонімічних типів варіюється в діапазоні від двох до шести. Більшість омографів представлені двокомпонентними омонімічними ланцюжками - 98,46 %. Визначене нами ядро міжчастиномовної морфологічної омонімії належить саме до цієї групи омографів.
Описані типи та моделі ММО репрезентують потенційні можливості словникового складу української мови. Системний аналіз досліджуваного явища морфологічної омонімії передбачає розгляд його в аспекті зіставлення мовно-мовленнєвих властивостей ММО з погляду реалізації визначених потенцій в реальних текстах. Цьому аналізу присвячено розділ 3 дисертації “Функціонування міжчастиномовних морфологічних омонімів в українських текстах”.
У розділі розглядається специфіка функціонування типів міжчастиномовних морфологічних омонімів у текстах наукового, публіцистичного та художнього стилів. Здійснюється порівняльний аналіз ТММО в мові та текстах. Визначається частота вживання ТММО в текстах та їх специфіка щодо наповнюваності омонімічними рядами. Особливу увагу в розділі зосереджено на представленні залежності частотної характеристики типів міжчастиномовних морфологічних омонімів від їх кількісного компонентного складу та граматичних властивостей компонентів омонімічного коду. У розділі розглядається методика автоматичного формування електронного словника міжчастиномовних морфологічних омонімів на основі розробленої бази даних.
ЛБД функціонування міжчастиномовних морфологічних омонімів у текстах сучасної української мови сформовано на текстах корпусу наукового, публіцистичного та художнього стилів, кожен із яких представлено вибірками обсягом 1 000 000 словоформ.
Принцип репрезентативності в даному випадку реалізується завдяки тому, що, по-перше, обрані для аналізу три стилі в основному представляють сучасну українську мову і, по-друге, як показав попередній аналіз матеріалу, в сукупній вибірці в 3 000 000 словоформ він представляє 95,06 % всіх типів ММО, властивих українській мові.
З-поміж виділених у текстах морфологічних омонімів міжчастиномовні омоніми найбільше представлені в художніх текстах, де їх частка становить 53,23 % (298 678 ММО) стосовно загальної кількості морфологічно неоднозначних словоформ. У публіцистичному стилі їх частка становить 41,21 % (254 713 ММО). Найменшу частку зафіксовано в текстах наукового стилю - 34,39 % (225 746 ММО).
За кількістю омонімічних рядів, які представляють міжчастиномовні омоніми в досліджуваних вибірках, перше місце посідає публіцистичний стиль, де зафіксовано 2355 ОР, у художніх текстах їх - 2150 та найменша кількість зафіксована в текстах наукового стилю - 1880. Загалом в аналізованій нами ЛБД текстів сучасної української мови реалізовано 58 % (5940) з реєстру ММО української мови.
Для розробки алгоритмів автоматичного усунення морфологічної омонімії особливо вагомою є інформація про реалізовані текстами типи міжчастиномовних омонімів та частоту їх вживання. Виділені в текстах типи ММО обумовлюють вибір конкретних текстових ситуацій, а за даними про частоту моделей визначається ієрархія правил алгоритму.
З 81 типу міжчастиномовних морфологічних омонімів, визначених для української мови, в досліджуваних текстах наукового стилю зафіксовано 70 типів, публіцистичного - 75 типів та художнього - 77. Отже, художній стиль реалізує максимальну кількість потенційно заданих мовою ММО. Найменший їх відсоток виявлено в науковому стилі. 70 типів міжчастиномовних морфологічних омонімів (із списку теоретично можливих) зафіксовано в усіх вибірках і їх можна вважати регулярними - такими, що функціонують в текстах усіх досліджуваних стилях сучасної української мови.
На сьогодні в українській лексикографії словника міжчастиномовних морфологічних омонімів, який би містив повний список усіх потенційних типів та моделей неоднозначних словоформ, немає. Це пояснюється тим, що досі лінгвісти були позбавлені можливості залучення комп'ютерних технологій до обробки репрезентативного повнотекстового мовного матеріалу.
Електронний словник ММО сучасної української мови було побудовано автоматично на основі бази даних, створеної за словником словоформ, синтезованим на основі граматичної лексикографічної системи української мови обсягом 3 094 174 словоформи, та стилістично диференційованого корпусу текстів за допомогою розробленого в УМІФі програмного забезпечення.
Словник міжчастиномовних морфологічних омонімів сучасної української мови містить таку інформацію:
реєстр міжчастиномовних морфологічних омонімів - близько 11 300 одиниць;
кожному із представлених у реєстрі омографів поставлена у відповідність модель, що описує морфологічні характеристики його компонентів;
для кожного компонента омонімічної моделі дається вихідна форма (вихідні форми виводилися автоматично за допомогою програми лематизації, розробленої в УМІФі);
про реалізацію реєстрових одиниць у Національному лінгвістичному корпусі обсягом 42 млн. слововживань (омографи, які не зустрілися жодного разу, позначені зірочкою).
Розроблена для словника пошукова система дає можливість формувати запити не лише за конкретним омонімом, а й за будь-яким типом інформації, представленої в словниковій статті: за значеннями граматичних класів ММО, за конкретними граматичними значеннями компонентів омоніма.
У четвертому розділі “Контекстна детермінація міжчастиномовних морфологічних омонімів сучасної української мови” розглянуто принципи формування лінгвістичної бази контекстів ММО та лінгвістичної бази діагностувальних контекстів, виділеної з ЛБД контекстів для дослідження міжчастиномовних морфологічних омонімів сучасної української мови. У розділі визначено загальні принципи формування правил автоматичного усунення омонімії текстових одиниць на основі діагностувальних контекстів.
У даному дослідженні основним засобом опису контекстної реалізації міжчастиномовних морфологічних омонімів є сформована на текстах українського корпусу спеціальна лінгвістична база контекстів ММО. Головне призначення її полягає у фіксації всіх можливих контекстів конкретного омоніма, моделі або типу в аналізованих текстах. База контекстів формувалася на основі морфологічно розміченого корпусу текстів трьох стилів обсягом 3 000 000 словоформ. Цю базу було інтегровано до бази міжчастиномовних морфологічних омонімів, описаної в розділі 2. Коригування сформованих правил усунення омонімії та доповнення їх новими здійснювалося на нових текстах наукового та публіцистичного стилів.
База контекстів формувалася на основі вибраних із морфологічно анотованого корпусу речень, які містять конкретний омограф. Речення представлено стільки разів, скільки в ньому вжито омографів. Омонім у реченні супроводжується диз'юнктивним кодом - ланцюжком двосимвольних кодів. Наприклад, для омоніма дзвони подається його код <ГЬЙАЙУЙШ>.
База лінгвістичних контекстів ММО складається з трьох таблиць: Таблиця лексико-граматичних контекстів міжчастиномовних морфологічних омонімів (Таблиця 1), Таблиця діагностувальних контекстів моделей ММО (Таблиця 2) та Таблиця діагностувальних контекстів у межах типу (Таблиця 3).
Матеріалом для формування таблиці 1 є контексти ММО, визначені на текстах публіцистичного стилю загальною кількістю 1 млн. словоформ і представлені у вигляді конкордансів ММО, довжина яких визначалася сімома текстовими одиницями (ТО) ліворуч і праворуч від омоніма в межах речення. Попередній аналіз показав, що саме в цих межах у 95 % перебувають контекстні детермінанти актуалізованого текстового значення ММО. Розділові знаки - кома, тире, крапка, крапка з комою тощо - вважаються на рівні зі словами окремими складниками контексту.
За результатами попереднього аналізу було встановлено необхідні й достатні ознаки текстового оточення, за якими може здійснюватися формальне розпізнавання актуалізованого значення ММО. До таких параметрів діагностувальних контекстів належать: позиція омографа в реченні - початкова, кінцева; розташування діагностувального контексту ліворуч, праворуч від ММО або ж одночасно і ліворуч, і праворуч; тип ММО; модель омоніма; граматичні ознаки ТО, що входять до складу ДК (граматичний клас, підклас); семантичні ознаки компонентів контексту - належність слова до певного семантичного класу (наприклад, урахування ознаки перехідності для дієслів, виділення дієслів семантичного класу, які вживаються на позначення розумової діяльності, виділення іменників назв істот тощо); семантична характеристика омоніма (один із компонентів омоніма є іменником, який вживається на позначення істоти / неістоти або ж є віддієслівним іменником).
Побудована таблиця лексико-граматичних контекстів опрацьовувалася нами для визначення діагностувальних контекстів актуалізованих значень ММО. Дослідником визначалися розміри контексту, який може бути достатнім для зняття омонімії в кожному конкретному випадку, позиція діагностувального компонента з оточення стосовно омографа (лівого, правого або лівого і правого), конкретне граматичне значення ДК, а також актуальне граматичне значення омографа в даному контексті. Визначені на основі таблиці 1 діагностувальні контексти автоматично переносилися в таблицю 2 діагностувальних контекстів моделей ММО.
Структура таблиці 2 і програмне забезпечення дозволяють в автоматизованому режимі перейти до таблиці 3 діагностувальних контекстів у межах кожного із 77 типів. Отримана таблиця представляє діагностувальні контексти в межах типу.
Побудова алгоритму усунення омонімії підпорядковується загальним принципам: доцільності, частоти вживання діагностувального контексту, найбільшого виграшу, принципу економності.
Висновки
Проведене дисертаційне дослідження дозволяє зробити такі висновки:
1. Спираючись на рівноправність визначення в плані вираження графемної та звукової форми представлення, що відповідає двом формам існування мови - писемній та усній, а в плані значення - розмежування лексичного й граматичного значень, доведено доцільність виділення в межах омонімії мови морфологічних омонімів як окремого закономірного мовного явища. Морфологічні омоніми характеризуються тими самими структурними ознаками, що й інші типи омонімів, й одночасно мають свою структурно-семантичну специфіку.
2. Розробка спеціальної методики виявлення морфологічних омонімів, яка полягає у виділенні графічно тотожних морфологічно неоднозначних одиниць словника словоформ (обсягом 3 094 174 одиниці), автоматично побудованого за допомогою програми синтезу парадигм слів, що увійшли до реєстру граматичного словника української мови обсягом 171 620 лексем, дозволила встановити максимально повний реєстр структурних моделей морфологічних омонімів, який нараховує 1486 одиниць й охоплює 610 612 омографів.
3. За допомогою спеціальної процедури із загального реєстру омонімів було виділено список міжчастиномовних морфологічних омонімів - 10 203 омоніми (820 моделей).
4. Аналіз омонімів найчисленніших структурних моделей, що представляють омонімію повнозначних частин мови, показав, що 75,24 % з них становлять міжчастиномовні морфологічні омоніми, між компонентами яких існує семантичний зв'язок: семантична близькість встановлюється через значення вихідних форм компонентів омоніма, які пов'язані між собою словотвірними відношеннями.
5. Виявлення структурно-семантичних особливостей омонімів з погляду морфологічних характеристик компонентів моделей та функціонально-стилістичної приналежності їх дозволило встановити продуктивні типи міжчастиномовних морфологічних омонімів сучасної української мови. Отримані дані про розподіл типів та моделей міжчастиномовних морфологічних омонімів за кількістю компонентів у відповідних їм моделях продемонстрував дію законів простоти та переваги: як на рівні типів, так і на рівні моделей домінують дво-, трикомпонентні одиниці.
Запропонована методика формування реєстру омографів та розроблені в роботі принципи формальної класифікації структурних моделей міжчастиномовних морфологічних омонімів можуть застосовуватися для аналізу морфологічних омонімів інших флективних мов.
6. На основі отриманого списку міжчастиномовних морфологічних омонімів було побудовано багатопараметризовану лінгвістичну базу даних, яка виявилася ефективним інструментом для дослідження омонімії в українській мові та може розглядатися як новий етап у розвитку лінгвістичних технологій. Сформована лінгвістична база міжчастиномовних морфологічних омонімів є основою для більш широкого узагальнення й глибшого дослідження омонімічних відношень на морфологічному рівні, наприклад, в аспекті вивчення прояву омонімічності певних граматичних форм.
7. Аналіз функціонування омонімів у текстах трьох стилів показав, що загальна частка морфологічних омонімів в українському тексті становить близько 61 %. У результаті аналізу було виявлено, що кількість реалізованих у текстах різних омонімів становить 11,88 % від їхньої загальної кількості - 610 612, із 10 203 міжчастиномовних омографів у текстах реалізовано 62 % омонімів. Із 81 встановлених типів ММО в текстах реалізовано 95 %.
8. Зважаючи на те, що обчислені коефіцієнти розбіжності між одержаними показниками частоти вживання морфологічних омонімів, частоти вживання міжчастиномовних морфологічних омонімів у випадку попарного порівняння вибірок виявилися суттєвими, можна говорити про коректність застосовування цих статистичних параметрів для розмежування стилів.
9. Автоматично побудований на основі сформованих баз даних словник міжчастиномовних морфологічних омонімів обсягом близько 11 300 омографів є інформаційною лексикографічною системою, розрахованою на широке коло запитів щодо різних аспектів омонімії в граматичній системі української мови, та може слугувати для зіставно-типологічних досліджень української та інших флективних мов. Створений словник є лексикографічним джерелом не тільки для фахівців, але й для тих, хто вивчає українську мову.
10. Розроблена структура бази даних лінгвістичних контекстів дала можливість сформувати списки діагностувальних контекстів, що є основою дослідження контекстної реалізації омонімів в мовленні та ефективним інструментом для побудови алгоритму автоматичного усунення морфологічної омонімії. База даних лінгвістичних контекстів відкриває нові шляхи до більш адекватного опису типів ознак, що залучаються для усунення омонімії граматичних елементів у системах автоматичної обробки мови. На основі створеної бази даних було розроблено загальні принципи формування правил автоматичного усунення омонімії.
11. Розроблена лінгвістична база даних дозволила визначити діагностувальну силу граматичних, лексико-граматичних та лексичних контекстів щодо детермінації ними конкретного граматичного значення міжчастиномовних морфологічних омонімів у тексті: 98 % правил спираються на граматичну інформацію діагностувальних контекстів.
12. Серед граматичних діагностувальних контекстів найбільшу діагностувальну силу було визначено для іменника, дієслова, прийменника, підрядних сполучників, займенника-іменника. Саме ці граматичні класи й можуть вважатися опорними елементами під час здійснення автоматичного контекстного аналізу текстів у системах автоматичної обробки мови.
13. Розроблені в процесі дисертаційного дослідження засоби та методи формування лінгвістичних баз даних являють універсальний лінгвістичний інструментарій, який може використовуватися у вирішенні інших лінгвістичних проблем.
Список опублікованих праць за темою дисертації
1 Шипнівська О.О. Кількісна та якісна характеристика типів морфологічних омонімів сучасної української мови // Актуальні пробл. укр. лінгвістики: Зб. наук. пр. - К.: Видавничо-поліграф. центр „Київський ун-т”, 2005. - С. 36-42.
2. Шипнівська О.О. Формування реєстру омографів сучасної української мови // Мовні і концептуальні картини світу: Зб. наук. пр. - Вип. 14. Книга 2. - К.: Вид. Дім Дмитра Бураго, 2004. - С. 255-259.
3. Шипнівська О.О. Функціонування міжчастиномовних морфологічних омонімів в українських текстах // Мовознавство. - 2005. - № 6. - С. 70-80.
4. Шипнівська О.О. Головні аспекти побудови електронного корпусу текстів української мови // Мова. - 2004. - № 9. - С. 211-215.
5. Шипнівська О.О. Лінгвістичні основи формування електронної лексичної картотеки // Науковий вісник кафедри ЮНЕСКО Київського нац. лінгвіст. ун-ту LINGUAPAX-VІІІ. Серія: Філологія. Педагогіка. Психологія. - Вип. 9. - 2004. - С. 18-24.
6. Шипнівська О.О. Композиція україномовних та польськомовних епістолярних пам'яток (формування електронної лексичної картотеки) // Проблеми зіставної семантики: Зб. наук. статей / Відпов. ред. д. філол. н., проф. М.П. Кочерган. - К.: Вид. центр КНЛУ, 2003. - С. 388-394.
7. Шипнівська О.О. Дослідження граматичної омонімії на морфологічно анотованому корпусі текстів // Широков В.А. та ін. Корпусна лінгвістика: Монографія / Широков В.А., Бугаков О.В., Грязнухіна Т.О., Костишин О.М., Кригін М.Ю., Любченко Т.П., Рабулець О.Г., Сидоренко О.О., Сидорчук Н.М., Шевченко І.В., Шипнівська О.О., Якименко К.М.; Український мовно-інформаційний фонд НАН України. - К.: Довіра, 2005, - С. 309-330 с.
8. Шипнівська О.О., Стариков С.В. Формування лінгвістичної бази даних граматичних омонімів на матеріалі Українського національного лінгвістичного корпусу // Лексикограф. бюл.: Зб. наук. праць / Відп. ред. д. філол. н., проф. В. Німчук. - К., 2006. - Вип. 14. - C. 188-194.
9. Шипнівська О.О., Рабулець О.Г. Функціонування граматичних омографів української мови в текстах різних стилів (на матеріалі морфологічно анотованого корпусу текстів) // Тр. междунар. конф. “MEGALING' 2005. Прикладная лингвистика в поисках новых путей”. - СПб.: Изд-во “Осипов”, 2005. - С. 140-147.
10. Шипновская О.А. Морфологические омографы в лексикографической практике // Слово и словарь = Vocabulum et vocabularium: Сб. науч. тр. по лексикографии / Отв. ред. Л.В. Рычкова. - Гродно: ГрГУ, 2005. - С. 208-213.
11. Шипнівська О.О., Рабулець О.Г. Функціонування граматичних омографів української мови в текстах різних стилів (на матеріалі морфологічно анотованого корпусу текстів) // MEGALING'2005 Прикладная лингвистика в поиске новых путей. Мат-лы междунар. конф.. 27 июня - 2 июля 2005 Крым, Меганом. - ТНУ им. В.И. Вернадского, Симферополь, 2005. - С. 56-57.
12. Шипнівська О.О., Стариков С.В. Створення лінгвістичної бази даних морфологічних омонімів на матеріалі Українського національного лінгвістичного корпусу // MegaLing'2006 Горизонти прикладної лінгвістики та лінгвістичних технологій. Доповіді міжнародної наукової конф. 20-27 вересня 2006, Україна, Крим, Партеніт / Ред. В.А. Широков, С.С. Дикарьова. Мовно-інформаційний фонд НАН України, Таврійський нац. ун-т ім. В.І. Вернадського. - Сімферополь: ДиАйПи, 2006. - С. 130-131.
Подобные документы
Формування ареалу південнослобожанських говірок південно-східного наріччя української мови. Перспективи дослідження діалектної мови цього континууму. Формування фонетичної, морфологічної, лексичної, словотвірної структури слобожанських говірок.
статья [27,3 K], добавлен 18.12.2017Виникнення і первісний розвиток української мови. Наукові праці україномовців про виникнення української мови. Дослідження розвитку писемної української мови: діяльність Кирила і Мефодія. Спільність української мови з іншими слов'янськими мовами.
реферат [29,5 K], добавлен 26.11.2007Роль і значення для розвитку мови місця її народження, дальшого поширення, положення країни на карті світу. Належність української мови до широко розгалуженої мовної сім'ї слов'янських мов. Переконлива відмінність української мови у її фонетиці.
реферат [24,8 K], добавлен 01.03.2009Теоретичні проблеми ареального варіювання української мови: закономірності розподілу лексики в межах українського континуума; межі варіативності лексики у зв’язку з проблемою лінгвістичного картографування; семантичні варіанти у говорах української мови.
реферат [20,5 K], добавлен 02.04.2011Характерні риси сучасної української літературної мови та особливості її використання. Історія становлення української графіки й орфографії, видання "Українського правопису" 1945 р. Походження іноземних слів, що використовуються в літературній мові.
реферат [24,7 K], добавлен 04.07.2009Теоретичні основи синтаксису сучасної української мови. З’ясування структурно-семантичних і функціонально-стилістичних особливостей вставних і вставлених частин речення. Дослідження ролі та значення вставних синтаксичних одиниць у публіцистичних текстах.
курсовая работа [51,2 K], добавлен 22.12.2017Засіб формування, оформлення та існування думки. Формування української мови. Норми української літературної мови. Стилі сучасної української мови. Ділова українська мова. Найважливіший засіб спілкування людей.
реферат [13,9 K], добавлен 17.07.2007Поняття "термін" у лінгвістичній науці. Джерела поповнення української термінології. Конфікси в афіксальній системі сучасної української мови. Специфіка словотвірної мотивації конфіксальних іменників. Конфіксальні деривати на позначення зоологічних назв.
дипломная работа [118,0 K], добавлен 15.05.2012Розвиток української літературної мови давньої і середньої доби. Доба відродження української літературної мови. Розвиток урядової мови в напряму зближення з живою мовою із впливом мови центральноєвропейських канцелярій: латинської, німецької, польської.
реферат [21,1 K], добавлен 14.10.2011Аспекти вивчення віддієслівних іменників у вітчизняних і зарубіжних мовознавчих студіях. Методика когнітивно-ономасіологічного аналізу, мотиваційні особливості й диференціація мотиваційних типів віддієслівних іменників сучасної української мови.
автореферат [28,4 K], добавлен 11.04.2009