Структура словоизменительной системы русского языка: аспект компьютерного моделирования (на материале системы русского глагольного словоизменения)

Изучение синтетических и аналитических форм парадигм русского глагола. Рассмотрение формального подхода к компьютерному моделированию (определение видов глаголов, переходности, типов спряжения, схем ударения) и унификации структур словоизменений.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 14.11.2009
Размер файла 27,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Санкт-Петербургский Государственный Университет

Филологический факультет

Отделение теоретической и прикладной лингвистики

Структура словоизменительной системы русского языка: аспект компьютерного моделирования (на материале системы русского глагольного словоизменения)

Курсовая работа

Николаевой Марии,

второй курс

Научный руководитель:

С.А. Коваль

2006 год

Введение

Компьютерные приложения, имеющие лингвистическую составляющую, начали создаваться с середины XX века: первым опытом в этой области принято считать Джорджтаунский эксперимент по машинному переводу 1954 года. На протяжении полувека занимающаяся такими приложениями лингвистическая дисциплина развивается и разделяется на поддисциплины. Стратификация происходит по уровням языка: от компьютерной фонетики до компьютерной семантики, в соответствии с языковым материалом и задачами. В получившемся ряду нашла свое место и компьютерная морфология.

В самых общих чертах задача морфологической части в лингвистическом компоненте компьютерного приложения заключается в уменьшении базы данных лексики за счет установления связи каждой словоформы с ее инвариантом. Иными словами, необходимо свести лексикон, включающий в себя все возможные словоформы как отдельные единицы, к набору инвариантов этих словоформ и набору правил образования парадигмы для каждого инварианта. Выполнение такой задачи существенно уменьшит объем базы данных, к которой обращается приложение, и, следовательно, существенно увеличит скорость работы приложения. В получаемом таким образом компоненте собственно лексикон как набор единиц и морфологическая часть оказываются настолько трудноотделимы друг от друга, что объединяются в лексико-морфологический компонент (или модуль). Лексикон преобразуется в словарь основ и словарь аффиксов, с которыми и работает морфологическая часть модуля. Принципы работы этой части естественным образом берутся различными в соответствии с необходимыми выходными данными. С этой точки зрения морфологический анализ подразделяется на собственно анализ и лемматизацию. В результате анализа модуль возвращает полный набор характеристик словоформы, включая словоизменительные, в случае же лемматизации происходит только определение лексической единицы. Помимо анализа существует и обратная задача морфологических компонентов, синтез словоформы по характеристике либо синтез парадигмы. Для различных функций компонента более удобными оказываются различные подходы к построению компьютерной морфологии, так, для анализа отлично себя зарекомендовали квазиагглютинативные приближения языкового материала, для синтеза наиболее подходит максимальное обобщение правил (к примеру, правила построения чередований через специальные символы вроде Ь для беглого "е").

Отличия в принципах построения и связанные с ними сложности обусловлены не только функционально, но часто и индивидуально. Исследователь, берущийся за построение морфологического модуля для некоторого приложения, либо адаптирует уже имеющийся к своим задачам, преобразуя его до неузнаваемости, либо создает собственный по новым принципам. Отсюда возникает целый ряд различных подходов к организации морфологических данных, на первый взгляд мало между собой связанных и недостаточно обоснованных. Кроме того, наведению некоторого порядка, т.е. структурированию подходов, мешает недоступность некоторых из них: компьютерные приложения являются коммерческими, модули закрытыми или даже платными. Одной из задач, решаемых сегодня компьютерной морфологией, является унификация подходов к построению морфологических модулей и создание единого открытого модуля. Она раскладывается на подзадачи по частям речи, заключающиеся в составлении систем признаков, влияющих на словоизменение, и морфологических типов. Такая подзадача существует в ряду прочего для русского глагола. В рамках данного направления в курсовой работе была поставлена задача по сопоставлению двух авторитетных систем русского глагольного словоизменения на примере одного-двух классов, выделению используемых в них признаков и оценке их с точки зрения дальнейшего применения в построении единого морфологического модуля.

Основным требованием к словоизменительному типу является однозначность построения парадигмы на его основе, т.е. однозначное задание набора окончаний для всех словоформ и правил преобразования основы, если таковое имеется. Самым базовым и общеизвестным делением глаголов на типы является деление на первое и второе спряжения по признаку тематической гласной. Оно, однако, не удовлетворяет указанному требованию по обоим пунктам (ср., например, глаголы второго спряжения корить и мостить). В системах, удовлетворяющих данному условию, выделяется несколько десятков словоизменительных классов, количество разрядов в каждом из которых колеблется от десятков до сотен. В качестве дополнительного требования можно указать однозначность звуковой оболочки выстраиваемых словоформ, т.е. наличие сведений об акцентуации. Значимость данного требования для построения морфологического модуля, обрабатывающего письменный текст, сомнительна, но можно говорить об адекватности системы, построенной с его использованием, с точки зрения фундаментальной морфологии.

В качестве материала исследования в работе были выбраны системы словоизменительных типов из работ Андрея Анатольевича Зализняка [Зализняк, 1977], и Сергея Александровича Кузнецова [Кузнецов, 2000], а именно четвертый словоизменительный класс [Зализняк, 1977] и соответствующий ему шестой РГ. В указанных классах дробность классификаций представлена наиболее полно (ср. 425 таблиц в 6м классе [Кузнецов, 2000], второй же по количеству -- 15й, 167 таблиц). Рассматриваемые классы включают в себя бoльшую часть глаголов т.н. второго спряжения, т.е. имеющих тематический элемент -и-. Деление на классы в указанных системах проводится именно в соответствии с тематическими элементами (16 классов в [Зализняк, 1977] и 27 классов в [Кузнецов, 2000]), с некоторыми, однако, особенностями. О различительных признаках, на которых строятся классификации словоизменительных типов в рассматриваемых работах, будет сказано ниже.

Русское глагольное словоизменение в традиционном и формальном освещении

В данном разделе будет приведено общее представление о словоизменительной системе русского глагола, принятое за основу в курсовой работе, некоторые из существующих подходов к ее описанию и формальному построению, а также некоторые особенности формального описания словоизменения в целом.

Общая характеристика системы словоизменения русского глагола

Совокупность словоформ лексемы с приписанными им грамматическими значениями принято называть парадигмой. Парадигму за вычетом словоформ, или, образно выражаясь, набор клеток, каждая из которых заполняется словоформой, называют парадигматической схемой. При переходе к группе инвариантов мы получаем парадигматическую схему группы в виде набора клеток с описанием как объединение наборов клеток, включенных в группу. Такую схему называют эталоном парадигмы. Т.о., эталонной парадигматической схемой для части речи, например, глагола, будет полученный в результате объединения (т.е. операции теоретико-множественной суммы) набор клеток с описаниями, состоящими из значений глагольных грамматических разрядов и категорий. Количество клеток и структура схемы задается грамматическими категориями, в то время как некоторые разряды сужают схему; например, это делают вид и залог глагола.

Полная парадигма русского глагола включает в себя, согласно моделям разных авторов, от 225 до 333 форм. Сюда входят как синтетические, так и аналитические формы (парадигму с аналитическими формами называют также расширенной). Полный набор личных форм состоит из собственно личных, родовых прошедшего времени, а также форм будущего времени, повелительного и сослагательного наклонения. Кроме того, в парадигму входят причастия, которых большинство авторов выделяет четыре вида, деепричастия и инфинитив.

Аналитические глагольные формы строятся при помощи вспомогательных глаголов быть и бывать, а также частиц (бы, пусть, давай и др.). Частицы вносят в конструкцию присущие им значения (сослагательности, императивности), вспомогательный глагол передает значения категорий лица, рода, наклонения. Смысловой же глагол привносит свое лексическое значение и грамматические значения залога и вида.

Собственно личные формы глагола (1е, 2е и 3е лицо, единственное и множественное число), подразумевающие личные формы настоящего (св вид) или будущего (нсв вид), называют также формами непрошедшего времени. Значения будущего и настоящего времени передаются в них одними и теми же морфологическими средствами. Именно по категории времени собственно личные формы противопоставляются родовым и вместе с последними, а также формами повелительного и сослагательного наклонения, составляют ту минимальную парадигму спрягаемых форм, которые присущи всем без исключения глаголам. Родовые синтетические формы образуются путем прибавления к основе инфинитива суффикса -л (в некоторых случаях нуль) и флексий. Аналитические формы строятся при помощи вспомогательного глагола быть (бывать) и причастных форм основного глагола. Формы повелительного наклонения 2л.ед. числа образуются обычно от основ настоящего времени с добавлением суффикса -и или представляют собой чистую основу (настоящего или прошедшего времени). Формы множественного числа (или вежливого обращения к одному лицу) образуются с помощью суффикса -те. Для образования аналитических форм используется вспомогательный глагол быть (в форме повелительного наклонения) или частицы давай (давайте), пусть (пускай), к которым присоединяется основной глагол.

В расширенной парадигме существует шесть видов инфинитивов, но регулярно образуется только инфинитив действительного залога (иначе называемый неопределенной формой глагола). Основа инфинитива (т.е. форма, взятая без суффикса <ть>, <ти>, <чь>) обычно выступает в качестве структурной единицы, формирующей часть глагольной парадигмы, которая называется подпарадигмой прошедшего времени, лишь в некоторых случаях (например, пасти, учесть, беречь) она оказывается изолированной формой и служит только для образования страдательного залога.

Неличные формы (вербоиды) традиционно относят к периферийной части глагольной парадигмы, в составлении их значении участвуют не только глагольные семы. Так, причастие обычно характеризуется как глагольная форма, сочетающая в себе как признаки глагола, так и признаки прилагательного. Как и глагол, причастие обладает категориями вида и залога; залоговое противопоставление представлено в полной мере, а видовые различия несколько ограничены по сравнению с личными формами. Кроме того, в системе причастий представлена категория относительного времени, состоящая из двух значений: настоящего и прошедшего; система личных форм значений относительного времени передавать не может.

От каждого глагола, кроме некоторых безличных, в зависимости от переходности и вида может быть образовано от одного до шести причастий (включая формы страдательного причастия на -щийся и -вшийся). Основа причастия образуется при помощи глагольной основы (прошедшего и настоящего времени) и специализированного суффикса, сообщающего о видовой и залоговой принадлежности причастия. Грамматические значения падежа, числа и рода (являющиеся признаками прилагательного в причастии) передаются с помощью прибавления к основе адъективных окончаний.

Формы действительного причастия настоящего времени образуются у глаголов нсв вида как переходных, так и непереходных, путем присоединения к основам настоящего времени суффиксов <ущ>, <ющ>, <ащ>, <ящ> и флексий прилагательного (мягкого типа). Формы действительного причастия прошедшего времени образуются у глаголов обоих видов от основы прошедшего времени при помощи суффикса <вш>, <ши>. Кратких форм действительные причастия прошедшего времени не имеют. Формы страдательного причастия настоящего времени образуются прибавлением суффиксами <ем>, <им> к основе настоящего времени у части переходных глаголов нсв вида. Страдательные причастия настоящего времени имеют твердый тип флексий прилагательного. Формы страдательного причастия прошедшего времени образуются у переходных глаголов совершенного вида и двувидовых глаголов путем присоединения к основе прошедшего времени суффиксов <нн>, <енн>, <т>. Причастия имеют твердый тип флексий.

Полные и краткие страдательные причастия настоящего и прошедшего времени входят в качестве смыслового центра в состав аналитических форм глагола. С помощью вспомогательного глагола быть (бывать) и причастно-страдательной формы типа исследуемый -- исследуем, исследованный -- исследован образуются аналитические причастно-страдательные формы, которые численно превосходят парадигму синтетических форм. Краткие формы у причастий имеются, но их синтаксическая роль специфическая, они участвуют именно в указанной выше аналитической конструкции.

Одной из основных форм глагола является деепричастие, оно также обладает категориями залога и вида. Форма пассивного деепричастия (будучи исследован) в принципе образуется свободно, но является книжной и употребляется редко. Категория вида, имея такое же содержание, что и у прочих глагольных форм, имеет определенную особенность: она жестко связана со значением относительного времени. Как правило, деепричастие несовершенного вида обозначает второстепенное действие, одновременное с основным, а деепричастие совершенного вида -- предшествующее основному. Форма деепричастия нсв вида действительного залога образуется у глаголов нсв вида и у двувидовых глаголов путем добавления суффикса <я>, <а> к основе настоящего времени. Формы деепричастия св вида действительного залога могут образовываться у глаголов обоих видов с помощью суффиксов <в>, <вши>, присоединяемых к основе прошедшего времени. В современных текстах у глаголов нсв вида эта форма употребляется только при отрицании. Возвратная форма существует только с суффиксом <вши>.

Налицо обширность и многообразие словоизменительной системы русского глагола; они должны затруднять работу над выделением словоизменительных типов, однако имеется возможность облегчить задачу и сузить парадигму. Для начала можно перейти от расширенной парадигмы к обычной, т.е. исключить из рассмотрения аналитические формы: это позволяет сделать тот факт, что в образовании последних используются другие части парадигмы, синтетические. Далее из рассмотрения, как правило, выпускаются родовые и падежные формы причастий, как имеющие крайне мало различий в образовании. В результате ограничений получается т.н. суженная парадигма, состоящая из инфинитива, полного набора собственно личных форм, родовых форм, форм повелительного наклонения, причастий в форме единственного числа мужского рода именительного падежа, деепричастий и форм страдательного залога (<-ся>).

В связи с теми же обширностью и многообразием системы словоизменения в научной литературе не существует единой морфологической классификации глаголов. До начала двадцатого века существовали схемы деления глаголов, исходящие их окончаний инфинитива, из окончаний основ настоящего времени, либо из тематических гласных.

Для системы форм русского глагола характерно наличие двух основ, именно поэтому многие классификации базируются на соотношении между основами. Считается, что, зная закономерности словоизменения, можно при помощи нескольких опорных форм образовать полную парадигму слова. Словоизменение глагола происходит путем прибавления окончаний к одной из двух основ: основе инфинитива (основе прошедшего времени) и к основе настоящего времени. Соотношение основ образует типы, которые в большинстве случаев обладают единством парадигм.

Современные словоизменительные классификации глаголов основываются на выявлении таких элементов в морфемном составе личных форм, сочетание которых указывает на его словоизменительные свойства. Для этого используются морфы глагольной основы, расположенные на стыке с финалями. Важными для таких классификаций формами признаются формы инфинитива, 1л. ед. числа, формы 3л. ед. числа настоящего времени или 3 л. мн. числа, формы прошедшего мужского или женского рода. Авторы по разным причинам выбирают разные показатели глагольного класса. Для одних -- это окончания форм инфинитива, 1 ед. и 3 ед. непрошедшего времени, для других -- окончания форм 3 л. мн. числа и женского рода прошедшего времени.

Особенности формального подхода к описанию словоизменения

Поскольку формальное рассмотрение текста в целом характеризуется особым вниманием к его внешней стороне, для формального описания словоизменения единицей является слово как сегмент, т.е. в случае анализа письменной формы -- последовательность символов от пробела до пробела. Далее на базе введенного понятия сегмента последовательно строится система понятий, таких как слово, парадигматическое слово, лексема, словоформа, парадигма, граммема, грамматический разряд (или морфологический класс). Образцом такого последовательного построения считается система определений, данных в [Зализняк, 2002]. Также необходимо отметить, что система А.А.Зализняка является не только классическим примером логической структуры, связывающей между собой понятия, но и источником собственно определений этих понятий, которые закрепились и лишь с небольшими изменениями переходят из одной работы по морфологии в другую.

Выше были даны определения парадигмы и парадигматической схемы. Под словоизменительным типом понимается совокупность слов, имеющих одну эталонную парадигматическую схему, клетки которой заполняются приложением к основе одного формообразующего правила (к основе прибавляется одна и та же последовательность символов и/или вносятся одинаковые изменения в основу). Кроме того, необходимо ввести определение дефектной парадигмы -- это парадигма, эталонная схема которой имеет пустые клетки (лакуны). Это понятие значимо, т.к. наличие стандартного дефекта в парадигме часто является одним из признаков словоизменительного типа.

А.А.Зализняк в своем [Зализняк, 2002] проводит важное разделение между различительным признаком и его значением. Различительным признаком является абстрактная характеристика (например, цвет объекта), а его значением -- конкретная реализация характеристики (например, красный цвет). На различительных признаках строятся классификации, два основных типа которых следующие. В одном случае все различительные признаки, участвующие в классификации, принимают некоторое значение для всех элементов классифицируемого множества. В другом случае существует хотя бы один признак, по которому характеризуются не все объекты. Классификацию первого типа А.А.Зализняк назвал универсальной, а классификацию второго типа -- древовидной. В большинстве морфологий фундаментального языкознания задействованы древовидные классификации, однако А.А.Зализняк указывает на существенные преимущества универсальной. Она позволяет сравнить любые два объекта по имеющимся признакам, значительно упрощает описание объекта, делая его более компактным. Универсальная классификация также позволяет унифицировать многие правила, в частности правила синтеза. Но особо А.А.Зализняк подчеркивает тот факт, что универсальная классификация позволяет глубже проникнуть в природу рассматриваемых объектов и увидеть нетривиальные соотношения между ними.

Примером последовательного применения универсальной классификации является опять же [Зализняк, 2002]. В последующей работе [Зализняк, 1977] классификация словоизменительных типов имеет иерархическую, т.е. древовидную структуру; в системе глагольного словоизменения [Кузнецов, 2000] классификация представляется универсальной.

Приступим далее к описанию глагольной подсистемы словоизменительной системы [Зализняк, 1977]. Как и всем единицам лексикона словаря, глаголам присваивается индекс. В индексе словоизменительного типа указываются значения участвующих в описании признаков, из грамматических сведений можно почерпнуть следующую их расшифровку (в порядке следования в индексе; указываются пометы, встречавшиеся непосредственно в материале):

- вид глагола. Значения признаков: св, нсв, св-нсв

- обозначения переходности/непереходности (#/нп), безличности (безл.), многократности (многокр.)

- тип спряжения. Определяется из соотношений следующих форм глагола: инфинитив, 1 ед непрошедшего времени, 3 ед непрошедшего времени. Пример: в 4ом классе -ить для инфинитива времени, -ю/-у для 1 ед, -ит для 3 ед. Существует 16 значений данного признака.

- схема ударения указывается с помощью латинской буквы (либо 2х букв, разделенных чертой), при этом слева стоит обозначение ударения в подпарадигме настоящего времени, а справа схема для подпарадигмы прошедшего времени.

- набор стандартных отклонений используется с дополнительными пометами. Набор дополнительных признаков неодинаков для различных словоизменительных классов. Так, в четвертом типе встречаются следующие стандартные отклонения -- и пометы, соответственно: "2" -- нестандартное образование форм повелительного наклонения, ["2"] -- нестандартные формы вариативны (точно так же для прочих помет, квадратные скобки вокруг пометы в электронном варианте означают наличие двух форм). "3" -- нестандартное образование одной из форм повелительного настроение. "4" -- нестандартный перенос ударения в действительном причастии настоящего времени с суффикса на корень. "7" -- нестандартный перенос ударения в страдательном причастии прошедшего времени на суффикс с заменой е на ё. "8" -- наоборот, т.е. нестандартный перенос ударения в страдательном причастии прошедшего времени на основу.

Кроме того, ряд операций по словоизменительной системе [Зализняк, 1977] производится автоматически. К таким операциям относится чередование основы: в определенных формах (это могут быть формы 1ед, 3ед непрош., страд.прич.прош.) псевдоаффиксы из набора 1й ступени автоматически меняются на соответствующие им из набора второй ступени. Подобным образом формулируется правило положения окончания внутри основы, приведем его дословно: "Если по схеме ударения данного глагола ударение в некоторой форме должно падать на основу, оно падает на тот же (по счету от начала) слог основы, что в инфинитиве; если же это невозможно ввиду того, что основа данной формы не насчитывает нужного числа слогов, ударение падает на последний слог основы".

Система словоизменения [Кузнецов, 2000] лишена подобных условных переходов и представляет собой подробную классификацию всех словоизменительных типов. Имея в качестве основы систему признаков [Зализняк, 1977], она, тем не менее, имеет ряд важных отличий.

Конечным продуктом системы, как только что было сказано, являются более мелкие единицы. Они получаются на второй ступени классификации, сразу после деления на классы, применением всех признаков к каждому типу (таблице). Иерархичность признаков отсутствует. В ряд признаков включено чередование основ. Также как отдельный признак рассматривается возвратность глагола, которая в [Зализняк, 1977] не учитывается после автоматического отсечения постфикса.

Подход С.А. Кузнецова к потенциальным формам отличен от подхода А.А.Зализняка. Если последний считал их полноправными участниками формообразования, то первый избегает их появления и вводит дефектность глагольной парадигмы (лакуной здесь в первую очередь является форма страд.прич.прош.) в качестве различительного признака в построении классификации.

В [Кузнецов, 2000] используется иной способ разбиения на классы, т.е. имеется различие в формулировке различительного признака "соотношение глагольных основ". Специально для данного признака вводится символ, не входящий в буквенный состав слов: интервокальный [j]. За счет данного изменения классификация получается более дробной; так 4му классу в [Зализняк, 1977] соответствует два класса [Кузнецов, 2000]: 6й (соотношение "и"-Со) и 10й (соотношение "и"=[j]= Го). Всего в системе словоизменения [Кузнецов, 2000] 27 классов; в последнем из них собраны типы, объединяющий словоизменение двух или меньше глаголов. Каждый класс далее подразделяется на типы, или, в обозначения [Кузнецов, 2000], таблицы спряжения. Таблицы устроены следующим образом: в описании указываются вид, переходность, возвратность, количество основ и особенности их чередования, соотношение тематических элементов, стандартные отклонения в образовании причастий и повелительного наклонения, наличие дефектов парадигмы и малоупотребительность форм. Далее приводится пример глагола и его сокращенной (суженной) парадигмы, в акцентуированной записи. Количество типов (таблиц) в различных классах варьируется: от десяти (3й класс) до 425 (6й класс).

Базовое сходство различительных признаков описанных классификаций делают их сравнение осуществимым, в то время как различия в них же делают его содержательным. Авторитетность и широкое использование на данный момент одной из систем ([Зализняк, 1977]), а также детальность и полнота другой ([Кузнецов, 2000]) позволяют полагать, что рассмотрение именно их может оказаться полезным в дальнейшем для построения единой словоизменительной базы данных русских глаголов.

Унификация формальной модели глагольного словоизменения

Как было указано выше, практической частью работы является таблица в формате .xls, содержащая описание с помощью различительных признаков невозвратных переходных глаголов 6-го класса РГ с указанием их индексов по [Зализняк, 1977]. В данной части будут приведены структура таблицы, процедура заполнения таблицы и возникшие в процессе работы проблемы.

Каждая строка сводной таблицы соответствует одному словоизменительному типу [Кузнецов, 2000], и содержит в своих ячейках набор значений различительный признаков и некоторые другие сведения. Столбцы таблица имеет следующие. Общее: номера таблиц в [Кузнецов, 2000], уникальность глагола в таблице по [Кузнецов, 2000], глагольный вид; далее следующие значимые для письменной формы текста признаки: чередование глагольных основ, с указанием чередующихся элементов и форм с чередованием, образование повелительного наклонения единственного и множественного числа, набор личных окончания непрошедшего времени, наличие страдательных форм на -ся; признак, значимый для текстов с расстановкой "ё": образование форм страдательного причастия прошедшего времени; следующие столбцы передают признаки, релевантные только для устной формы: ударения в формах непрошедшего, прошедшего времени, причастиях действительного залога настоящего времени. Наконец, столбец после признаков указывает индексы из [Зализняк, 1977], затем даются примеры, последние столбцы отведены для различных комментариев.

Выбор строк с одной стороны естественен, т.к. необходимо было описать все типы более дробной классификации [Кузнецов, 2000]; с другой же стороны он задает направление сопоставления, т.е. отправной точкой и предметом наблюдения является именно поведение типов [Кузнецов, 2000], классификация [Зализняк, 1977] оказывается вторичной. Попытка построения обратного соответствия также была предпринята, однако ее трудно назвать сколько-нибудь законченной, поэтому в рамках данной работы разбор такого соответствия описан не будет.

Набор признаков содержит все ступени иерархической классификации глагольных типов [Зализняк, 1977], включая стандартные отклонения (все они также лежат в основе системы [Кузнецов, 2000], как уже было отмечено). К ним были добавлены признаки: чередования основ, как первостепенно важный для формального анализа письменного текста; наличия форм страдательного залога, как учитывавшийся для различения типов в [Кузнецов, 2000] и важный для построения полной парадигмы. Выбор признаков также преследовал цель максимально разделить все типы [Кузнецов, 2000]. И, наконец, нужно отметить, что не указываются признаки, не участвующие в делении рассматриваемого класса глаголов.

Заполнение таблицы производилось следующим образом. Из описания каждой таблицы вычленялись значения указанных признаков и записывались в соответствующую строку. Затем приводился пример и указывался индекс [Зализняк, 1977] для него (точнее говоря, часть индекса). При всех трудностях "вычленения" была возможность обратиться к парадигме глагола, построенной в образце. Все глагольные формы, образование которых согласно [Кузнецов, 2000] представлялось сомнительным, исправлялись согласно мнению современного носителя. Получившаяся таблица после проверки была отсортирована по значениям столбцов, начиная со столбца С.

В процессе заполнения встретилось несколько явных погрешностей в таблицах [Кузнецов, 2000] и некоторое количество неочевидных погрешностей. К первым относятся: указание несуществующих форм (таких как повелительное наклонение "мысль", личные формы "чистат" и другие); все подобные ошибки были исправлены и выделены. Ко вторым относятся встреченные в некоторых таблицах несовпадения описания и образца; в таких случаях набор признаков записывался согласно образцу, и соответствующая строка помечалась в столбце Р "комментарий".

Могут также показаться ошибками следующие несоответствия, сохраненные в сводной таблице. В некоторых случаях (например, в строках 12, 16, 17) набор значений признаков и индекс по [Зализняк, 1977] не совпадают. Это связано с тем, что индексы соответствуют конкретному глаголу примера, а описание конкретного глагола в системах могло не совпадать; маловероятно, что различия вызваны сроком в 25 лет, который прошел между моментами составления систем: скорее дело в некоторых особенностях подходов авторов. Признаками, в значениях которых чаще всего (практически только в них) встречались расхождения, являются особенности образования форм повелительного наклонения единственного и множественного числа. Согласно индексам, в системе [Зализняк, 1977] вариативность в этих значениях проявляется чаще, чем в [Кузнецов, 2000], т.е. указывается большее количество допустимых форм, а это снова отсылает нас к подходам ААЗ и САК к потенциальным формам. Трудность в расценке таких случаев заключается в том, что сложно оценить самостоятельно реальность существования вариантов; в дальнейшем планируется произвести такую оценку с помощью обращения к корпусу.

Столбец О сводной таблицы имеет заголовок "совпадения". Данный столбец содержит пометы напротив некоторых строк (например "совпад.: 228=257", строка 9) в тех случаях, когда указанные в строках значения совпадали по всем различительным признакам. Действительно, после сортировки можно было явным образом увидеть идентичные по всем параметрам таблицы. Нам остается непонятной причина, по которой автор классификации проводил деление таких таблиц, по крайней мере, на формальном уровне подобная дробность представляется избыточной. В столбце Р приводятся значения ряда других несистематизированных признаков, в основном они указывают на употребимость тех или иных форм; однако, хотя некоторые совпадающие типы и могут быть различены по этим признакам, их мало. Сравнить глаголы совпадающих типов можно, найдя их по пометам в столбце О.

Заключение

Принимая во внимание полученную таблицу типов, можно сформулировать несколько предложений для дальнейшего построения базы данных глагольного словоизменения. Для анализа письменного текста признаки, указанные в столбцах J, K, L не представляют интереса, поэтому можно уменьшить дробность классификации, сузив ее и склеив некоторые типы. Также, вероятно, необходимо склеить таблицы, которые и при данном наборе являются идентичными.

Особый интерес представляют собой все "сомнительные" случаи формообразования, для которых обнаружились несовпадения в описаниях [Зализняк, 1977] и [Кузнецов, 2000]. Решения подобных спорных вопросов проще всего найти в корпусе, что и планируется сделать в дальнейшем. Однако перед этим необходимо решить вопрос о целесообразности детального подхода к потенциальным формам. С одной стороны, выбор, сделанный в [Кузнецов, 2000], выгоден с точки зрения морфологического синтеза, т.к. не позволит породить неупотребительные формы. С другой же стороны, вариативность, возможно, подвержена изменчивости, и, т.о., срок сохранения ситуации будет небольшим; кроме того, образование потенциальных форм по продуктивным моделям достаточно частотно, и, ограничивая его, мы рискуем не охватить весь материал.

В целом, как и ожидалось, классификация словоизменительных типов [Кузнецов, 2000] показала себя как более детальная, возможно, в некоторых случаях чересчур детальная. Ее универсальность, а также отсутствие автоматических переходов представляются выгодными для представления глагольной словоизменительной системы в виде базы данных.

Литература

Зализняк А.А. Грамматический словарь русского языка. Словоизменение. М, 1977 Зализняк А.А. Русское именное словоизменение. М., 1977

Коваль С.А. Лингвистические проблемы компьютерной морфологии. СПб, 2005

Кузнецов С.А. Глагольное словоизменение и формообразование в современном русском языке. Автореферат диссертации на степень доктора филологических наук. СПб, 2000а

Кузнецов С.А. Русский глагол: Формообразовательный словарь-справочник. СПб, 2000


Подобные документы

  • Изучение правил спряжения в русском языке - изменения глагола по видам, наклонениям (изъявительному, повелительному, условному), временам, числам, лицам и родам. Продуктивные и непродуктивные классы глаголов. История форм прошедшего и будущего времени.

    реферат [18,6 K], добавлен 29.04.2012

  • Положение русского языка в мире, популяризация русского языка и литературы. Положение ударения в фонетической структуре слова и развитая система словоизменения с помощью окончаний (флексий) и приставок. Лексические заимствования в современном языке.

    творческая работа [13,3 K], добавлен 02.04.2010

  • Причины и основные направления реформирования русского языка. Анализ и ключевые моменты основных реформ русского языка, оказавших влияние на современную речь и орфографию. Определение перспективы дальнейшего развития русского разговорного языка.

    курсовая работа [31,5 K], добавлен 19.03.2015

  • Определение фонетики. Изучение фонетической системы русского языка, которая состоит из значимых единиц речи - слов, форм слова, словосочетаний и предложений, для передачи и различения которых служат фонетические средства языка: звуки, ударение, интонация.

    реферат [122,0 K], добавлен 06.12.2010

  • Особенности русского словесного ударения. Слабые участки в системе акцентологических норм. Ударения в именах существительных, прилагательных, причастиях и в глаголах. Произносительные нормы русского языка и фонетические законы. Нормы и стили произношения.

    презентация [751,4 K], добавлен 10.04.2017

  • Исследование истории возникновения языков. Общая характеристика группы индоевропейских языков. Славянские языки, их схожесть и отличия от русского языка. Определение места русского языка в мире и распространение русского языка в странах бывшего СССР.

    реферат [239,6 K], добавлен 14.10.2014

  • Изучение лексикологической и морфологической функций ударения в русском языке. Анализ особенностей фонетического объединения слов в одно целое. Характеристика акцентных систем: монотонии и политонии. Обзор формирования современного русского произношения.

    контрольная работа [44,2 K], добавлен 21.06.2012

  • Знакомство с процессом развития речи младших школьников. Характеристика основных лингвистических словарей русского языка. Нормированность речи как ее соответствие литературно-языковому идеалу. Анализ типов норм современного русского литературного языка.

    дипломная работа [130,1 K], добавлен 11.02.2014

  • История исследований грамматических категорий, связанных с временными отношениями и способами протекания действия. Передача аспектуальных значений способов глагольного действия (на материале временных форм passе simple, passе composе, imparfait).

    курсовая работа [44,0 K], добавлен 12.09.2012

  • Словообразовательная система русского языка XX столетия. Современное словопроизводство (конец ХХ века). Словарный состав русского литературного языка. Интенсивное образование новых слов. Изменения в семантической структуре слов.

    реферат [23,2 K], добавлен 18.11.2006

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.