Дистрибутивный анализ лингвистических исследований

Основные экспериментальные приемы, применяемые в дистрибутивном анализе. Основные операции и элементы этапов проведения дистрибутивного анализа: фонологического, морфемного, морфосинтаксического и синтаксического уровней, их задачи и результаты.

Рубрика Иностранные языки и языкознание
Вид реферат
Язык русский
Дата добавления 21.12.2011
Размер файла 27,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ГОУ ВПО «СУРГУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

ХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ ОКРУГ - ЮГРА

ФАКУЛЬТЕТ ЛИНГВИСТИКИ

КАФЕДРА ЛИНГВИСТИКИ И МЕЖКУЛЬТУРНОЙ

КОММУНИКАЦИИ

РЕФЕРАТ

Дистрибутивный анализ лингвистических исследований

Выполнила

студентка группы 0791(а), II курса

факультета лингвистики

Кравчук Евгения Александровна

Сургут, 2011г.

Введение

Одной из узловых проблем общего языкознания является проблема методов лингвистической науки. Преобладание того или иного метода в определенную историческую эпоху может даже определять общий характер развития языкознания.

Сами конкретные методы лингвистических исследований обладают довольно большим разнообразием. Они сильно варьируют в зависимости от характера объекта, цели исследования и выбранного лингвистом аспекта исследования, например, существуют особые методы расшифровки текстов на неизвестных языках, специальные методы исследования фонетических характеристик звуков языка, методы сбора языкового материала в полевых условиях, особые лингвосоциологические методы, методы изучения истории литературных языков и т.д. Словом, чуть ли не каждая область языка может иметь специфические методы, предназначенные для ее изучения.

Выдвижение в качестве предмета изучения структурных свойств языка требует особых методов, значительно более сложных, чем простое наблюдение и классификация единиц речи.

Дистрибутивный анализ как особая методика исследования языка сформировалась в аме6риканской дескриптивной лингвистике. В 40-60-е годы появились многочисленные работы, посвященные описанию отдельных сторон фонетики, морфологии, синтаксиса языков различного строя.

Одним из важных следствий, вытекающих из работ дескриптивистов, является постановка вопроса о моделировании лингвистического исследования. Модели, имитирующие исследовательскую деятельность лингвиста, предназначаются для того, чтобы обосновать выбор основных понятий, которыми он пользуется при построении грамматики или другого описания языка. В идеале они сводят до минимума роль субъективного фактора в исследовании. По сложности проблематики модели такого типа стоят рядом с моделями творческой деятельности и научного поиска вообще.

Эти процессы могут рассматриваться как кибернетические процессы обработки информации.

Дескриптивная лингвистика не выдвинула своей концепции языка как предмета исследования. Ее задачи сводятся к описанию структуры плана выражения, который рассматривается в отвлечении от плана содержания. Структура языка анализируется в терминах дистрибутивных отношений (распределений) элементов различных ярусов. Конечный результат исследования заключается в построении компактного описания языка, которое обеспечивало бы понимание и построение любых высказываний на данном языке. Никаких дополнительных ограничений на форму описания не налагается, поэтому допустимы расхождения в результатах анализа у разных исследователей, работающих с одним и тем же материалом. Описания, выполненные с помощью дистрибутивных методов, предназначаются для использования в других лингвистических разделах (сравнительное изучение языков, диалектология и т.д.).

Такое ограничение задач способствовало разработке практических процедур анализа, которые применялись в процессе построения описания. Была сделана попытка изложить дистрибутивные методы как строгую систему исследовательских приемов, которая не имеет аналогии в языкознание предшествующего периода.

Этот опыт, однако, не дал идеальных результатов. Оказалось, что процесс исследования языка является весьма сложным и не допускает полной формализации процедур на всех этапах работы.

Основные допущения и термины

В качестве общих неопределяемых понятий в дистрибутивном анализе используются следующие:

Универсум речи (анг. - universe of discourse) - объект исследования. Наряду с этим термином в лингвистике принято употреблять и другие: континуум речи, совокупность текстов, корпус; выборка (анг. - sample), представляющая данный язык или его диалект в ограниченном промежутке времени (синхронном срезе).

Конкретный акт речи (к.а.р.) (анг. - act of communication) - любой отрезок речи одного из участников коммуникации, ограниченный с обеих сторон молчанием. Речь состоит из к.а.р., которые являются однократными, происходят в определенный момент времени. Повторяющиеся отрезки речи являются разными к.а.р. (например: снег, снег, снег…). Описать к.а.р. невозможно из-за многообразия случайных моментов, сопровождающих речь индивидуума.

При описании языка выделяют некоторые существенные черты речи, которые влияют на ее содержание. Понятие существенных признаков также неопределяемо. Каждая наука имеет своим представления о том, что существенно.

Лингвист обычно описывает абстрактные акты речи или высказывания (анг. utterance), - освобожденные от конкретных, ситуативных физических признаков, отрезки речи между двумя паузами.

Получение высказываний связано с операцией отождествления к.а.р. по существенным признакам.

Необходимые условия для такого отождествления: сходство содержания к.а.р.; сходство внешних физических признаков звучания к.а.р.. Степень сходства точно не определяется. По-видимому, нельзя отождествить к.а.р. только на основе подобия в смысле (глаза и очи) или только на базе подобия во внешнем звучании (ключ - «источник» и ключ - «инструмент для отпирания замка»).

В результате мы имеем высказывания, которые имеют разные реализации в речи, каждому высказыванию соответствует множество к.а.р..

Термин высказывание соответствует различным текстовым отрезкам: слову, звуку, фразе, предложению.

Принимается фундаментальная гипотеза о том, что непрерывные акты речи (а.р.) делятся на части, называемые сегментами. Высказывание рассматривается как дискретная последовательность отрезков речи, звуковых или морфемных сегментов, цепочек морфем и т.д. Возможны различные способы сегментации текста, повторные операции сегментации на каждом этапе описания. Сегмент - это отрезок речи, вычленяемой в данной последовательности к.а.р..

Понятие сегмента занимает важное место в дистрибутивном анализе. Дескриптивисты строго разграничивают операции сегментирования и последующие операции отождествления сегментов. В этом состоит принципиальное отличие их от традиционной лингвистики, которая обычно не ставит вопроса о сегментации речевого материала. При этом либо безоговорочно принимаются графические и орфографические членения текста, либо процедуры сегментации включаются в само описания и классификацию единиц речи. В методическом отношении оказывается очень важным не смешивать сегментацию с классификацией. При этом подходе допускается гипотетическое расчленение текста, которое в случае неточностей или обнаруженных в последствии ошибочных решений может быть изменено, т.е. может быть проведена пересегментация.

Сегмент противопоставляется элементу. Элемент - это абстрактный сегмент, освобожденный от конкретных ситуативных черт. Элементы определяются путем сопоставления различных отрезков речи, т.е. в результате операции отождествления сегментов по существенным признакам. Элемент - это обозначенный определенным символом сегмент. Так, буквы или транскрипционные знаки используют для обозначения звуковых сегментов. Сегмент принадлежит высказыванию, а элемент - описанию высказываний.

Сегмент и элемент - два важнейших процедурных термина, которые последовательно употребляются на каждом этапе анализа. Остановимся на некоторых дополнительных пояснениях этих понятий:

Сегменты - простейшие отрезки, выделяемые при расчленении континуума высказывания на первом этапе анализа текста. Элементы формируются путем объединения эквивалентных сегментов.

Пример: если мы имеем следующие высказывания, расчлененные на звуковые сегменты:

дарога

дорога

дарога

то можно следующим образом отождествить эквивалентные сегменты:

[дърога]

Сегмент есть всегда отрезок текста, принадлежит тексту, элемент же принадлежит описанию, его соотнесенность с текстом опосредована через одну ступень его классификации. Поэтому элемент всегда является сегментом. Обратное же не имеет смысла. Так, в нашем примере [д] = д, [р] = р, [о] = о, [а] = а и другие случаи, когда [ъ] = {а, о}, [г] = {г, г}.

Сегмент можно рассматривать со стороны его состава, его физических признаков (например, взрывность и фрикативность [г]). Элемент не рассматривается по составу, т.к. является цельной единицей.

Аналогично этому сегмент можно рассматривать как часть более сложного сегмента. Элемент обычно рассматривают безотносительно к иерархически более сложным элементам.

В процессе описания многократно осуществляется переход от рассмотрения высказываний как последовательных сегментов к их рассмотрению как цепочек элементов. Шаги перехода можно изобразить на схеме:

к.а.р. высказывание

сегмент элемент

Как видно, движение по циклу (высказывание сегмент элемент высказывание) может проводиться несколько раз. Такая возможность допускается в пределах одного уровня языка, а также при переходе с одного уровня на другой.

Следующее важное понятие - окружение (анг. - environment, position). Окружение элемента - это соседство в акте речи других элементов. Окружения могут быть различными, могут иметь произвольную длину. Так в непосредственное окружение элемента х входят элементы, предшествующие ему (ах, bах и т.д.), или следующие за ним (хс, хсd и т.д.). Полное окружение х включает весь набор элементов в данном высказывании (ахс или bахсd).

Дистрибуция или распределение (анг. distribution) элемента - совокупность всех окружений, в которых он встречается в речи. Дистрибуция представляет собой сумму всех позиций элемента относительно встречаемости других элементов.

О двух (или более) высказываниях или признаках говорят, что они лингвистически, дескриптивно или дистрибутивно эквивалентны, если они идентичны по составу элементов и дистрибутивным отношениям между элементами.

Понятие окружения и дистрибуции коррелятивны между собой так же, как сегмент и элемент. Подобно тому как элементы получаются в результате отождествления эквивалентных сегментов, дистрибуция есть результат типизации всех окружений данного элемента. Процедуры выявления элементов проводятся параллельно с процедурами определения дистрибуций. При этом осуществляется последовательный переход с одного шага анализа на другой и обратно. Учитывая это обстоятельство, можно дополнить схему:

к.а.р. высказывание

сегмент элемент

окружение дистрибуция

Понятия окружения и дистрибуции при нестрогом употреблении терминов часто смешивают друг с другом и отождествляют.

Однако между понятиями дистрибуции и окружения имеется существенное различие: объектами в анализе окружений являются элементы, связанные конъюнкцией (отношением одновременного вхождения - «и»); объектами в анализе дистрибуции являются сами окружения, связанные дизъюнкцией (отношением выбора - «или»). Так, в приведенном примере непосредственное окружение | д | составляет последовательность # | -ъ |. Это окружение, наряду со многими другими входит в дистрибуцию | д |:

# - ъ | дърога |

# - у | дума |

# - р | драка |

Таким образом, дистрибутивный анализ строится на основе синтагматических отношений между элементами. Однако его результаты касаются выделения классов эквивалентных элементов, т.е. охватывают область парадигматики языка.

Основные экспериментальные приемы, применяемые в дистрибутивном анализе:

Ю.Д. Апресян выделяет следующие приемы:

1) Добавление элементов к данной форме.

Например, в английском языке из-за омонимии предлогов и наречий типа up, in, on и др. довольно трудно решить вопрос о грамматической природе этих элементов.

Возьмем два предложения she was brought up by her grandmother - «она была воспитана бабушкой» и she is going up the hill - «она поднимается в гору». Для того чтобы определить, в каком предложении up является предлогом, а в каком наречием, необходимо поставить между глаголом и спорным элементом качественное наречие и проверить, получается ли в результате правильная фраза. Правильность фразы диагностирует предлог (she is going quickly up the hill - «она быстро поднимается в гору»), а неправильность - наречие (she was brought badly up by her grandmother).

2) Опущение элементов из данной формы.

Например, можно опустить косвенное дополнение, которое менее тесно связано с глаголом, чем прямое; прямое же дополнение опускать нельзя: Martin caused me pain - «Мартин причинил мне боль» Martin caused pain - «Мартин причинил боль», но не Martin caused me - «Мартин причинил мне».

3) перестановка элементов данной формы.

Возможность перестановки двух простых предложений в составе сложного указывает на наличие связи сочинения между ними, а невозможность такой перестановки свидетельствует о подчинительном характере этой связи.

Им можно, а вам нельзя Вам нельзя, а им можно.

НО: Она подумала, что собака убежала Собака убежала, что она подумала.

4) Субституция (замена) элемента другим элементом.

Для построения классов (частей речи, словоформ) используется принцип субституции: два элемента входят в один класс, если они способны замещать друг друга в одних и тех же окружениях без нарушения правильности данной фразы. Два элемента x1 и x2 считаются эквивалентными, если для любой правильной фразы вида A1x1A2 существует правильная фраза вида A1x2A2, и наоборот.

В зависимости от того, что считается элементом, окружением элемента и правильной фразой, субституция дает более или менее дробные классы: чем ближе к текстовой единице элемент и его окружение и чем жестче ограничения на правильность фразы, тем более дробными получаются классы. Например, возьмем фразу я читаю книгу. Здесь x1 является слово читаю, которое мы можем заменить на слова беру, открываю и т.д., т.е. на x2: я беру книгу; я открываю книгу.

Аналогично мы можем заменить x1 на x2 и в словах: т…м ( вместо многоточия мы можем поставить или о, или а и т.д.)

В классической дистрибутивной лингвистике в качестве элементов рассматриваются основы, их окружением считаются грамматические морфемы или классы основ и грамматических морфем, а на правильность фраз налагаются жесткие ограничения.

При замене одного элемента другим нельзя забывать о согласовательной связи: это любая синтаксическая связь между существительным и согласуемым словом, при которой форма согласуемого слова зависит от выбора существительного или от формы, в которой оно стоит. Помимо атрибутивной и предикативной связи, к этому типу синтаксический связи относятся

а) связь через предлог из (один из людей, но одна из девушек);

б) связь через глагол (эту затею считают безнадежной, но это дело считают безнадежным);

в) связь со словом «который» в придаточном предложении (дело, в котором, но статья, в которой) и др.

Таким образом, через согласовательную связь определяется ключевое понятие согласовательного класса, т.е. такая совокупность существительных, что любые два ее члена, будучи взяты в любой грамматической форме, требуют при любом типе согласовательной связи одной и той же словоформы любого согласуемого слова.

5) Метод непосредственных составляющих (НС).

Метод НС используется для получения синтаксической информации.

Метод НС основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение - отношение подчинения; 2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.

В ходе анализа устанавливаются как единичные предложения, так и отношения между ними.

Для дальнейших определений, Ю.Д. Апресян вводит понятие ранга. Пара символов XY является синтагмой первого ранга, если в любой содержащей ее правильной конструкции она может быть заменена без нарушения правильности конструкции символом Y, а Y заменен парой XY. Возьмем предложение

Моя подруга купила очень красивое платье

An Nn V D Aa Na

В данном примере синтагмой первого ранга можно считать пару символов DAn (очень красивое платье), которую можно заменить на An (красивое платье).

Синтагмой n-ого ранга называется пара символов XY, если в любой правильной конструкции, где X не входит в состав синтагмы (n - 1)-го ранга, она заменима символом Y, и наоборот. X и Y - непосредственные составляющие синтагмы, причем Y - ядро, X - зависимый элемент. Благодаря этому можно установить синтаксические связи между словоформами и иерархию связей. В приведенном выше примере синтагмами являются AnNn, DAa, NnV и др., причем главным является 2-ой элемент, а зависимым - 1-ый. Каждая синтагма по своим внешним синтаксическим свойствам эквивалентна ядру, взятому в отдельности. Анализ по НС называется свертыванием:

D Ax Ax

Ax Nx Nx

Результирующий элемент предыдущей синтагмы является НС следующей синтагмы, т.е. более простая синтагма может вкладываться в более сложную, выступая в качестве НС последней.

Существует несколько правил свертывания по НС: 1) одновременно можно свертывать не более двух символов в один новый; 2) запрещается перестановка символов; 3) порядок применения правил фиксирован.

Весь процесс анализа предложения (свертывания по НС) может быть изображен тремя способами: в виде правил подстановки, в виде скобочной записи и в виде дерева НС.

Однако эта модель имеет много недостатков: 1) в ряде случаев приводит к грубейшим решениям, поскольку не дает возможности фиксировать различия в синтаксической структуре предложений. Возьмем два предложения:

Изучение событий становится интересным

Развитие событий становится интересным.

В первом случае события являются объектом некоторого действия, во втором же - события являются субъектом действия (они сами развиваются). Анализ по НС не вскрывает этих структурных различий. 2) метод НС не показывает связи между активными и пассивными, утвердительными и отрицательными, утвердительными и вопросительными конструкциями, которые связаны отношением производности. 3) с трудом поддаются анализу экзоцентрические конструкции, конструкции с так называемыми разрывными морфемами и конструкции с аппозитивными элементами вида товарищ Иванов, князь Андрей и др. 4) по настоящему эффективной эта модель является только в рамках простого предложения. 5) не дает возможности ответить на вопрос, что является элементарной единицей языка на синтаксическом уровне.

Основные этапы дистрибутивного анализа

I. Долингвистический этап.

Исходные данные здесь - к.а.р. как физические процессы. Их части имеют физические признаки в каждый данный момент времени (характеризуются амплитудой, частотой и т.д.).

В качестве внешнего понятия используются существенные признаки к.а.р. и одинаковость содержания.

Основные операции на этом этапе: а) сегментирование а.р. на фонологические сегменты; б) классификация сегментов по существенным, смыслоразличительным признакам.

Результат - выделение фонемных элементов как классов конкретных фонологических сегментов.

II. Фонологический этап.

Элементы описания: символы фонологических элементов.

Исходные данные: высказывания, представленные как цепочки фонемных элементов.

Внешнее понятие: физическое сходство фонемных элементов.

Операции: классификация фонемных элементов по критерию дополнительной дистрибуции и физическому сходству.

Результат - выделение фонем как классов фонемных элементов (аллофонов).

III. Морфемный этап.

Элементы: символы фонем.

Исходные данные: высказывания как цепочки фонем.

Внешние пон6ятия: связь цепочки фонем с содержанием (наличие значения) и одинаковость значения.

Операции: а) сегментация - выделение морфемных сегментов как цепочек фонем (минимальных, имеющих значение); введение фиктивных морфемных элементов (для устранения неправильностей и исключений);

б) классификация морфемных сегментов по тождеству состава фонем и по дополнительности.

Результат: выделение морфем как классов морфемных элементов. Их очень много, больше, чем фонем, но теперь они связаны с содержанием.

IV. Морфосинтаксический уровень.

Элементы: символы морфем.

Внешне понятие: грамматическая правильность высказывания.

Операции: а) классификация морфем по взаимной подставимости в любых высказываниях без изменения их грамматической правильности.

б) группировка по критерию дополнительности.

Результат: Выделение класса морфем как множества эквивалентных морфем.

Количество элементов уменьшается за счет эквивалентности корневых и других морфем.

V. Синтаксический уровень.

Элементы: символы классов морфем.

Исходные данные: высказывания как цепочки классов морфем.

Внешнее понятие: фраза в данном высказывании или другой фразе.

Операции: а). Сегментация на фразы, т.е. цепочки классов морфем.

б). Классификация цепочек классов морфем по их взаимозаменяемости во всех высказываниях, где они являются фразами, без изменения грамматической правильности высказываний

в). Выписывание синтаксических уровней.

Результат: Синтаксические уравнения и результирующие классы.

В соответствии с этими этапами описания лингвистическая структура плана выражения складывается из элементов 4-х ярусов:

Синтаксический ярус - позиционные классы и их цепочки.

Морфосинтаксический ярус - классы морфем и их цепочки.

Морфемный ярус - морфемы.

Фонемный ярус - фонемы.

Каждый уровень имеет свой перечень элементов и дистрибутивных отношений между ними.

При переходе к каждому следующему уровню описания сохраняется возможность однозначного возврата к элементам предыдущего уровня. Или, имея высказывание, представленное через элементы некоторого уровня, можно восстановить его представление через элементы предыдущего уровня. Для этого применяются дополнительные данные, получаемые на каждом очередном этапе анализа.

Дистрибутивный анализ представляет собой целостную систему методов описания.

На каждом уровне:

1). Определяется форма получаемой части описания или форма записи, представления классификации.

2). Указывается вид процедуры:

а) выявление элементов на основе внешних понятий,

б) способы классификации,

в) способ получения синтаксических уравнений;

3). Даются практические рекомендации и рецепты, как проводить анализ:

а) интуитивные пояснения на конкретных примерах по аналогии,

б) значение критерия экономности и простоты получаемого описания.

Выводы

Принципы дистрибутивного анализа имеют большое научное значение, прежде всего в том плане, что они углубляют наши знания о процессе отождествления единиц речи. Тождества и различия - это то, на чем держится вся языковая система. Нормальная речевая деятельность осуществляется только при условии четкой работы механизмов отождествления и различия языковых элементов. Анализирую факты языка, лингвист также опирается на интуитивное отождествление и различение объектов текста. Основные процедуры дистрибутивного анализа делают шаг вперед в описании этих интуитивных действий исследователя, они расчленяют процесс идентификации на несколько ступеней.

Методы дистрибутивного анализа с успехом применяются в практике лингвистического исследования. Вместе с тем возникает теоретический вопрос о возможности получения универсального алгоритма вывода грамматики из текстовых данных. Для этого необходимо было бы иметь формальные методы описания материала, которые обеспечили бы однозначное построение грамматики без обращения к внешним понятиям. В настоящее время становится ясным, что такая задача в принципе не разрешима. Именно в силу того, что механизмы речевой деятельности протекают в скрытом от наблюдения виде, на современном этапе невозможна полная формализация анализа языка. В зависимости от внешних, неформальных данных о тексте разные исследователи, применяя приемы дистрибутивного анализа, приходят к несколько различающимся описаниям одного и того же языка.

Ценность этих методов состоит не в том, что они обеспечивают получение полного описания языка. Такая цель едва ли оправдана в отношении большинства языков, в особенности хорошо изученных. Дистрибутивный анализ эффективно применяется для задач дешифровки, которые понимаются достаточно широко. Речь идет не только о дешифровке неизвестной письменности, например, майя, карийского письма.

Любой фрагмент структуры языка может быть дешифрован дистрибутивными методами. Иначе говоря, структурные закономерности языка нуждаются в реконструкции, они не могут быть полностью обнаружены описательными приемами. Свойства сочетаемости элементов друг с другом являются основными характеристиками в их синтагматической развертке. Систематический анализ дистрибутивных признаков в связи с этим позволяет проникнуть во внутреннюю организацию структуры языка на всех его уровнях, начиная с фонологического и вплоть до синтаксического. Более того, дистрибутивные методы успешно применяются и для исследования структур плана содержания. Семантические оппозиции и семантические множители также манифестируются в дистрибутивных свойствах речевых единиц. В целом дистрибутивный анализ приводит к построению различных классификационных (таксономических) описаний языка.

дистрибутивный анализ лингвистический

Список литературы

1. Засорина Л.Н. «Введение в структурную лингвистику», М: «Высшая школа 1974 г.

2. Апресян Ю.Д. «Идеи и методы современной структурной лингвистики», М: «Просвещение» - 1966 г.

3. Степанов Ю.С. «Методы и принципы современной лингвистики», М: «Наука» - 1975 г.

4. «Общее языкознание: методы лингвистических исследований, М: «Наука» 1973 г.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.