Статистические методы в фонетическом экспериментальном исследовании

Сравнение статистических методов в лингвистической литературе. Экспериментально-фонетическое исследование методов статистической обработки. Анализ вариативности в рядах данных выборок и выявление статистически значимых расхождений между рядами данных.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 30.09.2018
Размер файла 16,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

СТАТИСТИЧЕСКИЕ МЕТОДЫ В ФОНЕТИЧЕСКОМ ЭКСПЕРИМЕНТАЛЬНОМ ИССЛЕДОВАНИИ

Ненашева Ю. А.

Использование статистических методов при обработке данных, полученных в результате экспериментального исследования, является важным компонентом успеха самого экспериментального исследования. Крайне важным представляется не только получение самих данных, но и проведение сравнительного анализа, результаты которого позволят объективно оценить их лингвистическую значимость.

В лингвистической литературе, к большому сожалению, мало внимания уделяется объяснению и сравнению самих статистических методов. Это представляется большим упущением, поскольку описание статистических методов позволяет исследователям расширить инструментарий при проведении экспериментального исследования. В отечественной лингвистической литературе можно отметить несколько авторов, занимавшихся изучением данной проблемы. В их числе следует назвать известную работу проф. Головина Б. Н. «Язык и статистика» (1971). Проблемами статистической обработки экспериментальных данных занимались также Артемов В. А., Бухтилов Л. Д., Златоустова Л. В., Потапова Р. К., Кантер Л. А. и др. В зарубежной лингвистике в своих исследованиях методы статистической обработки данных активно используют E. Grabe, J. Fletcher, P. Warren, а также Ladd R., и др.

В настоящей работе при описании методов статистической обработки данных представляется целесообразным опираться на результаты проведенного экспериментально-фонетического исследования [Ненашева, 2007]. Звуковой материал, использованный в исследовании, является частью базы данных, созданной в рамках проекта IViE, авторами которого являются E. Grabe, B. Post, F. Nolan (Oxford Phonetic Laboratory). Звуковой материал представлен речью носителей девяти региональных разновидностей британского варианта современного английского языка: Ньюкасл, Лондон, Лидс, Ливерпуль, Кембридж, Кардифф, Дублин, Бредфорд, Белфаст.

Дикторские реализации были подвергнуты обработке при помощи программы PRAAT 4.3. Результаты инструментального анализа были собраны в таблицы для дальнейшей статистической обработки. Математико-статистическая обработка полученных таблиц данных производилась при помощи программы Microsoft Office Excel 2003.

Целью математико-статистической обработки данных являлось определение вариативности в рядах данных выборок и выявление статистически значимых расхождений между рядами данных, что свидетельствует о существенных, с точки зрения статистики, различиях исследованных акустических параметров.

В проведенном исследовании статистический анализ использовался совместно с аналитической группировкой данных. Группировка данных по признаку - фактору позволяет установить связь между группами данных акустических параметров. В проведенном исследовании была использована однофакторная группировка данных, то есть сравниваемые ряды данных объединялись по одному признаку - фактору. Предполагалось, что наличие этого фактора влияет или не влияет на вариативность определенного акустического параметра. В качестве группировочных признаков были приняты следующие факторы: значение коммуникативного типа высказывания, региональная принадлежность дикторов, функциональное деление фонетической синтагмы.

Математико-статистическая обработка данных проводилась с использованием абсолютных и относительных величин. Абсолютные величины представляют собой замеряемые при помощи инструментального анализа значения акустических параметров. Относительные величины позволяют объективизировать данные, а также измерить и характеризовать соотношение абсолютных величин.

Дальнейшая обработка данных представляла собой движение в двух направлениях: в работе Б. Н. Головина [Головин, 1971, с. 36] упоминается коэффициент вариации, являющийся критерием степени вариативности в ряду данных. Коэффициент вариации вычисляется по формуле: v??, где ? - среднеквадратичное отклонение, а x - среднее значение параметра. Колебание параметра в ряду данных считается статистически незначимым, если значение коэффициента вариации не превышает 40%. Однако, при использовании коэффициента вариации была отмечена определенная степень неточности: практически все ряды данных показали статистически незначимую вариативность параметров. Применение критерия Стьюдента также оказалось недостаточно информативным, поскольку позволяет оценить степень расхождения данных в пределах двух сравниваемых групп. Предварительная же группировка исследуемых единиц предполагала наличие большего количества сравниваемых групп.

Для статистической оценки существенности расхождения рядов данных был использован однофакторный дисперсионный анализ [Елисеева, Юзбашев, 2001, с. 211], с выделением групп по одному фактору. Результаты дисперсионного анализа зависят от числа групп, выделенных по группировочному признаку. Статистическая достоверность составляет 95%. Уровень значимости (?) признается равным 0, 05.

На основании дисперсионного анализа проводятся три оценки общей дисперсии - пропорциональные степени свободы. Отношение сумм квадратов отклонений к соответствующему числу степеней свободы позволяет оценить существенность влияния группировочного признака - фактора на результативный признак. Иными словами, ответить на вопрос, влияет ли этот признак - фактор на реализацию акустических параметров речи.

Полученное значение F-критерия сравнивалось со значением Fкр (критическое). Полученное значение критерия позволяет оценить степень расхождения в рядах данных и представляет собой отношение выборочных дисперсий - оценок одной и той же общей дисперсии. Расхождения между рядами данных признаются статистически значимыми, если значение F-критерия равно или превышает значение Fкр. При этом величина сравниваемых коэффициентов позволяет оценить степень расхождения рядов данных. При значительном расхождении сравниваемых критериев следует сделать вывод о значительном различии между рядами данных акустического параметра, обусловленном воздействием признака, лежащего в основе группировки данных.

В приводимых иллюстрациях, результаты проведенного анализа представлены в виде таблиц. Сравнительный анализ данных проводился по следующим базовым акустическим параметрам, внутри каждого параметра выделяются измеряемые величины - абсолютные и относительные [Ненашева, 2007, с. 53-54]:

1.Временные характеристики.

2.Динамические характеристики.

3.Тональные характеристики.

Таблица 1 отражает коэффициент вариации параметра длительности синтагмы и ее частей, вычисляемый по формуле, представленной в работе Б. Н. Головина [Головин, 1971, с. 36].

Таблица 1. Коэффициент вариации параметра длительности синтагмы и ее частей (%)

Общая длительность синтагмы

Предшкала

Шкала

Ядро

Заядерная часть

Общий вопрос

20, 9

-

26, 5

24, 9

35, 6

Специальный вопрос

19, 3

-

30, 6

25, 4

31, 9

Повествовательное высказывание

18, 1

31, 7

25, 4

24, 8

33, 5

Коэффициент не отражает наличия значимого расхождения между рядами значений длительности исследуемых коммуникативных типов высказываний [Ненашева, 2007, с. 60]. Однофакторный дисперсионный анализ позволил обнаружить статистически значимые расхождения (значение F=32, 8 при Fкр=3, 014). Большое значение критерия позволяет определить степень различия между данными параметра длительности высказываний разных коммуникативных типов.

Статистически значимые расхождения между значениями длительности исследуемых высказываний сохраняются в представленных в исследовании региональных группах дикторов (F варьируется от 3, 8-7, 36, при Fкр=3, 17). При изменении группировочного признака - региональной принадлежности говорящих значимость различий сохраняется, хотя значение критерия значительно уменьшается.

Таблица 2 отражает вариативность параметра интенсивности высказывания, оцениваемого при помощи коэффициента вариации.

Таблица 2. Коэффициент вариации минимальных, максимальных и средних значений интенсивности в высказываниях исследуемых коммуникативных типов (%)

Минимальное значение интенсивности

Максимальное интенсивности

значение

Среднее значение интенсивности

Общий вопрос

19, 7

11

11, 6

Специальный вопрос

17, 9

11

11, 7

Повествовательное высказывание

21, 2

11, 1

12

Дисперсионный анализ показал, что минимальные значения интенсивности исследуемых коммуникативных типов высказываний обнаруживают статистически значимые расхождения (F=7, 1 при F кр=3, 014). Максимальные значения интенсивности исследуемых высказываний не обнаруживают статистически значимых расхождений (F=0, 184 при F кр=3, 014).

Средние значения интенсивности высказываний, представленных в исследовании коммуникативных типов, также не обнаруживают статистически значимых расхождений (F=0, 53 при F кр=3, 014) [Там же, с. 75]. Полученные значения показывают, что максимальные и средние значения интенсивности высказывания, кореллирующей с параметром громкости, не проявляют значимых различий, то есть, по сути, являются одинаковыми для всех региональных групп и всех типов высказываний.

Таблица 3 отражает вариативность тонального параметра [Там же, с. 89].

Таблица 3. Коэффициент вариации минимальных, максимальных и средних значений ЧОТ (%)

Минимальное значение ЧОТ

Максимальное значение ЧОТ

Среднее значение ЧОТ

Общий вопрос

37, 1

36, 8

31

Специальный вопрос

34, 8

39, 6

30, 9

Повествовательное высказывание

34, 7

37, 9

30, 2

Минимальные значения ЧОТ всех представленных в исследовании типов высказываний, обнаруживают статистически значимые расхождения между рядами данных (F=99, 8 при Fкр=3, 014), тогда как минимальные значения ЧОТ в общих и специальных вопросах не обнаруживают статистически значимых расхождений, обусловленных влиянием регионального фактора (F=1, 03; 1, 37 при Fкр=1, 99). Минимальные значения ЧОТ в повествовательных высказываниях обнаруживают статистически значимые расхождения, обусловленные региональной принадлежностью говорящих (F=2, 05 при Fкр=1, 99). Максимальные значения ЧОТ исследуемых высказываний обнаруживают статистически значимые расхождения между рядами данных коммуникативных типов высказываний (F=103 при Fкр=3, 014). Статистически значимых расхождений, обусловленных влиянием регионального фактора, между максимальными значениями ЧОТ в исследуемых коммуникативных типах высказываний не найдено (F=0, 54; 1, 29; 1, 92 при Fкр=1, 99). Средние значения ЧОТ представленных в исследовании коммуникативных типов высказываний не обнаруживают статистически значимых расхождений (F=2, 07 при Fкр=3, 014). Это свидетельствует о том, что тональный параметр (в минимальном значении) в высказываниях в форме вопроса реализуется во всех представленных региональных группах одинаково, тогда как в повествовательном высказывании проявляется больше региональных особенностей, выражающихся в вариативности тонального компонента интонационного комплекса высказывания. Максимальные и средние значения тонального параметра реализуются одинаково вне зависимости от региональной принадлежности говорящих.

Таким образом, статистическая обработка данных, полученных в результате инструментального анализа, позволяет создать объективную картину взаимодействия экстралингвистических факторов, участвующих в создании звуковой оболочки языкового знака и определяющих ее важнейшие характеристики. Необходимо использование широкого ряда статистических инструментов, которые позволяют более глубокое и подробное описание акустических параметров высказывания, которое в свою очередь способствует созданию просодической модели высказывания. Это оказывается чрезвычайно информативным и полезным для возможного математического описания интонационной модели высказывания и создания в дальнейшем алгоритма синтеза речи с более вариативными просодическими характеристиками.

лингвистический статистический фонетический

Список использованной литературы

1.Бухтилов Л. Д. К вопросу обработки акустических параметров просодических характеристик речи // Экспериментальная фонетика. Минск, 1975.

2.Головин Б. Н. Язык и статистика. М.: Просвещение, 1971. 191 с.

3.Елисеева И. И., Юзбашев М. М. Общая теория статистики. М.: Финансы и статистика, 2001. 480 с.

4.Златоустова Л. В. и др. Общая и прикладная фонетика / Л. В. Златоустова, Р. К. Потапова, В. И. ТрунинДонской. М.: Изд-во МГУ, 1986. 303 с.

5.Кантер Л. А. Системный анализ речевой интонации. М.: Высшая школа, 1988. 127 с.

6.Ненашева Ю. А. Кодификация фонетической нормы в интонационном контуре нейтральных высказываний в современном английском языке (экспериментально-фонетическое исследование): дисс. … канд. филол. наук: 10.02.04. Нижний Новгород, 2007. 296 с.

Размещено на Allbest.ru


Подобные документы

  • Проблема методов лингвистической науки. Основные допущения и термины. Основные экспериментальные приемы, процедуры анализа и типы дистрибутивных отношений на фонетическом уровне. Процедуры отождествления. Анализ пар неэквивалентных высказываний.

    реферат [48,1 K], добавлен 14.12.2008

  • Диалекты китайского языка и причины лексических расхождений в них. Лексические расхождения между путунхуа и диалектными группами у, юэ, минь, хакка. Анализ расхождений в лексике на примере нормативных говоров крупных диалектных групп китайского языка.

    дипломная работа [2,8 M], добавлен 16.09.2016

  • История изучения стилеметрии - прикладной филологической дисциплины, занимающейся измерением стилевых характеристик с целью систематизации и упорядочения текстов и их частей. Объект и предмет стилеметрии, методы анализа филолого-статистических данных.

    реферат [334,2 K], добавлен 12.04.2015

  • Понятие лингвистического исследования и его основные методы. Типичные недостатки в применении лингвистических методов. Правильный подбор метода лингвистического исследования на примере использования сравнительно-исторического метода в области грамматики.

    курсовая работа [44,0 K], добавлен 05.11.2013

  • Становление лингвистической географии. История возникновения лингвогеографии в Европе. Основные понятия этой науки. Развитие лингвистической географии в России. Картографирование языковых явлений. Диалектное членение русского языка. Ареальная лингвистика.

    курсовая работа [74,8 K], добавлен 07.01.2009

  • Внутренние факторы развития лингвистической науки как предпосылки становления младограмматизма. Развитие младограмматического направления, его основные черты. История Московской лингвистической школы. Шахматов как один из ведущих представителей МЛШ.

    реферат [19,0 K], добавлен 21.06.2010

  • Становление структурной лингвистики на рубеже XIX – ХХ веков. Статистические методы в изучении языка. Применение математических методов в лингвистике во второй половине ХХ века. Изучение языка методами формальной логики. Особенности машинного перевода.

    курсовая работа [110,1 K], добавлен 27.02.2010

  • Выявление словосочетаний, которые нельзя вычленить из предложения, связи между словами в данных словосочетаниях. Характеристика предложений по коммуникативной направленности. Тип сказуемого в двусоставных предложениях. Синтаксическая функция инфинитива.

    контрольная работа [14,0 K], добавлен 01.06.2010

  • Выявление отличительных особенностей детской речи на различных уровнях языка. Исследование детского словотворчества на фонетическом и морфолого-синтаксическом уровнях языка как феномена. Лингвистическая традиция анализа речи детей разных возрастных групп.

    дипломная работа [79,8 K], добавлен 13.05.2015

  • Рассмотрение проблемы обучения иностранным языкам в XXI веке. Характеристика интерактивных методов обучения. Сравнительный анализ двух методик - традиционной и интерактивной. Особенности применения методов проектов, кейса, кластера, "мозгового штурма".

    курсовая работа [119,1 K], добавлен 06.08.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.