Статистические методы в фонетическом экспериментальном исследовании
Сравнение статистических методов в лингвистической литературе. Экспериментально-фонетическое исследование методов статистической обработки. Анализ вариативности в рядах данных выборок и выявление статистически значимых расхождений между рядами данных.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | русский |
Дата добавления | 30.09.2018 |
Размер файла | 16,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СТАТИСТИЧЕСКИЕ МЕТОДЫ В ФОНЕТИЧЕСКОМ ЭКСПЕРИМЕНТАЛЬНОМ ИССЛЕДОВАНИИ
Ненашева Ю. А.
Использование статистических методов при обработке данных, полученных в результате экспериментального исследования, является важным компонентом успеха самого экспериментального исследования. Крайне важным представляется не только получение самих данных, но и проведение сравнительного анализа, результаты которого позволят объективно оценить их лингвистическую значимость.
В лингвистической литературе, к большому сожалению, мало внимания уделяется объяснению и сравнению самих статистических методов. Это представляется большим упущением, поскольку описание статистических методов позволяет исследователям расширить инструментарий при проведении экспериментального исследования. В отечественной лингвистической литературе можно отметить несколько авторов, занимавшихся изучением данной проблемы. В их числе следует назвать известную работу проф. Головина Б. Н. «Язык и статистика» (1971). Проблемами статистической обработки экспериментальных данных занимались также Артемов В. А., Бухтилов Л. Д., Златоустова Л. В., Потапова Р. К., Кантер Л. А. и др. В зарубежной лингвистике в своих исследованиях методы статистической обработки данных активно используют E. Grabe, J. Fletcher, P. Warren, а также Ladd R., и др.
В настоящей работе при описании методов статистической обработки данных представляется целесообразным опираться на результаты проведенного экспериментально-фонетического исследования [Ненашева, 2007]. Звуковой материал, использованный в исследовании, является частью базы данных, созданной в рамках проекта IViE, авторами которого являются E. Grabe, B. Post, F. Nolan (Oxford Phonetic Laboratory). Звуковой материал представлен речью носителей девяти региональных разновидностей британского варианта современного английского языка: Ньюкасл, Лондон, Лидс, Ливерпуль, Кембридж, Кардифф, Дублин, Бредфорд, Белфаст.
Дикторские реализации были подвергнуты обработке при помощи программы PRAAT 4.3. Результаты инструментального анализа были собраны в таблицы для дальнейшей статистической обработки. Математико-статистическая обработка полученных таблиц данных производилась при помощи программы Microsoft Office Excel 2003.
Целью математико-статистической обработки данных являлось определение вариативности в рядах данных выборок и выявление статистически значимых расхождений между рядами данных, что свидетельствует о существенных, с точки зрения статистики, различиях исследованных акустических параметров.
В проведенном исследовании статистический анализ использовался совместно с аналитической группировкой данных. Группировка данных по признаку - фактору позволяет установить связь между группами данных акустических параметров. В проведенном исследовании была использована однофакторная группировка данных, то есть сравниваемые ряды данных объединялись по одному признаку - фактору. Предполагалось, что наличие этого фактора влияет или не влияет на вариативность определенного акустического параметра. В качестве группировочных признаков были приняты следующие факторы: значение коммуникативного типа высказывания, региональная принадлежность дикторов, функциональное деление фонетической синтагмы.
Математико-статистическая обработка данных проводилась с использованием абсолютных и относительных величин. Абсолютные величины представляют собой замеряемые при помощи инструментального анализа значения акустических параметров. Относительные величины позволяют объективизировать данные, а также измерить и характеризовать соотношение абсолютных величин.
Дальнейшая обработка данных представляла собой движение в двух направлениях: в работе Б. Н. Головина [Головин, 1971, с. 36] упоминается коэффициент вариации, являющийся критерием степени вариативности в ряду данных. Коэффициент вариации вычисляется по формуле: v??, где ? - среднеквадратичное отклонение, а x - среднее значение параметра. Колебание параметра в ряду данных считается статистически незначимым, если значение коэффициента вариации не превышает 40%. Однако, при использовании коэффициента вариации была отмечена определенная степень неточности: практически все ряды данных показали статистически незначимую вариативность параметров. Применение критерия Стьюдента также оказалось недостаточно информативным, поскольку позволяет оценить степень расхождения данных в пределах двух сравниваемых групп. Предварительная же группировка исследуемых единиц предполагала наличие большего количества сравниваемых групп.
Для статистической оценки существенности расхождения рядов данных был использован однофакторный дисперсионный анализ [Елисеева, Юзбашев, 2001, с. 211], с выделением групп по одному фактору. Результаты дисперсионного анализа зависят от числа групп, выделенных по группировочному признаку. Статистическая достоверность составляет 95%. Уровень значимости (?) признается равным 0, 05.
На основании дисперсионного анализа проводятся три оценки общей дисперсии - пропорциональные степени свободы. Отношение сумм квадратов отклонений к соответствующему числу степеней свободы позволяет оценить существенность влияния группировочного признака - фактора на результативный признак. Иными словами, ответить на вопрос, влияет ли этот признак - фактор на реализацию акустических параметров речи.
Полученное значение F-критерия сравнивалось со значением Fкр (критическое). Полученное значение критерия позволяет оценить степень расхождения в рядах данных и представляет собой отношение выборочных дисперсий - оценок одной и той же общей дисперсии. Расхождения между рядами данных признаются статистически значимыми, если значение F-критерия равно или превышает значение Fкр. При этом величина сравниваемых коэффициентов позволяет оценить степень расхождения рядов данных. При значительном расхождении сравниваемых критериев следует сделать вывод о значительном различии между рядами данных акустического параметра, обусловленном воздействием признака, лежащего в основе группировки данных.
В приводимых иллюстрациях, результаты проведенного анализа представлены в виде таблиц. Сравнительный анализ данных проводился по следующим базовым акустическим параметрам, внутри каждого параметра выделяются измеряемые величины - абсолютные и относительные [Ненашева, 2007, с. 53-54]:
1.Временные характеристики.
2.Динамические характеристики.
3.Тональные характеристики.
Таблица 1 отражает коэффициент вариации параметра длительности синтагмы и ее частей, вычисляемый по формуле, представленной в работе Б. Н. Головина [Головин, 1971, с. 36].
Таблица 1. Коэффициент вариации параметра длительности синтагмы и ее частей (%)
Общая длительность синтагмы |
Предшкала |
Шкала |
Ядро |
Заядерная часть |
||
Общий вопрос |
20, 9 |
- |
26, 5 |
24, 9 |
35, 6 |
|
Специальный вопрос |
19, 3 |
- |
30, 6 |
25, 4 |
31, 9 |
|
Повествовательное высказывание |
18, 1 |
31, 7 |
25, 4 |
24, 8 |
33, 5 |
Коэффициент не отражает наличия значимого расхождения между рядами значений длительности исследуемых коммуникативных типов высказываний [Ненашева, 2007, с. 60]. Однофакторный дисперсионный анализ позволил обнаружить статистически значимые расхождения (значение F=32, 8 при Fкр=3, 014). Большое значение критерия позволяет определить степень различия между данными параметра длительности высказываний разных коммуникативных типов.
Статистически значимые расхождения между значениями длительности исследуемых высказываний сохраняются в представленных в исследовании региональных группах дикторов (F варьируется от 3, 8-7, 36, при Fкр=3, 17). При изменении группировочного признака - региональной принадлежности говорящих значимость различий сохраняется, хотя значение критерия значительно уменьшается.
Таблица 2 отражает вариативность параметра интенсивности высказывания, оцениваемого при помощи коэффициента вариации.
Таблица 2. Коэффициент вариации минимальных, максимальных и средних значений интенсивности в высказываниях исследуемых коммуникативных типов (%)
Минимальное значение интенсивности |
Максимальное интенсивности |
значение |
Среднее значение интенсивности |
||
Общий вопрос |
19, 7 |
11 |
11, 6 |
||
Специальный вопрос |
17, 9 |
11 |
11, 7 |
||
Повествовательное высказывание |
21, 2 |
11, 1 |
12 |
Дисперсионный анализ показал, что минимальные значения интенсивности исследуемых коммуникативных типов высказываний обнаруживают статистически значимые расхождения (F=7, 1 при F кр=3, 014). Максимальные значения интенсивности исследуемых высказываний не обнаруживают статистически значимых расхождений (F=0, 184 при F кр=3, 014).
Средние значения интенсивности высказываний, представленных в исследовании коммуникативных типов, также не обнаруживают статистически значимых расхождений (F=0, 53 при F кр=3, 014) [Там же, с. 75]. Полученные значения показывают, что максимальные и средние значения интенсивности высказывания, кореллирующей с параметром громкости, не проявляют значимых различий, то есть, по сути, являются одинаковыми для всех региональных групп и всех типов высказываний.
Таблица 3 отражает вариативность тонального параметра [Там же, с. 89].
Таблица 3. Коэффициент вариации минимальных, максимальных и средних значений ЧОТ (%)
Минимальное значение ЧОТ |
Максимальное значение ЧОТ |
Среднее значение ЧОТ |
||
Общий вопрос |
37, 1 |
36, 8 |
31 |
|
Специальный вопрос |
34, 8 |
39, 6 |
30, 9 |
|
Повествовательное высказывание |
34, 7 |
37, 9 |
30, 2 |
Минимальные значения ЧОТ всех представленных в исследовании типов высказываний, обнаруживают статистически значимые расхождения между рядами данных (F=99, 8 при Fкр=3, 014), тогда как минимальные значения ЧОТ в общих и специальных вопросах не обнаруживают статистически значимых расхождений, обусловленных влиянием регионального фактора (F=1, 03; 1, 37 при Fкр=1, 99). Минимальные значения ЧОТ в повествовательных высказываниях обнаруживают статистически значимые расхождения, обусловленные региональной принадлежностью говорящих (F=2, 05 при Fкр=1, 99). Максимальные значения ЧОТ исследуемых высказываний обнаруживают статистически значимые расхождения между рядами данных коммуникативных типов высказываний (F=103 при Fкр=3, 014). Статистически значимых расхождений, обусловленных влиянием регионального фактора, между максимальными значениями ЧОТ в исследуемых коммуникативных типах высказываний не найдено (F=0, 54; 1, 29; 1, 92 при Fкр=1, 99). Средние значения ЧОТ представленных в исследовании коммуникативных типов высказываний не обнаруживают статистически значимых расхождений (F=2, 07 при Fкр=3, 014). Это свидетельствует о том, что тональный параметр (в минимальном значении) в высказываниях в форме вопроса реализуется во всех представленных региональных группах одинаково, тогда как в повествовательном высказывании проявляется больше региональных особенностей, выражающихся в вариативности тонального компонента интонационного комплекса высказывания. Максимальные и средние значения тонального параметра реализуются одинаково вне зависимости от региональной принадлежности говорящих.
Таким образом, статистическая обработка данных, полученных в результате инструментального анализа, позволяет создать объективную картину взаимодействия экстралингвистических факторов, участвующих в создании звуковой оболочки языкового знака и определяющих ее важнейшие характеристики. Необходимо использование широкого ряда статистических инструментов, которые позволяют более глубокое и подробное описание акустических параметров высказывания, которое в свою очередь способствует созданию просодической модели высказывания. Это оказывается чрезвычайно информативным и полезным для возможного математического описания интонационной модели высказывания и создания в дальнейшем алгоритма синтеза речи с более вариативными просодическими характеристиками.
лингвистический статистический фонетический
Список использованной литературы
1.Бухтилов Л. Д. К вопросу обработки акустических параметров просодических характеристик речи // Экспериментальная фонетика. Минск, 1975.
2.Головин Б. Н. Язык и статистика. М.: Просвещение, 1971. 191 с.
3.Елисеева И. И., Юзбашев М. М. Общая теория статистики. М.: Финансы и статистика, 2001. 480 с.
4.Златоустова Л. В. и др. Общая и прикладная фонетика / Л. В. Златоустова, Р. К. Потапова, В. И. ТрунинДонской. М.: Изд-во МГУ, 1986. 303 с.
5.Кантер Л. А. Системный анализ речевой интонации. М.: Высшая школа, 1988. 127 с.
6.Ненашева Ю. А. Кодификация фонетической нормы в интонационном контуре нейтральных высказываний в современном английском языке (экспериментально-фонетическое исследование): дисс. … канд. филол. наук: 10.02.04. Нижний Новгород, 2007. 296 с.
Размещено на Allbest.ru
Подобные документы
Проблема методов лингвистической науки. Основные допущения и термины. Основные экспериментальные приемы, процедуры анализа и типы дистрибутивных отношений на фонетическом уровне. Процедуры отождествления. Анализ пар неэквивалентных высказываний.
реферат [48,1 K], добавлен 14.12.2008Диалекты китайского языка и причины лексических расхождений в них. Лексические расхождения между путунхуа и диалектными группами у, юэ, минь, хакка. Анализ расхождений в лексике на примере нормативных говоров крупных диалектных групп китайского языка.
дипломная работа [2,8 M], добавлен 16.09.2016История изучения стилеметрии - прикладной филологической дисциплины, занимающейся измерением стилевых характеристик с целью систематизации и упорядочения текстов и их частей. Объект и предмет стилеметрии, методы анализа филолого-статистических данных.
реферат [334,2 K], добавлен 12.04.2015Понятие лингвистического исследования и его основные методы. Типичные недостатки в применении лингвистических методов. Правильный подбор метода лингвистического исследования на примере использования сравнительно-исторического метода в области грамматики.
курсовая работа [44,0 K], добавлен 05.11.2013Становление лингвистической географии. История возникновения лингвогеографии в Европе. Основные понятия этой науки. Развитие лингвистической географии в России. Картографирование языковых явлений. Диалектное членение русского языка. Ареальная лингвистика.
курсовая работа [74,8 K], добавлен 07.01.2009Внутренние факторы развития лингвистической науки как предпосылки становления младограмматизма. Развитие младограмматического направления, его основные черты. История Московской лингвистической школы. Шахматов как один из ведущих представителей МЛШ.
реферат [19,0 K], добавлен 21.06.2010Становление структурной лингвистики на рубеже XIX – ХХ веков. Статистические методы в изучении языка. Применение математических методов в лингвистике во второй половине ХХ века. Изучение языка методами формальной логики. Особенности машинного перевода.
курсовая работа [110,1 K], добавлен 27.02.2010Выявление словосочетаний, которые нельзя вычленить из предложения, связи между словами в данных словосочетаниях. Характеристика предложений по коммуникативной направленности. Тип сказуемого в двусоставных предложениях. Синтаксическая функция инфинитива.
контрольная работа [14,0 K], добавлен 01.06.2010Выявление отличительных особенностей детской речи на различных уровнях языка. Исследование детского словотворчества на фонетическом и морфолого-синтаксическом уровнях языка как феномена. Лингвистическая традиция анализа речи детей разных возрастных групп.
дипломная работа [79,8 K], добавлен 13.05.2015Рассмотрение проблемы обучения иностранным языкам в XXI веке. Характеристика интерактивных методов обучения. Сравнительный анализ двух методик - традиционной и интерактивной. Особенности применения методов проектов, кейса, кластера, "мозгового штурма".
курсовая работа [119,1 K], добавлен 06.08.2015