Возможности идентификации иноязычных говорящих по голосу и речи экспертными методами

Оценка возможностей первичного распознавания говорящих на незнакомом и интерферированном русском языке с целью их дальнейшей идентификации по голосу и речи. Сопоставление просодического оформления высказывания в речевом поведении иноязычных дикторов.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 23.12.2021
Размер файла 57,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2. поскольку метод предназначен для сравнения фонограмм без ярко выраженной эмоциональной и модальной окраски, в случае необходимости участникам эксперимента следовало удалить из сигнала те участки, которые не соответствуют этому условию;

3. испытуемые должны (по возможности) подобрать элементы контура, имеющие ярко выраженную специфику и несколько примеров реализации в каждой из фонограмм (не менее 5);

4. аудиторы должны провести сравнение голосов в автоматическом режиме.

Параметры выделяемых экспертом на графике основного тона однотипных участков контура, сопоставимых с точки зрения реализационной специфики, коммуникативной и эмоционально-стилистической нагрузки, вычислялись автоматически, данные заносились в таблицу.

Автоматическое сравнение фонограмм осуществлялось на основе полученных средних (пороговых) значений по каждому параметру каждого типа / подтипа элементов мелодического контура. В процессе такого сопоставления для типов / подтипов рассчитывалась степень сходства и различия. Далее результаты сравнения отдельных типов суммировались для получения общего решения относительно тождества либо различия голосов.

При вычислении общего результата учитывались весовые коэффициенты, приписанные каждому параметру и типу фрагмента мелодического контура. Если показатель оценки сходства существенно превышал показатель различий, то вероятность тождества голосов считалась высокой. При высокой степени различий между фонограммами формулировалось решение о различии голосов. При незначительных различиях в оценках (менее 10 %) выдавалось сообщение о невозможности принять решение.

Результаты. Аудиторы группы №1, имеющие опыт экспертной работы более 5 лет, смогли успешно и уверенно выявить сопоставимые сегменты иноязычной речи во всех без исключения случаях. Сегментация сопоставимых фрагментов испытуемыми группы № 2 (опыт работы менее 5 лет) была несколько затруднена в связи с отсутствием навыка восприятия таджикской, цыганской и интерферированной русской речи и потребовала больших временных затрат, однако в целом эту задачу аудиторы также выполнили успешно.

На основе метода анализа мелодического контура аудиторами группы № 1 было установлено 9 лиц, говорящих на таджикском, цыганском и интерферированном русском языках, что составило 100 % от общего количества дикторов, подлежащих идентификации, а испытуемыми группы № 2 - 7 лиц, что составило 77,7 %.

При анализе идентификационных отчетов, выполненных методом анализа мелодического контура высказываний, обнаружилась прямая зависимость между опытом экспертной работы испытуемого и всесторонностью и правильностью проведенных исследований, в частности, полнотой и точностью выделения типов / подтипов фрагментов контура. Так, аудиторы группы № 1 с высокой степенью точности подобрали и проанализировали опорные фрагменты, дали правильные характеристики типов / подтипов синтагм, достаточно точно зарегистрировали наличие тех или иных речевых особенностей, дали им обоснованное толкование, наиболее полно проанализировали наличие в речи дикторов слов и нефонологических элементов, являющихся заполнителями пауз хезитации. Испытуемые группы № 2 также смогли выявить и проанализировать опорные фрагменты синтагмы, однако на выполнение данного задания ими было потрачено существенно больше времени, при этом оценка выявленных признаков затруднений не вызывала.

Таким образом, подготовленные эксперты в спонтанном речевом потоке на таджикском, цыганском и интерферированном русском языках уверенно выявляют и анализируют сопоставимые сегменты в условиях восприятия иноязычной речи. При этом для эффективного использования метода необходимо владеть понятийно-терминологическим аппаратом мелодического анализа и корректно подбирать опорные фрагменты контура для сравнения, соблюдая необходимые условия применимости данного метода.

Заключение

Результаты эксперимента № 2 позволили установить определенный «инвентарь» просодических характеристик, являющихся информативными при идентификации иноязычного диктора. Их статистическая обработка позволила установить следующее.

Диапазон модуляций частоты основного тона в речи дикторов, говорящих на родных таджикском и цыганском языках уже, чем у дикторов-китайцев, говорящих на интерферированном русском языке.

Распределение типичных значений ЧОТ

В связи с возможными различиями в особенностях распределения значений ЧОТ внутри каждой языковой группы, обусловленными гендерным фактором, статистической обработке подвергалась только речь дикторов-мужчин.

Область распределения значений ЧОТ различных типов мелодического контура в таджикской речи располагается в диапазоне частот от 125 Гц до 206 Гц. Большинство ядерных слогов сконцентрировано в области значений от 154 Гц до 187 Гц, при этом они по тональному уровню, как правило, не отличаются от обычных ударных слогов (например, в шкалах и предшкалах). Для цыганского языка характерно схожее распределение значений ЧОТ: минимальное и максимальное значения распределились в диапазоне от 102 Гц до 270 Гц, отличие синтагмы ядерных слогов от других ударных также практически не выражено, область значений ЧОТ в ядре синтагмы распределяется от 163 Гц до 207 Гц. При этом в обеих языковых группах очевидна тенденция к функциональному распределению слогов по тональным уровням в зависимости от ударности: чем более значим слог, тем выше уровень распределения значений основного тона голоса и более однозначна его принадлежность к ядерному участку синтагмы.

В группе дикторов-китайцев, говорящих на русском языке, тональный диапазон распределяется в значениях от 88 Гц до 315 Гц, ядер- ные слоги наиболее часто попадают в диапазон частот от 126 Гц до 292 Гц, при этом другие ударные и безударные слоги реализуются с практически равной частотой основного тона. В качестве дифференцирующего признака ядра испытуемыми отмечалось увеличение силы и (или) громкости произнесения ядерного слога.

Несмотря на то, что количество тональных модуляций у дикторов-китайцев значительно больше, чем у дикторов-таджиков и дикторов-цыган, их речь воспринимается как более однообразная и ровная. Все испытуемые характеризовали китайскую речь как «округло-текучую», с мягкими переходами, вокализованную, эластичную и мелодичную. Речь таджиков и цыган, напротив, характеризуется аудиторами обеих групп как немелодичная, «угловато-отрывистая», с разрывами слов, резкими изменениями громкости.

Особенности паузации

При анализе особенностей паузации в речи таджиков и цыган, говорящих на родных национальных языках, а также в речи китайцев, говорящих по-русски, наблюдается больше сходств, чем различий. В речи всех указанных языковых групп испытуемые отмечали такие виды пауз, как долгие и короткие по длительности, а также заполненные и незаполненные. Незаполненные паузы зафиксированы в речи во всех исследуемых языках и характеризовались в основном как актуализа- торы и (или) способ ограничения фраз без какой-либо дополнительной коннотации; заполненные отмечались испытуемыми гораздо реже и только в случаях хезитации.

Анализ длительности незаполненных пауз показал следующее: короткие незаполненные паузы практически совпадают по длительности в речи на таджикском, цыганском языках и в русской речи китайцев. Длительность коротких незаполненных пауз в речи этнических таджиков составила от 20 мс до 50 мс, цыган - от 15 мс до 40 мс, китайцев - от 25 мс до 60 мс. Длительность долгих пауз имеет следующую область распределения значений: для речи на таджикском языке - 58 мс до 70 мс; на цыганском - от 45 мс до 60 мс; на русском с признаками интерференции китайского - от 63 мс до 80 мс.

Средняя длительность заполненных пауз хезитации в речи таджиков, цыган и китайцев оказалась примерно равной: у дикторов-таджиков от 59 мс до 83 мс, дикторов-цыган - от 50 мс до 77 мс, дикторов-китайцев - от 48 мс до 74 мс.

Общее количество коротких по длительности пауз составило примерно 48,4 % в группе дикторов-таджиков, 39,8 % в группе дикторов-цыган, 52,3 % в группе дикторов-китайцев, говорящих на русском языке. Общее количество длинных незаполненных пауз для таджикской, цыганской и интерферированной русской речи в сумме составило 23,6 %, 25,3 %, 27,7 % соответственно.

Заполненные паузы, как было отмечено выше, зафиксированы испытуемыми только в случаях хезитации, по длительности они оценены всеми как длинные. Среднее количество заполненных хезитационных пауз в речи таджиков, цыган и китайцев оказалось практически равным: 12 %, 14 % и 9 % соответственно.

Основные различия паузации в речи на исследуемых языках наблюдаются в частоте употребления и характере функционирования незаполненных пауз, а также в особенностях заполнения пауз хезитации. Дикторы-таджики и цыгане используют короткие незаполненные паузы для ограничения синтагм (в среднем 69 % случаев), длинные - как метку-дескриптор, актуализирующую высказывание (в среднем 57 % случаев). Этнические китайцы, говорящие на русском языке, используют незаполненные короткие и длинные паузы для ограничения синтагм и выделения фраз примерно в равной пропорции, при этом частота их использования выше - в среднем 86 % и 83 % соответственно. Следовательно, зависимость функции паузы от ее длительности у дикторов-китайцев не настолько стабильная, как в речи таджиков и цыган.

Анализ характера заполнения пауз хезитации позволил установить различия в речи дикторов, говорящих на разных языках.

Для дикторов-таджиков характерно заполнение хезитационных пауз растягиванием конечного гласного; [а]-образное, [э]-образное, [эм]-образное заполнение, при этом реализуется одна схема заполнения и употребления таких пауз: «заполнение (100 % от длительности всей паузы) ^ начало коммуникации». Паузы хезитации встречаются как в начале, так и в середине фразы.

У дикторов-цыган отмечается более разнообразное заполнение пауз хезитации: для них, как и для дикторов-таджиков, характерно [а]-образное, [э]-образное, [эм]-образное заполнение, кроме того частотны случаи заполнения хезитационных пауз причмокиванием, цоканьем, шумным вдохом или выдохом, смехом, скрипящим звуком. Схемы заполнения и употребления пауз также разнообразны, наиболее частотны из них две: «заполнение (100 % от длительности всей паузы) ^ начало коммуникации»; «заполнение (30-40 % от длительности всей паузы) ^ молчание (10-20 % от длительности всей паузы) ^ заполнение (50 %) ^ начало коммуникации».

Для китайцев, говорящих на русском языке, характерно аналогичное дикторам-таджикам заполнение хезитационных пауз: растягивание конечного гласного, а также [эм]-образное заполнение. При этом заполнение пауз растягиванием конечного гласного встречается наиболее часто. Реализуется одна схема заполнения: «заполнение (60-70 % от длительности всей паузы) ^ молчание (30-40 % от длительности всей паузы) ^ начало коммуникации».

Темпоральные характеристики

Статистический анализ темпоральных характеристик заключался в исследовании скорости произнесения структурных составляющих синтагмы (предшкал, шкал и ядерных слогов). Особенности темпа речи у представителей исследуемых языковых групп проявляются в скорости произнесения слогов и степени их дифференциации.

В русской речи китайцев ядерный слог практически не отличается по длительности от других ударных и безударных слогов синтагмы в шкале, предшкале и заядерном участке, так как скорость их произнесения очень близка. В речи цыган скорость произнесения ядерного слога приблизительно равна скорости заядерного участка и противопоставлена шкале и предшкале, при этом ударные и безударные слоги шкалы и предшкалы практически не различаются между собой. Дикторы- таджики при произнесении ядерных слогов демонстрируют ту же тенденцию, что и дикторы, говорящие на цыганском языке, однако в отличие от речи дикторов-цыган в их речи ударные и безударные слоги шкалы и пред- шкалы, а также ядерно-заядерный участок более четко дифференцированы.

Среднее значение скоростей произнесения слогов для указанных языков представлено в таблице.

Среднее значение скорости произнесения слогов (мс)

Язык диктора

таджикский

цыганский

интерферированный русский

Исследуемая структура

предшкала (безударный слог)

268,03

86,05

287,06

шкала (ударный слог}

388,06

90,08

307,03

ядерный слог

511,06

229,08

309,05

заядерный участок

304,06

200,01

270,05

В целом, анализируя распределение скоростей произнесения слогов в анализируемом материале, можно констатировать, что для речи китайцев, говорящих на русском интерферированном языке, характерна средняя скорость произнесения слогов, речь таджиков характеризуется как размеренная, речь цыган - как быстрая и очень быстрая по сравнению с речью в других исследуемых языках.

Таким образом, идентификация иноязычных дикторов методами перцептивно-слухового и акустического анализа по просодическим характеристикам голоса и речи позволила выявить определенные закономерности при исследовании просодических параметров, в частности, ритмо-мелодических характеристик, особенностей паузации и темпоральных характеристик голоса и речи.

Результаты экспериментального исследования особенностей восприятия голоса и речи дикторов-таджиков и дикторов-цыган разными аудиторами позволяют говорить о возможности правильной перцептивно-слуховой оценки голоса и иноязычной речи подготовленными экспертами с опытом работы в области криминалистической идентификации по голосу и речи. Корректность восприятия иноязычной речи на супрасегментном уровне зависит от перцептивных эталонов аудиторов (просодических моделей), при этом указанная взаимозависимость уменьшается при наличии опыта в восприятии и анализе сегментов иноязычной речи на слух.

Проведенное экспериментальное исследование подтвердило эффективность применения предлагаемых методов анализа для идентификации русскоязычных и иноязычных дикторов подготовленными экспертами, не владеющими рассматриваемыми языками. Предлагаемый в работе подход к изучению звучащей речи методами анализа мелодических характеристик (перцептивно-слуховой метод) и оценки просодических параметров (инструментальный метод анализа параметров ЧОТ на разных мелодических структурах) позволяет обеспечить целостный анализ речевого сигнала с акустической (параметры ЧОТ) и лингвистической (интонация, тембр, темп, паузация и т. п.) точек зрения.

Список литературы

1. Голощапова Т. И., 2009. Идентификация иноязычных дикторов автоматическими методами // Информатизация и информационная безопасность правоохранительных органов: материалы междунар. конф. / отв. ред. В. И. Кирин. М.: Академия управления МВД России. С. 372-377.

2. Голощапова Т. И. и др., 2011. Идентификация по голосу и речи лиц, говорящих на таджикском, узбекском, цыганском и азербайджанском языках, с применением АПК «Этнос»: методические рекомендации для экспертов / Т И. Голощапова, М. И. Фомичева, И. В. Курьянова, А. В. Малышкин, П. О. Коровянский, Ю. А. Еле- мешина, Н. А. Фролова / под ред. к.ф.-м.н. С. В. Сыромятникова. 2-е изд., перераб. и доп. М.: ЭКУ 9 Департамента ФСКН России. 155 с.

3. Голощапова Т И. и др., 2012. Идентификация иноязычных дикторов на платформе SIS II АПК «Этнос»: методические рекомендации для экспертов / Т. И. Голощапова, Н. А. Кочетов, Ю. А. Елемешина, Е. А. Красовская, М. А. Девятова / под ред. к.ф.-м.н. С. В. Сыромятникова. 3-е изд., перераб. и доп. М.: ЭКУ 9 Департамента Федеральной службы Российской Федерации по контролю за оборотом наркотиков. 142 с.

4. Потапова Р. К., Михайлов В. Г., 2012. Основы речевой акустики. М.: ИПК МГЛУ «Рема». 493 с.

5. Потапова Р К., Потапов В. В., 2006. Язык, речь, личность. М.: Языки славянской культуры. 496 с. Потапова Р К., Потапов В. В., 2012. Речевая коммуникация: От звука к высказыванию. М.: Языки славянских культур. 464 с.

6. Потапова Р. К. и др., 2015. Междисциплинарность в исследовании речевой полиинформативнос- ти / Р К. Потапова, В. В. Потапов, Н. Н. Лебедева, Т В. Агибалова / под ред. Р К. Потаповой. М.: Языки славянской культуры. 352 с.

7. Koster O., Shiller N. O., 1997. Different influences of the native language of a listener on speaker recognition // Forensic Linguistics. The international Journal of Speech language and the law. Vol. 4, no. 1. I5 18-27.

8. Kunzel H. J., 1994. Current Approaches to Forensic Speaker Recognition' // Proceedings of the ESCA (European Speech Communication Association) Workshop on Automatic Speaker Recognition, Identification and Verification. April 5-7. P 135-141.

9. Nolan F., 2002. Intonation in speaker identification: an experiment on pitch alignment features // Forensic Linguistics. The international Journal of Speech language and the law. Vol. 9, no. 1. P. 1-21.

References

1. Goloshchapova T.I., 2009. Identification of foreign speakers by automatic methods. Kirin V.I. (ed). Informatizatsiya i informatsionnaya bezopasnost pravookhranitelnykh organov: Materialy mezhdunar. konf. Moscow, Akademiya upravleniya MVD Rossii Publ., pp. 372-377.

2. Goloshchapova T.I., Fomicheva M.I., Kuryanova I.V., MalyshkinA.V, Korovyanskiy PO., ElemeshinaYu. A., Frolova N.A., 2011. Identification of speakers of Tajik, Uzbek, Gypsy and Azerbaijani languages by voice and speech with the use of the hardware-software complex `Etnos ': Methodological recommendations for experts. Moscow, EKU 9 Departamenta FSKN Rossii. 155 p.

3. Goloshchapova T.I., Kochetov N.A., Elemeshina Yu.A., Krasovskaya E.A., Devyatova M.A., 2012. Voice identification of foreign speakers on the platform SIS II of the hardware-software complex `Etnos ': Methodological recommendations for experts. Moscow, EKU 9 Departamenta FSKN Rossii. 142 p.

4. Potapova R.K., Mikhaylov VG., 2012. Bases of speech acoustics. Moscow, Rema Publ. 493 p.

5. Potapova R.K., Potapov V.V, 2006. Language, speech, personality. Moscow, Yazyki slavyanskikh kultur Publ. 496 p.

6. Potapova R.K., Potapov V.V., 2012. Speech communication: from sound to utterance. Moscow, Yazyki slavyanskikh kultur Publ. 464 p.

7. Potapova R. K., Pot apov V. V., Lebedeva N.N., Agibalova T.V., 2015. Interdisciplinarity in the study of speech poly-informativity. Moscow, Yazyki slavyanskikh kultur Publ. 352 p.

8. Koster O., Shiller N.O., 1997. Different influences of the native language of a listener on speaker recognition. Forensic Linguistics. The international Journal of Speech language and the law, vol. 4, no. 1, pp. 18-27.


Подобные документы

  • Современная языковая ситуация. Факторы, влияющие на изменения в русском языке. Причины массовых речевых ошибок и пути повышения речевой культуры говорящих. Языковая ситуация в России. Изменения в русском языке.

    реферат [42,8 K], добавлен 02.06.2008

  • Основные причины и условия лексического заимствования в русском языке. Типы иноязычных слов. Фонетические и морфологические признаки заимствованных слов. Использование иноязычной лексики в речи. Граница между заимствованными словами и экзотизмами.

    реферат [31,2 K], добавлен 12.05.2014

  • Определение "варваризмов" как иноязычных слов и выражений, используемых в речи при описании реалий и обычаев других народов. Создание словаря для облегчения понимания поэтического языка Пушкина и толкования иноязычных слов. Структура словарной статьи.

    контрольная работа [14,9 K], добавлен 26.12.2011

  • Определение роли различных частей речи. Проблема универсальности их природы. Во всех ли языках выделяются части речи и одинаков ли их набор во всех языках. Критерии выделения частей речи в трудах различных ученых. Роль частей речи в русском языке.

    контрольная работа [23,7 K], добавлен 20.02.2010

  • Гендерная и социальная дифференциация речи в японском языке. Основные лингвистические особенности женской речи и их характеристика. Выражение эмоций и настроения. Влияние пола на степень вежливости высказывания. Особенность речи на уровне синтаксиса.

    дипломная работа [102,9 K], добавлен 02.08.2015

  • Историческое влияние экономических, политических и культурных контактов с другими странами на внедрение в русский язык иноязычных слов. Заимствование и освоение новых слов благодаря средствам массовой информации. Примеры происхождения некоторых слов.

    реферат [20,2 K], добавлен 02.04.2010

  • Иноязычные заимствования в русском языке, причины их возникновения. Освоение иноязычных слов русским языком, их изменения различного характера. Стилистические особенности средств массовой информации, анализ употребления в них англоязычных заимствований.

    дипломная работа [62,6 K], добавлен 23.07.2009

  • Причины и условия активизации употребления и заимствования иноязычной лексики. Особенности функционирования иностранного словарного запаса в современной русской речи. Использование контекста или внеязыковой действительности для идентификации калек.

    реферат [25,6 K], добавлен 08.07.2011

  • Выявление основных признаков иноязычных слов. История распространения модных английских, французских и тюркских терминов, обозначающих предметы одежды в русском языке. Классификация заимствованных лексических единиц по степени их освоенности в языке.

    курсовая работа [50,0 K], добавлен 20.04.2011

  • Теоретические основы исследования слов категории состояния как самостоятельной части речи. Основная проблематика учения о процессах переходности на уровне частей речи. Анализ категории состояния как самостоятельной части речи в современном русском языке.

    курсовая работа [42,5 K], добавлен 08.12.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.