Стратегии преобразования русских фонетических заимствований в китайском языке: фонетические и графические аспекты
Рассмотрение фонетических и графических трансформаций, которые претерпевают звуковые заимствования из русского языка. Комплексный анализ имен нарицательных и имен собственных, кодифицированных в словарях и справочниках и употребляемых в Интернете.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | русский |
Дата добавления | 20.02.2022 |
Размер файла | 841,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
График 5. Частотное распределение по индексу Жаккара
Также были проанализированы нормированное расстояние Левенштейна (график 4) и индекс Жаккара (график 5) на всех данных. Гистограммы показывают, что получившиеся распределения «зеркально» отражают друг друга. При этом около 3 тыс. объектов (что составляет около 22%) показывают полное совпадение нормы и узуса по обеим метрикам, а также наблюдается два «всплеска» на уровнях 0,2 и 0,5 (нормированное расстояние Левенштейна) и 0,8 и 0,5 (индекс Жаккара).
Наконец, существует около 500 объектов, полностью не совпадающих по каждой из метрик. Ручной анализ этих вхождений показал, что основная их часть - полные семантические кальки (напр., Первомайское и « ОеТ»Ў·“wьyп” /ь:jп:/, досл. «первое мая») либо дальневосточные топонимы (напр., Владивосток и «єЈІОбЛЎ· “hдishenwдi” /xдigsnwдi/ - «Излучина трепанга»).
Можно сделать вывод о том, что соответствие между предписаниями Синьхуа и реальными данными далеко не полное. Это не позволяет нам, например, автоматически сгенерировать еще несколько десятков тысяч китайских транслитераций на основе всего набора собственных имен, имеющихся в русском разделе Википедии.
Зависимость между расстоянием Левенштейна и дихотомией «личное имя VS географический объект» позволяет предположить, что в географических объектах, даже при использовании в целом фонетической транслитерации, части названий (прилагательные или морфемы в сложных словах) переводятся на китайский семантически мотивированными морфемами. Эта гипотеза выливается в достаточно обширное исследование, которое также было нами проведено, однако, чтобы не слишком отклоняться от проблематики данной статьи, промежуточные итоги этого исследования здесь приводиться не будут. Покажем лишь один пример такой частично семантической адаптации.
(11)ПВ- |
Еµ·тёзВЮµВ |
|
“xiа-“ |
“nuфfьgлluodй” |
|
/eа-/ |
/nwф:fwь:kf":lwo:tTЈє/ |
|
низ (сем.) |
Новгород (фон.) |
7. Анализ N-грамм в фонетических заимствованиях и в контрольных китайских текстах
В предыдущем разделе мы обнаружили, что нормативные предписания не описывают весь узус, представленный в Интернете. Это подтверждает и следующее наблюдение: было подсчитано символьное разнообразие иероглифов в списке всех переводов из Wikidata и в списке всех транслитераций по Синьхуа. Первых оказалось 877, вторых - 260. Можно ли в таком случае извлечь пользу из такого многообразия иероглифов, не умещающегося в рамки нормы?
Мы попробуем ответить на этот вопрос при помощи анализа частотности иероглифических (символьных) N-грамм. Для этого мы возьмем 1 тыс. самых частотных N-грамм, встреченных в китайских заимствованиях из Wikidata, и проверим по контрольному корпусу современной китайской литературы, насколько часто эти N-граммы встречаются в аутентичных китайских текстах. Мы сделали сравнение при N = 2 (биграммы) и при N = 3 (триграммы). В качестве контрольного корпуса мы взяли художественные произведения трех современных китайских авторов (Мо Янь, Лю Чжэньюнь и Юй Хуа) и создали корпус размером 860 тыс. символов.
Анализ тысячи наиболее частотных биграмм в заимствованиях показал, что 936 из этих биграмм вообще не встречаются в контрольном корпусе, а большая часть оставшихся биграмм имеет ранг выше, чем 10 тыс. Что касается тысячи наиболее частотных триграмм, то уже 988 из них не встречаются в контрольном корпусе вовсе, а все остальные (за исключением одной) имеют ранг выше 400 тыс.
Это позволяет сделать вывод о том, что даже простые модели, построенные на символьных N-граммах, должны будут показать хороший результат при дальнейшей реализации прикладных задач, таких как вычленение заимствованных именованных сущностей.
8. Перспективы исследования
Результаты, полученные в данном исследовании, преждевременно считать окончательными. Например, в разделах 3 и 4 был проигнорирован так называемый графический фактор, о котором не раз упоминала Мяо [Miao 2005, pp. 46, 56, 79], но который с трудом поддается исчислению и воспроизводимости, а следовательно, и верификации. Речь идет о том, что в пиньинь привычные для европейцев символы согласных обозначают звуки с совершенно другой артикуляционной характеристикой. Например, “z”, в большинстве европейских письменностей обозначающий щелевой, в пиньинь помечает аффрикату /te/. При сегодняшнем культурном доминировании английского языка и латинской письменности нельзя отвести такое предположение: носители китайского, размышляя о возможной транскрипции того или иного русского имени собственного, обращают внимание в первую очередь на английскую транслитерацию русского слова, а затем на соответствие английских букв символам пиньинь. Тогда объяснение аффрикаты в транслитерации, например, названия города Рязань становится более прозаичным, чем через влияние пиджина (см. пример 12). Контраргументом здесь может послужить существование системы прямой китайско-русской транскрипции Палладия, которая более точно передает различия аффрикат и щелевых, обозначая рассмотренный выше звук как «цз»; однако эта система более известна именно в России и нацелена на адаптацию слов в обратном направлении -- из китайского в русский.
Рязань > (гипотеза) англ. Ryazan > кит.БєФЮ “liвngzаn” /Mgtsжn/
Кроме этого, в первых разделах не было рассмотрено ни адаптации консонантных кластеров, ни адаптации гласных в заимствованиях в путунхуа. Особый интерес в этом разрезе представляет не раз высказанное предположение о том, что ударение в словах языка- донора влияет на тоновое маркирование в полученных словах (одну из вариаций этой гипотезы можно найти в [Ин, Шипанов- ская 2016]). Дальнейшие исследования должны будут завершить описание всех сегментов и супрасегментных единиц русских заимствований в китайском.
Очевидно, найденные фонетические и (в особенности) графические закономерности вдохновляют и на прикладные исследования в сфере автоматической обработки китайского языка. Наиболее важной задачей в этой области видится создание алгоритма, позволяющего выделять в китайских текстах именованные сущности, являющиеся фонетическими заимствованиями из русского языка (возможно, с дальнейшим их обратным переводом на русский). Учитывая неспособность норм Синьхуа предсказать реально используемые фонетические заимствования, следует использовать статистические модели порождения и распознавания заимствований. Для этих целей могут быть использованы как традиционные статистические подходы - например, модель скрытых цепей Маркова, -так и нейросетевые модели. Важным аспектом при составлении работающих моделей для китайского языка станет предварительное ознакомление с уже существующими подходами к выделению именованных сущностей в изолирующих языках, таких как индонезийский [Wibawa, Purwarianti 2016], [Gunawan, Suhartono, Purnomo, Ongk 2018].
В дальнейшем практическом исследовании необходимо будет учитывать и вхождения со вспомогательными (такие, как кавычки) и некитайскими (такие, как «буквенные слова» всех видов и вообще использование латиницы) символами, так как в Интернете именно такие обозначения нередко используются для передачи фонетических заимствований именованных сущностей из других языков. Один из показательных примеров - страница в китайской Википедии, посвященная российскому рэперу LOC-Dog:
(13) LOC- |
№· |
|
/lok/ |
“gцu”/kдu/ |
|
LOC (граф.)- |
собака(калька Dog) |
Алгоритмы, полученные в результате дальнейшего практического исследования, можно будет оценить на данных русско-китайского параллельного корпуса НКРЯ, в котором содержатся всевозможные виды русских заимствований (названия населенных пунктов, ручьев, уменьшительно-ласкательные русские имена и т. д.).
Литература
1. Завьялова 1996 - Завьялова О.И. Диалекты китайского языка. М.: Научная книга, 1996. 207 с.
2. Ин, Шипановская 2016 - Ин Ц, Шипановская Л.М. Русские заимствования в китайском языке как результат языковых контактов // Филологические науки. Вопросы теории и практики. 2016. Т. № 7 (61): В 3 ч. Ч. 1. С. 144-152.
3. Кодзасов, Кривнова 2001 - Кодзасов С.В., Кривнова О.Ф. Общая фонетика. М.: РГГУ, 2001. 590 с.
4. Ма 2015 - Ма Н. Харбинский русско-китайский пиджин первой половины ХХ века и его влияние на русский и китайский языки и культуры // Филологические науки. Вопросы теории и практики. 2015. Т. 3. № 8 (50). С. 122-127.
5. Перехвальская 2008 - Перехвальская Е.В. Русские пиджины. СПб.: Алетейя, 2008. 363 с.
6. Семенас 2005 - Семенас А.Л. Лексика китайского языка. Базовый учебник. М.: АСТ: Восток-Запад, 2005. 310 с.
7. Семенов 2019 - Семенов К.И. Стратегии преобразования иноязычных фонетических сочетаний в китайском языке (на материале заимствований из русского языка): Курсовая работа студента 2 курса бакалавриата. М.: НИУ ВШЭ, 2019. 55 с.
8. Попова, Таката 2017 - Словари кяхтинского пиджина / Под ред. И.Ф. Попова, Т. Таката. М.: Наука, 2017. 603 с.
9. Хаматова 2003 - Хаматова А.А. Словообразование современного китайского языка. М.: Муравей, 2003. 224 с.
10. Цзе 2007 - Цзе Я. Забайкальско-маньчжурский препиджин: опыт социологического исследования // Вопросы языкознания. 2007. № 2. С. 67-74.
11. Cook 2018 - Cook A. A typology of lexical borrowing in Modern Standard Chinese // Lingua Sinica. 2018. Т. 4, no. 1. P. 6.
12. Fujii, Ishikawa 2001 - Fujii A., Ishikawa T. Japanese/English Cross-Language Information Retrieval: Exploration of Query Translation and Transliteration // Computers and the Humanities. 2001. Vol. 35, no. 4. P. 389-420.
13. Gunawan, Suhartono, Purnomo, Ongk 2018 - Gunawan W., Suhartono D., Purnomo F., Ongk A. Named-Entity Recognition for Indonesian Language using Bidirectional LSTM-CNNs // Procedia Computer Science. 2018. Vol. 135. P. 425-432.
14. Huang, Chen 1996 - Huang C.-R., Chen K.-J. Issues and topics in Chinese natural language processing. Taipei: Chinese University Press, 1996. 22 p.
15. Koo 2015 - Koo H. An unsupervised method for identifying loanwords in Korean // Language Resources and Evaluation. 2015. Vol. 49, no. 2. P. 355-373.
16. Lin 2008 - Lin Y.-H. Variable vowel adaptation in Standard Mandarin loanwords // Journal of East Asian Linguistics. 2008. Vol. 17, no. 4. P. 363-380.
17. Miao 2005 - Miao R. Loanword Adaptation in Mandarin Chinese: Perceptual, Phonological and Sociolinguistic Factors. Ph.D. Thesis. Stony Brook University, Stony Brook, NY, 2005. 184 p.
18. Nelson 2013 - Nelson L. English Loan Words in Mandarin Chinese: Phonology vs. Semantics // Proc. of the National Conf. on Undergraduate Research (NCUR) 2013, University of Wisconsin La Crosse, WI April 11-13, 2013. Madison, 2013. P. 497-505.
19. Vervaet 2017 - Vervaet R. English Loanwords in the Chinese Lexicon. MA Thesis. Gent: Universiteit Gent, 2017. 128 с.
20. Wibawa, Purwarianti 2016 - Wibawa A., Purwarianti A. Indonesian Named-entity Recognition for 15 Classes Using Ensemble Supervised Learning // 5th Workshop on Spoken Language Technologies for Under-resourced languages, SLTU, 9-12 May 2016. Yogyakarta, 2016. P. 221-228.
21. Wong, Xu 2010 - WongK.-F., Xu R. Introduction to Chinese Natural Language Processing. San Rafael, CA: Morgan & Claypool Publ., 2010. 148 p.
22. БхХэзьЈЁM zhиngtan) 1985 -єєУпНвАґґКґКµдЈЁhаnyь wаilaid ddiдn) / ed.БхХэзь (M zhиngtan).ЙПєЈЈЁshаnghai):ЙПєЈґЗКйіц°жЙзЈЁshаnghвi dshь chьbanshи), 1985. 422 p.
23. РВ»ЄЈЁxпnhuа) 1993 -КАЅзИЛГы·ТлґуґЗµдЈЁshijiи rйnming fлnyi dа ddiдn)Ј¬ РВ»ЄЙзТлГыКТ±аЈЁxпnhua shи yiming shi biдn)Ј¬1993. 56 p.
References
1. Cook, A. (2018), “A typology of lexical borrowing in Modern Standard Chinese”, Lingua Sinica, vol. 4, no. 1, p. 6.
2. Fujii, A. and Ishikawa, T. (2001), “Japanese/English Cross-Language Information Retrieval: Exploration of Query Translation and Transliteration”, Computers and the Humanities, vol. 35, pp. 389-420.
3. Gunawan, W., Suhartono, D., Purnomo, F. and Ongk, A. (2018), “Named-Entity Recognition for Indonesian Language using Bidirectional LSTM-CNNs”, Procedia Computer Science, vol. 135, pp. 425-432.
4. Huang, C.-R. and Chen, K.-J. (1996), Issues and Topics in Chinese Natural Language Processing, Chinese University Press, Taipei, Taiwan.
5. Jie, Y. (2007), “Baikal-Manchurian pre-pidgin: a sociological study”, Voprosy yazykoznaniya, vol. 2, pp. 67-74.
6. Khamatova, A.A. (2003), Slovoobrazovaniye sovremennogo kitayskogo yazyka [Word formation in Modern Chinese], Muravei, Moscow, Russia.
7. Kodzasov, S.V. and Krivnova, O.F. (2001), Obshchaya fonetika [General phonetics], RGGU, Moscow, Russia.
8. Koo, H. (2015), “An unsupervised method for identifying loanwords in Korean”, Language Resources and Evaluation, vol. 49, no. 2, pp. 355-373.
9. Lin, Y.-H. (2008), “Variable vowel adaptation in Standard Mandarin loanwords”, Journal of East Asian Linguistics, vol. 17, no. 4, pp. 363-380.
10. Liu, Zh.-T. (1985), Hanyu wailaici cidian [Chinese Loanword Dictionary], Shanghai ci- shu chubanshe, Shanghai, China.
11. Ma, N. (2015), “Harbin Russian-Chinese pidgin in the first half of 20th century and its influence on Russian and Chinese languages and culture”, Filologicheskiye nauki. Voprosy teorii i praktiki, vol. 3, no. 8 (50), pp. 122-127.
12. Miao, R. (2005), Loanword Adaptation in Mandarin Chinese: Perceptual, Phonological andSociolinguistic Factors, Ph.D. Thesis, Stony Brook University, Stony Brook, NY, USA.
13. Nelson, L. (2013), “English Loanwords in Mandarin Chinese: Phonology vs. Semantics”, Proc. of the National Conf. on Undergraduate Research (NCUR) 2013, University of Wisconsin La Crosse, WI April 11-13, 2013, Madison, pp. 497-505.
14. Perekhval'skaya, E.V. (2008), Russkiye pidzhiny [Russian pidgins], Aleteiya, Saint-Petersburg, Russia.
15. Wibawa, A. and Purwarianti, A. (2016), “Indonesian Named-entity Recognition for 15 Classes Using Ensemble Supervised Learning”, 5th Workshop on Spoke-n Language Technologies for Under-resourced languages, SLTU, 9-12 May, 2016, Yogyakarta, pp. 221-228.
16. Semenas, A.L. (2005), Leksika kitayskogo yazyka. Bazovyy uchebnik [The Chinese lexicon. Basic Textbook], AST: Vostok-Zapad, Moscow, Russia.
17. Semenov, K.I. (2019), Strategii preobrazovaniya inoyazychnykh foneticheskikh sochetaniy v kitayskom yazyke (na materiale zaimstvovaniy iz russkogo yazyka) [Adaptation Strategies for Foreign Phonetic Borrowings in Chinese (Based on Russian Loanwords)], 2nd year BA term paper, NRU “Higher School of Economics”, Moscow, Russia.
18. Popova, I.F. and Takata, T. (2017), Slovari k^yakhtinskogo pidzhina [Dictionaries of Kyakhta pidgin], Nauka, Moscow, Russia.
19. Vervaet, R. (2017), English Loanwords in the Chinese Lexicon, MA Thesis, Universiteit Gent, Gent, Belgium.
20. Wong, K.-F. and Xu, R. (2010), Introduction to Chinese Natural Language Processing, Morgan & Claypool Publ., San Rafael, CA, USA.
21. Xinhua (1993), Shijie renming fanyi da cidian [Translation dictionary for world personal names], Xinhua she yiming shi bian, Beijing, China.
22. Ying, J. and Shipanovskaya, L.M. (2016), “Russian loanwords in Chinese as a result of language contacts”, Filologicheskiye nauki. Voprosy teorii i praktiki, no. 7 (61), pt. 1, pp. 144-152.
23. Zav'yalova, O.I. (1996), Dialekty kitayskogo yazyka [Dialects of Chinese], Nauchnaya kniga, Moscow, Russia. Размещено на Allbest.ru
Подобные документы
Научное представление о фонетических заимствованиях, их характерные особенности в китайском языке. Принципы разделения заимствований в названиях торговых марок. Фонетические заимствования, касающиеся коммунистической и социалистической тематики.
курсовая работа [35,2 K], добавлен 17.09.2012Понятие заимствований и их роль в системе языка. Источники и их классификации. Период появления скандинавских заимствований, его причины. Проблема ассимиляции заимствований. Анализ фонетических характеристик скандинавских заимствований в английском языке.
курсовая работа [75,3 K], добавлен 31.05.2015Понятие о фонетических законах и фонетических процессах. Позиционные и комбинаторные изменения звуков. Действие фонетических законов в синхронии. Условия, в которых происходит оглушение конечного звонкого. Фонетические процессы, происходящие в слове.
контрольная работа [27,2 K], добавлен 20.05.2010Ономастика как раздел языкознания, занимающийся изучением имен собственных. Прозвища людей, употребляемые в Ленском районе Архангельской области. Анализ классификации антропонимов. Семантика собственных имен. Отличие собственных имен от нарицательных.
курсовая работа [49,9 K], добавлен 07.02.2010Лингвистические свойства имен собственных, способы их образования, принципы и факторы, которые необходимо учитывать в процессе перевода. Сравнительный анализ имен собственных в русских и итальянских переводах произведений Дж.К. Роулинг "Гарри Поттер".
курсовая работа [43,1 K], добавлен 06.04.2012Сравнительный анализ семантической адаптации иностранных заимствований в лексике китайского языка. Изучение словообразовательных возможностей заимствований. Английские и американские заимствования в современном китайском языке: употребление и семантика.
дипломная работа [124,3 K], добавлен 20.06.2013Особенность звуковой передачи имен и названий на другом языке. Принципы перевода имен собственных путем транслитерации, транскрипции и транскрипции с элементами транслитерации. Анализ данных методов на примере перевода научной статьи Франсуа Грожана.
курсовая работа [47,0 K], добавлен 19.11.2014Фамилия как вид антропонима. Введение на Руси в X веке христианских личных имен, образованных от нарицательных слов греческого, латинского, древнееврейского и других языков. Народная форма крестильного имени. Смешения сходных имен путем заимствования.
курсовая работа [78,3 K], добавлен 29.10.2017Признаки аналитизма при выражении лексического и грамматического значения слова в русском языке. Рассмотрение роста аналитизма в системе глаголов, имен существительных, имен прилагательных, наречий, числительных, предлогов, и частиц русского языка.
реферат [28,6 K], добавлен 29.01.2011Критерии определения слова и его фонетические, семантические, грамматические признаки. Миграция слов по странам, из одного языка в другой вместе с их носителями. Примеры образования имен нарицательных от одного собственного в русском и других языках.
реферат [21,6 K], добавлен 02.04.2010