Оцінка адекватності машинного перекладу письмових спеціалізованих текстів
Розгляд складного процесу оцінки адекватності машинного перекладу для письмової спеціалізованої літератури. Помилки, яких припускаються системи машинного перекладу Google Translate та DeepL Translate під час перекладу навчальних матеріалів з біології.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | украинский |
Дата добавления | 30.10.2024 |
Размер файла | 1,8 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»
Державний вищий навчальний заклад «Ужгородський національний університет»
Оцінка адекватності машинного перекладу письмових спеціалізованих текстів
Артур Гудманян доктор філологічних наук, професор
Анатолій Мишко викладач
Анастасія Брай студентка магістратури
Київ, Україна
Анотація
Машинний переклад став критично важливим для подолання мовних відмінностей в епоху глобального зв'язку, передусім у спеціалізованих галузях. У цій статті розглядається складний процес оцінювання адекватності машинного перекладу для письмової спеціалізованої літератури. В дослідженні проаналізовано помилки, яких припускаються системи машинного перекладу Google Translate (далі - GT) та DeepL Translate (далі - DT) під час перекладу навчальних матеріалів з біології. У роботі підкреслено, що спеціалізовані тексти вимагають не лише термінологічної точності, а й збереження контексту, що робить галузевий машинний переклад надзвичайно складним. У попередніх працях було розглянуто кілька підходів до оцінювання, які наголошували на необхідності людської перевірки поряд з автоматизованими системами. Помилки машинного перекладу - від термінологічних і семантичних недоліків до стилістичних і граматичних - підкреслюють важливість ретельного пост-редагування. Результати дослідження продемонстрували, що, незважаючи на коректний переклад термінології загального вжитку, її використання у складних реченнях викликало труднощі. Обидві системи часто не розпізнавали тонкощів, що призводило до викривлених інтерпретацій. Стилістичні помилки, зокрема дослівний переклад без урахування контексту, ще більше послаблюють перекладені речення. Переклад також супроводжувався граматичними помилками, що демонструють складність синтаксичних структур у спеціалізованій тематиці. Дослідження виявило мінімальні відмінності між GT і DT, зокрема, GT краще перекладав термінологію, а DT демонстрував більш ефективні граматичні структури. Проте обидві системи застосовували дослівний переклад, що призвело до стилістичних помилок і неточного вибору слів. У цій роботі підкреслено необхідність людського редагування для забезпечення коректного перекладу експертних матеріалів, а також необхідність постійного вдосконалення технології машинного перекладу для підвищення точності термінології та збереження контексту в спеціалізованих текстах.
Ключові слова: машинний переклад; спеціалізовані тексти; методи оцінювання; термінологічні помилки; змістові помилки; стилістичні помилки; лексичні помилки; граматичні помилки; людське редагування.
Abstract
Specia, L., Scarton, C., & Paetzold, G. H. (2018). Quality estimation for machine translation. In Synthesis lectures on human language technologies. Morgan & Claypool Publishers.
Xu, J., Crego, J. M., & Senellart, J. (2020). Boosting Neural Machine Translation with Similar Translations. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.
Artur Gudmanian, Anatolii Myshko, Anastasiia Brai. Evaluation of the Adequacy of Written Specialized Texts Machine Translation. Machine translation has become critical for overcoming language differences in the age of global communication, especially in specialized fields. This article discusses the complex process of evaluating the adequacy of machine translation for written specialized literature. The study analyzes the mistakes made by Google Translate (GT) and DeepL Translate (DT) when translating biology textbooks.
The paper emphasizes that specialized texts require not only terminological accuracy but also context preservation, which makes machine translation in this field extremely challenging. Several evaluation approaches have been considered in previous work, emphasizing the need for human editing alongside machine translation systems. Machine translation errors, ranging from terminological and semantic mistakes to stylistic and grammatical errors, emphasize the importance of thorough post-editing.
The results of the study showed that despite the correct translation of commonly used terminology, its use in complex sentences caused difficulties. Both systems often failed to recognize details, leading to distorted interpretations. Stylistic mistakes, such as word-for-word translation disregarding context, further weakened the translated sentences. The translation was also accompanied by grammatical errors that demonstrate the complexity of syntactic structures in specialized topics.
The study revealed minimal differences between GT and DT, with GT translating terminology better and DT demonstrating more efficient grammatical structures. However, both systems used word-for-word translation, which resulted in stylistic errors and inaccurate word choice. This paper emphasizes the need for human editing to ensure the correct translation of specialized materials, as well as the need for continuous improvement of machine translation technology to ensure the accuracy of terminology and preserve context in specialized texts.
Keywords: machine translation; specialized texts; evaluation methods; terminological errors; semantic errors; stylistic errors; lexical errors; grammatical errors; human editing.
Вступ
У сучасному взаємопов'язаному світі потреба в успішній міжмовній комунікації є актуальнішою, ніж будь-коли. Машинний переклад (далі - МП) став важливою технологією, яка дозволяє безперешкодно передавати інформацію через мовні кордони. Необхідність оцінювати якість і надійність таких перекладів набуває особливого значення, оскільки організації, науковці та люди дедалі більше покладаються на матеріали, перекладені машинним способом у своїх професійних сферах. Тому в цій статті досліджується складна сфера оцінювання адекватності машинного перекладу письмових спеціалізованих текстів. машинний переклад навчальний
У зв'язку із великою кількістю онлайн-текстів у багатьох галузях і глобальним попитом на переклад, машинний переклад набуває все більшого значення в цифрову епоху. Традиційні перекладацькі підходи часто не здатні задовольнити світові потреби в перекладі (Conneau et al., 2018). Системи машинного перекладу (далі - СМП), зокрема нейронний машинний переклад, з'явилися як можливе вирішення цих проблем (Xu et al., 2020).
Дж. С. Джастесон і С. М. Катц зазначають, що точність мови в технічних дисциплінах забезпечує точну передачу понять та інструкцій, запобігаючи непорозумінням і помилкам (Justeson & Katz, 1995). Правильні формулювання у медичній документації мають вирішальне значення для безпеки пацієнтів і належної комунікації між медичними працівниками (Chatterjee & Yadav, 2019). Визначення в юридичних документах має вирішальне значення для забезпечення коректності та запобігання неправильному тлумаченню (Justeson & Katz, 1995). Точність у науковій літературі підвищує чіткість і повторюваність результатів досліджень (Chatterjee & Yadav, 2019). Тому якість машинного перекладу спеціалізованих текстів має вирішальне значення для успішної комунікації та інтерпретації інформації у різних дисциплінах.
Потреба в більш точних і достовірних перекладах у спеціалізованих галузях стимулювала розвиток алгоритмів машинного перекладу для обробки специфічного жаргону, технічних слів і спеціалізованої мови (Baroni & Bernardini, 2005). Традиційні системи машинного перекладу іноді не справлялися з перекладом спеціальної термінології, що призводило до помилкових або нелогічних перекладів (Baroni & Bernardini, 2005). Проте із розвитком нейронного машинного перекладу та збільшенням кількості навчальних даних для конкретних галузей алгоритми машинного перекладу стають дедалі ефективнішими в роботі зі спеціальною лексикою та надають високоякісні переклади в спеціалізованих галузях (Chu & Wang, 2020).
Переклад спеціалізованих текстів передбачає унікальні завдання, які виходять за рамки звичайних проблем машинного перекладу. Точність має вирішальне значення у спеціалізованих професіях, оскільки навіть незначні помилки або пропуски в мові можуть мати серйозні наслідки (Chu & Wang, 2020). Також важливо зберегти контекст і значення спеціальної термінології, оскільки унікальні значення, пов'язані з термінами, можуть бути втрачені під час перекладу (Chu & Wang, 2020). Подолання цих проблем вимагає глибокого розуміння спеціалізованої галузі, а також здатності помічати нюанси мови та контексту.
Основним питанням, яке розглядається у цій статті, є оцінювання машинного перекладу спеціалізованих текстів та виявлення помилок, пов'язаних з особливостями стилю. Стаття має на меті проаналізувати сучасний стан оцінювання якості машинного перекладу спеціалізованих текстів за допомогою критичного аналізу літератури та аналізу конкретних прикладів. Вона також містить корисну інформацію для дослідників, практиків і розробників, які працюють у галузі обробки природної мови та машинного перекладу.
Машинний переклад став незамінним інструментом для перекладу письмових документів, але оцінити його адекватність доволі складно. У цій сфері було проведено кілька досліджень з оцінювання якості машинного перекладу та створення методології для аналізу термінологічної узгодженості.
Так, наприклад, Л. Спеча та ін. розглядали стратегії оцінювання якості машинного перекладу (Specia, 2018). У роботі Дж. Сюй та ін. досліджується використання порівняльних перекладів для підвищення точності нейронного машинного перекладу (Xu et al., 2020). Дж. Діну та ін. пропонують навчити систему нейронного машинного перекладу використовувати спеціальну термінологію (Dinu et al., 2019). У дослідженні Р Гак та ін. розглядається переклад термінології у статистичному та нейронному машинному перекладі з акцентом на перекладі з англійської на хінді та з хінді на англійську (Haque et al., 2019). Серед вітчизняних дослідників особливості машинного перекладу політичного дискурсу досліджував Д. М. Чевдар (Чевдар, 2018). А.Л. Міщенко аналізувала машинний переклад у контексті сучасного науково- технічного перекладу (Міщенко, 2013).
Ці та інші праці розглядають різні напрями оцінювання якості та адекватності машинного перекладу загальних та спеціалізованих текстів. Проте не існує загально прийнятого способу оцінки перекладів, виконаних СМП.
Методи дослідження
Найчастіше розрізняють два основних підходи до оцінювання МП, а саме - людське та автоматичне оцінювання. У нашій попередній роботі докладніше висвітлено стратегії оцінювання МП, де однією з основних є використання людського рецензування, коли кваліфіковані перекладачі або фахівці-білінгви оцінюють переклади відповідно до заздалегідь визначених стандартів (Брай, 2023). Для цього може використовуватися оцінювання на рівні сегментів, під час якого певні фрази або речення оцінюються на предмет правильності, плавності та адекватності (Bojar et al., 2016).
Автоматичне оцінювання вимірює перекладені тексти за допомогою обчислювальних метрик і алгоритмів (Och, 2003). Ці показники дають змогу кількісно оцінити якість перекладу, намагаючись імітувати людське оцінювання. Найпоширенішими методами автоматизованого оцінювання є BLEU (Bilingual Evaluation Understudy), TER (Translation Edit Rate) та METEOR (Metric for Evaluation of Translation with Explicit ORdering) (Lavie & Agarwal, 2007).
Такі автоматизовані критерії оцінювання, що дають об'єктивну оцінку якості перекладу, часто використовуються для вивчення та вдосконалення технологій машинного перекладу. Проте важливо пам'ятати, що ці вимірювання мають певні обмеження й можуть неточно відображати всі тонкощі якості перекладу. Ретельне оцінювання якості перекладу все одно потребує людського контролю, оскільки може врахувати суб'єктивні аспекти якості перекладу, які не можуть бути повністю враховані автоматичними метриками.
А. Бірюков зазначає, що якість перекладу вимірюється певною кількістю помилок (Бірюков, 2004). Тому стаття аналізує адекватність машинного перекладу саме за кількістю та типологією помилок.
Аналізуючи переклад термінів у юридичних текстах, І. Р Алкатері класифікував найпоширеніші помилки таким чином: (1) лексичні помилки, (2) синтаксичні помилки, (3) пропуски та (4) помилки, пов'язані з юридичним реєстром (Alkatheery, 2023).
У дослідженні Р. Гак та ін. було виділено такі помилки: (1) помилка перестановки слів, (2) флексійна помилка, (3) часткова помилка, (4) неправильний лексичний вибір, (5) упущення терміну (Haque et al., 2019a).
Результати й обговорення
На основі цих робіт та власного аналізу перекладу було створено підбірку найпоширеніших помилок при машинному перекладі спеціалізованих текстів, а саме - термінологічні, змістові, стилістичні, лексичні і граматичні помилки, які є найпоширенішими.
Для аналізу було використано навчальні матеріали з біології загальним обсягом 14008 знаків та їх переклад за допомогою систем машинного перекладу Google Translate (GT) та DeepL Translate (DT) обсягом 13530 знаків та 13735 знаків відповідно. Після аналізу оригіналу та перекладу було визначено кількість помилок, допущених при перекладі (див. Табл. 1):
Таблиця 1. Відсоткове співвідношення помилок у перекладі
Тип помилки |
Відсоток від загальної кількості |
|
Термінологічні помилки |
60% |
|
Змістові помилки |
3% |
|
Стилістичні помилки |
3% |
|
Лексичні помилки |
20% |
|
Граматичні помилки |
14% |
Термінологічна помилка перекладу - це помилка в перекладі спеціалізованих слів, жаргонізмів або лексики, що може призвести до нерозуміння або втрати сенсу в перекладеному тексті. В основному терміни більш загального вжитку були перекладені коректно обома СМП (див. Табл. 2):
Таблиця 2. Переклад термінів загального вжитку
Оригінал |
GT |
DT |
|
Urinary System |
Сечовидільна система |
Сечовидільна система |
|
Kidneys |
Нирки |
Нирки |
|
Urethra |
Уретра |
Сечовід |
У простих реченнях терміни також були передані правильно. Наприклад, речення Blood arrives in an afferent arteriole and departs in an efferent arteriole (LESSON 13, n.d.) перекладено GT як Кров надходить у приносну артеріолу і відходить у виносну артеріолу (GT Дод. 7), а системою DT як Кров надходить в аферентну артеріолу і відтікає в еферентну артеріолу (DT Дод. 7). Обидва варіанти є коректними та широковживаними.
Проте, коли менш вживані терміни є частинами складних речень, СМП спотворюють їх, тим самим впливаючи на зміст. Яскравим прикладом є речення Renal blood vessels and the ureter draining the kidney pass through the hilus and branch within the renal sinus (LESSON 13, n.d.). Система GT пропонує такий переклад: Ниркові кровоносні судини та сечовід, що дренує нирку, проходять через воротар і розгалужуються в межах ниркового синусу (GT Дод. 4). Термін hilus (хілус / ниркові ворота) тут було перекладене як воротар, що хоч і віддалено передає сенс, є неправильним та спотворює сенс речення. Система DT пропонує такий варіант: Ниркові кровоносні судини і сечовід, що дренують нирку, проходять через чашечку і розгалужуються в нирковому синусі (DT Дод. 4). У цьому випадку термін був перекладений як чашечка, що знову ж таки є неправильним варіантом та спотворює зміст.
Змістова помилка перекладу - це неточність у перекладі загального значення, повідомлення або інформації, представленої в контенті, що може призвести до втрати зв'язності в перекладеному тексті. Прикладом такої помилки є неточність формулювання у реченні The podocyte feet are known as pedicels (LESSON 13, n.d.). GT переклав його як Ніжки подоцитів відомі як ніжки (GT Дод. 6), а DT - як Ніжки подоцитів відомі під назвою «ніжки» (DT Дод. 6). Обидва варіанти є неправильними саме зі змістової точки зору, а не з термінологічної, оскільки термін ніжки подоцитів є широковживаним. Помилка спричинена тим, що в українській мові існує лише один термін для двох в англійській мові podocyte feet та pedicels, тому в такому випадку вдалим варіантом перекладу буде Відростки подоцитів відомі як «ніжки». Також варто наголосити, що слово «ніжки» необхідно брати в лапки, як це зробила система DT, тому що саме так цей термін вживається у цьому контексті.
Стилістична помилка - це нездатність правильно передати відповідний стиль або естетичні особливості з тексту оригіналу в текст перекладу під час процесу передачі стилю тексту, що може призвести до невідповідності або відхилення від оригінального стилістичного ефекту.
Загалом обидві СМП вдало передають науковий стиль оригіналу, проте виникають труднощі при вживанні загальних слів, які можуть мати різні відтінки значення в контексті. Наприклад, This arrangement prevents the jolts and shocks of day-to-day existence from disturbing normal kidney function (LESSON 13, n.d.). Система GT переклала це речення як Таке розташування запобігає поштовхам і потрясінням повсякденного існування від порушення нормальної функції нирок (GT Дод. 3), а система DT як Таке розташування запобігає поштовхам і струсам повсякденного існування, які порушують нормальну функцію нирок (DT Дод. 3). Такий дослівний переклад без урахування оригіналу в обох варіантах призводить до стилістичної помилки. В цьому випадку необхідно використати диференціацію значення для словосполучення the jolts and shocks of day-to-day existence та перекласти як щоденні рутинні рухи людини, аби переклад звучав таким чином: Таке розташування запобігає порушенню нормальних функцій нирок, що може бути спричинено щоденними рутинними рухами людини.
Лексична помилка - це неправильний переклад окремих слів або лексичних одиниць, що може призвести до невідповідного вибору слів і вплинути на загальний зміст і зрозумілість перекладеного тексту. Вони виникають у машинному перекладі через труднощі з точною передачею відтінків і багатозначності слів, а також через контекстну залежність вибору лексики, що може призвести до помилок у виборі відповідників для конкретних слів або словосполучень (Brglez & Vintar, 2022).
Прикладом є речення The renalfascia anchors the kidney to surrounding structures (LESSON 13, n.d.), у якому цікавим є остання частина речення, а саме surrounding structures. Система GT перекладає це словосполучення як оточуючі структури (GT Дод. 2), а система DT як навколишні структури (DT Дод. 2). Обидва варіанти не є цілком правильними, оскільки в контексті речення ця одиниця має значення бічні поверхні хребта або спини. Таким чином, без урахування контексту, обидві системи дослівно переклали словосполучення, що спотворило значення речення.
Ще одним прикладом є речення Filtration produces an essentially protein-free solution, known as a filtrate, that is otherwise very similar to blood plasma (LESSON 13, n.d.). Система GT дослівно переклала an essentially protein-free solution як практично вільний від білка розчин (GT Дод. 5). Таке формулювання є нетиповим для української мови у такому контексті, тому в результаті дещо спотворює значення. Система DT в цьому випадку впоралася краще, переклавши словосполучення як практично безбілковий розчин (DT Дод. 5).
Граматична помилка - це помилка перекладу, пов'язана з неправильним застосуванням граматичних правил, що призводить до граматично неправильних або незграбно сформованих фраз у мові перекладу. Вони можуть виникати в машинному перекладі як через складність виявлення та відтворення граматично правильних структур, так і через труднощі застосування граматичних правил у різних мовах і контекстах (Specia, 2014).
Прикладом граматичної помилки є речення, яке в тексті оригіналу слугує заголовком Topography And Structure Of Urinary System Organs (LESSON 13, n.d.). Обидві системи припустилися граматичних помилок при перекладі, запропонувавши такі результати: GT - Релеф та будова органи сечовідільної системи (GT Дод. 1); DT - Топографія і будова органи сечовидільної системи (DT Дод. 1). У системи GT окрім граматичної помилки узгодження слів у реченні, виникла також помилка правильного написання слів рельєф та сечовидільної. Система DT також вдалася до спотворення змісту, помилившись в узгодження слів у реченні.
Висновки і напрями подальших досліджень
На підставі проведеного аналізу нами виявило, що системи машинного перекладу мають труднощі при перекладі спеціалізованих текстів. Загалом, переклади систем машинного перекладу Google та DeepL виявилися рівноцінними, з незначними відмінностями у перекладі термінології, з чим Google Translate впорався дещо краще, та граматичних конструкцій, в яких ефективнішим був DeepL Translate.
Обидві системи часто виконують переклад дослівно без урахування контексту, що призводить до стилістичних помилок. Неправильний підбір слів впливає на загальний зміст і сприйняття тексту. Граматичні помилки призводять до неправильної побудови речень мовою перекладу.
Отже, результати дослідження показують: незважаючи на численні переваги машинного перекладу, він часто не може самостійно забезпечити надійний переклад спеціалізованих матеріалів, що робить людське редагування невід'ємною частиною процесу перекладу для забезпечення точних і контекстуально релевантних перекладів. Виявлені недоліки підкреслюють важливість подальшого розвитку технології машинного перекладу, передусім з точки зору точності термінології та збереження контексту в спеціалізованих текстах.
Таким чином, перспектива майбутніх досліджень полягає в подальшому вдосконаленні технології машинного перекладу для задоволення потреб спеціалізованих дисциплін і забезпечення того, щоб переклади були не тільки точними, але й контекстуально релевантними та стилістично прийнятними. Для цього необхідне вдосконалення алгоритмів МП, відкриття нових метрик для оцінювання співпраці СМП та людей-перекладачів, а також багатомовні користувацькі дослідження у конкретних галузях.
Список літератури
1. Бірюков, А. (2004). Розробка методів оцінки якості машинного перекладу на основі результатів досліджень з оцінки якості перекладу традиційного. Культура Народов Причерноморья, 55(1), 100-105.
2. Брай, А. Ю. (2023). Засоби для оцінки якості машинного перекладу. Матеріали XVМіжнародної Студентської Науково-практичної Конференції, Людина як суб 'єкт міжкультурної комунікації: сучасні тенденції у філології, перекладі та навчанні мов, 84-87. (мова оригіналу - українська)
3. Міщенко, А. Л. (2013). Машинний переклад у контексті сучасного науково-технічного перекладу. Вісник Харківського Національного Університету Імені В. Н. Каразіна, 1051(73), 172-180.
4. Чевдар, Д. М. (2018). Особливості машинного перекладу політичного дискурсу. Науковий Вісник ПНПУІм. К. Д.
5. Ушинського, 27, 211-222. (мова оригіналу - українська)
6. Alkatheery, E. R. (2023). Google Translate Errors in Legal Texts: Machine Translation Quality Assessment. Arab World English Journal for Translation & Literary Studies, 7(1), 208-219.
7. Baroni, M. & Bernardini, S. (2005). A New Approach to the Study of Translationese: Machine-learning the Difference between Original and Translated Text. Literary and Linguistic Computing, 21(3), 259-274.
8. Bojar, O., Graham, Y., Kamran, A., & Stanojevic, M. (2016). Results of the WMT16 Metrics Shared Task. Proceedings of the First Conference on Machine Translation, 2, 199-231.
9. Brglez, M. & Vintar, S. (2022). Lexical diversity in statistical and neural machine translation. Information, 13(2), 93.
10. Chatterjee, S. & Yadav, S. B. (2019). The origin of prebiotic information system in the Peptide/RNA world: a simulation model of the evolution of translation and the genetic code. Life, 9(1), 25.
11. Chu, C. & Wang, R. (2020). A survey of Domain adaptation for Machine Translation. Journal of Information Processing, 28(0), 413-426.
12. Conneau, A., Kraszewski, G., Lample, G., Barrault, L., & Baroni, M. (2018). What you can cram into a single $&!#* vector: Probing sentence embeddings for linguistic properties. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2126-2136.
13. Dinu, G., Mathur, P., Federico, M., & Al-Onaizan, Y. (2019). Training Neural Machine Translation to Apply Terminology Constraints. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics
14. Haque, R., Hasanuzzaman, M., & Way, A. (2019). Investigating Terminology Translation in Statistical and Neural Machine Translation: A Case Study on English-to-Hindi and Hindi-to-English. Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2019).
15. Haque, R., Hasanuzzaman, M., & Way, A. (2019a). Terminology translation in Low-Resource scenarios. Information, 10(9), 273.
16. Justeson, J. S. & Katz, S. M. (1995). Technical terminology: some linguistic properties and an algorithm for identification in text. Natural Language Engineering, 1(1), 9-27.
17. Lavie, A. & Agarwal, A. (2007). METEOR: An Automatic Metric for MT Evaluation with High Levels of Correlation with Human Judgments. Proceedings of the Second Workshop on Statistical Machine Translation, 228-231.
18. Och, F. J. (2003). Minimum error rate training in statistical machine translation. Proceedings of the 41st Annual Meeting on Association for Computational Linguistics, 1, 160-167.
19. Specia, L. (2014). Statistical machine translation. In IGI Global eBooks (pp. 897-931).
20. Specia, L., Scarton, C., & Paetzold, G. H. (2018). Quality estimation for machine translation. In Synthesis lectures on human language technologies. Morgan & Claypool Publishers.
21. Xu, J., Crego, J. M., & Senellart, J. (2020). Boosting Neural Machine Translation with Similar Translations. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.
References
1. Alkatheery, E. R. (2023). Google Translate Errors in Legal Texts: Machine Translation Quality Assessment. Arab World English Journal for Translation & Literary Studies, 7(1), 208-219.
2. Baroni, M. & Bernardini, S. (2005). A New Approach to the Study of Translationese: Machine-learning the Difference between Original and Translated Text. Literary and Linguistic Computing, 21(3), 259-274.
3. Biriukov, A. (2004). Rozrobka metodiv otsinky yakosti mashynnoho perekladu na osnovi resultativ doslidgen z otsinky yakosti perekladu tradytsiinoho. Kultura Narodov Prichernomoria, 55(1), 100-105.
4. Bojar, O., Graham, Y., Kamran, A., & Stanojevic, M. (2016). Results of the WMT16 Metrics Shared Task. Proceedings of the First Conference on Machine Translation, 2, 199-231.
5. Brai, A. Y. (2023). Zasoby dlia otsinky yakosti mashynnoho perekladu. Materialy XV Mizhnarodnoi Studentskoi Naukovo- praktychnoi Konferentsii, Liudyna yak subiekt mizhkulturnoi komunikatsii: suchasni tendentsii u filolohii, perekladi, ta navchanni mov, 84-87. [in Ukrainian]
6. Brglez, M. & Vintar, S. (2022). Lexical diversity in statistical and neural machine translation. Information, 13(2), 93.
7. Chatterjee, S. & Yadav, S. B. (2019). The origin of prebiotic information system in the Peptide/RNA world: a simulation model of the evolution of translation and the genetic code. Life, 9(1), 25
8. Chevdar, D. M. (2018). Osoblyvosti mashynnoho perekladu politychnoho dyskursu. Naukovyi Visnyk PNPU im. K. U. Ushynskoho, 27, 211-222. [in Ukrainian]
9. Chu, C. & Wang, R. (2020). A survey of Domain adaptation for Machine Translation. Journal of Information Processing, 28(0), 413-426.
10. Conneau, A., Kruszewski, G., Lample, G., Barrault, L., & Baroni, M. (2018). What you can cram into a single $&!#* vector: Probing sentence embeddings for linguistic properties. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2126-2136.
11. Dinu, G., Mathur, P., Federico, M., & Al-Onaizan, Y. (2019). Training Neural Machine Translation to Apply Terminology Constraints. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics .
12. Haque, R., Hasanuzzaman, M., & Way, A. (2019). Investigating Terminology Translation in Statistical and Neural Machine Translation: A Case Study on English-to-Hindi and Hindi-to-English. Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2019).
13. Haque, R., Hasanuzzaman, M., & Way, A. (2019a). Terminology translation in Low-Resource scenarios. Information, 10(9), 273.
14. Justeson, J. S. & Katz, S. M. (1995). Technical terminology: some linguistic properties and an algorithm for identification in text. Natural Language Engineering, 1(1), 9-27.
15. Lavie, A. & Agarwal, A. (2007). METEOR: An Automatic Metric for MT Evaluation with High Levels of Correlation with Human Judgments. Proceedings of the Second Workshop on Statistical Machine Translation, 228-231.
16. Miscchenko, A. L. (2013). Mashynnyi pereklad u konteksti suchasnoho naukovo-tekhnichnoho perekladu. Visnyk Kharkivskoho Natsionalnoho Universytetu Imeni V. N. Karazina, 1051(73), 172-180.
17. Och, F. J. (2003). Minimum error rate training in statistical machine translation. Proceedings of the 41st Annual Meeting on Association for Computational Linguistics, 1, 160-167.
18. Specia, L. (2014). Statistical machine translation. In IGI Global eBooks (pp. 897-931).
Додатки
Додатки Google Translate
Додатки DeepL Translate
Размещено на Allbest.ru
Подобные документы
Розгляд фонових знань необхідних для перекладу текстів в галузі психології. Ознайомлення з положеннями перекладу та визначення особливостей перекладу текстів науково-технічної літератури. Систематизація і класифікація труднощів з метою їхнього подолання.
курсовая работа [67,5 K], добавлен 26.02.2012Розгляд антонімічного перекладу як однієї з лексико-граматичних трансформацій. Аналіз мовного антонімічного перекладу формальної негативації, позитивації й анулювання наявних у реченні негативних компонентів. Опис контекстуального антонімічного перекладу.
статья [20,1 K], добавлен 14.08.2017Проблема адекватності перекладу художнього тексту. Розкриття суті терміну "контрастивна лінгвістика" та виявлення специфіки перекладу художніх творів. Практичне застосування поняття "одиниці перекладу". Авторське бачення картини світу під час перекладу.
статья [26,9 K], добавлен 24.04.2018Приклади використовування на практиці перекладацьких прийомів за умов усного послідовного та письмового перекладу текстів за фахом. Вибір перекладацької стратегії згідно з видом перекладу. Алгоритм перекладу різних типів технічної та ділової документації.
отчет по практике [29,2 K], добавлен 14.05.2012Фонові знання, необхідні для перекладу текстів у галузі юриспруденції. Дослідження шляхів перекладу німецької юридичної термінології на українську мову. Основні прийоми перекладу термінів-словосполучень. Аналіз лексико-граматичних трансформацій.
курсовая работа [137,8 K], добавлен 28.12.2012Теоретичні підходи в дослідженні газетно-інформаційних повідомлень та їх перекладу. Загальні поняття і роль перекладу в сучасному світі, проблеми перекладу газетно-інформаційних повідомлень, аналіз лінгвістичних та екстралінгвістичних факторів перекладу.
дипломная работа [76,8 K], добавлен 06.06.2010Визначення поняття синтаксичної трансформації як особливого виду міжмовного перетворення та невід’ємної частини процесу перекладу. Характеристика основних типів синтаксичних трансформацій та аналіз їх використання під час перекладу різних текстів.
статья [24,1 K], добавлен 24.11.2017Пошукові системи Інтернет-мережі. Популярні он-лайн перекладачі, переваги електронних словників. Використання ресурсів Інтернету при перекладі науково-технічної літератури. Помилки і неточності, що виникають в процесі комп’ютерного перекладу текстів.
курсовая работа [46,3 K], добавлен 09.02.2013Засади художнього перекладу та аналіз моделей перекладу з точки зору їх відповідності загальній меті художнього перекладу. Основні аспекти відтворення авторського стилю в романі "Друга стать". Лексико-стилістичні особливості перекладу даного твору.
дипломная работа [95,6 K], добавлен 14.10.2014Німецька реклама та її відтворення у перекладі. Адекватність та еквівалентність перекладу реклами. Способи перекладу німецьких рекламних слоганів. Дослівний переклад реклами, субституція як специфічний засіб перекладу. Парафраза як спосіб перекладу.
курсовая работа [57,7 K], добавлен 21.06.2013