Корпус паралельних текстів як інструмент перекладача

Обґрунтування необхідності створення універсального електронного корпусу текстів як ефективного інструменту роботи перекладача. Переваги використання "корпусу паралельних текстів" при перекладі. Взаємодія корпусної лінгвістики та практики перекладу.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 15.03.2018
Размер файла 26,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Національний педагогічний університет імені М. П. Драгоманова

КОРПУС ПАРАЛЕЛЬНИХ ТЕКСТІВ ЯК ІНСТРУМЕНТ ПЕРЕКЛАДАЧА

С.А. Матвєєва

Анотація

переклад корпус паралельний текст

Статтю присвячено осмисленню й обґрунтуванню необхідності створення універсального електронного корпусу текстів як ефективного інструменту роботи перекладача. Автор розкриває суть поняття “корпус паралельних текстів”, аналізує переваги використання такого корпусу при перекладі та описує сучасну ситуацію взаємодії корпусної лінгвістики та практики перекладу.

Ключові слова: паралельні тексти, переклад, корпус текстів, сегментація, вирівнювання, контекст, словник.

Аннотация

Матвеева С. А. Корпус параллельных текстов как инструмент переводчика

Статья посвящена осмыслению и обоснованию необходимости создания универсального электронного корпуса текстов как эффективного инструмента работы переводчика. Автор раскрывает суть понятия “корпус параллельных текстов”, анализирует преимущества использования такого корпуса при переводе и описывает современную ситуацию взаимодействия корпусной лингвистики и практики перевода.

Ключевые слова: параллельные тексты, перевод, корпус текстов, сегментация, выравнивание, контекст, словарь.

Annotation

Matvieieva S. A. Parallel Corpus as a Translator's Tool.

The article deals with comprehension and justification of necessity for a universal electronic text corpus as an effective translator's tool. The author studies the definitions of the “parallel texts corpus” term, analyses the advantages of such corpus for translation and interpretation, and describes the current situation of interaction of Corpus Linguistics and Translation and Interpretation practice. The evaluation of alignment systems for parallel texts is described in the article. The authors emphasizes that nowadays parallel texts are becoming an increasingly important resource for building the natural language processing tools needed in the multilingual society. The high demand for research in this field (creation of multilingual parallel corpora, etc.) should stimulate rapid progress in the near future. Corpus linguistics currently appears to be expanding to include more of the world's languages, including Ukrainian.

Keywords: parallel texts, translation, text corpora, segmentation, alignment context, dictionary.

Виклад основного матеріалу

В останні роки особливу увагу дослідників різних галузей лінгвістичної науки привертають питання формалізації мовних явищ та одиниць всіх рівнів з метою створення універсальних ресурсів зберігання, обробки, аналізу та використання мовних одиниць. У сфері перекладу такі процеси викликані необхідністю встановлення чітких алгоритмізованих стандартів для комп'ютерної обробки мовного матеріалу з подальшим його використанням для створення програмних продуктів та баз даних, які стануть корисними та ефективними інструментами в руках перекладачів.

Надбання наукового суспільства останніх років дозволило виробити велику кількість алгоритмів і підходів до створення комп'ютерного лексикону, однак деякі ознаки та характеристики мовних одиниць досі не піддаються формалізації через лексичну та граматичну багатозначність, екстралінгвістичну специфічність окремих одиниць та цілих текстів, процес постійного розвитку та мінливості мови. Через це питання вироблення універсальних алгоритмів і стандартів, створення досконалих корпусів текстів не втрачають актуальності та потребують подальшого вивчення та пошуку шляхів вирішення.

Останнім часом проблемам корпусної лінгвістики приділяється велика увага в світовому мовознавстві. Серед робіт, присвячених створенню корпусів текстів та використанню їх у процесі роботи із текстом взагалі та його перекладу зокрема, праці зарубіжних лінгвістів G. Anderman, T. Piotrowski, W. Teubert, вітчизняних дослідників Н. Дарчук, О. Демської, В. Жуковської, В. Широкова та ін. Кожна з цих робіт наближає перекладацьке співтовариство до досягнення мети із створення досконалої електронної системи доступу до багатомовної лінгвістичної інформації - системи, що відкриває нові можливості для аналізу мовного матеріалу та використання його при перекладі.

Метою статті є осмислення й обґрунтування необхідності створення універсального електронного корпусу текстів як ефективного інструменту роботи перекладача.

Недовгий час існування такого напряму досліджень, як корпусна лінгвістика, пояснює недостатню сформованість термінологічного апарату та розбіжності в тлумаченні основних галузевих понять. Так, у зарубіжній лінгвістиці під корпусом паралельних текстів, чи паралельним корпусом текстів, розуміють: “депозитарій перекладів” [8, с. 128]; “вихідні тексти та їх переклади” [4, с. 14]; “корпус, якій містить певні вихідні тексти та їх переклади” [6, с. 20]. Українські дослідники визначають це явище як “єдність підмножини оригінальних текстів та підмножини їх перекладів на іншу(і) мову(и)” [1, с. 90]; “корпус, який складається як мінімум з двох підкорпусів, один з яких є вихідним, а інший містить тексти-переклади вихідного корпусу” [2, с. 136]. Всі ці визначення не суперечать одне одному, а описують новий лінгвістичний феномен з різних боків.

З точки зору теоретичного перекладознавства дослідників цікавлять питання використання корпусів для вивчення процесів перекладу, розуміння когнітивної суті діяльності перекладача, тобто їхню увагу зосереджено на аналітичній роботі із існуючими корпусами. З практичної точки зору таких питань набагато більше, і, в першу чергу, вони стосуються ефективного використання існуючих корпусів для створення нових текстів і корпусів найвищої якості.

За структурою корпус паралельних текстів суттєво відрізняється від одномовних корпусів. Такий корпус містить оригінальний текст та його переклад(и) іншою(ми) мовою(ами). При цьому тексти сегментовані за реченнями або абзацами, тобто кожному реченню або абзацу оригіналу відповідає речення або абзац перекладу. Такий устрій корпусу, при якому співвідносяться “переклади сегментів замість еквівалентів слів, переміщає увагу перекладача з лексичної одиницю на одиницю смислу” [9, с. 154].

Необхідно відзначити, що не завжди вдається досягти стовідсоткової відповідності сегментів при застосуванні автоматичної системи сегментування. Найбільш вдалим є сегментування перекладів, виконаних на мову тієї самої груп, що і мова тексту оригіналу (наприклад, українсько- білоруський, чесько-польський тощо). У близькоспоріднених мовах часто спостерігається повна або майже повна синтаксична відповідність. Щодо мов різних груп, то в цих випадках порушення співвідношення “форма-зміст” в межах певних сегментів трапляється частіше, що руйнує смисл всього перекладеного тексту й зводить нанівець створення корпусу з таких текстів. У таких випадках застосовується сегментація, яка виконується людиною, що робить процес створення корпусу більш тривалим, трудомістким та високовартісним.

Серед основних можливих напрямків використання корпусу паралельних текстів перекладачами називають наступні:

“1) перевірити, чи використовується певна форма в мові, на яку виконується переклад;

2) переконатися, що така форма використовується в певному контексті(ах), лінгвістичному чи соціальному;

3) перевірити, в яких словосполученнях і в яких контекстах використовується така форма” [7, с. 118].

Тобто, корпус паралельних текстів надає перекладачу інструмент для швидкого аналізу мовної одиниці та варіантів її перекладу із залученням великого масиву текстової та екстралінгвістичної інформації з одночасним зануренням у контекст.

Відомо, що якість перекладу залежить від трьох основних складових: розуміння предметної галузі, відмінного знання мови перекладу й досконалого володіння мовою оригіналу. Дослідники наголошують, що “переклади, виконані із застосуванням корпусів, відрізняються більш високою якістю щодо розуміння предмету, правильного вибору термінів та ідіоматичних висловів” [5, с. 631].

Таким чином, використання корпусу паралельних текстів у перекладі дозволяє перекладачу дізнатися, як слово чи конструкція перекладається в певному контексті, що часто суттєво відрізняється від того контенту й тих варіантів та еквівалентів, які містять традиційні словники. Очевидно, що завданням перекладача є не знаходження відповідника, або еквівалента слова в словнику, не робота з кожним окремим словом, а опрацювання всього тексту в цілому, перевірка життєздатності кожного конкретного варіанта перекладу в певному контексті, тобто перекладач має простежити, як перекладаються не окремі слова, а “як ідея, сформульована однією мовою, передається іншою” [6, с. 22]. Слова, позбавлені контекстуального оточення, не мають для перекладача жодної цінності.

Корпус паралельних текстів допомагає встановити такі еквіваленти, які, з урахуванням вже існуючих контекстів і варіантів, будуть органічно функціонувати в новому тексті перекладу поряд з автентичним текстом, та надає перекладачу можливість відстежити та врахувати при перекладі найменші та найтонші нюанси значення та вживання кожної одиниці тексту. Адже перекладач має збалансувати зв'язки та поєднати одиниці системи й тексту.

Корпус паралельних текстів дозволяє проводити порівняння не тільки тексту оригіналу й тексту перекладу, але й навпаки - порівнювати текст перекладу з текстом оригіналу. Цьому боку процесу перекладу завжди приділялося дуже мало уваги, при тому що глибоке вивчення цих питань дозволить краще зрозуміти процеси перекладу з точок зору психології, когнітивістики, лінгвістики, кібернетики тощо. При цьому необхідно пам'ятати, що в таких дослідженнях важливу роль грає напрямок перекладу в паралельному корпусі.

Високий потенціал корпусу паралельних текстів для перекладацької діяльності не зменшує ролі одномовних корпусів як інструменту перекладача. Саме одномовні корпуси надають перекладачу додаткову інформацію про предмет перекладу, допомагають покращенню його розуміння, актуалізують фонові знання перекладача. Такі корпуси також є важливим джерелом уточнення значення нестандартних висловів, технічних термінів, оказіоналізмів, найновіших запозичень, відчуття тонких стилістичних та емоційно-експресивних нюансів тощо.

Не можна стверджувати, що паралельний корпус робить процес перекладу безпроблемним, оскільки наявність одного паралельного тексту (особливо, якщо йдеться про переклад художнього тексту або будь-якого тексту з сильно вираженою авторською позицією та ставленням до описуваних подій) несе в собі стовідсотковий відбиток мовної особистості перекладача, яким цей переклад виконаний. З метою підвищення об'єктивності перекладу паралельний корпус має містити якомога більше варіантів перекладу того самого тексту, а перекладач особисто вирішує, який з варіантів обрати в кожному конкретному випадку.

Ще однією проблемою є недосконалість текстів, з яких складаються корпуси, наявність помилок, невдалий вибір перекладацьких відповідників, низька лінгвістична якість текстів в оригіналі або в перекладі тощо. Так саме є проблемою й використання неавтентичних текстів в якості оригінальних при створенні паралельних корпусів. Через це стає зрозумілим, що перекладач не може сліпо користуватися запропонованими варіантами, а має свідомо застосовувати сформоване критичне ставлення до кожного окремого випадку. Про цей аспект особливо треба пам'ятати при підготовці майбутніх перекладачів.

На сьогодні в Україні теоретичні дослідження з корпусної лінгвістики та корпуси текстів, що вже існують та знаходяться в процесі створення, викликають зацікавленість виключно дослідників корпусної лінгвістики, мовознавців-лексикографів й жодним чином не використовуються перекладачами-практиками. Така ситуація складається через відсутність тісного зв'язку спеціалістів з теорії перекладу та перекладачів, брак методичних та інформаційних матеріалів, що містять результати новітніх досліджень у перекладознавстві, незацікавленість перекладачів у підвищенні своєї кваліфікації тощо. Більше того, за нашими даними, на цей час не існує жодного корпусу паралельних текстів з українською мовою серед мов корпусу. В 2009 р. групою вітчизняних дослідників заявлено про спробу створення англо-українського корпусу текстів офіційного стилю та корпусу текстів із комп'ютерної лінгвістики [3, с. 25], але поки ці здобутки не представлені для користування.

Розвиток комп'ютерних технологій в лінгвістиці та перекладознавстві є вкрай перспективним й важливим питанням сьогодення. Переваги використання корпусів паралельних текстів перекладачами є очевидним і беззаперечним. При цьому створення таких корпусів є справою, яка тільки чекає на розв'язання. Результатом подальшої спільної роботи лінгвістів і програмістів у цьому напрямку стане удосконалення існуючих та пошук нових способів машинного опрацювання природної мови, які покращать якість обробки текстів і ступінь ефективності використання отриманих даних у процесі роботи з існуючим мовним матеріалом та при створенні нових продуктів мовленнєвої діяльності.

Література

1. Демська О. Текстовий корпус: ідея іншої форми / О. Демська. К.: НаУКМА, 2011. 282 с.

2. Жуковська В. В. Вступ до корпусної лінгвістики / В. В. Жуковська. Житомир: Вид-во ЖДУ ім. І. Франка, 2013. 142 с.

3. Касьяненко М. К. Принципи побудови корпусу текстів різних функціональних стилів / М. К. Касьяненко, К. М. Лебедєв, П. М. Петренко // Науковий вісник Волинського національного університету імені Лесі Українки. 2009. № 6. С. 25-28.

4. Anderman G. The Linguist and the Translator / G. Anderman, M. Rogers // Incorporating Corpora. The Linguist and the Translator. Clevedon: Multilingual Matters Ltd, 2008. P. 5-17.

5. Bowker L. Using Specialized Monolingual Native-Language Corpora as a Translation Resource: A Pilot Study / Lynne Bowke. Meta: Translators' Journal. 1998. Vol. 43. No. 4. P. 631-651.

6. MCenery T. Parallel and Comparable Corpora: What is Happening? / T. MCenery, R. Xiao // Incorporating Corpora. The Linguist and the Translator. Clevedon: Multilingual Matters Ltd, 2008. P. 18-31.

7. Piotrowski T. The Translator and Polish-English Corpora / Tadeusz Piotrowski // Incorporating Corpora. The Linguist and the Translator. Clevedon: Multilingual Matters Ltd, 2008. P. 117-132.

8. Teubert W. Corpus linguistics and lexicography / Wolfgang Teubert // Text corpora and multilingual lexicography. Amsterdam: John Benjamins Publishing Company, 2007. P. 109-133.

9. Vintar S. Corpora in Translator Training and Practice: A Slovene Perspective // Spela Vintar // Incorporating Corpora. The Linguist and the Translator. Clevedon: Multilingual Matters Ltd, 2008. P. 153-167.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.