Фразеологический машинный перевод. Структура машинного словаря
История появления машинного перевода. Преобразование текста на компьютере. Последовательность формальных операций, обеспечивающих анализ и синтез в системе перевода. Способы обработки образной фразеологии. Основные проблемы перевода фразеологизмов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 26.03.2020 |
Размер файла | 6,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http: //www. allbest. ru/
Факультет Прикладной математики и информатики
Кафедра Информационных технологий и прикладной математики
Реферат по дисциплине:
«Экономическая информатика»
на тему: «Фразеологический машинный перевод. Структура машинного словаря»
Москва 2019
Содержание
Введение
1. История появления машинного перевода
2. Классификация систем машинного перевода
3. Системы машинного перевода и их структура
4. Последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода
5. Концепции развития систем МП
6. Система фразеологического машинного перевода
7. Принципы построения систем фразеологического машинного перевода
8. Основные способы перевода образной фразеологии
9. Проблемы перевода фразеологизмов
Заключение
Список использованной литературы
Приложения
Введение
Осуществление перевода компьютером - сложная, но интересная научная задача. Основная ее сложность состоит в том, что естественные языки плохо поддаются формализации. Отсюда и невысокое получаемого с помощью систем МП текста качество.
Термин машинный перевод (МП) понимается по крайней мере в двух смыслах. Машинный перевод в узком смысле - это процесс перевода некоторого текста с одного естественного языка на другой, реализуемый компьютером полностью или почти полностью. В ходе данного процесса на вход машины подается текст, словесная честь которого не сопровождается никакими дополнительными указаниями, а на выходе получается текст на другом языке, являющийся переводом входного, причем преобразование входного текста в выходной происходит без вмешательства человека (иногда допускается постредактирование).
Машинный перевод в широком смысле - это область научных исследований, находящаяся на стыке лингвистики, математики, кибернетики, и имеющая целью построение систем, реализующих машинный перевод в узком смысле. машинный перевод образный фразеология
1. История появления систем машинного перевода
Идея машинного перевода уходит корнями далеко в прошлое. Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж, разработавший в 1836-1848 гг. проект цифровой аналитической машины. Его идея состояла в том, что память объемом 1000 50-разрядных десятичных чисел можно использовать для хранения словарей. Однако аналитическую машину, ему так и не удалось построить.
А через 100 лет, в 1947 году, У. Уивер предложил использовать технику дешифрования для перевода текстов. Этот год считается годом рождения машинного перевода. В этом же году был разработан алгоритм осуществления пословного перевода. В последующие два десятилетия системы машинного перевода бурно развивались. Но в 1967 году специально созданная Комиссия Национальной Академии Наук США признала машинный перевод нерентабельным, что существенно затормозило исследования в этой области. Новый подъем машинный перевод переживает в 70-е годы, а в 80-е становится экономически выгодным за счет сравнительной дешевизны машинного времени.
2. Классификация систем машинного перевода
Классификация систем машинного перевода по Лари Чайлду:
- полностью автоматический перевод;
- автоматизированный машинный перевод при участии человека;
- перевод, осуществляемый человеком с использованием компьютера.
Полностью автоматизированный машинный перевод
Этот вид машинного перевода и подразумевается большинством людей, когда они говорят о машинном переводе. Смысл здесь прост: в компьютер вводится текст на одном языке, этот текст обрабатывается и компьютер выводит этот же текст на другом языке. К сожалению, реализация такого вида автоматического перевода сталкивается с определенными препятствиями, которые еще предстоит преодолеть.
Основной проблемой является сложность языка как такового. Возьмем, к примеру, значения слова "can". Помимо основного значения модального вспомогательного глагола, у слова "can" имеется несколько официальных и жаргонных значений в качестве существительного: "банка", "отхожее место", "тюрьма". Кроме этого, существует архаичное значение этого слова - "знать или понимать". Если предположить, что у выходного языка для каждого из этих значений имеется отдельное слово, каким образом может компьютер их различить?
Как оказалось, определенные успехи были достигнуты в сфере разработки программ перевода, различающих смысл основываясь на контексте. Более поздние исследования при анализе текстов опираются больше на теории вероятности. Тем не менее, полностью автоматизированный машинный перевод текстов с обширной тематикой все еще является невыполнимой задачей.
Автоматизированный машинный перевод при участии человека
Этот вид машинного перевода теперь вполне осуществим. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так и после их обработки компьютером. Люди-переводчики изменяют тексты так, чтобы они были понятны машинам. После того, как компьютер сделал перевод, люди опять редактируют грубый машинный перевод, делая текст на выходном языке правильным. Помимо такого порядка работы, существуют системы МП, во время перевода требующие постоянного присутствия человека-переводчика, помогающего компьютеру делать перевод особенно сложных или неоднозначных конструкций.
Перевод, осуществляемый человеком с использованием компьютера
При этом подходе человек-переводчик оказывается в центре процесса перевода, в то время как программа компьютера становится инструментом, делающим процесс перевода более эффективным, а перевод - точным. Это обычные электронные словари, которые обеспечивают перевод требуемого слова, возлагая на человека ответственность за выбор нужного варианта и смысл переведенного текста. Такие словари значительно облегчают процесс перевода, но требуют от пользователя определенного знания языка и затрат времени на его осуществление. И все же сам процесс перевода значительно ускоряется и облегчается.
Среди систем, помогающих переводчику в работе, важнейшее место занимают так называемые системы Translation Memory (TM). Системы ТМ представляют собой интерактивный инструмент для накопления в базе данных пар эквивалентных сегментов текста на языке оригинала и перевода с возможностью их последующего поиска и редактирования. Эти программные продукты не имеют целью применение высокоинтеллектуальных информационных технологий, а наоборот, основаны на использовании творческого потенциала переводчика. Переводчик в процессе работы сам формирует базу данных, и чем больше единиц она содержит, тем больше отдача от ее использования.
Наиболее известные системы Translation Memory (TM):
- Transit швейцарской фирмы Star,
- Trados (США),
- Translation Manager от IBM,
- Eurolang Optimizer французской фирмы LANT,
- DejaVu от ATRIL (США),
- WordFisher (Венгрия).
Системы ТМ позволяют исключить повторный перевод идентичных фрагментов текста. Перевод сегмента осуществляется переводчиком один раз, а затем каждый следующий сегмент проверяется на совпадение с базой данных, и, если найден идентичный или похожий сегмент, то он предлагается в качестве варианта перевода.
Несмотря на широкий ассортимент систем TM, они имеют несколько общих функций:
- Функция сопоставления (Alignment). Одно из преимуществ систем ТМ - это возможность использования уже переведенных материалов по данной тематике. База данных ТМ может быть получена путем посегментного сопоставления файлов оригинала и перевода.
- Наличие фильтров импорта - экспорта. Это свойство обеспечивает совместимость систем ТМ с множеством текстовых процессоров и издательских систем и дает переводчику относительную независимость от заказчика.
- Механизм поиска нечетких или полных совпадений. Именно этот механизм и представляет собой основное достоинство систем ТМ. Если при переводе текста система встречает сегмент, идентичный или близкий к переведенному ранее, то уже переведенный сегмент предлагается переводчику как вариант перевода текущего сегмента, который может быть подкорректирован.
- Поддержка тематических словарей. Эта функция помогает переводчику придерживаться глоссария. Если в переводимом сегменте встречается слово или словосочетание из тематического словаря, то оно выделяется цветом и предлагается его перевод, который можно вставить в переводимый текст автоматически.
- Средства поиска фрагментов текста. Этот инструмент очень удобен при редактировании перевода. Если в процессе работы был найден более удачный вариант перевода какого-либо фрагмента текста, то этот фрагмент может быть найден во всех сегментах ТМ, после чего в сегменты ТМ последовательно вносятся необходимые изменения.
Конечно, как и любой программный продукт, системы ТМ имеют свои достоинства и недостатки, и свою область применения. Однако в отношении систем TM, основным недостатком является их дороговизна.
Особенно удобно использовать системы ТМ при переводе таких документов, как руководства пользователя, инструкции по эксплуатации, конструкторская и деловая документация, каталоги продукции и другой однотипной документации с большим количеством совпадений.
3. Системы машинного перевода и их структура
Системы МП осуществляют автоматизированный перевод текста. Единицами перевода при этом служат слова или словосочетания, причем последние разработки позволяют учитывать морфологию переводимого слова. Развитые системы МП осуществляют перевод по заданным разработчиком и/или корректируемым пользователем алгоритмам перевода.
Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией для обеспечения передачи переводных соответствий, а также средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод трех и более языков, но они в настоящее время являются экспериментальными.
Структура систем машинного перевода :
1. Вспомогательные программные средства.
2. Состав лингвистической базы данных.
3. Лингвистический процессор.
1. Вспомогательные программные средства.
На этапе обработки исходного текста в системе машинного перевода должны присутствовать определенные вспомогательные программные средства. Чтобы преобразовывать тексты из одного кодового представления в другое, необходимы конверторы. Типичный конвертор поддерживает подмножество кодовых таблиц, используемых для символов конкретного языка. При обработке документов возникает задача преобразования исходного документа в обычный текст (plain text), для дальнейшей его семантической и синтаксической обработки. При этом на этапе преобразования необходимо сохранить полезную информацию о структуре документа и его стилевом оформлении, о взаимосвязи между абзацами, о заголовках и т.д. В задачу преформатора входит распознавание различных форматов документов поступающих на вход и выделение текстовой информации из этих документов с сохранением ее структуры.
Отдельным блоком можно выделить программы взаимодействия с базами данных, которые необходимы для полноценного лингвистического анализа исходного текста и синтеза текста на переводном языке.
Для удобной работы с системой машинного перевода необходимо обеспечить дружественный интерфейс, оперирующий доступным для любого пользователя языком управления заданиями. Именно с помощью этого интерфейса пользователь должен иметь возможность без программирования ввести, отредактировать и проверить текст, сделать его перевод, вывести его на печать, провести статистическую обработку материала, получить нужную справку и т. п.
2. Состав лингвистической базы данных.
Лингвистическая база данных для системы машинного перевода включает в себя накопленные лингвистические данные, объективированные текстами, картотеками, словарями, грамматиками и другими лингвистическими источниками. Типичный состав лингвистической базы данных можно ограничить следующими компонентами:
а) Лексико-грамматический классификатор свойств исходного языка и переводного языка (система морфологического кодирования). При анализе исходного текста каждое слово в нем должно получить соответствующие морфологические характеристики: признак части речи, род, падеж, наклонение, число и др. Система кодирования должна быть единой для конкретной системы машинного перевода.
б) Базовый двуязычный морфологический словарь. В этом словаре устанавливается пословное соответствие каждой словоформы исходного языка словоформам языка перевода.
в) Словарь сокращений и аббревиатур. Словарь используется на этапе разбиения исходного текста на слова и предложения. Сокращения и аббревиатуры должны быть по возможности расшифрованы, так как они могут являться членами предложения, следовательно, их необходимо учитывать при синтаксическом и семантическом анализе.
г) Словарь идиом. Данный словарь применяется до синтаксического анализа, поскольку очень часто идиома является одним членом предложения и рассматривается как единое целое; при переводе идиома на исходном языке может соответствовать одному слову на переводном языке.
д) Терминологические словари по предметным областям. Дополнительные словари подключаются при необходимости перевода специализированных текстов.
е) Синтаксический словарь. В данном словаре должна содержаться информация о синтаксической сочетаемости членов предложения как в языке оригинала, так и в переводном языке, а также синтаксические соответствия, необходимые при переводе.
ж) Семантический словарь (тезаурус, онтология). Данный компонент содержит информацию о семантической сочетаемости лексем, о лексикосемантических полях, применяется на этапе построения семантического графа предложения.
з) Корпус параллельных текстов. Корпус содержит тексты на языке оригинала и их переводы на другой язык. При нахождении предложения или его фрагмента в корпусе параллельных текстов в текст перевода вставляется его соответствие на переводном языке. На использовании корпуса текстов построена технология памяти переводов.
3. Лингвистический процессор.
Лингвистический процессор предназначен для полного лингвистического анализа текста на исходном языке, а также синтеза текста на языке перевода. Лингвистический процессор включает следующие компоненты:
а) Программа разбиения текста на предложения и слова.
б) Программа распознавания устойчивых словосочетаний. Идиомы
должны анализироваться и переводиться как неделимое целое.
в) Программа расшифровки сокращений и аббревиатур.
г) Программа морфологического аннотирования исходного текста.
д) Программа синтаксического анализа и построения дерева зависимостей.
е) Программа семантического анализа и построения семантического
графа каждого предложения исходного текста.
ж) Программа выбора переводного соответствия из двуязычного словаря
или корпуса параллельных текстов.
з) Программа семантического синтеза текста на переводном языке.
и) Программа построения синтаксической структуры предложения и
определения порядка слов в синтезируемом предложении.
к) Программа морфологического синтеза словоформ в переведенном тексте.
4. Последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода
1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) в словаре языка, с которого производится перевод с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря).
2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических) характеристик элементов входного текста ексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.
3. Окончательный грамматический анализ, в ходе которого окончательно определяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, несмотря на то, что в оригинале может быть и единственное число).
4. Синтез выходных словоформ и предложения в целом на выходном языке.
В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным - скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).
5. Концепции развития систем МП
Первая: Модель «большого словаря со сложной структурой», которая заложена в большинство современных программ-переводчиков;
Вторая: Модель «смысл-текст», впервые сформулированная А.А. Ляпуновым, но пока что не реализована ни в одном коммерческом продукте.
На сегодняшний день наиболее известны следующие системы машинного перевода:
ь PROMT 2000/XT компании PROMT
ь - Retrans Vista компаний Vista и Advantis;
ь - Сократ - набор программ компании Арсеналъ.
В большинстве случаев при работе над проектом применение систем МП не оправдано, поскольку:
- Системы МП не дают приемлемого качества выходного текста. Более высокого качества можно добиться с помощью предварительной настройки, что неудабно при небольших объемах переводимого текста.
- Системы МП не гарантируют соблюдения единства терминологии, особенно при работе коллектива переводчиков над большим проектом
Однако в некоторых случаях использование систем МП все же помогает сократить временные затраты. Это происходит, если текст достаточно объемный и содержит однообразную терминологию, что позволяет сравнительно быстро настроить под него систему МП. Тогда редактирование текста не займет слишком много времени. Однако в этом случае следует особенно внимательно отнестись к стилю текста перевода.
Вообще говоря, системы МП вполне могут применяться там, где используется максимально стандартизованный язык с простой грамматикой и сравнительно небольшим запасом слов. Довольно успешным проектом системы МП считается немецкая программа Meteo, выполняющая перевод метеопрогнозов с французского языка на английский и обратно. Для облегчения работы переводчиков и технических писателей компанией Boeing в свое время был разработан стандарт языка для написания технической документации, который известен как Boeing English.
6. Система фразеологического машинного перевода
Системы машинного перевода текстов с одних естественных языков на другие моделируют работу человека-переводчика. Их эффективность зависит от того, в какой степени в них учитываются объективные законы функционирования языка и мышления. Решая проблему машинного перевода, необходимо учитывать богатый опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. А этот опыт свидетельствует о том, что в процессе перевода в качестве основных единиц смысла рассматриваются, прежде всего, фразеологические словосочетания, выражающие целостные понятия, а не отдельные слова. Именно понятия являются теми элементарными мыслительными образами, используя которые можно строить более сложные языковые модели, соответствующие переводимому тексту.
Системы машинного перевода, в которых в качестве основных минимальных единиц смысла рассматриваются не отдельные слова, а фразеологические словосочетания, называют системами фразеологического машинного перевода. В этих системах отдельные слова также могут использоваться, но они рассматриваются как вспомогательные единицы смысла.
Система фразеологического машинного перевода включает в себя базу знаний, содержащую переводные эквиваленты для наиболее часто встречающихся фраз, фразеологических сочетаний и отдельных слов, и программные средства для морфологического и синтаксического анализа и синтеза текстов и для их редактирования человеком. В процессе перевода текстов система использует хранящиеся в ее базе знаний переводные эквиваленты в следующем порядке: сначала делается попытка перевести всю фразу как целостную единицу; далее, в случае неудачи, входящие в ее состав словосочетания; и, наконец, осуществляется пословный перевод тех фрагментов текста, которые не удалось перевести первыми двумя способами. Фрагменты выходного текста, полученные всеми тремя способами, должны грамматически согласовываться друг с другом.
7. Принципы построения систем фразеологического машинного перевода состоят в следующем
1. Основными единицами языка и речи, которые, прежде всего, включают в машинный словарь, это фразеологические единицы (словосочетания, фразы). Отдельные слова также могут быть включены в словарь, но они должны использоваться только случаях, когда не удается осуществить перевод, опираясь только на фразеологические единицы.
2. Наряду с фразеологическими единицами, состоящими из непрерывных последовательностей слов, в системах машинного перевода следует использовать и так называемые "речевые модели" - фразеологические единицы с "пустыми местами", которые могут заполняться различными словами и словосочетаниями, порождая осмысленные отрезки речи.
3. Машинный словарь, предназначенный для перевода текстов даже только из одной тематической области, должен быть политематическим. Он должен создаваться, прежде всего, на основе автоматизированной обработки двуязычных текстов, являющихся переводами друг друга, и в процессе функционирования систем перевода.
4. Наряду с основным политематическим словарем большого объема, в системах фразеологического машинного перевода целесообразно использовать также набор небольших по объему дополнительных тематических словарей. Дополнительные словари должны содержать только ту информацию, которая отсутствует в основном словаре.
5. Основным средством разрешения полисемии (многозначности) слов в системах фразеологического перевода является их использование в составе фразеологических словосочетаний. Дополнительным - аппарат дополнительных тематических словарей, где для каждого многозначного слова или словосочетания указывается его приоритетный переводной эквивалент, специфичный для рассматриваемой предметной области.
6. Большую роль в системах фразеологического машинного перевода текстов могут играть разработанные авторами процедуры морфологического и синтаксического анализа и синтеза русских и английских текстов, построенные на основе принципа аналогии. Эти процедуры позволяют отказаться от хранения в словарях большого объема грамматической информации и порождать ее по мере необходимости автоматически, в процессе перевода. Они делают систему перевода открытой - способной обрабатывать тексты с "новой" лексикой.
7. Наряду с переводом текстов в автоматическом режиме, в системах фразеологического машинного перевода целесообразно предусмотреть и интерактивный режим их работы. В этом режиме пользователь должен иметь возможность вмешиваться в процесс перевода и настраивать дополнительные машинные словари на тематику переводимых текстов.
На основе описанных принципов были построены две системы фразеологического машинного перевода:
1) система русско-английского перевода (RETRANS)
2) система англо-русского перевода (ERTRANS).
8. Основные способы перевода образной фразеологии
1)Эквивалентным фразеологизмом языка перевода (с сохранением образа)
При использовании таких соответствий сохраняется весь комплекс значений переводимой единицы. В этом случае в переводимом языке имеется образный фразеологизм, совпадающий по всем параметрам с фразеологической единицей оригинала, например:
to play with fire - «играть с огнем»; to read between lines - «читать между строк».
2) Замена образа при сохранении семантической близости.
В случае отсутствия фразеологического эквивалента, следует подобрать в ПЯ фразеологизм с таким же переносным значением, основанном на ином образе. Например:
move heaven and earth to get smth.- «свернуть горы на пути к чему-либо» ; a pig in a poke - «кот в мешке»
Использование соответствия этого типа обеспечивает достаточно высокую степень эквивалентности. Однако и здесь существуют некоторые ограничения.
Во-первых, необходимо сохранить эмоциональные и стилистические значения фразеологизма.
Во-вторых, следует учитывать два фактора: стилистическую неравноценность некоторых аналоговых фразеологизмов и национальную окраску фразеологических единиц
Национально-окрашенные фразеологизмы следует передавать русскими фразеологическими единицами, в которых национальная окраска отсутствует:
Queen Anne is dead! - «Открыл Америку!»
3) Дословный перевод фразеологизмов (калькирование)
Перевод путём калькирования фразеологических единиц может быть применен лишь в том случае, если в результате калькирования получается выражение, образность которого легко воспринимается русским читателем и не создает впечатления неестественности и несвойственности общепринятым нормам русского языка
Например: put the cart before the horse - «поставить телегу впереди лошади»;
keep a dog and bark oneself - «держать, собаку, а лаять самому»;
Еще одну немаловажной трудностью при создании фразеологической кальки является придание ей подходящей формы крылатой фразы. Для этого иногда целесообразно приблизить кальку к уже имеющемуся образцу. Так, для перевода английской пословицы «Rome was not built in a day» не может быть использован русский фразеологизм с таким же переносным значением - «Не сразу Москва строилась» - из-за его национальной окраски. Можно дать точную кальку «Рим не был построен за один день», но еще лучше приблизить его к русской пословице «Не сразу Рим строился» (Комиссаров).
4) Перевод ФЕ без сохранения образа
В целях объяснения смысла фразеологической единицы, которая не имеет в русском языке ни аналога, ни эквивалента и не подлежит дословному переводу, переводчику необходимо прибегнуть к описательному переводу. Например: «бить баклуши» - waste time.
9. Проблемы перевода фразеологизмов
1) Сходство фразеологизмов со свободным сочетанием
Определенные трудности при переводе вызывает сходство фразеологизма со свободным сочетанием, например:
to let one's hair down - а) держать себя очень непринужденно, раскованно; б) изливать душу; to be left holding the bag (baby) - «остаться в дураках»; to turn the tables - «поменяться ролями».
Принимая фразеологизм за свободное сочетание, при переводе возникают грубые ошибки. Поэтому, прежде всего, необходимо уметь распознавать фразеологизмы в тексте.
2) Ассоциативная схожесть фразеологизмов
Л.Ф. Дмитриева, С.Е Кунцевич, Е. А Мартинкевич, Н. Ф Смирнова отмечают, что очень часто при полном совпадении формы русского и английского фразеологизма их значения могут не совпадать.
Так, английское выражение to lead by the_nose значит «вести на поводу, всецело подчинить» в отличие от русского «водить за нос»;
3) Стилистическая недифференцированность и многозначность фразеологизмов.
Английская фразеология отличается большей смысловой и стилистической недифференцированностью и многозначностью (Дмитриева).
Например:
to take the floor - в общественно-политической жизни означает «взять слово, выступить на собрании», а в быту -- «пойти потанцевать»;
Таким образом, стилистическая недифференцированность и многозначность фразеологизмов, а также их сходство со свободным сочетанием и ассоциативная схожесть представляют основные трудности при переводе на русский язык.
Почему машинный перевод пока не сможет полноценно переводить без человека?
I. На верхнем уровне по степени непереводимости стоят тексты, обыгрывающие неизвестный читателю перевода контекст, а также каламбуры, завязанные на уникальные синтаксические особенности данного конкретного языка и/или отсутствующие в языке перевода реалии. Фактически перевод подобного даже нельзя назвать собственно переводом - от переводчика необходимо, основательно вникнув в контекст, придумать нечто такое, что донесло бы до читателя перевода "цель высказывания" (насмешило/заставило бы задуматься так же, как читателя оригинала), обеспечив тем самым прагматическую эквивалентность, что возможно далеко не всегда.
"President Bush is so dumb that when someone asked him what the capital of Texas is, he said, 'Capital T.'" (из "Вечернего шоу с Дэвидом Леттерманом").
"Президент Буш настолько туп, что когда его спросили, с чего начинается Родина, он ответил "С буквы Р".
Обыграна игра слов "Capital = столица / прописная буква".
II. Серьезно осложняет жизнь переводчика перевод достаточно старых текстов, которые должны сохранить свою "архаику" и в переводе. Если речь идет о научных работах, то там проблемы не возникают - реалии передаются транслитерацией с соответствующими комментариями. С художественной литературой гораздо сложнее. Допустим, если в оригинале некоторые герои романа говорят на древнеанглийском языке, то абсолютно невозможно перевести их речь древнерусскими фразами, потому что мы таким образом внесем в перевод абсолютно неуместный в нём национальный колорит.
III. Примыкает к предыдущему пункту и передача средствами языка перевода различного рода жаргона, просторечия, акцентных особенностей и т.д.
IV. Фразеологизмы. В общем случае проблема решаема за счет того, что значительной части фразеологизмов языка оригинала соответствуют те или иные аналоги в языке перевода. Однако машинного переводчика здесь ждёт "подводный камень", который заключается в том, что некоторые фразеологизмы нельзя переводить их аналогами "из словаря" по причинам, которые уже были указаны в п. 2 - недопустимое создание национального колорита. Скажем, крайне странно будет смотреться перевод в английском тексте, повествующем об английских реалиях, пословицы "to carry coals to Newcastle" как "ездить в Тулу со своим самоваром".
V. Технические/бытовые реалии, отсутствующие в языке перевода. В наш век стремительного научного прогресса практически каждый новый текст на иностранном языке привносит с собой какую-либо новую терминологию, ранее неизвестную.
VI. Технические/бытовые реалии, присутствующие в языке перевода, но не попавшие в массив текстов для анализа (например, по той причине, что по данной тематике до сих пор не было переводов; потому что они существуют исключительно в устной речи в качестве профессионального сленга;
Заключение
Можно сказать о том, что данное направление является достаточно перспективным и будет активно развиваться, так как проблема языкового барьера остаётся актуальной, пожалуй, во все времена.
Список использованных источников
1. http://www.kompling.narod.ru/index14.html
2. http://study-english.info/article065.php
3. http://linguisticus.com/ru/TranslationTheory/OpenFolder/PEREVOD_FRAZEOLOGIZMOV
4. https://pikabu.ru/story/pochemu_perevodchikam_v_blizhayshie_godyi_mozhno_ne_opasatsya_mashinnogo_perevoda_ili_na_chto_poka_ne_sposobnyi_neyroseti_chast_ii__primeryi_5163709
5. https://www.dissercat.com/content/teoreticheskie-osnovy-i-metody-postroeniya-sistem-frazeologicheskogo-mashinnogo-perevoda/read
6. http://www.dslib.net/teor-informatika/teoreticheskie-osnovy-i-metody-postroenija-sistem-frazeologicheskogo-mashinnogo.html
Приложение 1
Рисунок 1
Приложение 2
Рисунок 2
Рисунок 3
Рисунок 4
Рисунок 5
Рисунок 6
Рисунок 7
Рисунок 8
Рисунок 9
Рисунок 10
Рисунок 11
Рисунок 12
Рисунок 13
Рисунок 14
Рисунок 15
Рисунок 16
Рисунок 17
Рисунок 18
Рисунок 19
Размещено на Allbest.ru
Подобные документы
История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.
презентация [455,3 K], добавлен 22.10.2013История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.
курсовая работа [30,0 K], добавлен 19.06.2015Мировая история технологии машинного перевода как класса систем искусственного интеллекта. Классификация программ онлайн-переводчиков, поддержка функции контролируемого входного языка. Многоязычные браузеры в Интернете и перечень электронных словарей.
контрольная работа [21,6 K], добавлен 03.02.2011Исследование современных технологий машинного перевода. Изучение классификации систем перевода. Характеристика особенностей работы с электронным словарем. Языковые инструменты Google. Программы для проверки правописания и грамматики, текстовые редакторы.
реферат [917,0 K], добавлен 02.11.2014Понятие и цель применения текстовых данных. Принцип кодирования азбуки Морзе. Основные методы языка высокого уровня C#. Алгоритм работы, листинг, тестирование программы для перевода текста в последовательность кодов азбуки Морзе. Руководство пользователя.
курсовая работа [1,4 M], добавлен 15.01.2013Компьютерная программа как последовательность инструкций, предназначенная для исполнения устройством управления вычислительной машины. Анализ стандартов перевода текстов компьютерных игр. Рассмотрение особенностей ИТ-перевода, примеры грубейших ошибок.
реферат [65,5 K], добавлен 29.01.2013Перевод - процесс создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке, требования к обеспечению его эквивалентности. Машинные технологии перевода; характеристика систем Translation Memory.
презентация [347,8 K], добавлен 06.01.2014Способы автоматического перевода математической литературы с английского языка на русский. Вопросы передачи формул (пересчет при необходимости). Импликации в математических текстах. Применение технологии Translation Memory. Основные математические штампы.
реферат [33,2 K], добавлен 07.09.2009Исследование процесса разработки и кодирования приложения для перевода двоичных чисел в шестнадцатеричные в операционной системе Linux. Изучение требований к надежности и программной документации. Определение основных состояний интерфейса программы.
курсовая работа [2,4 M], добавлен 23.06.2012Человеко-машинный интерфейс. Текстовый и смешанный (псевдографический) интерфейсы. Применение человеко-машинного интерфейса в промышленности. Программные средства для разработки человеко-машинного интерфейса. Среда разработки мнемосхем GraphworX32.
дипломная работа [5,3 M], добавлен 19.03.2010