Машинный перевод

История развития машинного перевода. Критерии выбора электронных словарей. Осуществление процесса перевода на компьютере. Популярность программ-переводчиков. Онлайновый перевод информации в Интернете. Советы по улучшению качества переведенных текстов.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 26.05.2010
Размер файла 45,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

"Коперник" лучше всего подойдет для домашнего офиса профессионального переводчика. Он обладает достаточными возможностями для подготовки переводных текстов высокого качества. Программа хорошо переводит тексты самых разнообразных тематик, иногда даже без дополнительных словарей. В некоторых случаях после подключения словарей и несложного постредактирования удается получить переводы, удовлетворяющие всем правилам грамматики и стилистики русского языка. Кроме того, эта программа поддерживает четыре языка, в том числе украинский, что в последнее время весьма актуально. К тому же единственная система, которая может работать с таким же набором языков, - Language Master 98 - стоит на порядок дороже. А интеграция с Word и функция выбора вариантов перевода слов позволяют значительно сократить затраты времени на постредактирование.

"Сократ Персональный 3.0.3" - это предельно простая система для ознакомительного перевода небольших фрагментов текста. Ее козыри - компактность и наличие встроенного электронного словаря, она нетребовательна к квалификации пользователя и максимально автоматизирована. Качество перевода этой системы не всегда высокое, но зато мало зависит от тематики текста. Соответственно, эта программа найдет применение при интенсивной работе с разнообразными иностранными текстами на ознакомительном уровне. Лучше всего поддаются переводу с ее помощью тексты интерактивной справки. Их смысл удается понять во всех случаях, а большинство предложений построены грамотно. Также хорошие результаты можно получить при работе с деловыми письмами - здесь сказываются хорошая сбалансированность словаря, большой запас экономической лексики, а также строгость и шаблонность делового стиля речи, под который, в частности, и настраивался программный алгоритм "Сократа". Удовлетворительными можно считать результаты работы с документацией к программам и руководствами к бытовым приборам, однако, понять их содержание, как правило, можно. Слабым местом программы являются научные тексты, личная переписка, разговорные темы и особенно руководства к компьютерным играм. В первом случае сказывается отсутствие в составе "Сократа" словарей специальных терминов. Остальные же представляют собой естественное затруднение для всех систем машинного перевода, вызванное неформализованной лексикой, сложностью оборотов и стилистическим разнообразием указанных текстов.

И в заключение немного о "темных лошадках". Существует еще одна программа, которую, признаться, мне очень хотелось бы видеть среди недорогих домашних переводчиков. Это утилита QTrans, на сегодняшний день поставляемая только в комплекте с PROMT 98. В ней реализованы довольно мощные функции перевода и предельно простой пользовательский интерфейс. К тому же, объединив QTrans с новой коллекцией тематических словарей под названием "Домашняя", компания ПРОМТ могла бы предложить отличный продукт, удовлетворяющий и начинающих, и более опытных пользователей.

Также сейчас наблюдается новый всплеск интереса к системам МП в связи с развитием сети Интернет. Миллионы людей, говорящих на разных языках, оказались в едином информационном пространстве. Доминирует в Сети английский язык, но есть пользователи, которые им не владеют, как, впрочем, есть множество Webстраниц, написанных не по-английски. Для облегчения просмотра страниц Интернет на незнакомом пользователю языке появились дополнения к броузерам, которые осуществляют немедленный перевод выбранных пользователем фрагментов просматриваемой Webстраницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы ПРОМТ, созданная на базе программы Stylus, которая подключается как к броузеру Netscape Navigator, так и к броузеру Microsoft Internet Explorer.

9. МАШИННЫЙ ПЕРЕВОД В ИНТЕРНЕТЕ

Онлайновый перевод информации в Интернете становится все более популярным. Интернет стремительно превращается из преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам МП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей. Так, на канадском информационно-поисковом портале InfiniT (http://www.infiniT.com) открылся новый сервис переводов. На сайте теперь доступен онлайновый перевод текста с английского и немецкого языков на французский язык и обратно. Увеличение числа посетителей портала обусловлено возможностью онлайнового перевода Web-страниц. Для этого пользователю достаточно указать только адрес Web-страницы, выбрать направление перевода и нажать кнопку перевода. В результате через несколько секунд пользователь получает полностью переведенную Web-страницу с сохранением форматирования. Новый сервис позволяет ликвидировать языковую проблему в канадском Интернете, где в силу исторических особенностей широко используются два языка: английский и французский. Кроме того, онлайновый переводчик открывает доступ к сайтам на немецком языке тем жителям Канады, которые не владеют иностранными языками. Сервис работает на базе серверного Интернет-решения компании ПРОМТ под названием PROMT Internet Translation Server version 2.0. Проект был реализован совместно с компанией Softissimo, которая занимается продвижением продуктов компании ПРОМТ под торговой маркой REVERSO. Интересной особенностью Web-сайтов, знакомящих с программами МП, электронными словарями и другими программами лингвистической поддержки, является то, что с работой многих программных продуктов можно познакомиться в интерактивном режиме, используя версию, установленную на сервере и имеющую шлюз для удаленного общения через Web-интерфейс. На сервере Web- издательства "ИнфоАрт" (http://www.infoart.ru/misc/dict) организована интерактивная демонстрация словарей Lingvo и "МультиЛекс". Вы можете ввести слово или словосочетание и мгновенно получить перевод, толкование, примеры употребления и устойчивые словосочетания.

Что же посоветовать пытливому читателю, решившемуся на штурм языкового барьера в Интернет? Его оружием могут стать WebTranSite 98 (разработчик - ПРОМТ, цена ~ $32), WebView (продукт поставляется в комплекте с PROMT и PROMT Internet), PROMT Internet (разработчик - ПРОМТ, цена ~ $42) или Socrat Internet (разработчик - "Арсеналъ", цена ~ $30). Наиболее универсальным из них является PROMT Internet. Купив этот пакет, вы получите сразу несколько программ для перевода Web-страниц, и не только их. Можно с уверенностью сказать, что возможностей данного набора приложений вполне достаточно для полноценной работы с документами на английском, французском и немецком языке.

Если вы предполагаете использовать универсальную переводящую программу WebTranSite 98 или броузер WebView больше, чем другие части пакета PROMT Internet, и при этом желаете сэкономить немного денег, то можете приобрести эти продукты по отдельности. В таком случае WebTranSite 98 придется по вкусу тем, кто часто переводит небольшие фрагменты текста не только из Интернет, но и из офисных, почтовых и других программ, а также из системы интерактивной справки. Замечу, что WebTranSite 98 подходит не только для перевода Web-страниц. Она достаточно универсальна и позволяет обрабатывать фрагменты текста из любых приложений, в том числе из текстовых редакторов, электронных таблиц, органайзеров, броузеров. Программа переводит тексты с английского, немецкого или французского языка на русский и обратно. Что касается WebView, то это - инструмент искушенного "интернетчика", много времени проводящего на иноязычных серверах и не желающего пропустить ни одной крупицы информации. Программа WebView - полноценный броузер для загрузки и просмотра Web-страниц. Так что, используя его при работе с Интернет-документами на иностранном языке, вы можете даже отказаться от привычных Internet Explorer и Netscape Navigator. WebView - это своеобразный "гибрид" броузера Internet Explorer 4.0 и системы машинного перевода PROMT 98. Полученная в результате такого "скрещивания" программа позволяет переводить Web-страницы, полностью сохраняя их внешний вид. WebView может работать с тремя иностранными языками: английским, французским и немецким, причем переводит как с любого из них на русский, так и в обратном направлении. Функции перевода в этой программе шире, чем в WebTranSite 98, и их набор практически такой же, как в PROMT 98. Так, в дополнение к рассмотренным выше операциям со словарями WebView позволяет вводить в них новые слова и фразы. Чтобы облегчить вашу задачу, программа составляет список незнакомых ей выражений, встретившихся в тексте, подсчитывает количество появлений каждого из них и выводит результаты в специальном диалоговом окне. Выбрав любое из этих слов, вы можете либо запретить его перевод, либо добавить в пользовательский словарь. Единственный недостаток, который портит хорошее впечатление о WeView - это то, что программа иногда зависает при несовпадении направления перевода и языка оригинальной страницы. Однако программы WebTranSite 98 и Web View по отдельности уже сняты с производства. Да и экономия по сравнению с покупкой PROMT Internet не так уж велика. Socrat Internet - это аналог "переводящего броузера" WebView. С ее помощью можно выполнять "синхронный" перевод Web-страниц с сохранением их форматирования. Однако если WebView по возможностям настройки опций перевода ничем не уступает профессиональной системе PROMT 98, то в Socrat Internet никаких средств управления этими функциями нет вообще. Броузер от компании "Арсеналъ" не позволяет подключать тематические словари, что сильно ухудшает качество перевода специальных текстов (их, кстати, в Интернет очень много). Простота использования, которой так добивались разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и управляемость, такие важные для систем машинного перевода. В итоге Socrat Internet существенно уступает продуктам "ПРОМТ" по многим параметрам, в том числе и по самому важному - качеству выходного текста.

10. КАК УЛУЧШИТЬ КАЧЕСТВО ПЕРЕВОДА?

Практические советы.

Наверняка многие уже имеют опыт "общения" с системами машинного перевода. Кое-кто сумел уловить правильный подход к работе с этими программами и эффективно использует их. Другие, наоборот, после первого же сеанса работы испытали разочарование, оценив качество полученного текста. Но не стоит отчаиваться. Существуют способы улучшения результатов машинного перевода, доступные каждому пользователю. О некоторых из них мы сейчас и поговорим.

1. Исход работы в значительной мере решается еще до ее начала. Прежде чем приступить к переводу, обязательно определите две вещи: во- первых, для каких целей предполагается использовать его результаты, а во- вторых, что представляет собой исходный текст. Назначение перевода играет первостепенную роль при оценке его качества. В самом деле, один и тот же результат можно считать отличным, если нужно просто узнать, о чем идет речь в оригинальной статье, и совершенно непригодным, если нужно получить текст для публикации в книге или журнале. Но иногда даже самый "грубый" перевод оказывается приемлемым, если в нем имеется достаточно информации, по которой специалист в соответствующей предметной области может легко восстановить содержание текста. С другой стороны, определив, к какому стилю речи принадлежит исходный текст, нетрудно оценить его пригодность для машинного перевода, а значит, и предугадать результат. Чем больше в тексте иносказательных оборотов, метафор, чем свободнее стиль, тем хуже справится компьютер с его переводом. Лучше других обрабатываются научные, технические и образовательные тексты, которым присуще строгое изложение материала. Если своевременно пополнять специальные словари новыми терминами, то можно получать полностью связный перевод текстов, требующий минимальной стилистической доработки. Разговорный и публицистический стиль, где много специфических оборотов, но большинство слов используется в прямом смысле, пригодны для ознакомительного перевода, однако для получения грамотного выходного текста потребуется ручная правка. А вот поэзия и художественная литература, к сожалению, совершенно непригодны для машинного перевода. Смысл текста, построенного на иносказательных выражениях, при машинном переводе искажается и недоступен даже для ознакомления.

2. Бойтесь опечаток!

Очень часто причиной неправильного перевода являются опечатки в оригинале. В особенности это касается отсканированных и распознанных текстов. Слова с орфографическими ошибками в большинстве случаев помечаются системой как незнакомые, поскольку в исковерканном виде они в словарях отсутствуют. Сложнее, если опечатка превращает одно слово в другое, которое также существует в иностранном языке, - программа переведет его, но смысл текста будет искажен. Но самыми серьезными "подводными камнями" являются ошибки в пунктуации. Одна неправильно поставленная запятая способна серьезно исказить перевод предложения. Поэтому перед переводом как можно тщательнее проверьте исходный текст.

3. Хороший словарь - половина успеха. Обязательно найдите и подключите специальные словари по тематике переводимого текста. Если в точности такой тематики нет, определите наиболее подходящую комбинацию имеющихся у вас словарей и, кроме того, обязательно создавайте свои. Идеально, конечно, иметь для каждого текста свой словарик, но оптимальным, с точки зрения продуктивности работы, является разбиение наиболее распространенных тем на подпункты. Например, в рамках компьютерной тематики можно создать словари "Офисные программы", "Графика", "Сети", "Internet и WWW" и т.д.

4. Строим "пирамиду". Если к системе подключено несколько словарей, то успех перевода во многом зависит от того, в каком порядке программа ищет в них текущее слово. Поэтому организуйте иерархию словарей в порядке от частного к общему. Самый высокий приоритет должен иметь словарь, созданный для текущего текста, затем - тематические (в порядке расширения предметной области), а самый низкий уровень остается за словарем общеупотребительных понятий. Так, при переводе текста о программе Adobe Photoshop лучше всего на самом высоком уровне поставить словарь "Photoshop" (созданный вами специально для этого текста), затем - "Компьютерная графика", "Информатика" и в самом конце списка - общий словарь. Поскольку объем узкоспециализированных пользовательских словарей, как правило, невелик, а общего, наоборот, огромен, то полученная в результате "конструкция" в чем-то походит на пирамиду.

5. Не надо спешить! Никогда не переводите сразу весь текст. В нем всегда найдется как минимум одно-два слова, отсутствующих в словарях, и превеликое множество таких, которые система переводит неправильно. Покончив с подключением словарей и определением других опций перевода, для начала переведите небольшой фрагмент в начале текста, например первый абзац. Найдите в этом фрагменте слова, переведенные неправильно, и внесите их в словарь самого высокого уровня. Переведите фрагмент заново. Если результат вас удовлетворит, переходите к следующему абзацу. Практика показывает, что для точной настройки системы необходимо перевести таким образом четверть, а иногда даже треть материала и только после этого запускать автоматическую обработку всего текста.

6. Различайте общее и частное! Прежде чем внести новое слово в пользовательский словарь, определите, будет ли оно переводиться в тексте данным образом только один-два раза или постоянно. Искусство правильной работы с системой машинного перевода состоит в том, чтобы различать общее и частное. В идеальном случае от вас потребуется знание иностранного языка и предметной области текста. В словарь вносите только систематически встречающиеся варианты перевода, единичные же исправляйте вручную. В противном случае слово по всему тексту будет переведено неправильно.

Соблюдение приведенных выше простых правил обычно позволяет существенно повысить качество переведенных компьютером текстов. Нельзя гарантировать, что они всегда окажутся абсолютно правильными и стилистически грамотными. Однако, вероятнее всего, свою первую задачу - понять смысл текста - вы решите.

З А К Л Ю Ч Е Н И Е

Стремительные потоки информационного обмена между высокоразвитыми промышленными странами, лавина научно-технической документации, поступающая от производителей товаров и современных технологий, требуют совершенно нового подхода к проблеме перевода технической литературы. Выход один: максимально автоматизировать процесс, оставив человеку его творческую редакционную часть. В этом помогает система машинного перевода. Ее параметры должны удовлетворять четырем основным требованиям: * оперативность; * гибкость; * скорость; * точность.

Оперативность машинных систем -- это возможность постоянного пополнения словарного запаса и создания новых тематических словарей. В этом параметре они значительно опережают привычные типографские издания различных словарей.

Гибкость -- это возможность "грубой настройки" на конкретную предметную область (для этой цели служат специализированные словари) и "тонкой настройки" на конкретный текст, книгу или группу документов (модифицируемые пользовательские словари).

Скорость -- возможность автоматического ввода и обработки текстовой информации с бумажных носителей. Только одна система оптического ввода текстов (OCR-System) ежедневно заменяет более десяти классных машинисток.

Точность -- стилистически и грамматически правильная адекватная передача смысла исходного текста на язык перевода. Это наиболее "уязвимое" место систем машинного перевода. Однако столь явное улучшение качества перевода в поздних версиях систем машинного перевода, как например, PROMT 98, вселяет уверенность, что вскоре компьютер полностью примет на себя всю рутинную часть перевода.

В ходе данной работы мы выяснили, что машинный перевод -- это эффективное средство для просмотра и поиска информации на иностранном языке, и именно эта функция является главной при работе в Internet. Далее, в результате настройки на предметную область и интеграции с другими программами обработки документов средство машинного перевода позволяет автоматизировать получение перевода. И наконец, -- это уникальный гуманитарный инструмент, позволяющий преодолевать проблемы общения в системах, работающих на разных языках. И пожалуй, самый главный, поистине революционный для прикладной лингвистики вывод состоит в том, что многие разработчики осознали: при создании программы машинного перевода кроме хорошо реализованной лингвистики необходима достойная программная реализация. Несомненно, средства машинного перевода никогда не смогут улавливать все смысловые нюансы оригинального текста. Различия в синтаксисе и семантике, особенно между западными и восточными языками, - скажем английским и китайским - слишком велики для этого. Даже сторонники машинного перевода признают, что он способен в лучшем случае передать основную суть документа. Но нельзя забывать, что ошибки часто случаются и у обычных переводчиков, и наивно ожидать от системы машинного перевода, что она способна исправить ошибки оригинала и выдаст грамотный перевод. Безусловно, тезис о том, что мозг человека совершенней компьютера, не требует никаких доказательств. Хотя честно сказать, после общения на выставках с некоторыми пользователями в этом появляются сомнения. В заключение хотелось бы подчеркнуть, что программа-переводчик - это, прежде всего, инструмент, который позволяет решить проблемы перевода или повысить эффективность труда переводчика только в том случае, если он используется грамотно.

ЛИТЕРАТУРА

1. Англо-русский словарь. Под рук. Мюллера В.К. - М.% Русский язык, 1985. 2. Аристов Н.В. Основы перевода. - М.: изд-во литер. на иностр. языках,

1959.

3. Архипов А.Ф. Самоучитель перевода с немецкого языка на русский. - М.:

Высш. шк., 1991.

4. Бархударов Л.С. Язык и перевод. - М.: Международные отношения, 1975. 5. Бреус Е.В. Основы тории и практики перевода с русского языка на английский. - М.: УРАО, 1998.

6. Ванников Ю.В. Языковая сложность текста как фактор трудности перевода

(Методическое пособие). - М.: Всесоюзный центр переводов, 1988.

7. Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы с ангилийского языка на русский. - Минск, 1997.

8. Вейзе А. А., Мирончиков И. К. Перевод технического текста с английского языка на русский. - Мн.: МГЛУ, 1995.

9. Васильев А. (Компьютер на месте переводчика). // Подводная лодка. -

1998, № 6.

10. Винокуров А.А.,Чуканов В.О. Новый метод оценки машинного перевода.// Информационные технологии и системы. Hardware Software Security.


Подобные документы

  • История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.

    презентация [455,3 K], добавлен 22.10.2013

  • Мировая история технологии машинного перевода как класса систем искусственного интеллекта. Классификация программ онлайн-переводчиков, поддержка функции контролируемого входного языка. Многоязычные браузеры в Интернете и перечень электронных словарей.

    контрольная работа [21,6 K], добавлен 03.02.2011

  • История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.

    курсовая работа [30,0 K], добавлен 19.06.2015

  • Компьютерная программа как последовательность инструкций, предназначенная для исполнения устройством управления вычислительной машины. Анализ стандартов перевода текстов компьютерных игр. Рассмотрение особенностей ИТ-перевода, примеры грубейших ошибок.

    реферат [65,5 K], добавлен 29.01.2013

  • Программы автоматизированного перевода: электронные словари, tools-приложения, система Translation Memory, редакторское ПО. Анализ использования САТ-программ в практической деятельности. Выполнение перевода при помощи переводчиков Wordfast и Promt.

    курсовая работа [46,5 K], добавлен 10.11.2011

  • Исследование современных технологий машинного перевода. Изучение классификации систем перевода. Характеристика особенностей работы с электронным словарем. Языковые инструменты Google. Программы для проверки правописания и грамматики, текстовые редакторы.

    реферат [917,0 K], добавлен 02.11.2014

  • Перевод - процесс создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке, требования к обеспечению его эквивалентности. Машинные технологии перевода; характеристика систем Translation Memory.

    презентация [347,8 K], добавлен 06.01.2014

  • История развития компьютерного анализа текста на естественном языке; выделение его проблем. Принципы извлечения информации и обработки разговорной речи. Ознакомление с программными продуктами, реализующими машинный перевод и проверку орфографии.

    реферат [371,0 K], добавлен 13.02.2011

  • Схема разбора арифметического и логического выражения. Внешняя спецификация конвертора и алгоритм перевода программ на языке Паскаль в текст на языке Си. Назначение подпрограмм, особенности констант и переменных. Код программы и ее тестирование.

    курсовая работа [567,5 K], добавлен 03.07.2011

  • Исследование процесса разработки и кодирования приложения для перевода двоичных чисел в шестнадцатеричные в операционной системе Linux. Изучение требований к надежности и программной документации. Определение основных состояний интерфейса программы.

    курсовая работа [2,4 M], добавлен 23.06.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.