Тенденции развития компьютерной лексикографии

Этапы разработки словаря. История развития компьютерной лексикографии. Основные направления приоритетов в разработке электронных словарей. Частота использования электронных словарей по сравнению с бумажными словарями. Тенденции создания онлайн-словарей.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 15.12.2020
Размер файла 24,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Министерство образования и науки Кыргызской Республики

Кыргызский национальный университет имени Ж.Баласагына

Кыргызско-Китайский факультет

Самостоятельная работа студента

По компьютерному обеспечению переводческой деятельности

Выполнила: Нурисламова Сезим Нурисламовна

ПП-1-20 (1курс)

Проверила: Ибраимова Бермет Муратовна

Бишкек 2020

Оглавление

Введение

Компьютерная лексикография

История развития компьютерной лексикографии

Перспективы развития компьютерной лексикографии

Заключение

Список литературы

Введение

Развитие науки и техники сегодня нельзя представить без использования достижений информационных технологий. Развитие всех сфер общественной жизни сопряжено с оптимизацией информационных процессов (сбор, хранение, обработка, передача информации), поэтому современное общество называют информационным. Важным фактором успешности любой личности в таком обществе является умение выбирать необходимые в конкретный момент сведения из общего потока, а также умение грамотно применять полученные знания. Несмотря на постоянное усовершенствование всевозможных технических средств, лучшим инструментом для обмена мыслями, идеями и переживаниями остаётся естественный язык. Одной из самых востребованных отраслей лингвистического знания на сегодняшний день является прикладная лингвистика, и, в частности, компьютерная лингвистика - наука, возникшая на стыке лингвистики и компьютерных наук (computer science).

В самом общем смысле компьютерную лингвистику можно определить как «направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов для моделирования функционирования языка в тех или иных условиях, а также вся сфера применения». Однако вопрос определения границ предметной области данной дисциплины сегодня остаётся дискуссионным. Связано это прежде всего с расширением области применения её достижений и появлением новых областей исследования. Разработки прикладного характера, созданные с помощью достижений компьютерной лингвистики, позволяют людям лучше ориентироваться в информационном мире, быстрее находить нужные материалы и обеспечить удобство работы с ними. Не последнюю роль в данном вопросе играет наличие разработанных и хорошо структурированных справочников и словарей. Разработкой компьютерных словарей занимается компьютерная лексикография.

Несмотря на то, что компьютерная лексикография хронологически является одним из первых направлений компьютерной лингвистики, многие вопросы данной дисциплины на сегодняшний день остаются неразрешёнными. В частности, нет не только единого понимания основных принципов составления электронных словарей и единой для всех терминологии дисциплины, но не существует также и чёткой характеристики инструментария для решения всех возможных задач компьютерной лексикографии. Однако электронные лексикографические продукты имеют ряд преимуществ по сравнению с традиционными аналогами, и потому их разработка является приоритетной задачей для компьютерной лингвистики в целом и компьютерной лексикографии в частности.

Бурным развитием компьютерной лексикографии и востребованностью её достижений во многом обусловлена актуальность работы по созданию учебного электронного толкового словаря русского языка для иностранцев. Однако не менее важным является то, что использование современных информационных технологий позволяет повысить качество обучения языкам как иностранным за счёт увеличения наглядности материала и возможности различных способов его представления и организации работы с ним. Также можно отметить, что создание электронных лексикографических продуктов - и, в частности, электронных учебных словарей, - на наш взгляд, является не просто возможностью, расширяющей методологию обучения языкам как иностранным, а в какой-то степени требованием времени.

Компьютерная лексикография

Лексикография (от гр. lexikon -- словарь, grapho -- пишу) изучает теорию и практику составления различных языковых словарей.

Теоретическая лексикография изучает вопросы разработки макроструктуры и микроструктуры словаря, разработку типологии словарей, историю развития лексикографии.

Макроструктура словаря определяет отбор лексики, объём и характер словника, принципы расположения материала.

Микроструктуры словаря определяет структуру словарной статьи, типы словарных определений, соотношение разных видов информации о слове, типы языковых иллюстраций.

Практическую лексикографию можно определить как процесс составлением словарей различных типов на базе теоретических разработок.

Этапы разработки словаря:

Разработка системы требований, касающихся назначения и круга пользователей.

Разработка системы требований, касающихся таких параметров словаря как единицы описания, объем, структуру, вид словарной информации.

Отбор текстов, расписывание контекстов, характеристика грамматических форм, составление предварительных словников.

Дистрибутивный анализ текстов, тесты с носителями языка.

Обобщение экспериментальных данных.

Построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов.

Сбор и систематизация дополнительной информации о каждой языковой единице.

Оформление словарных статей.

Системный анализ и упорядочение словарных статей.

Оформление словаря

Компьюмтерная лексикограмфия -- прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.

Компьютерная лексикография представлена совокупностью методов и программных средств обработки текстовой информации для создания словарей. В рамках компьютерной лексикографии разрабатываются компьютерные технологии составления и эксплуатации словарей. Специальные программы -- базы данных, компьютерные картотеки, программы обработки текста -- позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать её.

Термин «электронный словарь» появился в языкознании приблизительно в последние десять лет. Термин же «компьютерная лексикография» возник в языкознании ещё раньше. Разные ученые называли его по-разному, например: Ю.Н. Марчук в 1976 г. - «вычислительная лексикография», Е.В. Вертель в 1984 г. - «машинная лексикография», О.А. Казакевич в 1985 г. - «автоматизированная лексикография», а В.В. Марковкин в 1990 г. - «компьютерная лексикография».

Позже Ю.Н. Марчук объединил все эти названия под общим названием «компьютерная лингвистика», считая, что решение актуальных проблем лингвистики осуществляется на компьютерах с современным программным обеспечением. Касаясь этой темы, Г.М. Мандрикова в своих работах отмечает, что термины «вычислительная лексикография», «вычислительная машина» и «автоматическая лексикография» являются однотипными, так как все они опираются в своей работе на одно средство -компьютер. Она приходит к такому выводу, что компьютерную лексикографию как область лексикографии можно принимать как отдельный раздел языкознания. Содержание этой науки составляет наличие теоретических и практических вопросов компьютерных словарей различного вида, а также осмысление всех результатов, имеющих отношение к этой проблеме

Множество различных компьютерных лексикографических программ разделяются на две большие группы: программы поддержки лексикографических работ и электронные словари различных типов, включающие лексикографические базы данных.

История развития компьютерной лексикографии

Часть исследователей называет отправной точкой развития компьютерной лексикографии 2-ую половину 1940-х гг., связывая это с первыми экспериментами на ЭВМ - в частности, с экспериментом Р. Бузы. Однако на наш взгляд, правильнее будет отнести начало развития дисциплины к концу 1950-х - началу 1960-х гг., поскольку именно к этому времени восходит осознание компьютерной лексикографии как самостоятельной отрасли знания. Технические возможности этого времени главным образом были направлены на то, чтобы автоматизировать и оптимизировать работу лексикографа по созданию традиционных (бумажных) словарей. Исходя из этой точки зрения, словари, создаваемые с помощью компьютера, в то время называли скорее «машиночитаемыми» (англ. machine-readable), чем электронными, и основной задачей компьютерной лексикографии называлось «использование компьютеров в создании словарей». Но уже тогда такая постановка вопроса не в полной мере отражала запросы лексикографов: с помощью компьютера исследователи хотели получить новые возможности структурирования, кодифицирования, обработки информации на естественных языках. Мощности вычислительной техники того времени, однако, были недостаточны для реализации таких задач.

На следующем этапе развития электронной лексикографии, который условно можно ограничить 1980 - началом 1990-х гг., начала формироваться технология электронных корпусов и корпусных словарей. Ярким примером разработки того времени может являться словарь Collins COBUILD, выпущенный в 1987 году. Корпусная база данного словаря насчитывает 40 миллионов употреблений как общеупотребительной, так и специальной лексики. Дальнейшие корпусные разработки такого же либо схожего типа содержали более обширные базы - 100 (например, Британский национальный корпус) и более млн. употреблений.

Ещё одна тенденция того времени - перевод существующих бумажных словарей в электронную форму. Новые возможности информационных технологий позволяли оптимизировать поисковые алгоритмы, алгоритмы сортировки и создания выборки, что давало массу преимуществ электронным продуктам в плане удобства использования. Кроме того, появилась тенденция к разработке небольших автономных вычислительных устройств, содержащих словарные базы. В общем и целом, в то время наиболее популярными были два типа электронных словарей: небольшие «карманные» устройства с одним или несколькими словарями, загруженными в него, и программы, записанные на оптические диски (CD-ROM и позже DVD-ROM), которые продавались вместе с большими (бумажными) словарями - такое техническое решение было предпринято, в частности, для Оксфордского словаря (англ. the Oxford Advanced Learner's Dictionary) и словаря Макмиллана (англ. Macmillan English Dictionary (MED)). Кроме того, появились карманные обучающие словари типа Speak & Spell (англ. буквально «Говори и произноси по буквам»). Данная технология была представлена ранними примитивными экземплярами, и в дальнейшем её «поглотили» мобильные устройства. «Обычные» же электронные словари карманного типа в отдельных странах распространены и по сей день.

Несмотря на бурное развитие технологий создания электронных словарей, вопрос о разработке учебных словарей долгое время оставался проблемным. Словарь Dictionary of phrasal verb описанной нами серии Collins COBUILD вышел в 1990 году, и его можно отнести к учебным словарям: в словарных статьях, помимо толкования слов, можно было найти грамматические правила и правила и примеры употребления. Следующий значительный по объёму учебный электронный словарь появился уже в 1993 году. Он назывался Interactive English Dictionary (издательство Longman) и распространялся на CD-носителях.

Таким образом, можно сделать вывод о том, что за несколько десятилетий сформировались два основных направления работы компьютерных лексикографов: создание традиционного словаря с помощью компьютера и создание непосредственно электронного словаря. Причём здесь следует отметить, что различия между традиционной технологией разработки словарей и компьютерной технологией были очевидны уже на первых этапах развития дисциплины, но чётко оформились только после широкого распространения практики создания электронных словарей (в частности, учебных словарей) и справочников.

Получив широкое развитие в странах романо-германской языковой семьи, инновационные тенденции постепенно дошли до славянских стран. Первая российская коммерческая система электронных словарей LINGuist Volume v. 1.0 вышла в 1990 году. Устанавливалась она под операционную систему DOS и содержала 38 000 слов, причём только на английском. Примерно в то же самое время начинается разработка многоязычного словаря «Мультитран», первая версия которого вышла в 1993 году и также была ориентирована на работу в операционной системе DOS. Тем не менее, словари под операционную систему «Windows» на постсоветском пространстве начали разрабатываться немного раньше. Первым таким словарём был вышедший в 1992 году электронный словарь ABBYY Lingvo 3.0. Словарная база его была небольшой - всего 9000 слов - однако принципиально важным новшеством было то, что это был «компилированный» продукт, включавший в себя разных словарей: экономический, научный, политехнический, математический, компьютерный и др. .

С конца 1990-х и на протяжении 2000-х происходило создание новых электронных словарей, предусматривающих установку на персональные компьютеры, а также развитие уже существующих проектов (в частности, расширение их функционала и словарных баз). Однако в это же время меняется концепция развития Интернет-технологий, которую в 2005-м году Тим О'Рейли обозначит как «Концепция Веб 2.0». Отныне Интернет-проекты становятся ориентированными на интерактивность, потребности простых пользователей, а также на сотрудничество пользователей и разработчиков. Разработчики электронных словарей быстро оценили преимущества такого подхода, потому у многих лексикографических продуктов и инструментов появляются онлайнверсии. Так, сегодня существуют и активно развиваются онлайн-версии упомянутых выше словарей «Мультитран» и «Lingvo», Оксфордского и Кембриджского словарей, словаря Лонгмана и др.

2000-е годы, а также начало 2010-х ознаменовались не только созданием значительных лексикографических интернет-проектов и усилением тенденции к взаимодействию разработчиков и пользователей, но и распространением практики создания электронных словарей и справочников специализированного типа, обслуживающих конкретную область человеческого знания. В качестве примера здесь можно привести как значительные по объёму ресурсы, наподобие белорусского «Многоязычного словаря юридических терминов» или российского «Словаря нанотехнологических и связанных с нанотехнологиями терминов», так и многочисленные приложения глоссарии к сайтам определённой тематики и направленности (архитектурностроительной, медицинской, преподавательской и т.д.). На наш взгляд, это связано, прежде всего, с оценкой преимуществ использования более ранних электронных лексикографических изданий, а также распространением технологий, позволяющих достаточно быстро организовать информацию в форме справочников.

Перспективы развития компьютерной лексикографии

Что сегодня является приоритетным в разработке электронных словарей, и какой прогноз можно сделать касательно будущих приоритетов дисциплины? Как отмечают зарубежные специалисты, сегодня всё большее число словарей предлагается в электронной форме - функционирующих в режиме онлайн либо доступных для скачивания на мобильные устройства. Возможности современных мобильных устройств позволяют включить в словари, помимо основных, также разнообразные дополнительные структурные элементы - например, записи произнесённых слов, ссылки на тексты статей тезаурусов или списки слов, относящихся к основной словарной статье. Есть также возможность создания расширенного поиска по словарю, который позволит пользователю осуществлять поиск по специфическим лингвистическим или семантическим категориям либо персонализировать личный опыт работы, создавая свои собственные «субсловари». Также предполагается появление электронных словарей, ориентированных прежде всего на нужды профессиональных переводчиков. Такие словари будут предоставлять множество интересных и полезных возможностей - например, выбор словарной статьи / значения слова в заданном контексте, формирование запроса о различиях или отношениях между двумя концептами, прямой лексический перевод формы слова, поиск синтаксических конструкций, соотносимых с данным паттерном и т.д. Одним из таких словарей является разрабатываемая сегодня система Anhitz.

Тенденции создания онлайн-словарей во многом, на наш взгляд, зависят от развития интернет-технологий и смены концепций соответствующих программно-инструментальных систем. Эпоха Веб 2.0 внесла свои коррективы в данный процесс путём привлечения широкой аудитории к работе с Интернетпроектами. Со сменой технологических тенденций в компьютерной лексикографии происходило устаревание старых представлений о целях и задачах дисциплины и актуализация новых знаний и подходов. Процесс развития информационных технологий не стоит на месте - некоторые исследователи, в частности, Дж. Калаканис, уже заявляют о приходе эпохи Веб 3.0, призванной дать больше свободы рядовому пользователю Интернета путём учёта его персональных потребностей. Очевидно, что исследуемой нами дисциплине в скором времени предстоит выработать новые подходы к созданию онлайн-словарей и инструментов разработки. компьютерный словарь лексикография

Возрастёт ли частота использования электронных словарей по сравнению с бумажными словарями? На наш взгляд, данная тенденция будет иметь место, скорее исходя из общих тенденций развития средств Интернет-общения. Уже сегодня многие популярные сервисы, предоставляющие возможности коммуникации через Интернет с конкретными или случайными людьми, предлагают пользователям выбор различных языковых «комнат» для общения на любом из распространённых мировых языков. Общение с представителями других культур позволяет человеку расширить свой кругозор, узнать о духовных потребностях носителей иного национально-исторического мировоззрения, а также просто завести новые знакомства. Для обеспечения удобства подобных типов коммуникации уже сейчас существует потребность в интеграции переводческих сервисов. Возможно, не последнюю роль в этом вопросе сыграют интегрированные мультиязычные словари различных типов.

Кроме технических моментов, на наш взгляд, возникнут и вопросы теоретико-методологического характера. Так, основные термины компьютерной (и традиционной) лексикографии нуждаются в уточнении, равно как и общая типология словарей. Помимо этого, может встать вопрос о создании новых типов электронных словарей для обслуживания новых отраслей филологического знания либо уже существующих, но сравнительно молодых дисциплин.

Заключение

Компьютерная лексикография - отрасль компьютерной лингвистики, прошедшая сложный путь развития и весьма востребованная сегодня.

Термин «Компьютерная лексикография» был придуман для обозначения области изучения машиночитаемых (электронных) словарей и появился в середине 1960-х годов. Этой дисциплине уделяли мало внимания вплоть до начала 1990-х годов. Термин «машиночитаемый словарь» означает, что данные из словаря (хранящиеся в электронном виде) могут быть обработаны и исследованы с помощью современной вычислительной техники.

Новаторские работы Эвенса и Амслера (1980) послужили толчком для расширения исследований электронных словарей, например, была проведена практическая работа с использованием Седьмого Энциклопедического словаря Вебстера. Стимулом для этих исследований послужило также широкое использование Longman Dictionary of Contemporary English в 1980-х, этот словарь по-прежнему является одним из лучших электронных словарей.

Первоначально электронные словари имели такую же форму записи, как обычные словари, и исследователям приходилось тратить много времени для интерпретации такой формы записи (например, чтобы определить, к какой части речи относится определенное слово). С развитием технологий издатели решили отделить базу данных электронного словаря от того, как он выглядит при печати. Сегодня существуют более удобные формы записи, например расширяемый язык разметки XML. Используя XML, исследователи получают быстрый доступ к информации, хранящейся в электронном словаре.

Несмотря на глубокие исторические корни лексикографии как дисциплины в целом и бурное развитие компьютерной лексикографии в частности (а возможно, и благодаря данным факторам), даже её самые основные проблемы, такие как определение терминов «словарь» и «электронный словарь» и составление единой типологии электронных словарей, на сегодня остаются дискуссионными.

Компьютерная лексикография является и «дисциплиной на стыке», и своеобразной коммуникативной зоной для филологов и специалистов в области информационных технологий.

Размещено на Allbest.ru


Подобные документы

  • Мировая история технологии машинного перевода как класса систем искусственного интеллекта. Классификация программ онлайн-переводчиков, поддержка функции контролируемого входного языка. Многоязычные браузеры в Интернете и перечень электронных словарей.

    контрольная работа [21,6 K], добавлен 03.02.2011

  • История развития и популярные модели электронных книг. Характеристика электронных книг c LCD-, ChLCD-дисплеем, E-Ink дисплеем. Преимущества и недостатки электронных книг по сравнению с бумажными, перспективы их развития и популярность у потребителей.

    реферат [2,9 M], добавлен 09.04.2014

  • История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.

    презентация [455,3 K], добавлен 22.10.2013

  • Особенности развития технологий беспроводного доступа, современные тенденции развития компьютерных сетей. Необходимость создания компьютерной сети. Беспроводное оборудование, применяемое в Wi-Fi сетях. Разработка структурной схемы организации сети.

    дипломная работа [14,5 M], добавлен 21.04.2023

  • Понятие и виды электронных ресурсов муниципальных библиотек. Организация и использование электронных ресурсов в муниципальных библиотеках РФ. Анализ современного состояния и основные тенденции развития электронных ресурсов муниципальных библиотек.

    курсовая работа [77,9 K], добавлен 16.05.2017

  • Проектирование программного обеспечения, позволяющего создавать и вести множество электронных словарей. Обоснование выбора программных средств решения задачи. Разработка формы входных и выходных данных. Описание модулей программы и процесса отладки.

    дипломная работа [1007,7 K], добавлен 03.07.2015

  • Словарь — книга, содержащая собрание слов, расположенных по определённому принципу. Электронный словарь – компьютерная база данных, содержащая особым образом закодированный словарные статьи. Возможности электронных словарей, достоинства и недостатки.

    статья [178,0 K], добавлен 11.11.2010

  • Понятие электронных курсов. Описание программных и языковых средств разработки. Технология создания компьютерной обучающей системы, пакета вопросов в редакторе Excel. Разработка интерфейса ЭС. Организация диалога пользователя с экспертной системой.

    дипломная работа [10,8 M], добавлен 20.06.2014

  • Периодизация развития электронных вычислительных машин. Счетные машины Паскаля и Лейбница. Описаний эволюционного развития отечественных и зарубежных пяти поколений электронных вычислительных машин. Сущность внедрения виртуальных средств мультимедиа.

    доклад [23,6 K], добавлен 20.12.2008

  • Эволюция электронных библиотек (ЭБ) в Российской Федерации. Понятие, структура и основные направления деятельности ЭБ. Современные тенденции развития электронных библиотек РФ. Характеристика деятельности Президентской библиотеки им. Б.Н. Ельцина.

    дипломная работа [2,4 M], добавлен 29.10.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.