Использование статистических программ при исследовании фразеологических единиц книжного стиля в русском и английском языках

Специфика использования компьютерных программ, позволяющих собирать для дальнейшего анализа статистику употребления языковых единиц в диахроническом аспекте. Изучение фразеологических единиц книжного стиля, недостатки современных статистических программ.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 23.12.2018
Размер файла 21,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Использование статистических программ при исследовании фразеологических единиц книжного стиля в русском и английском языках

Филологические науки

Гурьянов Игорь

Статья посвящена особенностям использования компьютерных программ, позволяющих собирать для дальнейшего анализа статистику употребления языковых единиц в диахроническом аспекте. Материалом исследования послужили фразеологические единицы книжного стиля из двуязычных словарей. Были изучены программы Google Ngram Viewer, поисковой механизм русского национального корпуса языка и британский национальный корпус. В ходе исследования выявлены недостатки современных статистических программ.

Ключевые слова и фразы: фразеология; корпус; статистика; трансформации; книжный стиль.

Вопрос применения математических и статистических методов исследования в лингвистике является давним вопросом на стыке наук. На возможность использования математических методов при исследовании языковых особенностей указывал И. А. Бодуэн де Куртенэ. Несмотря на это, только в начале XX века с появлением структурной лингвистики ученые начали экспериментировать с применением математических методов для анализа языковых процессов. В. А. Звегинцев выделяет следующих ученых - математиков В. Я. Буняковского, А. А. Маркова. Языковые элементы рассматривались ими как подходящий иллюстративный материал для построения квантитативных методов или для статистических теорем. Ученые совершенно не задавались вопросом, представляют ли интерес результаты такого исследования для лингвистов [2, c. 115].

Современные компьютерные технологии дают большой простор для проведения различных исследований. Большие вычислительные мощности позволяют обрабатывать большие массивы данных. Нами была поставлена задача оценить возможность применения данных статистических методов для поиска трансформаций фразеологических единиц. В качестве материала исследования использовались фразеологические единицы книжного стиля, отобранные из двуязычных словарей. В ходе исследования были использованы следующие ресурсы: «Google Ngram viewer» [8], «Ruscorpora» ? корпус русского языка [5], «BNC» ? британский национальный корпус [7].

Применение методов квантитативной лингвистики во фразеологии является сложной задачей. Это объясняется тем, что основной предмет изучения ? фразеологическая единица ? обладает следующими характеристиками: воспроизводимость, устойчивость, сверхсловность (раздельнооформленность), принадлежность к номинативному инвентарю языка.

Современные российские и зарубежные ученые рассматривают использование фразеологических единиц в контексте. Обзор литературы по данному вопросу показал, что большинство ученых выделяют два вида употребления фразеологизмов: узуальный (словарная форма единицы) и окказиональный (трансформация единицы на одном из языковых уровней). Ученые не определили свое отношение к окказиональному способу употребления фразеологизмов: «С одной стороны, подобные преобразования рассматриваются как отклонения от нормы и, следовательно, подвергаются открытой критике. С другой стороны, контекстуальное обыгрывание фразеологических единиц приветствуется как неисчерпаемый источник творческой фантазии носителей языка» [1, c. 4].

В ходе нашего исследования нами были отобраны 23 фразеологические единицы книжного стиля из англорусского словаря под редакцией А. В. Кунина и 30 фразеологических единиц книжного стиля из русскоанглийского словаря под редакцией С. И. Лубенской.

Книжный стиль речи считается наиболее давним видом речи, так как возник вместе с первыми памятниками письменности. Именно поэтому книжные фразеологизмы являются наиболее связными и реже поддаются изменениям, в сравнении с фразеологическими единицами других стилей.

Э. М. Солодухо в своих работах по изучению интернациональных фразеологизмов отмечал принадлежность некоторых фразеологизмов как к интернациональному, так и к книжному пласту фразеологии. Эта позиция подтверждается тем, что наиболее ранними памятниками европейской письменности считаются религиозные труды, включая Библию [6, c. 35].

Также отмечается, что большое количество книжных фразеологических единиц относятся к устаревшей лексике.

Для проверки этой гипотезы мы обратились к двум ресурсам, которые используются при обработке статистических данных языка.

Первая программа Google Ngram Viewer позволяет отслеживать частотность употреблений не только отдельных фраз, но и словосочетаний, а также фразеологических единиц. Программа производит поиск по обширной библиотеке Google Books и отмечает количество употреблений рассматриваемой единицы. Отличительная особенность ресурса состоит в том, что на выбор представляется большое количество языков: английский, русский, испанский, немецкий, китайский. С помощью данной программы нами был подтвержден тезис о том, что большинство фразеологических единиц книжного стиля относятся к устаревшим выражениям. В английском языке у всех отобранных единиц пики частности употребления относились к XIX веку и к началу XX. Приведем примеры:

The wings of Azrael - пик употребления ? 1923 год [3, c. 18].

Appeal to Caesar - пик употребления ? 1824 год [Там же, c. 59].

Обетованная земля - пик употребления ? 1847 год [4, c. 287].

Почивать на лаврах ? пик употребления ? 1824 год [Там же, c. 170].

В английском языке выявилась следующая особенность - при добавлении артикля в конструкцию фразеологизма пик употребления может сместиться в сторону.

The burden of years - бремя лет [3, c. 47], пик приходится на 1856 год; The burden of the years - бремя лет, пик приходится на 1916 год [Там же].

The cask of Danaides - бочка Данаид [Там же], пик приходится на 1912 год.

The cask of the Danaides - бочка Данаид [Там же, с. 68], пик приходится на 1823 год.

При исследовании частотности употребления русских фразеологических единиц возникла проблема правильного написания фразеологических единиц, так как в 1917-1918 году произошла реформа орфографии. База данных Google Ngram Viewer состоит из оригинальных письменных источников, переведенных в электронный вид, что осложняет выявление частотности употребления фразеологических единиц.

Стоит отметить особенность использования программы Google Ngram Viewer. В окно поиска могут вводиться только узуальные образцы единиц, поиск трансформаций, которым подвергаются фразеологизмы, практически невозможен. компьютерная программа фразеологический статистический

Согласно классификации Е. Ф. Арсентьевой, существуют следующие типы трансформации:

Фразеологический каламбур - обыгрывание переносного значения фразеологизма и буквального значения его компонентов.

Замена лексического компонента/компонентов на лексему, связанную с окказионально варьируемым компонентом системными отношениями (синонимией, антонимией, принадлежностью к одному лексикосемантическому полю или одной тематической группе).

Вклинивание - 1) вклинивание, в котором вклинивающиеся слова синтаксически связаны с компонентами фразеологической единицы, и 2) вклинивание, в котором вклинивающиеся слова синтаксически не зависят от компонентов фразеологизма.

Добавление переменного компонента/компонентов к концу или началу оборота.

Эллипсис - сокращение количества компонентов фразеологизма.

Фразеологический повтор.

Расширенная метафора - создание нескольких ассоциативных метафор, связанных с базовым значением фразеологизма.

Фразеологическое насыщение контекста - простой тип представляет собой одновременное использование двух или более фразеологизмов; второй тип подразумевает использование сразу нескольких типов контекстуальных трансформаций фразеологических единиц [1, с. 8].

Если рассматривать данные трансформации как материал для использования в программе Google Ngram Viewer, то возникают следующие проблемы:

Программа не может отличить буквальное значение от переносного, поэтому стоит ограничиться лишь структурными изменениями фразеологических единиц, такими как вклинивание, лексическая замена, эллипсис и добавление компонента.

При вклинивании фразеологизма его компоненты могут быть разнесены в пределах предложения, но встречаются случаи, когда разрыв выходит за пределы предложения. В результате, программа может пропустить данную трансформацию.

В русском языке возникает сложность при поиске единиц в дореволюционных источниках.

Основным источником сбора статистической информации для исследования является национальный корпус русского языка (ruscorpora.ru). Преимущество отечественного корпуса состоит в том, что частотность употребления каждой единицы можно рассмотреть как в синхронии, так и в диахронии. Наиболее важной особенностью следует считать возможность настраивать расстояние удаленности компонентов друг от друга, что позволяет осуществлять поиск единиц, трансформированных с помощью вклинивания, разрыва, лексической замены. Приведем примеры трансформаций, найденных в корпусе.

Пример вклинивания в структуру фразеологической единицы местоимения «какой-нибудь»: На смену романтическим порывам энтузиастов приходят здравомыслящие работяги, пытающиеся возвести на своих шести сотках башню из какой-нибудь кости, а то и цельный воздушный замок (Дмитрий Бавильский. Новые стихи) [5].

Но черное газетное дело давно уже опостылело ему (А. И. Куприн. Яма) [Там же]. В данном примере мы наблюдаем расширение смысла фразеологической единицы с помощью вклинивания смыслового компонента, выраженного прилагательным «газетное».

Немаловажным аспектом, влияющим на удобство обработки и пользования программой, является вкладка «статистика» и «распределение по годам». Система строит графики частотности употребления данной единицы по временной оси. Во вкладке «статистика» мы наблюдаем статистику по метаатрибутам, стилистическое направление текста, пол автора, что делает интересным исследование с точки зрения гендерной лингвистики, и другие показатели.

Британский национальный корпус языка (natcorp.ox.ac.uk) [Там же] не располагает столь подробной статистической информацией при поиске языковых единиц, что отчасти компенсируется сторонними приложениями ? BNC Web at Oxford, BNC Web at Lancaster University. Для использования этих приложений необходимо зарегистрироваться во внутренней сети этих университетов, что в рамках исследования пока невозможно.

Стоит отметить, что, несмотря на большое количество статистических данных, полученные результаты требуют тщательной проверки, так как среди единиц с переосмысленным значением могут быть и свободные сочетания слов.

Современное программное обеспечение позволяет облегчить поиск фразеологических единиц и способов их использования. Основная проблема при поиске фразеологизмов и их трансформаций заключается в невозможности для программы разделить прямое и переносное значение слова и словосочетания. При дальнейшем развитии искусственного интеллекта и создании самообучающихся систем поиска данная проблема может быть решена.

Программы по выведению статистики при изучении фразеологических единиц значительно облегчают труд ученого по исследованию фразеологических единиц в диахроническом аспекте.

Тезис о том, что книжные фразеологические единицы принадлежат к устаревшему пласту лексики, подтвердились лишь в английском языке, где пики использования 23 отобранных единиц пришлись на XIX и первую половину XX века; в русском языке, напротив, была отмечена тенденция на растущую популярность некоторых книжных фразеологизмов.

Список литературы

1. Арсентьева Е. Ф. Контекстуальное использование фразеологических единиц. Казань: Хэтер, 2009. 168 c.

2. Звегинцев В. А. Очерки по общему языкознанию. М.: МГУ, 1962. 382 с.

3. Кунин А. В. Англо-русский фразеологический словарь. Изд-е 4-е, перераб. и доп. М.: Рус. яз., 1984. 945 с.

4. Лубенская С. И. Русско-английский фразеологический словарь. 2-е изд-е. М.: АСТ-ПРЕСС КНИГА, 2004. 1080 с.

5. Национальный корпус русского языка [Электронный ресурс]. URL: http://ruscorpora.ru/ (дата обращения: 17.11.2014).

6. Солодухо Э. М. Теория фразеологического сближения. Казань: Изд-во КГУ, 1989. 296 с.

7. British National Corpus [Электронный ресурс]. URL: http://www.natcorp.ox.ac.uk/ (дата обращения: 18.11.2014).

8. Google Ngram viewer [Электронный ресурс]. URL: https://books.google.com/ngrams (дата обращения: 15.11.2014).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.