Универсальные морфосинтаксические маркеры стиля в задачах компьютерной стилометрии
Теоретические подходы к определению языковой личности. Методики анализа языковой личности в судебно-автороведческой экспертизе. Лингвистические модели представления текста. Использование морфосинтаксических моделей репрезентации письменного текста.
Рубрика | Иностранные языки и языкознание |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 09.09.2020 |
Размер файла | 871,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Факультет гуманитарных наук
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
Универсальные морфосинтаксические маркеры стиля в задачах компьютерной стилометрии
Пимонова Елена Владимировна
Научный руководитель
ст. преподаватель
Нижний Новгород-2020
Содержание
Введение
1. Основные теоретические подходы к определению языковой личности и методы её анализа
1.1 Узколингвистический и коммуникативный взгляды на проблему автора
1.2 Семантико-стилистический подход к языковой личности
1.3 Формальный подход к языковой личности
1.4 Постструктуралистский подход к языковой личности
1.5 Широкий взгляд на проблему автора
1.6 Коммуникативно-деятельностный подход к языковой личности
1.7 Когнитивный подход к языковой личности
1.8 Методики анализа языковой личности в судебно-автороведческой экспертизе
1.9 Выводы
2. Обзор исследований по компьютерной стилометрии
2.1 Формальные модели представления текста
2.1.1 N-граммы фиксированного размера
2.1.2 N-граммы переменной длины
2.1.3 N-граммы искажённой версии текста
2.1.4 Интерпретируемость n-граммов
2.1.5 Компрессия текстов
2.2 Лингвистические модели представления текста
2.2.1 Частотный анализ слов
2.2.2 Морфосинтаксическая модель
2.2.3 Семантическая модель
2.3 Статистические модели представления текста
2.4 Выводы
3. Решение задачи атрибуции с использованием морфосинтаксических моделей репрезентации письменного текста
3.1 Принципы сбора и объём материала
3.2 Инструментарий
3.3 Модели текстовой репрезентации
3.3.1 Doc2Vec модель
3.3.2 Простые морфологическая и синтаксическая модели
3.3.3 Усложнённая морфологическая модель
3.3.4 Усложнённая синтаксическая модель
3.4 Методы обучения и оценки
3.5 Проведение классификации текстов по авторам
3.5.1 Результаты классификации русских произведений
3.5.2 Результаты классификации английских произведений
3.5.3 Общие выводы по классификации
3.6 Анализ ошибок классификации
3.7 Выявление закономерных признаков стиля
3.7.1 Стилистические признаки в русском языке
3.7.2 Стилистические признаки в английском языке
3.7.3 Универсальные и специфичные стилистические маркеры
3.8 Выводы
Заключение
Библиографический список
Введение
языковый личность лингвистический текст
Стилометрия - это компьютерный метод исследования языкового стиля, основанный на статистике и тесно связанный с такими задачами, как атрибуция, профилирование автора, выявление признаков изменения стиля внутри одного текста или в работах одного и того же автора. В текущем исследовании решается задача атрибуции, то есть определения автора письменного текста на основании набора текстов, принадлежащих авторам-кандидатам. Для решения этой задачи разрабатываются лингвистические модели текстовой репрезентации, в основу которых заложены морфосинтаксические особенности английской и русской грамматики.
Материалом для исследования служат тексты русской и английской классики XVII - XX веков.
В качестве объекта исследования выступают идиолекты авторов, чьи произведения взяты для анализа.
Предметом исследования являются языковые единицы, которые используются автором письменного текста и потенциально являются устойчивыми свойствами речевого навыка и составляют индивидуальный авторский стиль.
Цель исследования - разработать универсальные морфосинтаксические признаки для решения задач компьютерной стилометрии.
Цель предполагает решение следующих задач:
1) Проследить историю анализа языковой личности и индивидуального авторского стиля.
2) Выявить подходы к автоматическому определению автора письменного текста.
3) Разработать лингвистические модели представления текста для решения задачи атрибуции.
4) Решить задачу определения авторства, используя разработанные модели и оценить их качество.
5) Выявить универсальные маркеры стиля для русского и английского языков на основе лингвистической интерпретации результатов.
Теоретико-методологическую базу данного исследования составляют работы, принадлежащие разным подходам к определению понятия «языковая личность». Среди таких подходов биографический, или историко-культурный, в котором образ автора рассматривается в тесной связи с экстралингвистическими факторами: биографией, социальным статусом, мировоззрением и так далее (Ш. Сент-Бёв, Г. Лансон); семантико-стилистический, в котором автор считается средоточием идейных и эстетических установок произведения (В.В. Виноградов, Б.О. Корман); формальный, сторонники которого изучают образ автора в совокупности языковых и стилистических особенностей речи писателя (Н.С. Трубецкой, Р. Уеллек, О. Уоррен); постструктуралистский, в котором роль автора принижается за счет возвышения роли читателя как интерпретатора художественного произведения (Р. Барт); коммуникативно-деятельностный, основанный на теории речевой деятельности (Ю.Н. Караулов) и когнитивный, рассматривающий автора с психолингвистических позиций (И.А. Тарасова, Е.Г. Фоменко).
Текущее исследование базируется также на методологии из работ, в которых решались непосредственно практические задачи определения авторства. Среди них работы, в основу которых заложены формальные модели, а именно: n-граммы символов и/или слов (Д.В. Хмелёв, Т.А. Литвинова, Л.А. Борисов, Б. Мурауэр, У. Сапкота, Е. Стамататос, Л. Муттенталер, А. Баччу, Х. Куштодиу), компрессия текстов (О. Халвани, Л. Гранер), статистические параметры текста, например, количество предложений, длина текста, частота слов и так далее (О.В. Огальцов, Р. Чжэн, К. Лёйкс), - а также работы, в которых используются лингвистические модели, основывающиеся на: лексических критериях (В.В. Поддубный), синтаксических критериях (М. Хоссейни, А. Мукерджи, А. Иогансен), морфологических и синтаксических критериях (А.А. Рогов, Г. Байен), морфологических и семантических критериях (П.В. Паничева, Я.А. Ледовая).
Для решения поставленных задач используются следующие методы научного исследования:
- лексико-морфологический метод текстовой репрезентации,
- морфолого-синтаксический метод текстовой репрезентации,
- сравнительный анализ для сопоставления языковых моделей текста в рассматриваемых задачах, а также для сравнения маркеров стиля, выделяемых в русском и английском языках,
- метод компьютерного моделирования,
- метод статистического анализа.
Актуальность работы. В последнее время возрос интерес к решению задачи атрибуции, так как расширилась область применения алгоритмов, позволяющих определять авторство. Атрибуция автора используется в гуманитарных науках, например, для анализа индивидуального стиля автора или для исторического исследования анонимно опубликованных произведений. Другой сферой применения атрибуции является лингвокриминалистика, связанная с категорией дел по автороведению, например, с установлением и подтверждением авторства текста, с выявлением плагиата, компиляции и так далее. Автоматические алгоритмы определения авторства значительно упрощают решение данных задач и позволяют получить объективные результаты, что особенно важно в правовых вопросах. Однако в настоящее время всё чаще поднимается вопрос о том, насколько можно доверять вердикту, который выносят алгоритмы машинного обучения. Большинство современных алгоритмов атрибуции автора основаны на формальных и статистических моделях. Несмотря на то, что они показывают высокое качество в задаче классификации, результаты работы алгоритма сложно проинтерпретировать. Для того, чтобы решить эту проблему, мы предлагаем собственные, усложнённые лингвистические модели для решения задачи атрибуции. В отличие от формальных моделей, они поддаются интерпретации и наиболее приближены к тому, как язык воспринимает человек.
Теоретическая значимость данного исследования состоит в том, что предложенные модели позволят определить универсальные и уникальные стилистические маркеры, характерные для русского и английского языков.
Практическая значимость исследования заключается в возможности использования этих стилистических маркеров в программах автоматического определения авторства для повышения интерпретируемости результатов и уровня доверия к ним.
1. Основные теоретические подходы к определению языковой личности и методы её анализа
1.1 Узколингвистический и коммуникативный взгляды на проблему автора
Термин «языковая личность» появился в отечественной науке в 1930 году в книге В.В. Виноградова «О художественной прозе» Виноградов В.В. О художественной прозе // books.e-heritage.ru [Электронный ресурс] URL: http://books.e-heritage.ru/book/10077359 (дата обращения: 12.05.2020). и получил отклик во множестве работ на ту же тематику. Проблема текстовой категории автора на протяжении многих лет вызывала интерес учёных в области литературоведения и языкознания. Вплоть до 80-х годов XX века между языковедами возникали серьёзные разногласия, касающиеся принципов определения понятия «автор» и ставящие под сомнение право на существование этой текстовой категории вообще. Ю.Н. Караулов объясняет это явление тем, что в лингвистике XX века личность еще не стала «равноправным с языком объектом изучения, оставаясь скрытым, незаявленным, а иногда и неосознанным предметом исследовательского интереса» Караулов Ю.Н. Русский язык и языковая личность. - 7-е изд. - М.: Издательство ЛКИ, 2010. - С. 48.. Следуя за концепцией «языка в себе и для себя» Ф. де Соссюра, лингвисты долгое время рассматривали личность как явление второстепенное по отношению к языку. Языковые и стилистические особенности текста изучались отдельно от стоявшего за ними авторского сознания.
В то же самое время в зарубежной традиции, в частности во французской литературоведческой школе, существовало мнение о том, что анализ категории автора состоит в изучении биографии писателя. Знаменитый французский литературный критик Ш. де Сент-Бёв, раскрывая суть «биографического» критического метода, ставит своей задачей «изучение писем, разговоров, мыслей, различных особенностей характера и нравственного облика» писателя для того, чтобы «воскресить» его «живой облик» Сент-Бёв Ш. Литературные портреты. Критические очерки: пер. с фр. - М.: Художественная литература, 1970. - С. 109.. Немаловажным он считает при этом историческую оценку произведений писателя, то есть отражение в текстах влияния страны, эпохи, социальных явлений, религиозных взглядов писателя и так далее. Эту точку зрения разделяет Г. Лансон, который в своём труде «История французской литературы» описывает известных французских авторов того времени, опираясь на историю создания произведений, биографию писателей, влияние исторической и социальной ситуации в стране Лансон Г. История французской литературы: пер. с фр. - СПб.: Образование, 1899. - С. 7-40.. В отечественной лингвистике биографический подход тоже нашел своих последователей. Р.В. Плетнёв приводит аргументацию в защиту биографического метода, утверждая, что если писатель выступает «как выразитель своего личного жизненного опыта и мировоззрения, как историческая личность», то традиционного метода изучения «языка в себе и для себя» становится недостаточно для полного и всестороннего анализа языковой личности Плетнев Р.В. О методах изучения Достоевского: ответ на статью кн. Н. Трубецкого // Новый журнал. - 1957. - №51. - С. 288..
Эти два противоположных взгляда на категорию автора Е.В. Старкова обозначает как узколингвистический и коммуникативный подходы Старкова Е.В. Проблема понимания феномена идиостиля в лингвистических исследованиях // Вестник ВятГУ. - 2015. - №5. - С. 76.. Сторонники первого подхода концентрируют внимание на языковых средствах и стилистических особенностях речи писателя, а сторонники второго изучают творческую индивидуальность автора. Таким образом, для первых важен язык автора, а для вторых - сам автор, его реальная биографическая личность. В.В. Виноградов предложил разграничить «конкретного» и «абстрактного» автора Виноградов В.В. О художественной прозе // books.e-heritage.ru [Электронный ресурс] URL: http://books.e-heritage.ru/book/10077359 (дата обращения: 12.05.2020).. Под «конкретным» автором он понимает реальную личность, написавшую текст, а под «абстрактным» - прослеживаемую во всех произведениях, созданных одним человеком, языковую личность, текстовую категорию. Однако такое разделение только усилило разногласия, так как вопрос о том, чем представлена эта текстовая категория, остался открытым.
1.2 Семантико-стилистический подход к языковой личности
Сам В.В. Виноградов определяет языковую личность в рамках семантико-стилистического подхода как систему идей и «эстетико-метафизических воззрений» Виноградов В.В. О художественной прозе // books.e-heritage.ru [Электронный ресурс] URL: http://books.e-heritage.ru/book/10077359 (дата обращения: 12.05.2020).. При этом другие факторы такие, как биография, социальный статус, культурно-историческая предпосылка, психологический портрет автора, В.В. Виноградов отодвигает на второй план. В его понимании данные факторы характеризуют только реально живущего человека, в то время как для языковой личности, являющейся «идейно-стилистическим средоточием» произведения, они становятся неважны Виноградов В.В. О теории художественной речи. - М.: Высшая школа, 1971. - С. 118.. Таким образом, задачу языковеда он видит в семантическом анализе и эстетической оценке произведения.
Подобного мнения придерживались и другие учёные раннего периода исследований категории автора. Б.О. Корман разграничивает «биографического» и «художественного» автора. В работе «Избранные труды по теории и истории литературы» он пишет, что «руководствуясь некоей концепцией действительности и исходя из определенных нормативных и познавательных установок, реальный, биографический автор (писатель) создает с помощью воображения, отбора и переработки жизненного материала автора художественного» Корман Б.О. Избранные труды по теории и истории литературы. - Ижевск: Издательство Удмуртского университета, - 1992. - С. 174.. При этом последнего Б.О. Корман определяет как совокупность идей, нравственных и эстетических установок. Такое мнение было широко распространено среди литературоведов, многие из которых и в настоящих работах, вслед за теорией автора Б.О. Кормана, продолжают рассматривать писателя с точки зрения его нравственных позиций и идеалов, выражаемой идеи, проблематики, а также системы образов, которые регулярно воспроизводятся и прослеживаются в произведениях одного автора.
1.3 Формальный подход к языковой личности
Другой взгляд на проблему автора сформировался в отечественном языкознании под влиянием набирающей популярность структурной лингвистики. Если в семантико-стилистическом подходе в фокусе исследования находится смысловой, идейный компонент произведений, отражающий суть языковой личности, то в формальном подходе на первый план выходит построение текста и организация его структурных единиц. В статье «О методах изучения Достоевского» Н.С. Трубецкой из пяти подходов к категории автора, а именно: биографического, философско-идеологического, психологического, социологического и формального, - признает только формальный подход истинно научным Трубецкой Н.С. О методах изучения Достоевского // Новый журнал. - 1956. - №48. - С. 114.. Остальные подходы Н.С. Трубецкой отклоняет, аргументируя это тем, что они характеризуют реального человека, а на языковую личность экстралингвистические факторы не влияют. Задачу лингвиста он видит исключительно в анализе языковых и стилистических средств. Комментируя работу Н.С. Трубецкого, В.В. Виноградов писал: «По Трубецкому, творец замкнут в своём творении. Литературовед познает автора лишь как создателя, выразителя и носителя стиля литературно-художественных форм» Виноградов В.В. Проблемы авторства и теория стилей // StudFiles.net [Электронный ресурс] URL: http://www.studfiles.ru/preview/460724/page:2/ (дата обращения: 12.05.2020)..
Такая точка зрения была характерна и для зарубежных учёных. Зародившаяся ещё в 30-х годах XX века англо-американская традиция «Новой критики», а также развившаяся из неё «Практическая критика» перенесли акцент с идейных и эстетических установок автора на стилистические и жанровые особенности текста. Авторское влияние они видели только в том, как он или она использует языковой материал для отнесения своего произведения к этим направлениям, жанрам и так далее. «Новые» и «практические» критики рассматривали только языковые особенности текста, считая, что «биографический подход затмевает правильное понимание литературного процесса» (перевод мой) Wellek R., Warren A. Theory of Literature // Harcourt, Brace and Company. - 1949. - P. 72..
1.4 Постструктуралистский подход к языковой личности
Стремление как можно больше формализовать языковую личность привело к тому, что к 60 - 80 годам XX века роль автора стала постепенно угасать на фоне интерпретации литературного текста самого по себе, в оторванности от породившего его авторского сознания. Экстралингвистический аспект рассматривался как объект изучения совершенно других областей: психологии, философии, этнографии, социологии. Задача лингвистики виделась только в изучении языка внутри самого себя. Эта позиция достигла своего предела в 1967 году после выхода известного сочинения Р. Барта «Смерть автора», написанного в духе постструктуралистского течения. Ключевой мыслью этой работы является то, что творение не связано напрямую со своим творцом. Автор играет роль инструмента, с помощью которого создаётся произведение. После его написания автор «умирает», теряет свою значимость, потому что созданное им произведение начинает жить своей жизнью: «голос отрывается от своего источника, для автора наступает смерть, и здесь-то начинается письмо» Барт Р. Избранные работы: Семиотика. Поэтика: пер. с фр. Сост., общ. ред. и вступ. ст. Г.К. Косикова - М.: Прогресс, 1989 - С. 384.. Определяющую роль в интерпретации художественного произведения Р. Барт видит не в авторе, а в читателе. Критикуя положения коммуникативной стилистики Ш. Сент-Бёва и Г. Лансона, Р. Барт отказался от экстралингвистических аспектов творческой индивидуальности и перевёл акцент на впечатления читателя. «Всякий текст вечно пишется здесь и сейчас», и зависит он не от автора, а от «языка как такового», - утверждает Р. Барт Барт Р. Избранные работы: Семиотика. Поэтика: пер. с фр. Сост., общ. ред. и вступ. ст. Г.К. Косикова - М.: Прогресс, 1989 - С. 387..
Программа деконструктивистской критики просуществовала в лингвистической традиции не так долго. Представленные в ней положения по поводу языковой личности сильно всколыхнули научное сообщество, что несомненно отразилось на содержании работ по языковедению того времени. Однако такой взгляд на лингвистику и на образ автора быстро уступил место так называемому широкому подходу к категории автора, возникшему в конце XX века Старкова Е.В. Проблема понимания феномена идиостиля в лингвистических исследованиях // Вестник ВятГУ. - 2015. - №5. - С. 76.. Обесценивание автора было скорее явлением историческим, а не абсолютным, как утверждает Ли Хи Вон, и объясняется оно исключительно духом своего времени Ли Хи Вон. Системно-субъектный метод Б.О. Кормана: Теория автора: автореф. дис.... канд. фил. наук: 10.01.08. - М., 2000. - 187 с.. Вместе с тем такой радикальный подход к проблеме автора позволил исследователям посмотреть на неё с новой стороны, всколыхнул новую волну интереса и привёл к расширению задач, касающихся данной проблематики.
1.5 Широкий взгляд на проблему автора
Помимо узколингвистического и коммуникативного, Е.В. Старкова выделяет широкий подход к изучению языковой личности Старкова Е.В. Проблема понимания феномена идиостиля в лингвистических исследованиях // Вестник ВятГУ. - 2015. - №5. - С. 76.. Широкий подход объединяет две предыдущие точки зрения и может быть определён как совокупность лингвистического и экстралингвистического аспектов, или как «творческая индивидуальность автора плюс языковые средства её выражения» Сивкова А.В. Идиостиль Н.В. Гоголя в аспекте лингвокогнитивной поэтики: автореф. дис.... канд. фил. наук: 10.02.01. - Калининград, 2007. - 23 с.. Таким образом, сторонники широкого подхода не разделяют аспекты языковой личности, а считают её сложным, многогранным целым, включающим «единство творческих особенностей, присущих данному писателю: идей, тем, характеров, сюжета, языка», - и обусловленных прежде всего «биографией, жизненным опытом, культурой, талантом, той социальной обстановкой, в которой развивается его творчество и по отношению к которой он, естественно, занимает определённую позицию в зависимости от своих эстетических идеалов» Тимофеев Л.И., Тураев С.В. Краткий словарь литературоведческих терминов. - М.: Просвещение, 1985. - 312 с.. Такая позиция стала характерна для работ конца XX - начала XXI века. Её прогрессивная идея состояла в том, чтобы объединить все предложенные ранее взгляды на определение языковой личности, а методы её исследования разделить.
В 1980 году В.А. Кухаренко предложила развести понятия «идиолект» и «идиостиль». Под идиолектом она понимает «единицы синтаксического, лексического, морфологического, фонетического уровней, их частоты и распределение в тексте», а под идиостилем - «систему изобразительно-выразительных средств, а также сюжетно-тематические и жанрово-композиционные особенности текста» Кухаренко В.А. Индивидуально-художественный стиль и его исследование. - Киев-Одесса: Вища школа, 1980. - С. 6.. Е.В. Литус считает, что анализ идиолекта является исключительно лингвистической задачей, в то время как идиостиль, который она определяет как совокупность авторских интенций, выраженных в содержании текстов с помощью системы изобразительных средств, является предметом исследования литературоведения Литус Е.В. Эволюция идиолекта писателя (на материале ранних произведений А.П. Чехова) // Человек и наука [Электронный ресурс] URL: http://cheloveknauka.com/evolyutsiya-idiolekta-pisatelya (дата обращения: 12.05.2020).. Тем не менее в лингвистике существуют методы анализа языковой личности, объединяющие исследование идиолекта и идиостиля. В частности, коммуникативно-деятельностный подход, который разработал в 80-х годах XX века Ю.Н. Караулов.
1.6 Коммуникативно-деятельностный подход к языковой личности
Коммуникативно-деятельностный подход построен на теории речевой деятельности и включает в себя учение о цели и мотивах. Таким образом, беря за основу изучение языка, его структур и особенностей, Ю.Н. Караулов расширяет границы исследования, рассматривая язык как средство воплощения коммуникативной потребности автора, как отражение его опыта и языковых способностей. Ю.Н. Караулов предлагает три модели языковой личности: методическую, целевую (или готовностную) и лингводидактическую.
В методической модели языковая личность представлена на трёх уровнях Караулов Ю.Н. Русский язык и языковая личность. - 7-е изд. - М.: Издательство ЛКИ, 2010. - С. 56.. На нулевом, или вербально-семантическом, уровне языковая личность формирует типичные для своего языка высказывания, построенные по грамматическим моделям словосочетаний и предложений. Таким образом, на этом уровне выявить индивидуальные особенности автора довольно сложно, только если он или она не обладает какими-то редкими специфичными особенностями: например, неспособностью формировать грамматически правильные предложения и словосочетания из-за каких-то нарушений. На первом (тезаурусном) уровне языковая личность пользуется высказываниями, сформированными под влиянием системы культурных ценностей и традиций того социума, частью которого она является. Иными словами, на тезаурусном уровне представлена картина мира языковой личности, выраженная в тексте с помощью афоризмов, дефиниций, крылатых слов, пословиц и так далее. Наконец, на последнем, мотивационном уровне представлены коммуникативные потребности языковой личности, которые выражаются в тексте множеством способов (например, символами, образами, цитатами и прецедентными именами). Этот уровень в наивысшей степени отражает индивидуальные особенности автора в выборе речевых средств.
Готовностная модель языковой личности во многом повторяет методическую Караулов Ю.Н. Русский язык и языковая личность. - 7-е изд. - М.: Издательство ЛКИ, 2010. - С. 60.. В ней языковая личность также выражена на трёх уровнях, но дополнена речевыми готовностями. На вербально-семантическом уровне представлены готовности, характерные для среднего уровня владения языком, например, «готовность к устной и письменной речи», «готовность понимать и воспроизводить в речи значительное богатство средств выражения», «владение нормами орфографии» и так далее. На тезаурусном и мотивационном уровнях представлены более сложные готовности, например, «готовность использовать иностранные понятия», «готовность к импровизации речи», «готовность использовать стилистические средства того или иного подъязыка», «готовность оперировать прецедентными текстами художественной культуры» и другие.
После создания двух указанных моделей языковой личности Ю.Н. Караулов пришёл к выводу, что они во многом зависят от того, насколько автор владеет языком. В третьей, лингводидактической модели Ю.Н. Караулов дополняет предыдущие схемы пятью уровнями владения языком и четырьмя видами речевой деятельности: говорением, слушанием, чтением и письмом Там же. С. 67.. Таким образом, лингводидактическая модель «представляет языковую личность в её развитии, становлении и движении от одного уровня владения языком к другому» Там же. С. 67..
1.7 Когнитивный подход к языковой личности
Модели языковой личности Ю.Н. Караулова и коммуникативно-деятельностный подход в целом повлияли на развитие когнитивного подхода. И.А. Тарасова понимает под идиостилем единство ментального и языкового - «концептов и когнитивных структур их языкового воплощения» Тарасова И.А. Поэтический идиостиль в когнитивном аспекте (на материале поэзии Г. Иванова и И. Анненского): автореф. дис.... д-р. фил. наук: 10.02.01. - Саратов, 2004. - С. 41.. Когнитивисты считают, что в совокупности текстов одного автора можно проследить языковое отражение его или её индивидуальной картины мира, опыта взаимодействия с миром и знаний о нём. Е.Г. Фоменко пишет, что художественные тексты одного писателя создают лингвотипологическое пространство его идиостиля, то есть типичные для этого автора внутритекстовые отношения, жанры, композицию, нарративные формы и так далее Фоменко Е.Г. Проблемы лингвотипологического описания идиостиля писателя // Вестник Северного (Арктического) федерального университета. Серия: Гуманитарные и социальные науки. - 2006. - №2. - С. 97.. При этом лингвотипологическое пространство писателя является некой проекцией лингвотипологического инварианта художественного текста конкретной эпохи. Это значит, что изучение индивидуального стиля языковой личности является отправной точкой для исследования обобщенного, «идеального» текста той эпохи, в которую творил автор. По этой причине моделирование языковой личности представляется очень важным для анализа литературных жанров и направлений с точки зрения когнитивной лингвистики.
В когнитивном подходе языковая личность рассматривается также с психолингвистических позиций. С.А. Сухих выделяет четыре лингвопсихологических типа языковой личности Сухих С.А., Лузаков А.А. Психология взаимопонимания // Language, communication and social environment [Электронный ресурс] URL: http://lse2010.narod.ru/index/0-220 (дата обращения: 12.05.2020).. В текстах традиционалистов наблюдается тенденция к констатации внешних наблюдений, к рациональному восприятию действительности и к нарративности. Для реалистов характерен динамический способ построения речи, аналитический стиль, рациональные аргументы, сложный терминологический аппарат, наличие в одном тексте нескольких тем. Концептуалисты склонны к предикативному способу изложения. В их текстах представлены как внешние, так и внутренние наблюдения, то есть рациональное и эмоционально-чувственное восприятие, оригинальные метафорические переносы, яркие художественные образы, архетипы. Концептуалисты способны к вербальной креативности, то есть к словотворчеству, а также к абстрагированию и обобщению. Для них характерна повышенная субъективная оценка в речи и высокий коэффициент эпизодичности (наличие лирических отступлений, непрямого повествования, флешбэков). И, наконец, у идеалистов наблюдается предикативный способ построения речи, низкий коэффициент эпизодичности, высокая эмоциональность и оценочность речи.
1.8 Методики анализа языковой личности в судебно-автороведческой экспертизе
Когнитивные и коммуникативно-деятельностные модели языковой личности часто используются в судебно-автороведческой экспертизе. В судебных делах чрезвычайно важна полнота и объективность проведённого исследования, поэтому в автороведческой экспертизе были разработаны собственные методики анализа языковой личности, объединяющие некоторые из уже рассмотренных подходов. С.М. Вул выделяет следующие идентификационные признаки языковой личности: пунктуационные, орфографические, лексико-фразеологические, грамматические, стилистические, дискурсивные и интеллектуальные.
Яркой отличительной чертой С.М. Вул считает повторение в тексте или текстах одного автора однородных ошибок. Так, к частным признакам пунктуационного навыка относятся: пропуск или немотивированная постановка знака препинания, использование знака препинания в несвойственной ему функции (например, постановка тире вместо запятой или двоеточия), использование знака препинания в несвойственной ему графической форме (например, написание многоточия с двумя точками вместо трех), ошибочная постановка знака препинания, вызванная интерферирующим воздействием другого языка (например, обособление обстоятельства, выраженного предложным оборотом, в начале предложения - пунктуационная норма для английского и французского языков), ошибочное сочетание знаков препинания (например, постановка вопросительного и восклицательного знаков в обратном порядке). Различают также мотивированное использование знака препинания, которое не предусмотрено грамматикой, но оправдано смысловой направленностью изложения. Такие знаки препинания называют авторской пунктуацией. К ним относятся: знаки, употреблённые в местах, не предназначенных для постановки знака препинания, для интонационного выделения важной, по мнению автора, части высказывания; знаки, употреблённые в функции другого знака с целью более точного, эмоционального, смыслового выражения мысли; составные знаки (например, использование нескольких восклицательных знаков подряд) Вул С. М. Судебно-автороведческая идентификационная экспертиза: методические основы: Методическое пособие. - Харьков: ХНИИСЭ, 2007. - С. 7..
К частным признакам орфографического навыка относятся следующие случаи: орфографические ошибки, которые могут быть вызваны незнанием грамматических норм, использованием устаревшей формы, интерференцией диалекта или другого языка, и так называемые опечатки, несознательные ошибки, не связанные с нарушением правил орфографии: пропуск буквы, написание лишней буквы, перестановка букв или слогов Там же. С. 7..
Лексико-фразеологический навык составляет использование лексики разных разрядов: книжной, разговорной, просторечной, жаргонной и так далее. Отличительной чертой может быть использование диалектизмов, иностранных слов, оценочной лексики, канцеляризмов, эвфемизмов, а также повторяющихся слов, выражений, фразеологизмов, пословиц, поговорок, крылатых слов. Ошибки в употреблении лексики могут быть намеренные и ненамеренные (например, использование архаизмов, историзмов, неологизмов и изменённых фразеологизмов) Вул С. М. Судебно-автороведческая идентификационная экспертиза: методические основы: Методическое пособие. - Харьков: ХНИИСЭ, 2007. - С. 8..
Значительный пласт грамматического навыка составляют грамматические ошибки разного рода: нарушение связи между подлежащим и сказуемым, неправильный порядок слов, ошибочное построение словосочетаний и предложений, неправильное употребление падежных форм и служебных частей речи. Такие нарушения, как и в других навыках, могут быть вызваны незнанием грамматических правил или интерферирующим воздействием другого языка или диалекта (например, неправильный порядок слов в английском предложении под воздействием грамматики русского языка, где порядок слов сравнительно свободный). К грамматическому навыку относятся также следующие признаки: использование определенного рода словосочетаний (однородных по типу связи, по степени слитности компонентов, по грамматическим типам и по количеству элементов), предложений (разные виды простых, сложносочинённых, сложноподчинённых и бессоюзных предложений), количественное соотношение простых и сложных предложений, средняя длина предложения, количество предложений в абзаце, использование простых глагольных, составных именных и составных глагольных сказуемых, частотное соотношение разных частей речи, использование определенных способов синтаксического оформления и связи между предложениями, организация абзацев и другие Там же. С. 8..
К стилистическому навыку относится использование всевозможных тропов и фигур, а также средств, использованных в определённых стилистических функциях (например, использование архаизмов для придания торжественности повествованию или же напротив - для создания иронии или комического эффекта) Вул С. М. Судебно-автороведческая идентификационная экспертиза: методические основы: Методическое пособие. - Харьков: ХНИИСЭ, 2007. - С. 9..
Навык дискурсивного мышления по С.М. Вулу состоит в логических средствах аргументации мысли. Авторское мышление может отличаться по характеру доказательства мысли: по типу аргумента (рациональный или эмоциональный), по виду умозаключения (категорическое, условное), по общей логической структуре аргументации. Например, автор может разворачивать аргументацию вокруг одного ключевого понятия или использовать цепочку последовательно связанных друг с другом аргументов. Важно также обращать внимание на то, как автор акцентирует внимание на важных, по его мнению, высказываниях: лексическими средствами, с помощью пунктуации, графически и так далее. Как и в любом другом навыке, частным признаком дискурсивного мышления являются ошибки: логические, то есть ошибки в рассуждениях, умозаключениях, и фактические, то есть отображение действительности, не соответствующее реальности Там же. С. 9..
Интеллектуальный навык заключается в том, как автор воспринимает и отображает действительность. С.М. Вул обращает внимание на три типа восприятия действительности: синтетический - восприятие целостной картины, аналитический - восприятие частностей, а также смешанный, сочетающий в себе первые два. К интеллектуальному навыку относятся также: объективный и субъективный способы описания действительности, характер и предметная область аргументов, отсылки к авторитетным источникам, характер оценки описываемых событий или объектов, например, эстетический, этический, прагматический и так далее Там же. С. 11..
Ещё одним важным методологическим вопросом в судебно-автороведческой экспертизе является то, соблюдаются ли условия для проведения исследования. Задача верификации (определения, является ли конкретный человек автором или нет), идентификации (определения, кто из потенциальных авторов является реальным автором) и диагностики (определения, какого автор пола, возраста, национальности, какой у него уровень образования, психический статус и так далее) всегда производится на основе сравнения нескольких текстов. Тексты, авторство которых достоверно известно, называются свободными образцами. Непременным условием для сравнения спорного текста, то есть текста, авторство которого требуется подтвердить, с свободными образцами является условие их сопоставимости. Тексты должны быть сопоставимы по языку, дате написания, функциональному стилю, жанру и адресату. Кроме того, тексты должны быть объемом не менее 500 слов Вул С. М. Судебно-автороведческая идентификационная экспертиза: методические основы: Методическое пособие. - Харьков: ХНИИСЭ, 2007. - С. 35.. Авторство текста устанавливается на основе сравнения показателей представленности упомянутых идентификационных признаков в спорном и свободных образцах текста. При этом С.М. Вул указывает на то, что «общие признаки языковых навыков письменной речи устанавливаются на основе соответствующей количественной методики». Количественный анализ идентификационных признаков довольно сложно провести вручную. По этой причине в настоящее время создаются автоматические алгоритмы определения авторства письменного текста.
1.9 Выводы
Итак, в лингвистике существует несколько взглядов на языковую личность. В ранних исследованиях, начавшихся ещё в 30-е годы XX века, наблюдается теоретическая неопределённость: у учёных не было единого мнения о том, что из себя представляет категория автора и с помощью каких методов её следует изучать. Основные подходы к языковой личности были:
- биографический, основанный на анализе биографии автора, а также на изучении социальных, культурных и исторических предпосылок его произведений,
- семантико-стилистический, основанный на анализе текстовой категории автора, выраженной в совокупности заложенных им смыслов, идей и эстетических установок,
- формальный, заключающийся в анализе языковых, стилистических и жанрово-композиционных средств, регулярно повторяющихся в произведениях одного автора,
- постструктуралистский, переводящий акцент с анализа категории автора на анализ роли читателя в интерпретации произведения.
В 80-е годы XX века наблюдается тенденция к объединению всех предыдущих взглядов на категорию автора. Широкий подход определяет языковую личность как сложное, многоаспектное явление, включающее как языковые, так и неязыковые факторы. Среди новых подходов к изучению языковой личности выделяются:
- коммуникативно-деятельностный, в котором языковая личность исследуется с точки зрения выражаемых ею интенций,
- когнитивный, заключающийся в анализе индивидуальной картины мира автора.
Особые методы исследования языковой личности существуют в судебно-автороведческой экспертизе. Они основаны на анализе идентификационных признаков автора, выраженных в пунктуационном, орфографическом, лексико-фразеологическом, грамматическом, стилистическом, дискурсивном и интеллектуальном навыках письма. Представленные навыки исследуются количественно, в силу чего экспертам-автороведам требуются для анализа автоматические алгоритмы определения авторства.
2. Обзор исследований по компьютерной стилометрии
2.1 Формальные модели представления текста
К концу XX века в связи с развитием компьютерных технологий стали появляться работы по автоматическому анализу автора письменного текста. Задачи компьютерной стилометрии подразделяются на атрибуцию, профилирование и обнаружение изменений в стиле. Атрибуция - это задача автоматического определения автора текста из списка имеющихся авторов-кандидатов. Смежной к атрибуции является задача верификации, то есть подтверждения, является ли конкретный человек автором набора текстов. Профилирование является задачей определения каких-либо характеристик автора, например, пола, возраста, рода занятий, психологических особенностей. И, наконец, задача обнаружения изменений в стиле чаще всего связана с установлением факта вмешательства в текст какого-то другого лица (например, соавтора или редактора).
В силу того, что все задачи компьютерной стилометрии основаны на анализе стиля языковой личности, они имеют схожий набор методик. Подходы к решению данных задач можно поделить на две категории: формальные и лингвистические. Первые представляют текст в виде формальной или статистической модели. В отличие от лингвистических, формальные модели не принимают во внимание языковые особенности текста и могут быть применены к любому языку. Одной из самых распространённых и успешных моделей в рамках формального подхода является модель n-граммов. N-граммы представляют текст в виде последовательности символов или слов. Эта сравнительно простая модель репрезентации показывает высокие результаты в ряде работ.
2.1.1 N-граммы фиксированного размера
Один из первых алгоритмов определения авторства текста для русского языка, созданный Д.В. Хмелёвым, основан именно на модели n-граммов фиксированного размера. В этом алгоритме текст представляется в виде последовательности двухбуквенных сочетаний, то есть биграммов символов. На корпусе из 1000 произведений, принадлежащих 82 авторам, Д.В. Хмелёву удалось достичь 84% точности Хмелёв Д.В. Распознавание автора текста с использованием цепей А.А. Маркова // Вестник МГУ. Сер. 9: Филология. - 2000. - № 2. - С. 126.. Похожее исследование проводили Л.А. Борисов, Ю.Н. Орлов и К.П. Осминин: они сравнивали результаты работы алгоритма, основанного на моделях двух-, трёх- и четырёхбуквенных сочетаний. Эта работа проводилась на материале 300 текстов 30 авторов. Задача определения стилистической однородности текстов, то есть задача кластеризации, показала лучшую точность (около 85%) при использовании модели биграммов символов, в то время как задача отнесения текстов к тому или иному автору, то есть задача классификации, наивысшее качество (100%) показала при использовании триграммов символов Борисов Л.А., Орлов Ю.Н., Осминин К.П. Идентификация автора текста по распределению частот буквосочетаний // Препринты ИПМ им. М.В.Келдыша. - 2013. - № 27. - С. 3-26..
В исследовании Т.А. Литвиновой, А.Г. Сбоева и П.В. Паничевой по профилированию возраста русских блогеров в качестве основных характеристик используются униграммы и биграммы не только слов, но и частей речи Litvinova T.A., Sboev A.G., Panicheva P.V. Profiling the Age of Russian Bloggers // Proceedings of the 7th International Conference, AINL 2018, St. Petersburg, Russia, 17-19 October 2018 / In: Ustalov D., Filchenkov A., Pivovarova L., Ћiћka J. (eds). - Cham: Springer, 2018. - P. 167-177.. Дополнительными характеристиками являются морфологические данные (например, вид и время глагола). Исследователи поставили перед собой несколько задач, а именно: задачу классификации по возрастным группам (20 - 30, 30 - 40 и 40 - 50) и задачу регрессии, то есть предсказание возраста как непрерывной величины. Результаты классификации получились следующие: около 50% с алгоритмом SVC и 33% с алгоритмом Random Forest, - а в задаче регрессии средняя квадратичная ошибка (MAE) получилась равна 6.0. Эти результаты сопоставимы с качеством, полученным для других языков. Авторы статьи пришли к выводу, что в задаче профилирования модель n-граммов показывает себя хорошо, а добавление к ней дополнительных признаков (морфологических характеристик) немного улучшает качество.
2.1.2 N-граммы переменной длины
В последних работах по атрибуции и профилированию автора модель n-граммов всё ещё остаётся лидирующей по качеству. В соревновании PAN по стилометрии 2018 года решались задачи атрибуции и обнаружения изменений в стиле. В силу того, что конкурс PAN направлен на решение реальных прикладных задач, условия исследования были максимально приближены к действительности. Несмотря на то, что одним из условий проведения судебно-автороведческой экспертизы является сопоставимость текстов (то есть совпадение по языку, функциональному стилю, жанру, дате написания и характеру адресата), в реальной жизни определять автора приходится и в том случае, если отсутствует совпадение по какому-то из названных параметров. В связи с этим соревнование по атрибуции 2018 года проходило при условии смешения областей (междоменная атрибуция), то есть тренировочные и тестовые тексты могли отличаться по жанрам, темам, функциональным стилям и так далее. В качестве материала для исследования участникам было предложено использовать фанфики - рассказы о героях популярных оригинальных литературных произведений, киноискусства, комиксов и компьютерных игр. Этот материал, по мнению организаторов конкурса, идеально удовлетворяет требованию междоменной атрибуции, так как фанфики, взятые для анализа, принадлежат разным темам, жанрам, и направлениям. Тексты были представлены на пяти языках: английском, французском, итальянском, польском и испанском. Длина текстов была строго ограничена от 500 до 1000 токенов. Это было сделано также для воссоздания реальных условий, так как лингвистам-экспертам часто приходится иметь дело с короткими текстами, в которых определить закономерные черты стиля сложнее, чем в длинных текстах Kestemont M., Tschuggnall M., Stamatatos E., Daelemans W., Specht G., Stein B., Potthast M. Overview of the author identification task at PAN-2018: cross-domain authorship attribution and style change detection // CEUR Workshop Proceedings. - 2018. - Vol. 2125. - P. 4-6..
Самой лучшей моделью для решения поставленной задачи оказалась модель n-граммов, разработанная Х. Куштодиу и И. Парабони Custoмdio J.E., Paraboni I. EACH-USP Ensemble Cross-domain Authorship Attribution [Electronic resource] // Working Notes of CLEF 2018 - Conference and Labs of the Evaluation Forum, Avignon, France, 10-14 September 2018 / In: Cappellato L., Ferro N., Nie J.Y., Soulier L. (eds.). - Aachen: CEUR Workshop Proceedings, 2018. URL: http://ceur-ws.org/Vol-2125/paper_76.pdf. Исходную модель триграммов символов, предложенную организаторами PAN, они усовершенствовали и получили следующие результаты: macro-F1 = 0.685, macro-precision = 0.672, macro-recall = 0.784, micro-accuracy = 0.779. Вместо n-граммов фиксированной длины в работе использовались n-граммы символов и слов с переменной длиной. Значение n > 3 позволило захватить долгосрочные зависимости в более длинном контекстном окне, а последовательное сокращение n помогло охватить контексты разной длины. Кроме того, Х. Куштодиу и И. Парабони использовали n-граммы искажённой версии текста.
2.1.3 N-граммы искажённой версии текста
Этот подход предложил в 2017 году Е. Стамататос Stamatatos E. Authorship Attribution Using Text Distortion // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics, Valencia, Spain, 3-7 April 2017. - Cambridge: ACL, 2017. - P. 1138-1149.. Суть искажения текста заключается в том, что всё в тексте, кроме пробелов, пунктуации и чисел заменяется на символ звездочки. Такая модель акцентирует внимание на знаках пунктуации, пробелах, диакритических знаках и числах, которые составляют структурную организацию текста. Есть основания полагать, что структуры текстов одного автора выглядят примерно одинаково, а значит, эта модель потенциально отражает признак индивидуального стиля. Е. Стамататос использует два варианта модели: DV-MA, где на звёздочку заменяются символы (цифры заменяются на знак решётки), и DV-SA, где на звёздочку заменяются слова (в этом случае на решётку заменяются числа). При этом в модели присутствует регуляризатор k, находящийся в прямой зависимости от частоты слов: чем больше значение k, тем больше видно частотных слов. Так, при k, равном 0, все знаки заменены на звёздочку, а при k, равном 100, становятся видны служебные слова. На новостных корпусах CCAT-10 (по 100 текстов на 10 авторов) и Guardian (по 10 текстов на 13 авторов) лучшее качество было получено на модели n-граммов символов и DV-MA модели со значением k, равным 541.7. Модель ориентировалась при классификации на расположение абзацев и предложений, на структуру предложений и на самые частотные лексемы.
Второй по качеству в соревновании PAN 2018 года оказалась модель Б. Мурауэра, М. Чугналля и Г. Шпехта Murauer B., Tschuggnall M., Specht G. Dynamic Parameter Search for Cross-Domain Authorship Attribution [Electronic resource] // Working Notes of CLEF 2018 - Conference and Labs of the Evaluation Forum, Avignon, France, 10-14 September 2018 / In: Cappellato L., Ferro N., Nie J.Y., Soulier L. (eds.). - Aachen: CEUR Workshop Proceedings, 2018. URL: http://ceur-ws.org/Vol-2125/paper_84.pdf. Они также использовали модель n-граммов, но она была чуть проще, чем у Х. Куштодиу и И. Парабони. В этой работе использовались только n-граммы символов, но с подбором определённых параметров, а именно: частота n-граммы в документе (игнорирование n-граммы, если ее частота меньше заданного числа в диапазоне от 0 до 5), размер n-граммы (от 3 до 5), приведение к нижнему регистру, idf-нормализация, удаление апострофов, L1 или L2 нормализация, svm с параметром C (от 0.01 до 100). Параметры подбирались отдельно для каждого языка с помощью GridSearch. Результаты с использованием данной модели получились следующие: macro-F1 = 0.643, macro-precision = 0.646, macro-recall = 0.741, micro-accuracy = 0.752, - что в среднем только на 0.03 уступает модели Х. Куштодиу и И. Парабони.
В соревновании PAN 2019 года модель n-граммов опять оказалась в топе лучших алгоритмов Kestemont M., Stamatatos E., Manjavacas E., Daelemans W., Potthast M., Stein B. Overview of the cross-domain authorship attribution task at {PAN} 2019 // CEUR Workshop Proceedings. - 2019. - Vol. 2380. - P. 1-15.. Условия конкурса 2019 года практически идентичны условиям 2018 года лишь за двумя исключениями. В качестве дополнительного условия участникам было предложено решить атрибуцию на открытом наборе данных (open-set task). Это значит, что текст, у которого необходимо определить авторство, может не принадлежать ни одному из предложенных авторов в тренировочной выборке. Такие тексты определялись в отдельный класс. Вторым отличием от задания 2018 года были языки текстов: для анализа брались тексты на английском, французском, итальянском и испанском языках.
Лучшей моделью 2019 года стала модель n-граммов, предложенная Л. Муттенталером, Г. Лукасом и Я. Аманом, которая во многом похожа на лидирующую модель прошлого года Muttenthaler L., Lucas G., Amann J. Authorship Attribution in Fan-Fictional Texts given variable length Character and Word N-Grams [Electronic resource] // CLEF 2019 Labs and Workshops, Notebook Papers, Lugano, Switzerland, 9-12 September 2019. - Aachen: CEUR Workshop Proceedings, 2019. URL: http://ceur-ws.org/Vol-2380/paper_49.pdf. Авторы использовали комбинации n-граммов переменной длины из символов и слов (длина контекстного окна варьировалась от двух до пяти символов или слов). Кроме этого, в работе использовались униграммы пунктуации и n-граммы искажённой версии текста, построенные по методике Е. Стамататоса. В финальной модели проводилось tf-idf взвешивание, L2 нормализация и понижение размерности с помощью SVD. Классификация проводилась ансамблем из трёх моделей: n-граммы символов, n-граммы символов искаженной версии текста и n-граммы слов. Результаты получились следующие: macro-F1 = 0.690, macro-precision = 0.716, macro-recall = 0.742, - что сопоставимо с результатами прошлого года.
Подобные документы
История появления и общее понятие языкового портрета личности. Анализ способов речевых манипуляций. Разработка концепции языковой личности в отечественном языкознании. Реконструирование портрета личности. Роль речевых особенностей в языковой личности.
реферат [22,0 K], добавлен 10.04.2015Предпосылки создания теории языковой личности. Лексемы "мать" и "отец" как универсальные доминанты в дискурсе Н.А. Дуровой. Лексико-семантическое поле "мать" в дискурсе мемуарной прозы "Записки кавалерист-девицы". Особенности идиостиля писательницы.
курсовая работа [57,5 K], добавлен 15.05.2014Типы орфографической языковой личности, разработка методики ее исследования. Исследование портретов индивидуальных орфографических личностей на основе лингвистических и психологических тестов при помощи работ по русскому языку и дополнительным предметам.
курсовая работа [15,8 K], добавлен 02.10.2011Понятие языковой личности в отечественной лингвистике, уровни ее анализа. Категория комического дискурса как объекта лингвистического исследования. Характеристика вербально-семантического уровня языковой личности шута в поэме Шекспира "Король Лир".
курсовая работа [55,7 K], добавлен 25.01.2011Языковой портрет музыканта на примере певицы Adele, ее семантико-синтаксические, лексические и морфологические особенности. Отражение языковой личности в музыке. Анализ языковых особенностей современного музыканта в рамках воздействия на общество.
реферат [21,6 K], добавлен 21.05.2013Теоретические понятия языковой игры, политического текста и метафоры. Определение политической метафоры. Классификация примеров метафорического использования языковых единиц. Формирование негативного образа властных субъектов в сознании адресата.
курсовая работа [38,2 K], добавлен 23.08.2011Речевые параметры и особенности речеупотребления языковых личностей, могущих быть отнесенными к типу сильных. Высказывания советской актрисы театра и кино Фаины Георгиевны Раневской и современного писателя-сатирика Михаила Михайловича Жванецкого.
дипломная работа [155,2 K], добавлен 03.02.2015Определение понятия текста в лингвистике; его содержательная структура. Импликации в художественном произведении. Причины семантико-структурных отступлений перевода от оригинала. Анализ ценности информации и сообщения. Сущность языковой избыточности.
презентация [44,7 K], добавлен 30.10.2013Теоретические основы изучения текста. Разграничение текста и дискурса. Понятие текста и подходы к его анализу. Употребление терминов texte и discours во французском языке. Сравнительно-сопоставительное исследование текста астрологического прогноза.
дипломная работа [204,5 K], добавлен 03.07.2009Проблема языковой личности в гуманитарных науках. Языковая личность как объект лингвистических исследований. Структура языковой личности. Семантико - синтаксический уровень языковой личности ученого. Терминологическая система обозначения Гумилева.
курсовая работа [56,2 K], добавлен 08.07.2008