Корпусная грамотность как малоизученная проблема: содержание и специфика понятия

Исследование и освещение понятия о корпусной грамотности корпусных пользователей. Определение составляющих корпусной грамотности в случае ее применения по отношению к лингвистам иных направлений. Факторы, обуславливающие содержание корпусной грамотности.

Рубрика Педагогика
Вид статья
Язык русский
Дата добавления 07.11.2022
Размер файла 144,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

КОРПУСНАЯ ГРАМОТНОСТЬ КАК МАЛОИЗУЧЕННАЯ ПРОБЛЕМА: СОДЕРЖАНИЕ И СПЕЦИФИКА ПОНЯТИЯ

Оксана Шиллова

Анотація

Висвітлено проблему так званої «корпусної грамотності» користувачів мовних корпусів. Вивчено історію питання переважно на матеріалі англомовної, російськомовної та чеськомовної наукової літератури. Проаналізовано зміст, межі і специфіку поняття «корпусна грамотність», що з'явилося в науковій літературі на початку ХХІ століття. На основі критичного аналізу й узагальнення наукових джерел запропоновано дефініцію поняття «корпусна грамотність», встановлено чинники, що визначають зміст і специфіку цього поняття при його застосуванні в різних галузях роботи з мовою (викладання мови, перекладацька діяльність, дослідницька діяльність та ін.). Порушено питання про корпусну грамотність лінгвістів, що належать до інших, ніж корпусна лінгвістика, мовознавчих напрямів.

Ключові слова: користувач корпусу, корпусна грамотність, корпусна компетенція, мовний корпус.

Annotation

CORPUS LITERACY AS AN UNDERRESEARCHED PROBLEM: THE CONTENT AND SPECIFICITY OF THE CONCEPT Aksana Schillova

Czech Language Institute of the Czech Academy of Sciences, Prague, Czech Republic.

Background: The rapid development of information technologies and corpus linguistics in our century has made language corpora accessible to a wide range of users. Corpora are constantly growing and improving and many of them are free available on the Internet today. Nevertheless, courses on corpus linguistics and on working with corpora still have not been universally integrated into the university core curricula of philological disciplines. Under these circumstances, it is relevant to discuss the question of the so-called «corpus literacy» which reflects the correspondence (or noncorrespondence) between users' competencies and the requirements that must be met when using corpora in research, teaching, translation, or any other work concerned with language data. In the present paper, the corpus literacy is considered an essential condition for the quality and effectiveness of the use of language corpora.

Purpose: The article aims a) to summarize and critically analyse literature on the corpus literacy, mainly in English, Russian, and Czech, b) to consider the content of the concept of «corpus literacy», its specifics and boundaries, c) to establish the factors influencing its content, d) to deduce the definition of this concept based on the generalizations made. A sub-purpose of the article is to raise the issue of corpus literacy among linguists of other fields than corpus linguistics.

Results: Following conclusions can be drawn from the present theoretical study: 1) the corpus literacy is an underresearched and underdiscussed topic as far as the Russian a Czech contexts are concerned. This issue has been actively discussed in the English language literature since the early 2000s (apparently for the first time in Mukherjee's works), however, mainly in the context of problems related to integrating corpora into practice teaching English as a foreign language in different countries; 2) the corpus literacy does not arise by itself; it should be purposefully developed; 3) the corpus literacy should be developed both by future and current language specialists; 4) the issue of the corpus literacy should be addressed at universities by integrating corresponding courses into philological core curricula, organizing courses for in-service specialists, compiling corresponding study guides, etc.; 5) the corpus literacy is a generalized concept that has many specific implementations, the volume and content of which are influenced by various interrelated factors; in particular, what users use the corpora, for what purpose, which corpus resources are used; 6) the corpus literacy can be defined as a set of general and specific knowledge, skills, and abilities developed by certain corpus users within a certain educational process in order to effectively use a certain corpus (corpora) in a certain occupation.

Discussion: The corpus literacy is a vast area for research and the theoretical investigation in this area is intended to lay theoretical foundations for the preparation of textbooks on the use of language corpora by non-specialists (i. e., by non-corpus linguists). The following issues are to be considered in future studies: sources and ways of developing the corpus literacy, the concept of the efficiency of the corpora use (what is it and how to evaluate or measure it), the content and boundaries of general and specific components of the corpus literacy, the state of the corpus literacy among linguists of other fields than corpus linguistics (in the Czech context).

Keywords: language corpus, corpus literacy, corpus competence, corpus user.

Введение

Возникновение множества общедоступных языковых корпусов Поскольку литературы по корпусной лингвистике очень много (на английском, чешском, русском и других языках), существует много дефиниций понятия «языковой корпус». Здесь мы приведем одну из них (выделения курсивом принадлежит авторам цитаты). «Под лингвистическим, или языковым, корпусом текстов (или обычно просто корпусом текстов) понимается большой, представленный в машиночитаемом формате, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач» (Захаров - Богданова 2020: 11). в разных странах для разных языков является характерной чертой нашего времени. Бурное развитие информационных технологий, Интернет и компьютер «в каждом доме» позволили корпусной лингвистике М. Копотев дает следующее определение корпусной лингвистики: «Корпусная лингвистика (англ. corpus linguistics) - 1) раздел компьютерной лингвистики, связанный с созданием корпусов; 2) раздел языкознания, использующий корпуса текстов для анализа данных с помощью корпусных методов» (Копотев 2014: 198-199). Ф. Чермак более краток: корпусная лингвистика - это «наука о корпусе и работе с ним, а также новая одноименная дисциплина» (Cermak 2017: 10), перевод с чешского наш. - О. Ш. Встречаются и широкие определения: «... корпусная лингвистика - это не направление, связанное с определенным ярусом языковой системы (как фонетика, лексикология или синтаксис), или определенной теорией (как функциональная или генеративная грамматика), или аспектом анализа (формальным, семантическим или прагматическим). Это скорее идеология, согласно которой результаты лингвистического исследования должны опираться прежде всего на анализ текстов (устных или письменных), а не на интуицию исследователя или информанта» (Лаврентьев 2004: 121). В целом, существует столько определений корпусной лингвистики, что дефиниционный анализ данного понятия мог бы стать содержанием отдельной публикации. Ср., В. Захаров считает корпусную лингвистику «феноменом» (Захаров 2016: 150) и характеризует сущность данного феномена следующим образом: «Корпусная лингвистика не является монолитным набором категорий или методов, это некое гетерогенное поле, внутри которого варьируются различные подходы к созданию и использованию корпусов» (Захаров 2016: 150). Терминологическую расплывчатость, характерную для корпусной лингвистики как дисциплины, некоторые авторы связывают также с «молодостью» данного научного направления (см., напр., Ганиева 2007: 104)., которая еще 20-30 лет назад была делом узкого круга специалистов, стать одним из флагманов современной науки о языке, а вместе с тем горячей темой для споров и обсуждений в лингвистических сообществах См., например, любопытную научную полемику между энтузиастами и реалистами в отношении языковых корпусов, которая параллельно имела место быть в русской (ср. Перцов 2006; Плунгян 2008; Шмелев 2010) и чешской лингвистике (ср. Cech 2014; Sticha 2015; Chromy 2017)..

На главной странице сайта Национального корпуса русского языка (далее - НКРЯ) www.ruscorpora.ru в рубрике «другие корпуса» представлен список корпусов русского языка, а также других языков (славянских, других индоевропейских, неиндоевропейских, искусственных), с комментарием об их доступности («доступен для онлайн-поиска», «доступен для скачивания», «требуется регистрация» и т. п.) и прямыми ссылками на интернет-страницы соответствующих корпусных проектов, который насчитывает около 150 корпусов (https://ruscorpora.ru/new/corpora-other.html, дата обращения: 13.09.2021). Михаил Копотев, ссы - лаясь на международные специализированные каталоги CLARIN (www.clarin.eu) и ELRA (www.elra.info), говорит о существовании более чем трех тысяч языко - вых корпусов в мире (Копотев 2014: 23).

Чешский национальный корпус (ЧНК), активным пользователем которого является автор настоящей статьи, считается «одним из наиболее известных» (Захаров - Богданова 2020: 90) и оценивается специалистами как корпусный ресурс мирового уровня - по объему и вариативности охваченного языкового материала, а также по технической оснащенности самого корпуса, который отличается высокоразвитым инструментарием поиска и статистического анализа языковых данных (Резникова 2009: 403 и след.; Hebal-Jezierska 2014a: 29) На русском языке об особенностях ЧНК и возможностях, которые данный ресурс предоставляет своим пользователям, можно прочитать, например, в статьях московского богемиста Андрея Изотова (Изотов 2013; Изотов 2015; Изотов 2018 и др.). См. также сайт ЧНК: www.korpus.cz.

Корпуса предоставляют в распоряжение пользователей беспрецендентное количество языковых данных, подготовленных усилиями специалистов по корпусной лингвистике к использованию в лингвистических исследованиях. Каждый общедоступный корпус имеет свой сайт в Интернете с определенным дизайном, структурой и содержанием, с определенной поисковой машиной (или, как говорят специалисты, корпусным менеджером), предоставляющей различные возможности поиска (по словоформе, лексеме, грамматическим признакам, по текстам определенных жанров, годов издания и т. п.), а также различные функции по статистической обработке данных (частотная дистрибуция, меры ассоциации и т. д.). Языковые корпуса являются общедоступным достижением современного языкознания, и с этим трудно не согласиться.

Однако в то время как корпусная лингвистика набирает обороты и появляются новые корпуса все больших и больших объемов Интернет-корпуса, насчитывающие миллиарды словоупотреблений, называются корпусами третьего поколения и возникли относительно недавно, ср.: «TenTen corpora» (Jakubicek et al. 2013) и «Генеральный интернеткорпус русского языка» (ГИКРЯ) (Беликов и др. 2013) стали доступными с 2013 г., интернет-корпуса «Aranea» - c 2014 г. (Benko 2014), интернет-корпус чешского языка «ONLINE» в рамках ЧНК был обнародован в 2020 г. (Cvrcek 2020). Корпуса второго поколения (размеченные корпуса с объемом 100 млн слов и больше) возникали с 90-х гг. 20-го века. Образцом послужил первый такой корпус - British National Corpus (https://www.english-corpora.org/bnc/). Корпусами первого поколения считаются одномиллионные корпуса-первопроходцы, которые еще не содержали разметки, как Брауновский корпус (A Standard Corpus of Present-Day Edited American English, for use with Digital Computers (Brown). 1964, 1971, 1979. Compiled by W. N. Francis and H. Kucera. Brown University.

Providence, Rhode Island. Freely available at: https://www.sketchengine.eu/brown-corpus/) или Ланкастерский корпус (University of Oxford, Lancaster-Oslo-Bergen corpus of modem English (LOB): [tagged, horizontal format] / Stig Johansson, Oxford Text Archive, http://hdl.handle.net/20.500.12024/0167). О трех поколениях корпусов см., например, в (Cvrcek et al. 2017)., а корпусные технологии беспрерывно совершенствуются (см., например, об этом в сноске 10), остается нерешенной и даже малообсуждаемой проблема подготовленности адресата кор - пусов, в первую очередь лингвистов иных направлений, чем корпусная лингвис - тика, к использованию ими в их исследовательской деятельности данных высокотехнологичных ресурсов.

Тот очевидный факт, что работать с корпусами неподготовленным пользователям трудно, а также тот факт, что курсы по корпусной лингвистике до сих пор не являются повсеместно внедренными в вузовские программы филологических специальностей Например, в alma mater Чешского национального корпуса - на Философском факультете Карлова университета в Праге - в актуальных учебных программах по русистике и украинистике (бакалаврских и магистерских) предметы, связанные с корпусной лингвистикой, отсутствуют вовсе. Что касается богемистики, в трехлетней бакалаврской программе специальности «Чешский язык и литература» присутствует лишь один обязательный курс «Введение в работу с языковыми корпусами», на который отводится всего 26 часов в течение одного семестра. В обязательной программе двухлетнего магистерского обучения по специальности «Чешский язык и литература» спецкурсов по корпусной лингвистике уже нет, см. учебные планы специальностей на сайте факультета по адресу: https://www.ff.cuni.cz/studium/studijni-obory-plany/studijni-plany/ (дата обращения: 05.10.2021).

В данных условиях трудно представить, каким именно образом у студентов могут сформироваться знания, умения и навыки в области использования корпусов в лингвистических исследованиях. Следующий проблемный вопрос: откуда взяться этим знаниям и умениям у самих преподавателей, если большинство из них получали образование еще в «докорпусную эпоху»?, и стали главными импульсами для возникновения настоящей статьи.

Основные сведения о настоящей статье

1.1. Теоретические предпосылки статьи. Проблема подготовленности пользователей к работе с корпусами, которая в данной статье рассматривается как проблема так называемой «корпусной грамотности» пользователей, является малоизученной темой, поэтому анализу состояния и истории данного вопроса мы посвящаем отдельную главу, см. главу 2 «Корпусная грамотность: Состояние вопроса».

1.2. Объект и предмет исследования. Объектом рассмотрения в настоящей статье является понятие о «корпусной грамотности» пользователей, отражающее соответствие или несоотвествие их компетенций тем требованиям, которые несет собой использование языкового корпуса в исследовательской, педагогической, переводческой или какой-либо другой деятельности, сопряженной с языковыми данными. Предметом анализа является содержание и специфика понятия «корпусная грамотность».

1.3. Цели и задачи работы. Главной целью настоящей статьи является исследование и освещение понятия о корпусной грамотности корпусных пользователей как явлении, неотъемлемо сопровождающем функционирование языковых корпусов. Частной целью данной работы является поднять и рассмотреть вопрос о корпусной грамотности среди одной из категорий пользователей, а именно среди лингвистов, представляющих иные области языкознания, чем корпусная лингвистика.

Для реализации поставленных целей требуется решить следующие задачи:

1) найти и рассмотреть научную литературу, в которой поднимается и освещается проблема корпусной грамотности;

2) обобщить опыт исследователей, которые занимались изучением и обсуждением данной проблемы, и определить малоисследованные или неисследованные ее аспекты;

3) обсудить содержание понятия «корпусная грамотность», его специфику, границы, и уточнить составляющие данного понятия в случае его применения по отношению к лингвистам иных направлений, чем корпусная лингвистика, как корпусным пользователям; вывести дефиницию данного понятия на основе сделанных обобщений.

1.4. Источники исследования и методы их анализа. Поскольку настоящее исследование носит теоретический характер, его источниками выступают прежде всего научные публикации по исследуемой теме, а главным методом работы является критический анализ и обобщение найденных источников. Для поиска научной литературы, в которой освещается или по крайней мере затрагивается тема корпусной грамотности, мы использовали следующие общедоступные онлайн-ресурсы (здесь и далее в данном пункте статьи дата последнего обращения: 1.10.2021):

1) eLIBRARY.ru - крупнейшая в России научная электронная библиотека, интегрированная с Российским индексом научного цитирования (РИНЦ), доступная в Интернете по адресу: www.elibrary.ru;

2) Google Scholar - онлайн-инструмент поиска научных публикаций и их цитирований, доступный в Интернете по адресу: https://scholar.google.com/;

3) Biblio - репозиторий научных публикаций, основанных на материалах Чешского национального корпуса (ЧНК), доступный на сайте ЧНК по адресу: https://www.korpus.cz/biblio.

Следует также отметить, что настоящее исследование находит инспирацию и опору в личном опыте автора по работе с корпусами ЧНК, а также некоторыми другими (например, НКРЯ) .

1.5. Научная новизна, теоретическая и практическая значимость исследования. Научная новизна данного исследования и его теоретическая значимость обусловлены новизной общедоступных языковых корпусов как нового дигитального инструмента лингвистических исследований и малой изученностью процессов адаптации к ним лингвистического сообщества. Настоящая статья посвящается рассмотрению и оценке понятия «корпусная грамотность», которое, насколько нам известно, до настоящего момента не было главным предметом обсуждения и теоретического осмысления в научной литературе.

Поскольку корпусная грамотность является залогом качества корпусных исследований, нам представляется необходимым сформировать четкие представления о том, что данное понятие собой подразумевает. Результаты данного исследования адресуются, в первую очередь, лингвистам, которые являются специалистами иных областей, чем корпусная лингвистика, и проявляют интерес к использованию корпусов в своей исследовательской работе, а равно стремятся к высокому качеству своих корпусных исследований.

Практическая значимость настоящего исследования заключается в том, что оно призвано сформировать теоретические основы для создания учебных пособий по использованию корпусов для неспециалистов по корпусной лингвистике. Помимо того, оно призвано обратить внимание на проблему, которую должен решить для себя каждый пользователь-неспециалист.

Мы надеемся, что данный текст вдохновит читателя к более глубокому восприятию языковых корпусов и повысит мотивацию к более внимательному освоению этого современного инструмента лингвистических исследований.

Корпусная грамотность: состояние вопроса

Мы намеренно оставляем за рамками настоящей статьи обсуждение основных понятий корпусной лингвистики, а также основных черт так называемого корпусного подхода и сфер его применения. Раскрытию потенциала корпусной лингвистики и осмыслению ее вклада в современное языкознание посвящено много научной литературы - статей, монографий, учебных пособий Ср.: поиск в электронной научной библиотеке eLIBRARY.RU по запросу «корпусная лингвистика» имеет 1 289 результатов (на дату обращения: 25.11.2021). И это преимущественно публикации только на русском языке..

Поскольку корпусная лингвистика развивается в разных странах по всему миру и является интернациональным научным явлением, литература по корпусной лингвистике представляет собой пестрый массив публикаций на разных языках (больше всего на английском языке), написанных авторами из разных стран. Очень сложно говорить о корпусной лингвистике вообще, поскольку состояние данной дисциплины от страны к стране будет отличаться Насколько все корпуса разные, можно убедиться, сравнив их описания в публикациях, обозревающих корпусные ресурсы для разных языков. Корпуса славянских языков подробно освещаются, например, в (Резникова 2009; Hebal-Jezierska 2014Ь). Однако следует считаться с быстрым устареванием корпусных обзоров, поскольку развитие корпусов идет стремительно вперед. Можно привести в пример ЧНК, который сильно изменился со времени обзора Т. Резниковой (Резникова 2009): поменялся корпусный менеджер, концепция репрезентативности корпусов, усовершенствовалась лингвистическая и металингвистическая аннотация текстов и т. п. Пользователям необходимо самим следить за обновлениями того корпусного ресурса, с которым они работают. Например, за обновлениями НКРЯ можно следить по ленте новостей проекта, см. «Новости проекта» на главной странице сайта НКРЯ www.ruscorpora.ru (дата обращения: 25.09.2021). Обновления ЧНК отражаются в собственном Интернет-справочнике проекта («Вики ЧНК») (Сугсек 2020), доступном на сайте ЧНК по адресу: https://wiki.kor- pus.cz/doku.php (дата обращения: 25.09.2021)..

Отправной точкой настоящей статьи служит, во -первых, опыт автора в области использования Чешского национального корпуса, во -вторых, рефлексия автора на «корпусную» проблематику, актуальную в Чешской республике, где он живет и работает. В своем исследовании мы стараемся рассматривать как можно больше релевантных и доступных источников на тех языках, которыми мы владеем, и пытаемся извлечь из них знания, которые помогут нам продвинуться в осмыслении и поиске путей решения а) проблематики частной, актуальной именно в Чешской республике, б) проблематики общей, актуальной для всех, кто имеет дело с корпусами и корпусной лингвистикой, независимо от национальной принадлежности и страны проживания.

Одной из таких общих проблем, которая в последние годы бурно обсуждается в англоязычной научной литературе, начинает обсуждаться в русскоязычной литературе, а в чешскоязычной литературе пока не была сформулирована и выдвинута к обсуждению, является проблема «корпусной грамотности» (англ. «corpus literacy»), или иначе «корпусной компетенции» (англ. «corpus competence») пользователей корпусов.

Рассмотрим подробнее состояние данного вопроса в трех вышеназванных контекстах.

2.1. Публикации на английском языке. Публикации на тему корпусной грамотности на английском языке мы искали с помощью онлайн-платформы Google Scholar11. Поиск на Google Scholar имел следующие результаты: по запросу «corpus literacy» (ключевая фраза в строке поиска - в кавычках) было найдено 186 публикаций, исключая цитирования (дата запроса: 22.09.2021), по запросу «corpus competence» - 44 публикации, исключая цитирования (дата запроса: 22.09.2021). Малую часть найденных публикаций составляют статьи на немецком, русском и других языках, в которых данные термины употребляются в исконном виде (как англоязычное вкрапление), ср., например, (Wallner 2013; Яжинова 2019; Krekeler 2021).

Просмотр всех публикаций по названиям и аннотациям с выборочным прочтением некоторых из них показал, что наиболее популярной темой обсуждения является использование корпусов в преподавании английского языка как иностранного, в частности в аспекте проблематики внедрения корпусных технологий в реальную преподавательскую практику: в этом плане исследователи из разных стран констатируют отрыв теории (потенциал корпусов в обучении языку) от практики (реальное применение корпусов преподавателями в процессе обучения) и ищут пути его преодоления, ср., например, статьи специалистов из Германии (Mukherjee 2008), Ирландии (Chambers 2019), Индонезии (Oktav ianti 2019), Норвегии (Kavanagh 2021).

Однако не только корпусные ресурсы английского языка с трудом внедряются в педагогическую практику. Аналогичные сообщения поступают также от специалистов по немецкому языку как иностранному, ср., (Lьdeling 2009; Walln er 2013; Kana 2014; Nadassy 2019), и от специалистов по русскому языку как иностранному (РКИ). Опрос, проведенный У. Яжиновой и А. Бергманн в Берлине, Потсдаме и Регенсбурге в период с 2013 по 2019 гг. среди студентов-славистов, преподавателей РКИ и переводчиков (всего - 185 человек) «в целях изучения уровня владения и применения корпусных ресурсов в реальной учебной и профессиональной практике» (Яжинова 2019: 332), показал, что большая часть рес - пондентов (81 %) «не используют и даже не знают о существовании корпусных ресурсов» (Яжинова 2019: 333). Мы пытались искать публикации в специализированных базах данных Web of Science, Scopus и некоторых других, однако результат поиска был очень скромный (единицы публикаций). На Google Scholar хотя и можно найти все, что угодно, однако выдаваемое количество результатов является приблизительным, а также имеются ограничения в возможностях поиска и сортировки найденных публикаций. Выдачу следует перепроверять вручную, поскольку в ней может встречаться шум (например, повторы), т. е. количество публикаций, указанных в результатах поиска на Google Scholar, имеет только информативный характер. «Подводные камни» использования Интернет-поисковиков в научной работе подробно рассматриваются В. Беликовым в (Беликов 2016).

По наблюдениям А. И. Ольховской и М. К. Парамоновой (2019), аналогичный отрыв теории от практики, касательно корпусов, наблюдается также в области преподавания русского языка и литературы в российских вузах: «... мы часто сталкиваемся с ситуацией, когда педагоги-русисты в общем знакомы с корпусом как с лингвистическим ресурсом, но практически не используют его как инструмент обучения» (Ольховская 2019: 95).

2.2 Публикации о корпусной грамотности, найденные в eLIBRARY.RU. Для поиска публикаций по теме корпусной грамотности на русском языке мы обратились к крупнейшей в России научной электронной библиотеке eLIBRARY.RU (www.elibrary.ru) Поскольку алгоритм поиска в любой электронной базе данных может влиять на полученные результаты, уточним тот алгоритм, которым мы пользовались при поиске публикаций в eLIBRARY.RU: Расширенный поиск > Что искать: ключевая фраза в кавычках (напр., «корпусная грамотность») > Где искать: в названии публикации, в аннотации, в ключевых словах > (Все прочие параметры поисковой формы - по умолчанию) > (произвести) Поиск.. По запросу «корпусная грамотность» выдача содержит всего три записи (дата запроса: 21.09.2021), еще три записи можно найти по запросу «корпусная компетенция» (дата запроса: 21.09.2021). По запросу «corpus competence» были найдены те же публикации, что и по эквивалентному запросу на русском языке «корпусная компетенция» (дата запроса: 21.09.2021), по запросу «corpus literacy» были найдены три записи, одна из которых отличалась от записей по запросу «корпусная грамотность» (дата запроса: 21.09.2021). Таким образом, всего в eLIBRARY.RU мы нашли 7 публикаций, в которых корпусная грамотность является либо главной темой, либо ключевой фразой (дата обращения: 21.09.2021), причем одна из них написана на английском языке (Osipova 2020), а еще одна - на немецком (Baumann 2019).

Следует отметить, что все 7 публикаций, найденных в eLIBRARY.RU, связаны с обсуждением корпусной грамотности как актуального вопроса в прикладных областях, а именно: 1) в области обучения иностранному языку: а) английскому языку как иностранному (Osipova 2020; Осипова 2018а; Горина 2018); б) русскому языку как иностранному (Яжинова 2019); 2) в области обучения переводу (Baumann 2019); 3) в области вузовской подготовки студентов лингвистических специальностей: речь идет об опыте внедрения предметов по корпусной лингвистике в программы подготовки специалистов по компьютерной лингводидактике (Дмитриев 2019), а также об опыте внедрения в процесс подготовки филологов так называемого корпусного обучения, т. е. методов обучения языку и лингвистическим дисциплинам с применением корпусов (Дикарева и др. 2015).

2.3 О корпусной грамотности по-чешски. Публикации по теме корпусной грамотности на чешском языке мы искали в «Репозитории научных публикаций, основанных на ЧНК», размещенном на сайте ЧНК по адресу: https://www.korpus.cz/biblio. В целом, в данном репозитории содержится 3 039 записей (дата обращения: 21.09.2021), однако поиск по запросам «korpusova gramotnost», «korpu - sova kompetence» не дал никаких результатов (дата запроса: 21.09.2021). По запросам «corpus literacy», «corpus competence» результат поиска был также нулевой (дата запроса: 21.09.2021).

Насколько нам известно, корпусная грамотность пользователей корпусов чешского языка (в первую очередь, национального корпуса ЧНК), пока не была темой отдельных исследований и тем более опросов. И нулевой результат поиска публикаций на данную тему в Репозитории ЧНК является тому подтверждением. При этом корпусная лингвистика в Чешской республике начала развиваться еще в 90-е гг. прошлого века, а первый стомиллионный корпус современного чешского языка SYN2000 был обнародован в Интернете в 2000 году (об истории ЧНК см., напр., (Cermak-Schmiedtova 2004)).

Однако следует отметить, что упоминания о существовании данной проб - лемы время от времени встречаются в чешской лингвистической литературе. Так, во введении к статье 2011 г. «Возможности и пределы корпусной лингвистики» («Moznosti a meze korpusove lingvistiky»), которую сотрудники ЧНК В. Цврчек (Vaclav Cvrcek) и Д. Коваржикова (Dominika Kovankova) написали, по сути, в защиту корпусной лингвистики, авторы указывают на критическое отношение чешского лингвистического сообщества к корпусам (что и стало главной мотивацией к возникновению их статьи) и отмечают, что, по их мнению, главной причиной упреков и критических замечаний со стороны коллег являются «неточные представления о корпусах и корпусной лингвистике» (Cvrcek 2011: 113-114) (здесь и далее перевод с чешского наш. - О. Ш.), т. е. элементарная непросвещенность в данной области.

На недостаточную компетентность чешских богемистов в использовании корпусов указывают также замечания о случаях некомпетентного обращения с количественными данными, извлеченными из корпуса. Так, Р. Чех в критической статье «Всего лишь описание с цифрами? Перспективы корпусной лингвистики» (Radek Cech, «Jen popis s cisly? Perspektivy korpusove lingvistiky», 2014) констатирует, что у большинства чешских лингвистов отсутствует подготовка по математической статистике, вследствие чего многие корпусные исследования содержат «интерпретации, которые с точки зрения статистики являются (мягко гово - ря) проблематичными» (Cech 2014: 178). Л. Веселы, в свою очередь, отмечает, что с появлением корпусов в богемистике возросло количество публикаций, которые можно характеризовать как «слишком описательные», поскольку в них содержится много списков и статистик, извлеченных из корпуса, но практически отсутствует интерпретация полученных корпусных данных (Vesely 2018: 71).

Таким образом, вопрос о состоянии корпусной грамотности в среде чешских лингвистов (предположительно, не только чешских) представляется не менее актуальным, чем вопрос о корпусной грамотности практикующих преподавателей иностранных языков из разных стран, который обсуждался выше. Мы можем также предположить, что практикующие преподаватели чешского языка как иностранного и как родного в Чешской республике сталкиваются с такими же трудностями, что и их коллеги из других стран. Публикации, раскрывающие потенциал применения корпусных методов в преподавании чешского языка, уже выходят в свет, ср., например, (Smejkalova 2019; Sormova 2019; Zasina 2019), однако реальная практика применения методов корпусного обучения в преподавании чешского языка пока остается неисследованной областью.

О понятии «корпусная грамотность»

1.1. Первое упоминание термина в научной литературе. Джойбрато Мукержи и его единомышленники

1.1.1. Теоретический аспект проблематики, поднятой Дж. Мукержи. Судя по цитированиям в научной литературе, см. (Baumann 2019: 134; Lьdeling 2009: 2), термин corpus literacy (корпусная грамотность) впервые был употреблен немецким лингвистом-англистом Джойбрато Мукержи (Joybrato Mukherjee) в его монографии, посвященной раскрытию потенциала корпусной лингвистики для преподавания английского языка как иностранного в немецких школах (Mukherjee 2002). В данной книге понятие corpus literacy вводится для обозначения особых компетенций обучающихся иностранному языку, которые заключаются в умении учащихся пользоваться корпусом так, чтобы это служило углублению их языковых знаний и умений (Mukherjee 2002: 179-180).

Содержание понятия «корпусная грамотность» кратко освещается и в других публикациях Дж. Мукержи, ср., например, (Mukherjee 2006; Mukherjee 2008). Согласно Дж. Мукержи, корпусная грамотность, например, включает «... общее понимание того, что такое корпус, что вы можете (или не можете) с корпусом делать, как может анализироваться конкорданс, как следует (или не следует) выводить на основе корпусных данных общие тенденции употребления языка» (Mukherjee 2006: 14) , перевод с английского наш. - О. Ш.

Общая дефиниция корпусной грамотности, данная Дж. Мукержи, звучит следующим образом: «Под корпусной грамотностью подразумевается, в первую очередь, способность самостоятельно и компетентно использовать соответствующие корпуса и корпусные лингвистические программы для объяснения языковых вопросов и решения лингвистических проблем» (Mukherjee 2008: 39) , перевод с немецкого наш. - О. Ш. Далее исследователь добавляет, что корпусная грамотность также предполагает умение создавать собственные корпуса по так называемому принципу «сделай сам» («do-it-yourself») (Mukherjee 2008: 41).

В целом, Дж. Мукержи употребляет данное понятие в лингводидактическом контексте, рассматривая корпусную грамотность как потребность, с одной сто - роны, обучающихся языку и, с другой стороны, обучающих языку, будущих (студентов-филологов) и настоящих (практикующих учителей), а условием успешного формирования корпусной грамотности обучающихся языку исследователь считает успешно сформированную корпусную грамотность обучающих языку, ср. схему системы корпусного обучения, представленную Дж. Мукержи в (Mukherjee 2004: 245). Поэтому, согласно Дж. Мукержи, очень важно предпринимать меры по формированию корпусной грамотности среди действующих и будущих педагогов-филологов (Mukherjee 2008: 41).

Однако поскольку рассмотрение и осмысление корпусной грамотности как понятия и как явления не является главной целью в публикациях Дж. Мукержи, теоретическому освещению данного понятия в них отводится от нескольких предложений до нескольких абзацев, а главное внимание сосредотачивается на изложении конкретных примеров использования корпусов в преподавании языка (для подготовки дидактических материалов, в организации самостоятельной работы учащихся и т. п.), которые могут послужить руководством к действию для практикующих учителей английского языка как иностранного. Главная цель ци - тируемых выше публикаций Дж. Мукержи носит практический характер и заключается в способствовании внедрению методов корпусного обучения в реальную практику преподавания английского языка как иностранного в школах Германии и других стран. Как подтвердили исследования Дж. Мукержи, данное внедрение теории в практику в Германии является острой актуальной проблемой.

1.1.2. Практический аспект проблематики, поднятой Дж. Мукержи. В 20012002 гг. Дж. Мукержи организовал серию воркшопов по корпусной лингвистике для квалифицированных учителей английского языка, работающих в федеративной земле Северный Рейн-Вестфалия в Германии, в которых приняло участие 248 человек. На данных воркшопах был также проведен опрос участников на тему применения ими корпусов в педагогической практике, который показал, что около 80 % преподавателей до данного воркшопа ничего даже не слышали о корпусах и корпусной лингвистике (Mukherjee 2004: 241) .

Исследователь указывает также на тот факт, что в большинстве вузов Германии курсы по корпусной лингвистике не являются обязательной частью прог - рамм подготовки студентов по специальности «Английский язык и литература» (Mukherjee 2004: 244). Поскольку данная статья была опубликована в 2004 году, речь идет о ситуации в начале 2000 -х годов. Одной из важных задач в данных условиях Дж. Мукержи видит популяризацию корпусной лингвистики среди учителей английского языка как иностранного путем проведения специализированных воркшопов не только в Германии, но и в других странах, где преподается английский как иностранный (Mukherjee 2004: 244, 248).

В 2016 году профессор англистики из Бременского университета (Германия) М. Каллиес (Marcus Callies) провел новый опрос по образцу исследования Дж. Мукержи (Mukherjee 2004), только на меньшей выборке респондентов разного возраста (общее число - 26) и в онлайн-форме, чтобы установить, изменилась ли ситуация с использованием корпусов немецкими школьными учителями английского языка в реальной практике в течение последних приблизительно 15 лет, прошедших со времени исследования Дж. Мукержи (Callies 2019). Как отмечает М. Каллиес, с начала 2000-х гг. популярность корпусной лингвистики значительно выросла в немецкой университетской среде, и студентов лингвистических специальностей все больше учат тому, что такое корпуса и как с ними работать (Callies 2019: 248). Тем не менее опрос М. Каллиеса показал, что ситуа-

ция с практическим применением корпусов в каждодневной работе учителей английского языка в Германии мало изменилась со времен опроса Дж. Мукержи: только меньшинство респондентов (7,7 %) подтвердили, что хорошо знакомы с корпусами английского языка и регулярно ими пользуются (Callies 2019: 250).

В то же время М. Каллиес отмечает, что появляется молодое поколение педагогов, которые имеют университетскую подготовку по корпусной лингвистике (34,6 % респондентов подтвердили это), однако это мало влияет на реальное применение методов корпусного обучения в их педагогической деятельности (Callies 2019: 252). По мнению М. Каллиеса, перед прикладной лингвистикой стоит актуальная задача по разработке специальных модулей обучения по корпусной лингвистике для студентов-педагогов, которые будут сосредоточены на педагогическом аспекте использования корпусов и будут готовить учителей, которые смогут «на самом деле учить с помощью корпусов» («actually teach with corpora») (Callies 2019: 261).

Обобщая опыт коллег (из Германии, Польши, Австрии, США и др.), занимающихся проблематикой внедрения корпусного обучения в практику преподавания английского языка, среди которых Дж. Мукержи, Агнешка Ленко-Шиманска (Agnieszka Lenko-Szymanska), Кристиане Далтон-Пуффер (Christiane DaltonPuffer), Уте Рёмер (Ute Rцmer), Джулиан Хезер (Julian Heather), Мари Хелт (Marie Helt) и др., М. Каллиес определяет корпусную грамотность как «многокомпонентную систему комплексных навыков» («a multicomponential set of complex skills») (Callies 2019: 247), которая включает в себя четыре аспекта: 1) ориентирование в основных понятиях корпусной лингвистики, 2) поиск и анализ корпусных данных с помощью интерфейса данного корпуса, 3) интерпретация корпусных данных, 4) использование корпусных данных для создания дидактических материалов (Callies 2019: 247).

3.2. Появление и освещение понятия «корпусная грамотность» в русскоязычной научной литературе. Согласно результатам поиска соответствующих публикаций в eLIBRARY.RU (см. пункт 2.2), в русскоязычной научной среде тема корпусной грамотности впервые поднимается в статьях С. С. Дикаревой (Дикарева 2011а; Дикарева 2011б; Дикарева и др. 2015), в которых данное понятие рассматривается в контексте внедрения технологий корпусного обучения в программы подготовки студентов вузов по филологическим специальностям, в данном случае речь идет о внедрении корпусного обучения в подготовку по предмету «Русский язык и культура речи».

С. С. Дикарева определяет корпусную грамотность как «умение рационально пользоваться корпусом» (Дикарева 2011а: 160) и выделяет два аспекта данного «умения», а именно:

* теоретический, который предполагает владение следующими вопросами: «1) знание базовых понятий, методов и технологий корпусной лингвистики; 2) изучение и обобщение основных способов и этапов создания корпуса; 3) типология корпусов; 4) паспортизация текста; 5) характеристика различных видов внешней и внутренней разметки текста; 6) Интернет как корпус и др.» (Дикарева 2011а: 161);

* практический, который предполагает «умение корректно задать парамет - ры поиска в Национальном корпусе русского языка с обращением к другим корпусным ресурсам русского языка в открытом пространстве Интернет» (Дикарева 2011а: 161).

Следует отметить, что два аспекта корпусной грамотности, выделенные С. С. Дикаревой, соответствуют двум первым аспектам, приводимым М. Каллиесом (см. выше): 1) ориентирование в основных понятиях корпусной лингвистики, 2) поиск и анализ корпусных данных с помощью интерфейса данного корпуса (Callies 2019: 247).

Далее тема корпусной грамотности затрагивается, например, в работах Е. С. Осиповой и О. Г. Гориной, однако в данных работах не встречается непосредственно термин «корпусная грамотность», а данная проблематика освещается в категориях «компетенция», «знания», «умения» и рассматривается в контексте использования корпусных ресурсов в лингводидактике, а именно в целях повышения качества вузовской подготовки по профессионально ориентированному иностранному языку (в данном случае - английскому) специалистов различных направлений, сопряженных с языковой сферой, а именно переводчиков (английский язык - русский язык) (Осипова 20186; Осипова 2017), регионоведов английского отделения (Горина 2014), тестологов (Горина 2018).

О. Г. Горина в своем диссертационном исследовании под названием «Использование технологий корпусной лингвистики для развития лексических на - выков студентов-регионоведов в профессионально-ориентированном общении на английском языке» (2014) вводит понятие «корпусная компетенция», которое определяет как «набор элементарных корпусных умений (формирование запро - са, использование средств поиска и сортировки примеров, сохранение и трактовка результатов), релевантных для эффективного использования корпуса как справочной системы» (Горина 2014: 234). Развитие корпусной компетенции учащихся О. Г. Горина считает неотъемлемой составляющей современной подготовки по профессионально-ориентированному иностранному языку, поскольку работа с корпусом позволяет «эффективно развивать ключевые иноязычные компетенции» (Горина 2018: 192). Ср., Р. Крейер (Rolf Kreyer), отталкиваясь от работ Дж. Мукержи (Mukherjee 2002; Mukherjee 2004), в статье (Kreyer 2008) подробно анализирует отдельные «корпусные умения» («corpus skills») и взаимосвязь меж - ду ними, также объединяя их под термином «корпусная компетенция» («corpus competence»).

Е. С. Осипова, занимающаяся исследованием потенциала корпусных технологий в процессе профессиональной подготовки переводчиков, см., например, (Осипова 2017; Осипова 2018а; Осипова 2018б), выделяет «инструментальный компонент» обучения переводу, состоящий из двух блоков:

* «когнитивный блок», предполагающий, во-первых, «знания» структуры, содержания, специфики, поисковых и функциональных возможностей конкретных корпусов (в данном случае - различных корпусов английского языка и НКРЯ), во-вторых, «знания» возможностей и алгоритма применения корпусов для решения переводческих задач (Осипова 2018б: 215);

* «процессуальный блок», предполагающий, во -первых, «умения» общего характера, например, умение осуществлять поиск в корпусе, эффективно работать с различными опциями интерфейса, производить последующую обработку корпусных данных (систематизация, модификация, интеграция, оценка релевантности) и т. п.; во-вторых, «умения» частного характера: «умение правильно выбирать необходимый корпусный инструмент перевода», «умение использовать полученные корпусные данные для перевода» (Осипова 2018б: 215).

В другой своей статье Е. С. Осипова при изложении выше приведенных блоков (с исключением частной, «переводческой» составляющей каждого блока) применяет термин «инструментально-корпусная компетенция», под которым понимает «знания, умения и навыки, необходимые студентам для использования ресурсов корпусной лингвистики на занятиях по иностранному языку с целью решения лингвистических проблем» (Osipova 2020: 47) , перевод наш. - О. Ш.

Следует отметить, что содержание понятия «корпусная компетенция» у О. Г. Гориной и Р. Крейера и «инструментально-корпусная компетенция» у Е. С. Осиповой коррелирует с тем содержанием, которое Дж. Мукержи вкладывает в понятие «корпусная грамотность» («corpus literacy»), когда употребляет его впервые (см. пункт 3.1.1), а именно для обозначения особых способностей обучающихся иностранному языку, которые заключаются в умении учащихся пользоваться корпусом так, чтобы это служило углублению их языковых знаний и умений (Mukherjee 2002: 179-180). Р. Крейер делает акцент на том, что развитая у учащихся корпусная компетенция позволит им совершенстовать свои языковые знания и умения на протяжении всей дальнейшей жизни и вне учебной аудитории (Kreyer 2008: 423). Дж. Мукержи и О. Г. Горина в своих последующих работах подчеркивают важность наличия корпусной компетенции и ее совершенствования также у самих преподавателей иностранного языка (Mukherjee 2008; Горина 2018).

О значимости корпусной грамотности не только для студентов, но и для самих педагогов, пишет У. Яжинова, занимающаяся исследованием проблематики применения корпусных технологий в преподавании русского языка как иностранного в немецких вузах (о данном исследовании мы упоминали выше, см. пункт 2.1). У. Яжинова а) характеризует корпусную грамотность «как вид цифровой грамотности, формируемой в процессе профессиональной подготовки студентов и повышения квалификации преподавателей филологических дисциплин» (Яжинова 2019: 334-335), б) выделяет два аспекта данного понятия - теоретический и практический (как выделяют и выше цитируемые авторы), в) подчеркивает, что корпусная грамотность «предполагает поликомпетентность пользователей и многопрофильность применения этих компетенций» (Яжинова 2019: 334). Ср. с формулировкой М. Каллиеса, которую мы приводили выше (см. пункт 3.1.2): корпусная грамотность как «многокомпонентная система комплексных навыков» («a multicomponential set of complex skills») (Callies 2019: 247).

Косвенно проблематика корпусной грамотности затрагивается и в иных публикациях, в которых, например, указывается на необходимость считаться с под - водными камнями в использовании корпусов или на необходимость предварительной подготовки к работе с корпусами. Однако в данных источниках не встречаются понятия «корпусная грамотность» или «корпусная компетенция», что усложняет поиск такого рода публикаций.

Так, во введении к учебному пособию по корпусной лингвистике (Грудева 2012) Е. В. Грудева обращает внимание на то, что пользователь при использовании различных корпусов русского языка должен учитывать особенности состава, объема, разметки и т. д. каждого корпуса при анализе и интерпретации полученных данных (Грудева 2012: 4-5). В свою очередь, например, А. Ч. Пиперски одной из причин низкого интереса со стороны русистов к использованию интернет - корпусов русского языка в исследованиях считает «неудобство» данных корпусных ресурсов «для технически неподготовленного пользователя» (Пиперски 2020: 624).

Таким образом, несмотря на малое количество русскоязычных публикаций, в которых обсуждаемая проблематика была сформулирована как проблематика «корпусной грамотности» или «корпусной компетенции», мы можем зафиксировать замечания на данную тему и в других источниках, непосредственно ей не посвященных. Ср. с подобными «упоминаниями» в чешской научной литературе (см. пункт 2.3).

3.3. Подытоживание опыта специалистов в области обсуждения понятия «корпусная грамотность». Из исследований, которые цитируются выше, можно сделать следующие общие выводы о корпусной грамотности как понятии:

* корпусная грамотность - это понятие образовательной сферы, актуальное а) в контексте лингводидактики; б) в контексте вузовской подготовки студентов по филологическим специальностям, в) в контексте образовательных мероприятий по повышению квалификации действующих языковых специалистов;

* корпусная грамотность представляет собой систему знаний, умений и на - выков, которые следует целенаправленно формировать, причем как у специалистов будущих (студентов), так и у специалистов уже сложившихся (преподавателей, исследователей, переводчиков и др.); как у обучающихся языку, так и у обучающих языку;

* корпусная грамотность - это гибкое понятие, содержание и границы которого обуславливаются, во-первых, спецификой области практического применения языковых корпусов (преподавание иностранного языка, преподавание родного языка, преподавание филологических дисциплин, перевод, лингвистическое исследование и др.), во-вторых, спецификой тех языковых корпусов, которые тот или иной специалист использует;

* корпусная грамотность включает общую составляющую, универсальную для всех пользователей, т. е. то, что должен знать и уметь каждый корпусный пользователь, и частную составляющую, обусловленную профессиональными или учебными задачами конкретного пользователя, т. е., то, что должен знать и уметь данный пользователь, который использует данный корпус в данной профессиональной или учебной деятельности.

3.4. Выведение дефиниции понятия «корпусная грамотность». На основе выше приведенных обобщений можно сформулировать следующую общую дефиницию корпусной грамотности:

* корпусная грамотность - это система общих и частных знаний, умений и навыков, формируемая у определенных пользователей в рамках определенного образовательного процесса в целях эффективного использования ими определенного языкового корпуса (корпусов) в определенной деятельности.

Предложенную нами общую дефиницию можно модифицировать в соответствии с частными случаями применения понятия «корпусная грамотность», на - пример, корпусную грамотность лингвистов иных направлений, чем корпусная лингвистика, можно определить следующим образом:

* корпусная грамотность лингвистов иных направлений, чем корпусная лингвистика - это система общих и частных знаний, умений и навыков, формируемая у лингвистов иных направлений, чем корпусная лингвистика, в рамках мероприятий по повышению квалификации лингвистов иных направлений, чем корпусная лингвистика, в целях эффективного использования ими корпусов исследуемого языка (языков) в их научно-исследовательской деятельности.

Или, например, в интересующем нас случае:

* корпусная грамотность лингвистов-богемистов иных направлений, чем корпусная лингвистика - это система общих и частных знаний, умений и навыков, формируемая у лингвистов-богемистов иных направлений, чем корпусная лингвистика, в рамках мероприятий по повышению квалификации лингвистов - богемистов иных направлений, чем корпусная лингвистика, в целях эффективного использования ими корпусов чешского языка (ЧНК, Агапеит Bohemicum и др.) в их научно-исследовательской деятельности.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.