Построение информационной образовательной среды вуза на основе технологий управления знаниями

Применение технологий управления знаниями в учебном процессе. Основа информационной образовательной среды в условиях технологий управления знаниями. Анализ моделей и методов адаптации в современных системах. Выявление системы методологических положений.

Рубрика Педагогика
Вид автореферат
Язык русский
Дата добавления 20.11.2010
Размер файла 162,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Реализация отдельных процессов обработки знаний часто осуществляется на основе относительно простых технологий. Это Intranet, электронная почта, системы мгновенного обмена сообщениями, групповое программное обеспечение, базы данных и т.д. Наилучшие результаты достигаются, если удается построить распределенную информационную систему, бесконфликтно объединяющую эти механизмы. В этом случае ядром СУЗ является хранилище документов, к которому предъявляются требования масштабируемости, устойчивости к ошибкам, возможности полного и частичного архивирования и восстановления данных в пределах одной системы, возможности полной или частичной выгрузки данных в другую систему, высокой эффективности использования хранилища, высокой производительности хранилища, возможности оценки состояния хранилища, диагностики и мониторинга.

Наиболее сложной с информационной точки зрения является организация поиска и представления необходимой для организации обучения информации в хранилище СУЗ. Наиболее часто поиск в неупорядоченном массиве информации выполняется за счет полного перебора элементов данных и их сравнения с условиями запроса. Высокая скорость поиска информации в СУБД обеспечивается за счет алгоритмов, работающих с упорядоченной информацией. В последнее время для этого стали широко использоваться технологии семантического анализа, основанные на формировании формального описания смысла текста в виде фреймов, семантической сети или других способов представления знаний. Для проведения семантического анализа необходимы средства статистической обработки, словари, базы данных, описывающие синтаксис и морфологию, словари синонимов, омонимов и профессионализмов (тезаурусы). При работе с большим количеством объектов, представленных как в естественной, так и в электронной форме, одним из средств сокращения времени поиска и обеспечения удобного доступа является рубрикация или классификация. Системы рубрикации используют результаты семантического анализа текста, поэтому они обычно являются частью поисковой машины. С целью уменьшения объема анализируемой информации наряду с рубрикацией по ключевым словам все чаще начинают использоваться системы автоматического аннотирования и реферирования.

В третьей главе «Методика построения информационной образовательной среды вуза на основе технологий управления знаниями» обосновывается использование корпоративного портала управления знаниями, как основного элемента информационной образовательной среды вуза, анализируются психолого-педагогические аспекты использования портальной технологии в учебном процессе вуза.

Становление экономики, ориентированной на знания, предполагает создание научно-образовательных информационных сред, позволяющих обновлять профессиональные знания и навыки на протяжении всей жизни.

На основе анализа работ Б.Л. Агранович, П.Л.Брусиловского, Г.В. Кедровой, А.М. Короткова, О.П. Крюковой, Е.А. Локтюшиной, Ю.М. Насоновой, Е.С. Полат, Д.В. Смолина и других можно выделить три основных типа сред, которые были реализованы на практике или описаны в виде теоретических подходов в известных нам работах: среды, ориентированные на представление знаний; среды, ориентированные на самостоятельную деятельность по приобретению знаний; смешанный тип сред.

Первое понимание информационно-образовательной среды связано с аппаратно-программной моделью изучаемой области знания, в которую встраивается определенная методика или методики обучения. Как правило, это высокоструктурированные обучающие среды, в которых программно определены характер и направления обучения, возможности и формы участия обучаемого, реализуется последовательное приближение к поставленной конечной цели обучения. В создании таких сред активно используется когнитивный подход, в основе которого лежит опора на внутреннюю структуру человеческого знания, на системно-структурные свойства изучаемого предмета. Такие среды могут быть установлены как на локальном компьютере, так и в сетевой среде (локальной или глобальной). К этому же типу относятся большинство интеллектуальных и адаптивных обучающих сред, направленных на реализацию гибкого индивидуализированного процесса обучения, в основе которого лежат модели познавательной деятельности обучаемого.

В основу построения сред второго типа положен их деятельностный, конструктивистский характер. Понимание среды базируется на концепции обретения знаний в процессе решения содержательных задач, разработанных в рамках конструктивистской когнитологии. Согласно такому взгляду, обучение в информационно-образовательной среде является активным процессом, направленным на извлечение, конструирование знания, а не просто на его воспроизведение. Обучение в такой трактовке выполняет роль поддержки конструктивных усилий обучаемого по освоению знаний и умений.

Анализ современных российских и зарубежных исследований показывает, что в последние годы происходит стирание различий между этими типами сред, и формируются среды, которые интегрируют оба подхода, то есть, среды представляет собой источник учебно-методического знания в конкретной области знания и одновременно высокоструктурированную среду для организации различных форм самостоятельной познавательной деятельности. Такие среды, как правило, формируются в рамках общедоступных технологий в среде WWW, либо базируются на профессионально разработанных оболочках - распределенных обучающих средах, средах ориентированных на сотрудничество и других, основанных на телекоммуникационных технологиях. Они открыты и для преподавателя и для обучаемого, позволяют дополнять содержание и вносить в него коррективы, представлять результаты своей учебной деятельности в среде. Коммуникационные процессы в такой среде обеспечивают дидактический, методический и организационный фон обучения и являются центральным элементом учебного процесса.

Как показал выполненный нами анализ значительного числа публикаций, для создания информационной среды могут использоваться несколько организационно-технологических подходов (использование монолитной системы класса ERP (Терехов И.В., Шеян И. и др), использование корпоративных веб-служб, в том числе порталов(Крюков В.В., Ловицкий К.Э., Фер С.В., Шахгильдян К.И., Шагурина Н. и др.), принципы и технология открытых систем (Водяхо А.И., Пантелеев М.Г., Олейников А.Я. и др.) ). Однако наибольший эффект достигается при использовании корпоративных порталов управления знаниями.

Корпоративный портал управления знаниями - это система сбора информации, система выявления и формализации новых знаний опирающаяся на весь накопленный и формализованный ранее потенциал знаний образовательной организации (на входную информацию), на коллективный интеллект и интуицию задействованных в процессе обучения людей (на совместную работу), на вычислительные приложения, а также система выдачи накопленной и вновь созданной информации обучаемому в соответствии с принятой технологией обучения.

Можно выделить следующие задачи, которые должны решаться корпоративным порталом управления знаниями:

1. предоставление обучаемому всей необходимой информации накопленной в портале в соответствии с принятой технологией обучения и выбранной им последовательности получения учебной информации;

2. подключение обучаемого, в случае необходимости получения дополнительной информации, к специалистам, базам знаний портала и внешним источникам знаний;

3. удаленный доступ к вычислительным приложениям в рамках реализации лабораторных и практических работ;

4. организация совместной работы обучаемых.

Причем, если ранее решение этих задач требовало специального клиентского программного обеспечения и обеспечивалось в пределах локальной сети образовательной организации, то этот новый класс корпоративных порталов имеет стандартный Web-интерфейс и обеспечивает пользователям единый безопасный персонифицированный доступ к внутренним и внешним информационным ресурсам, специалистам, приложениям в любое время суток и независимо от их территориального расположения.

Корпоративный портал управления знаниями должен базироваться на корпоративных информационных порталах, экспертных порталах, порталах совместной работы и порталах приложений и интегрировать в себя все их возможности. Это и возможности сбора информации, коллективной работы, привлечения экспертов, обработки информации и выдачи информации обучаемым. Это также и возможность обеспечения документирования и самодокументирования выявляющихся в ходе совместной работы знаний, превращение их в доступную информацию, в интеллектуальный капитал образовательной организации. Но, в отличие от информационного портала, в котором информация портала равна сумме входной информации, информация портала управления знаниями всегда превышает сумму входной информации.

Одним из ключевых сервисов КПУЗ должен быть сервис, обеспечивающий глубокую персонализацию образовательных услуг. Анализ образовательных запросов с точки зрения сложности их обработки позволил выделить их следующие типы: простейшие запросы (определить новое понятие, пояснить его на примерах и т.п.); изучение отдельного вопроса (например, метода решения некоторой задачи); изучение темы (например, методы сортировки списков в программировании); изучение раздела курса (например, исчисление предикатов в логике); запрос уровня учебного курса; запросы уровня образовательной программы, включающей множество взаимосвязанных курсов.

Предлагаемый подход к построению индивидуальных программ обучения с использованием корпоративного портала управления знаниями основан на выделении двух типов сущностей: концептов и учебных объектов.

Концепты соответствуют фрагментам знаний (дидактическим единицам) разного уровня: отдельным понятиям, фактам, темам, разделам и т.д. Предполагается, что все концепты явно зафиксированы в соответствующей онтологии предметной области, доступной всем образовательным сервисам, функционирующим в корпоративном портале управления знаниями.

Учебным объектом является любой доступный на КПУЗ ресурс, который может использоваться в учебных целях как самостоятельно, так и совместно с другими ресурсами.

Процесс обслуживания образовательного запроса в общем случае включает два этапа.

На первом этапе итеративно уточняется образовательная потребность клиента и детализируется программа обучения. Результатом этапа является индивидуальная программа обучения, построенная из концептов глобально разделяемой онтологии предметной области.

На втором этапе выполняется покрытие составленной из концептов программы доступными в образовательном пространстве учебными объектами. Поскольку в открытой образовательной среде будет доступно большое число учебных объектов, для каждого концепта существует множество вариантов покрытия. Для сокращения перебора должны использоваться дополнительные ограничения пользователя на форму представления материала, стратегии обучения, временные и финансовые ресурсы и т.п. Результатом данного этапа является программа обучения, составленная из реальных учебных объектов, доступных в корпоративном портале управления знаниями.

Архитектура КПУЗ включает в себя: базы знаний (хранилище единиц знаний) и мультиагентную систему, состоящую из программного интерфейса и интеллектуальных агентов. Центральным компонентом КПУЗ являются базы знаний, которые выступают по отношению к другим компонентам как содержательная подсистема, составляющая основную ценность.

Рисунок 1 - Архитектура КПУЗ

Базы знаний (БЗ) - это совокупность единиц знаний предметной области, технологии обучения и обучаемого, которые представляют собой формализованное с помощью некоторого метода представления знаний - отражение объектов предметной области и их взаимосвязей, и действий над объектами.

Обмен данными между пользователями (обучаемыми и преподавателями) и базами знаний выполняет мультиагентная система, которая принимает сообщения от пользователей при помощи программного интерфейса, преобразует их в форму статических знаний для передачи между агентами и, наоборот, переводит статические знания, переданные интеллектуальными агентами, в формат пользователей и выдает сообщения некоторому пользователю (обучаемому или преподавателю). Важнейшим требованием к организации диалога пользователей с КПУЗ является естественность, которая означает формулирование потребностей пользователей предложениями естественного языка.

В построении индивидуальной программы обучения участвуют три типа агентов: агент обучаемого, агент - построитель программ обучения (ППО) и поисковый агент баз знаний.

Агент обучаемого выполняет роль посредника между обучаемым, с одной стороны, и агентом-построителем программ обучения и поисковым агентом - с другой. Он передает поисковому агенту исходные параметры запроса, получает от него уточненный список концептов и передает его агенту-построителю. Одной из важных задач является тестирование пользователя по выбранным концептам для построения дерева концептов, опирающегося на действительные знания учащегося.

Агент-построитель программ обучения на основе исходного запроса и соответствующей онтологии предметной области строит дерево концептов и предлагает обучаемому непосредственно или с помощью тестирования подтвердить готовность к изучению этих концептов. Он может уточнить программу обучения по результатам тестирования и представить ее обучаемому для утверждения. Затем агент-построитель во взаимодействии с поисковым агентом решает задачу покрытия дерева концептов учебными объектами. В своей работе агент-построитель программ обучения существенно использует онтологии предметных областей и может обращаться к различным онтологическим сервисам (например, для решения задачи согласования онтологий).

Поисковый агент, исходя из концептуальной структуры курса и дополнительных ограничений пользователя, выполняет поиск учебных объектов в корпоративном портале управления знаниями.

Построение и функционирование КПУЗ должно быть подчинено следующим основным принципам:

1. КПУЗ предназначен для использования на различных занятиях: лекциях, лабораторных и практических занятиях, во время самостоятельной работы обучаемых, в процессе научно-исследовательской деятельности, курсового и дипломного проектирования.

2. КПУЗ содержит текстовые массивы, параметры модели, включает в себя модули контроля, автоматизации расчетов, реализации модели, построения графиков, формирования текстовых окон.

3. В процессе работы обучаемого с КПУЗ предусматривается компьютерная визуализация учебной информации, математическое моделирование изучаемых объектов, процессов и явлений, имитация работы различных устройств.

4. Взаимодействие обучаемого и КПУЗ характеризуется наличием интерактивного диалога, позволяющего обеспечить приближение диалога между обучаемыми и системой к диалогу между обучаемыми и преподавателем.

5. Содержащийся в базах знаний учебный материал располагается в экранных фрагментах, т. е. обеспечивается представление информации в виде гипертекста и гипермедиа.

При этом эффективность работы КПУЗ зависит от соблюдения ряда требований: высокой скорости обработки информации и выполнения всех процедур, так как задержки в работе системы отрицательно влияют на протекание учебного процесса; возможности накопления и применения знаний о результатах обучения каждого обучаемого для выбора индивидуальных обучающих воздействий и управления процессом обучения для формирования комплексных знаний и умений; валидности критериев оценки уровня знаний, умений, навыков; уровня подготовки (низкий, средний, высокий) или уровня усвоения материала (узнавание, алгоритмический, эвристический, творческий); возможности адаптации системы к изменению состояния обучаемого.

Использование портальной технологии в образовании должно основываться на учете психологических особенностей работы пользователей в сети в контексте образовательной деятельности с акцентом на эффективности представления знаний для их последующего освоения. В этом случае возникает потребность в использовании педагогических и дидактических принципов и методов для организации эффективного взаимодействия пользователя с информационным пространством.

Анализ обучения показывает, что для эффективного функционирования образовательного портала пользователь должен максимально вовлекаться в познавательную деятельность, что требует соответствующего воздействия на мотивационную сферу. Интериоризации в значительной мере может способствовать общение с модератором знаний (преподавателем, тьютором, экспертом) и членами своей группы с помощью форумов и телеконференций. Информация, предоставляемая пользователю портала, должна быть актуальной и отражать его личностные интересы. Если пользователь не относится к категории обучаемых, то необходимо привлечь его внимание интересными разработками и достижениями в образовательной и научной сфере, конструируя виртуальную образовательную среду в информационном пространстве портала из наиболее приемлемых для него кирпичиков информационных блоков и сервисов.

Согласно теории поэтапного формирования умственных действий организация мыслительной деятельности человека осуществляется в несколько стадий. Сначала организуются механизмы восприятия, формируются начальные представления, затем обучаемый осваивает мыслительные операции с данным предметом или понятием, и лишь в дальнейшем он оказывается способен на эмпирическое и теоретическое обобщение накопленных знаний и их применение. Репродуктивный уровень освоения знаний становится доступным, когда обучаемый овладевает способом эмпирического обобщения учебного материала. Соответственно, продуктивный уровень освоения знаний возможен при овладении способом теоретического обобщения материала. Достижение продуктивного уровня освоения знаний является целью всех перспективных методов обучения, поэтому эти механизмы должны лежать в основе проектируемой модели пользователя образовательного портала.

Большинство существующих практических методов обучения являются экстенсивными по своей сути. Они учитывают лишь два первых способа освоения и уделяют крайне мало внимания продуктивному и творческому способам освоения знаний. Однако при нелинейном росте информационных потоков, которые приходится перерабатывать пользователю портала, требуется более эффективный подход к формированию познавательной деятельности, внедрение коллективных методов работы и повышение творческой активности пользователя путем увеличения доли динамического контента в информационном пространстве портала (создание собственной виртуальной образовательной среды).

Познавательная деятельность - это сложный, трудно формализуемый процесс, в котором участвует несколько сторон: источник знаний (автор), передатчик знаний (модератор) и реципиент (пользователь). В связи с этим важной задачей портала является передача знаний без искажений. При этом, однако, возможно изменение формы представления информации с обязательным сохранением ее семантики. Уже сама такая процедура требует использования нестандартных методов, реализованных в технологиях образовательного портала.

Характерной особенностью использование КПУЗ является возможность формирования информационных воздействий двух различных типов:

- вербальных, характеризующихся высоким уровнем формализации, требующих повышенной мыслительной активности и наличия абстрактного мышления. К таким информационным воздействиям относятся: текст, звук (голос лектора), графика (формулы, структурные схемы).

- невербальных, характеризующихся представлением материала, требующего невысокой мыслительной активности и наличия образного мышления. Это соответствует следующим типам воздействий: графика (фон), видеофрагменты, звук (фон).

При этом для каждого обучаемого существует свой оптимальный набор информационных воздействий, способствующих наиболее эффективной познавательной деятельности. Поэтому важной задачей является выявление таких различий в восприятии, формировании представлений и усвоении знаний, которые позволят наиболее эффективно управлять процессом обучения.

При организации обучения с использованием КПУЗ используется подход, реализующий принципы адаптивного программируемого обучения, позволяющий осуществлять в Intranet/Internet, как доставку учебно-методической информации (УМИ), так и интенсивное удаленное интерактивное, в том числе адаптивное обучение, повысить эффективность и надежность таких систем в целом. При этом процесс обучения (работы обучаемого с учебными объектами) рассматривается как дискретный процесс. На каждом шаге работы с учебными объектам обучаемый получает от КПУЗ обучающие воздействие (некоторый объем учебного материала), представленное в виде совокупности текстовой (гипертекстовой), статической графической, анимированной графической - и видео - информации, а также аудиоданных. При этом если материал воспринят обучаемым, то осуществляется переход в новое устойчивое состояние. Если результат обучающего воздействия оказался отрицательным, то выполняется переход для изучения дополнительного учебного материала, или возврат к учебному материалу, представленному другими учебными объектами. Обработка УМИ, хранение которой осуществляется в базе знаний КПУЗ в виде большого числа фрагментов, имеющих законченное логико-смысловое содержание с одной стороны и минимально возможный объем хранения с другой, выполняется на основе объектной технологии.

В КПУЗ с точки зрения эффективности хранения и последующей обработки предложено выделить учебные объекты нулевого, первого и высокого уровней.

Объектом нулевого уровня является минимальная единица учебно-методической информации, обусловленная возможностью физического хранения в базе знаний КПУЗ. Основным (информативным) полям объектов нулевого уровня соответствуют монохромные по содержанию фрагменты информации: текстовый фрагмент, изображение (рисунок), таблица, звуковой фрагмент, видеофрагмент, программа и т. д. Дополнительными информационными полями объектов являются поля содержащие информацию о принадлежности к той или иной области знаний, периоду обучения, ключевые слова для поиска информации и т.д., которые описывают принадлежность объекта, как части технологии хранения и обработки УМИ.

Объект первого уровня в отличие от объектов нулевого уровня, обретает собственные, свойственные первому уровню методы: сборка учебно-методической информации, сборка тестовых заданий, сборка содержания, сборка списка используемой литературы и др.

Объекты второго и последующих уровней (высокого уровня) строятся из объектов более низких уровней, наследуя их свойства и методы.

Одной из важных отличительных особенностей предлагаемого подхода является то, что любой минимальный фрагмент УМИ содержит в себе не только учебную информацию, но и блок контроля его усвоения, представляемый серией контрольных вопросов. Данный блок с одной стороны позволяет оценить качество усвоения данного учебного материала, с другой стороны обеспечивает возможность предоставления этого фрагмента УМИ обучаемому, если на этапе предварительного тестирования удается выяснить его уровень знаний по данной тематике.

Объектный подход к обработке информации, положенный в основу КПУЗ, позволяет построить некоторую среду - совокупность учебных объектов, правила взаимодействия которых определяются составом УМИ. Уровень учебных объектов при этом может быть неограничен и иметь, например, статус фрагмента учебного курса (лекция, практическое занятие, лабораторная работа и т.д.), дисциплины, строящийся как совокупность этих фрагментов, и даже специальности. Все это позволяет обеспечить высокую эффективность, гибкость и надежность обучения за счет формирования для каждого обучаемого индивидуального учебного материала, что способствует улучшению его усвоения и, в конечном итоге, повышает качество обучения.

С точки зрения организации и содержания учебного процесса учебный объект - это базовая учебная единица, объединяющая различные виды и формы обучения и ориентированная на изменение конкретных способностей обучаемого от незнания к знанию.

Разработка учебных объектов призвана устранить дублирование, временные и логические разрывы между различными дисциплинами, видами и формами обучения, усилить связи между отдельными предметами, повысить качество обучения (преподавания и восприятия учебного материала обучаемыми), повысить эффективность самостоятельной работы обучаемых.

Учебный объект характеризуется семантической самостоятельностью и самодостаточностью и представляется в наглядной форме (текстовой, графической, фото, видео, аудио).

Семантическая самостоятельность подразумевает четкие контуры предмета изучения. Самодостаточность предполагает, что учебный объект содержит только необходимые и достаточные сведения, позволяющие полностью раскрыть содержание изучаемого предмета.

Цель любого учебного объекта - вполне конкретное обогащение системы знаний, навыков, умений и/или представлений обучаемого.

При определении содержания учебного объекта необходимо четко определить: границы его предметной области; опорные учебные объекты, т.е. те, без изучения которых невозможно успешное освоение данного учебного объекта. Учебный материал, содержащийся в опорных учебных объектах, активно используется при изучении данного учебного объекта; смежные учебные объекты, т.е. те, в которых раскрывается содержание наиболее близких в семантическом отношении к данному учебному объекту предметов изучения; учебные объекты, в которых в дальнейшем будут использоваться учебные материалы данного учебного объекта.

Таким образом, для освоения понятий курса необходимо разработать учебные объекты, содержащие как теоретический учебный материал, так и включающие упражнения для его практического усвоения. В то же время при разработке учебных объектов следует предусмотреть возможность их повторного (многократного) использования в рамках различных курсов.

Объекты обучения разделяются на две основные группы: информационные (ИУО) и задачные (ЗУО).

ИУО предназначены для изучения учебного материала и может включать различные виды информации, изложенной с разной степенью детальности.

ЗУО предназначены для практического усвоения учебного материала путём выполнения некоторой задачи. Он состоит из двух основных частей: задание или вопрос и комментарий.

Для наиболее эффективного обеспечения адаптивности обучения необходимо учитывать связь между параметрами модели обучаемого и параметрами учебных объектов.

Адаптация реализуется при помощи сценария диалога с учетом модели обучаемого и модели учебного материала. Могут быть использованы три способа создания сценария: полностью преподаватель - преподаватель создает один или несколько сценариев, которые хранятся в базе знаний; частично система - преподаватель включает необходимые, по его мнению, ОО, а система дополняет сценарий в зависимости от работы обучаемого и его характеристик; полностью система - агенты системы сами определяют, какой и когда ОО отобразить, основываясь на значения параметров модели обучаемого и модель учебного материала.

Для представления модели предметной области в настоящее время наиболее часто используются онтологии.

В четвертой главе «Методы представления знаний в корпоративных порталах управления знаниями» рассматриваются онтологии как метод представления знаний о предметных областях, а также модели онтологии и онтологической системы. Рассмотрены проблемы обработки естественно-языковых текстов, дан обзор существующих методов, проанализирована возможность применения онтологии для автоматической обработки естественно-языковых текстов, показана различные подходы к определению понятия онтология, применение, методология создания и инструменты инженерии знаний.

В диссертации проанализированы работы отечественных и зарубежных ученых, занимающихся использованием гипертекстового представления информации в электронных образовательных ресурсах.

Рассматриваются различные подходы к определению гипертекстовых систем, данные В. Бушем, Д. Энгельбартом и Т. Нельсоном. В основе гипертекстового представления информации лежит идея расширения традиционного понятия текста путем введения понятия нелинейного текста, в котором между выделенными текстовыми фрагментами (информационные статьи) устанавливаются перекрестные связи и определяются правила перехода от одного фрагмента текста к другому. В общем виде структура гипертекста представляет совокупность связей, узлы - объекты и пользовательский интерфейс. В диссертации приведен обзор современных гипертекстовых систем.

В диссертации проанализированы современные методы обработки естественно-языковых текстов. В качестве ключевого элемента рассматривается лингвистический процессор. Созданием лингвистических процессоров посвящены работы Андреева А.М., Березкина Д.В., Брика А.В., Апресяна Ю. Д., Богуславского И. М. Исследуется функциональная схема лингвистического процессора, содержащая блоки графематического, морфологического, синтаксического и семантического анализа, кратко рассматриваются каждый из этих блоков, приводятся различные методы и способы их технической реализации и анализируются недостатки каждой из реализаций. В результате анализа делается вывод, что помимо графематического, морфологического, синтаксического и семантического анализа системам обработки естественных текстов требуется знания о предметной области.

Поэтому проблема автоматической обработки текстов рассматривается в дальнейшем как междисциплинарная, указывается, что в сферу создания систем обработки текстов входят физика, психология, лингвистика, информатика и т.д. В диссертации проанализированы принципы построения систем автоматической обработки текстов. На основе анализа сделан вывод о том что, техническая система, выполняющая функцию автоматического понимания текста, должна быть по существу моделью интеллектуального посредника между автором текста и его адресатами. В качестве основы понимания выступают знания о предметной области. По мнению Смирнова А.В., Пашкина М.П., Шилова Н.Г., использование онтологий как одного из методов представления знаний предметной области является на данный момент средством описания знаний, объединяющим в себе другие известные модели представления знаний.

В связи с этим в диссертации рассмотрено применение онтологий для автоматической обработки текста. Проанализирован опыт применения онтологии предметной области в целях подготовки, анализа и контроля информационной целостности технических документов, машинном переводе, анализе электронных документов, поддержки технологии Semantic Web, создания лингвистической онтологии для обеспечения автоматической обработки научно-технической информации, рассмотрен подход к решению задачи поиска противоречий в текстах на основе модели предметной области и онтологии.

В современной литературе приводится несколько определений понятия онтология в зависимости от целей применения:

1. Онтология предметной области есть та часть знаний предметной области, относительно которой предполагается ее неизменность. Относительно остальной части знаний предметной области предполагается, что она может изменяться, но должна оставаться согласованной с онтологией предметной области.

2. Онтология предметной области есть та часть знаний предметной области, которая ограничивает значения терминов предметной области. Значения терминов предметной области не зависят от остальной (изменяемой) части знаний предметной области.

3. Онтология предметной области является множеством соглашений о предметной области, другая часть знаний предметной области является множеством эмпирических и других законов этой области. Онтология определяет степень согласования значений терминов специалистами предметной области.

4. Онтология предметной области является явно заданной внешней аппроксимацией неявно заданной концептуализации. Концептуализация есть подмножество множества всех ситуаций, которые могут быть представлены. Множество ситуаций, соответствующих базе знаний, есть подмножество концептуализации. Это подмножество есть некоторая аппроксимация множества ситуаций, возможных в действительности.

В работах Клещева А.С. и Артемьевой И.Л., посвященных анализу онтологий, предлагается три подхода к определению онтологии условно названные математическим, гуманитарным и компьютерным.

Вводится понятие формальной онтологии О

О=X,R,F

где

Х - конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология O;

R - конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;

F - конечное множество функций интерпретации (аксиоматизации), заданных на концептах и/или отношениях онтологии O.

Рассматривая различные ограничения на множества F и R получаем следующие случаи:

1. R= и F=. Онтология O трансформируется в простой словарь:

O=V=X, {},{}.

Такая вырожденная онтология может быть полезна для спецификации, пополнения и поддержки словарей предметной области, но онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов.

2. R=, F. Тогда каждому элементу множества терминов из X может быть поставлена в соответствие функция интерпретации f из F. Вид отображения f из F определяет выразительную мощность и практическую полезность этого вида онтологии. Если функция интерпретации задается оператором присваивания значений (X1:=X2), где X1 -- имя интерпретации X2), то онтология трансформируется в пассивный словарь Vp:

O= Vp = X1=X2 ,{},{:=}.

Такой словарь пассивен, так как все определения терминов из X1 берутся из уже существующего и фиксированного множества X2. Практическая ценность его выше, чем простого словаря, но явно недостаточна, например, для представления знаний в задачах обработки информации в Интернете в силу динамического характера этой среды.

Для того чтобы учесть последнее обстоятельство, предположим, что часть интерпретирующих терминов из множества X2 задается процедурно, а не декларативно и вычисляется каждый раз при интерпретации термина из множества X1. В этом случае онтология преобразуется в активный словарь определений.

Ценность такого словаря для задач обработки информации в среде Интернет выше, чем у предыдущей модели, но все еще недостаточна, так как интерпретируемые элементы из X1 никак не связаны между собой и, следовательно, играют лишь роль ключей входа в онтологию.

Для представления модели онтологии, которая нужна для решения задач обработки информации в Интернете R.

В диссертации рассмотрены возможные варианты формирования множества отношений на концептах онтологии.

Далее обобщаются частные случаи модели онтологии, для обеспечения возможности представления множества концептов X в виде сетевой структуры, использования достаточно богатого множества отношений R, включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества R, использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.

Вводится в рассмотрение понятие онтологической системы O:

O =Ometa, {Odt}, inf

где Ometa - онтология верхнего уровня (метаонтология), {Odt} - множество предметных онтологии и онтологии задач предметной области, inf - модель машины вывода, ассоциированной с онтологической системой O.

В модели O выделяются три онтологические компоненты - метаонтология, предметная онтология, онтология задач.

В диссертации отмечается, что в настоящее время существует лишь несколько предметно-независимых методологий, ориентированных на построение онтологии. Эти подходы и методологии базируются на следующих принципах проектирования и реализации онтологии, предложенных Груббером - ясность, согласованность, расширяемость, минимум влияния кодирования, минимум онтологических обязательств.

В рамках итеративного подхода разработка онтологии включает определение классов в онтологии, расположение классов в таксономическую иерархию (подкласс - надкласс), определение слотов и описание допускаемых значений этих слотов, заполнение значений слотов экземпляров.

В диссертации описаны математические принципы построения лингвистической онтологии, и как следствие, на ее основе создание контента корпоративного портала управления знаниями, использующего гипертекстовую модель.

Математическая модель идеального гипертекста, построенного с учетом принципов общезначимости, объектографии и учетом жизненных циклов объектов может быть представлена следующим образом.

Тогда в наиболее общем виде идеальный гипертекст описывается как

H0=T, I, S, Q

где Т - тезаурус, I - информационная составляющая, включающая в себя содержание информационных статей хранящих сведения о всех объектах, S - упорядоченный (по алфавиту, времени существования или другим критериям) словарь наименований всех объектов, Q - список главных тем гипертекста.

Лингвистическая онтология - это иерархическая сеть терминов. Каждое понятие связывается отношениями с другими понятиями онтологии. Определяются отношения между терминами в лингвистической онтологии. Первый тип отношений - родовидовое отношение ниже - выше, обладает свойством транзитивности и наследования.

Второй тип отношений - отношение часть-целое. Используется не только для описания физических частей, но и для других внутренних сущностей понятия, таких как свойства или роли для ситуаций.

Еще один тип отношения, называемого несимметричной ассоциацией, связывает два понятия, которые не могут быть связаны выше рассмотренными отношениями, но одно из понятий не существовало бы без существования другого. Последний тип отношений - симметричная ассоциация связывает, например, понятия очень близкие по смыслу, но которые нельзя склеить в одно понятие.

Построение данного вида онтологии (лингвистической онтологии) подразумевает определение множества терминов из обрабатываемого текста и сопоставление им соответствующего определения.

Процесс создания лингвистической онтологии состоит из следующих этапов:

· формирование терминологического словаря некоторой предметной области по массиву текстовой информации;

· анализ полученной информации экспертами, с целью «фильтрации» терминов, и указания определения данных терминов;

· установление экспертами отношений между набором терминов предметной области.

Предполагается, что ключевые слова текста (т. е. слова, частота повторения которых в тексте выше других), являются основными и предположительно терминами. В работе используются статистические методы поиска ключевых слов в тексте в силу их простоты и ресурсонезависимости.

Для поиска ключевых слов в тексте вводится функция F:

X=F(T),

где X - искомое множество ключевых слов, T - множество информационных элементов текстового фрагмента.

Элементами множества T являются либо отдельные слова, либо предложения текстового фрагмента. В диссертации описывается задача выделения слов из входного потока, которая сводится к тому, что на каждом шаге анализируется очередной символ текущей строки, если он не является разделителем, то добавляется к текущей лексеме, в противном случае текущая лексема добавляется в таблицу лексем, после чего ей присваивается пустое значение. На данном этапе происходит проверка наличия очередного полученного таким способом слова в стоп-словаре. Если проверка проходит успешно, данная лексема не добавляется в таблицу, а отбрасывается, так как не является необходимой с рассматриваемой точки зрения.

Таким образом, обрабатываются все строки входного массива. В результате имеем таблицу лексем, содержащую все слова из входного потока (за исключением стоп - слов). С точки зрения структур данных таблица лексем представляет собой хеш-таблицу. Получая в качестве аргумента некоторое слово, хеш-функция выдает в результате некоторое целое число - индекс в таблице лексем, под которым следует хранить это слово. Реализуется это при помощи функции выдающей по заданной букве ее номер в русском алфавите, и функции суммирующей коды букв слова.

Для разрешения коллизий используется линейный список. Каждый элемент данного списка содержит два поля: строковое, в котором хранится лексема, и целочисленное, содержащее количество повторений данной лексемы во входном потоке. Следующий этап выделения возможных терминов заключается в поиске морфологически родственных слов в полученной таблице и замена их, так называемым главным словом. Для этого необходим дополнительный проход по хеш-таблице, а также дополнительная структура данных - морфологический словарь.

Морфологический словарь представляет собой древовидную сильноветвящуюся структуру, каждая вершина которой представляет собой массив, содержащий элементы, имеющие три поля: поле флагов, уникальный номер и указатель на вершину следующего уровня. Каждый элемент пронумерован и ему соответствует буква русского алфавита. Данный подход позволяет не хранить букву непосредственно в памяти. Таким образом, слово представляет собой путь в дереве, от корня, до вершины, имеющий признак конца слова.

Поиск морфологически родственных слов заключается в рекурсивном спуске по дереву и нахождению элемента вершины, имеющего признак основы. После этого осуществляется левосторонний обход дерева, корнем которого является найденная вершина, и все найденные слова добавляются в список родственных слов, с пометкой слова, являющегося главным. После разбора текста необходим дополнительный проход по таблице лексем, для поиска и замены групп родственных слов соответствующим главным словом, складывая частоту их появления в тексте. После завершения данного этапа таблица лексем содержит уже главные слова всех групп родственных слов, которые встретились во входном потоке. Необходимо заметить, что при наличии в тексте слов, не присутствующих в морфологическом словаре, формируется выходной список данных слов. На его основе в дальнейшем осуществляется корректировка морфологического словаря.

В пятой главе «Экспериментальная проверка эффективности построения информационной образовательной среды вуза на основе технологий управления знаниями» отражен ход эксперимента на трех этапах: подготовительном этапе, этапе дидактического эксперимента и этапе обработки результатов. Формирующий этап дидактического эксперимента проводился на базе Курского государственного университета в ходе преподавания курса «Информатика» для специальностей «Математическое обеспечение и администрирование информационных систем» и «Прикладная математика и информатика». Дидактический эксперимент проводился в форме эксперимента перекрестных групп.

Общая цель опытно-экспериментальной работы заключалась в практической проверке работоспособности и эффективности, предложенных нами моделей для совершенствования информатизации обучения в вузе за счет использования технологий управления знаниями. Для достижения поставленной цели необходимо было решить следующие задачи: выбрать набор дисциплин для формирования корпоративного портала управления знаниями; выявить и описать характерные особенности восприятия, последующей переработки и использования обучаемыми информации предоставляемой КПУЗ; определить рациональные способы представления, структурирования и содержательного наполнения КПУЗ; проверить работоспособность и целесообразность применения в педагогической практике предложенных нами принципов проектирования КПУЗ; отработать основные принципы организации обучения с использованием КПУЗ, в том числе и в условиях применения технологий дистанционного обучения.

В числе основных задач, решение которых требуется для формирования КПУЗ, необходимо выделить следующие: выбор ведущих принципов организации образовательного процесса; отбор технологий и способов представления информации в КПУЗ в зависимости от характерных особенностей их восприятия и использования обучаемыми; определение оптимального состава предметного учебно-методического комплекса (УМК); определение для каждого из элементов УМК содержательного и деятельностного компонентов; интеграция КПУЗ в образовательную среду вуза.

Анализ современной психолого-педагогической литературы и педагогической практики показал, что для оценки значимости использования корпоративного портала управления знаниями в образовательном процессе требуется комплексный подход и решение двух взаимосвязанных задач по определению:

· педагогической целесообразности разработки и применения в образовательном процессе КПУЗ, под которой будем понимать целесообразность соответствия образовательного процесса конкретному состоянию модели педагогической системы, позволяющему достигать поставленные цели обучения;

· педагогической эффективности КПУЗ, под которой мы понимаем производительность (эффективность) КПУЗ как модели педагогической системы по формированию в процессе обучения предписанных (спрогнозированных) свойств и качеств личности обучаемого.

При этом связь между целесообразностью и эффективностью проявляется на содержательном и временном уровнях.

Для положительного оценивания с точки зрения целесообразности КПУЗ должен удовлетворять целям и задачам обучения, учитывать специфику и содержание учебного предмета, требуемый уровень формирования знаний, умений и навыков как с точки зрения изучения и освоения конкретной дисциплины, так и с точки зрения профессиональной необходимости и значимости КПУЗ, допускать вариацию уровня проблемности и сложности заданий и интенсивности экранного предъявления информации обучаемым, предусматривать различные формы организации занятий с использованием компьютеров, позволять осуществлять контроль деятельности (этапы, структура, виды), фиксацию и анализ результатов контроля и иметь соответствующий интерфейс, учитывать психоэмоциональные и возрастные особенности обучаемых и уровень их умственного развития, допускать конфигурирование системы, вариацию и генерирование заданий, помогать педагогу в проверке правильности выполнения заданий.

При оценке педагогической целесообразности создания и практического применения КПУЗ должны быть выбраны измерители, параметры и критерии. При этом учитывается: его основное педагогическое назначение; объем и специфика соответствующего учебного предмета; степень выраженности социально - дидактических функций.

Оценка педагогической целесообразности КПУЗ должна осуществляется на этапах проектирования КПУЗ, апробации в реальном образовательном процессе, практического использования КПУЗ в образовательной системе (согласование применения с реальными условиями функционирования и решения задач по обеспечению педагогической целесообразности).

При оценке педагогической целесообразности в качестве количественных показателей нами предлагается использовать следующие параметры: ступень абстракции, уровень усвоения, широта опыта, степень осознанности.

Критериями для принятия решения о педагогической целесообразности КПУЗ являются: изменения по траекториям подготовленности обучаемого, индекс развития, коэффициент усвоения.

Использование КПУЗ оказывает существенное влияние на интенсификацию образовательного процесса, которая может быть достигнута следующими способами: увеличением количества учебной продукции (например, правильно решенная задача, разработанный алгоритм решения задачи и т.д.) производимой обучаемыми в единицу времени; повышением плотности подачи информации, т.е. увеличением количества материала, предъявляемого обучаемому в единицу времени; изменением временных характеристик отдельных этапов продуктивного мыслительного процесса; возрастанием операциональной интенсивности, связанной с уменьшением времени, отводимого обучаемому на выполнение тех или иных учебных действий; повышением степени напряженности труда, связанной с трудностью заданий и их сложностью; формированием положительной эмоционально-мотивационной сферы преподавания и учения в условиях реализации учебных компьютерных технологий; всесторонним учетом индивидуально-типологических особенностей личности обучаемого и педагога; активным участием педагогов-практиков в проектировании и создании КПУЗ, целенаправленной их методической, психологической и компьютерной подготовкой для работы в компьютеризированной среде.

Эффективность применения в педагогическом процессе университета КПУЗ требует учета трех важнейших групп факторов. Они связаны с содержательными и структурными аспектами построения КПУЗ, возрастными и психофизиологическими особенностями педагогов и обучаемых, режимами и дидактическими функциями, выполняемыми КПУЗ.

Эффективность использования КПУЗ во многом определяется тем, какие психолого-педагогические идеи реализовал в ней педагог в процессе его создания.

В своей работе мы исходили из того, что формирование КПУЗ и его использование не является самоцелью или способом, позволяющим формализовать и упростить образовательный процесс. Напротив, мы предполагали с помощью нового средства обучения создать условия для формирования саморазвивающейся, самоактуализирующейся личности, высвободить педагога для более глубокого взаимодействия с обучаемыми.

Эффективность использования КПУЗ в основном определяется эффективностью (производительностью) учебной компьютерной технологии, которая как подсистема КПУЗ, представляет собой, с одной стороны, совокупность знаний о способах организации образовательного процесса с использованием компьютерных обучающих систем, а с другой стороны, - сам процесс обучения, при котором происходит изменение качественных характеристик, интеллектуальной и эмоционально-волевой сфер личности обучаемого.

Следовательно, педагогическая значимость выражает дидактическое свойство КПУЗ, которое детерминируется качествами целесообразности и эффективности. При этом она обуславливается педагогической целесообразностью разработки и использования КПУЗ и прогнозируется педагогической эффективностью, а в целом сама педагогическая значимость гарантирует обеспечение (воспроизведение) пределов задаваемых качеств в формировании личности обучаемого.

Таким образом, если разработка и использование КПУЗ педагогически целесообразно для развития личности обучаемого в пределах установленных в дидактической задаче, а в результате использования учебных компьютерных технологий с заданной педагогической эффективностью достигаются цели обучения, то такой КПУЗ обладает свойством педагогической значимости.

Для опытно-экспериментальной работы нами были выбраны дисциплины «Информатика» для специальностей «Математическое обеспечение и администрирование информационных систем» и «Прикладная математика и информатика». Курсы построены в соответствии с Государственными образовательными стандартами соответствующих специальностей.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.