Методы и модели интеллектуального автоматизированного контроля знаний
Анализ методов и моделей интеллектуального контроля знаний с применением средств вычислительной техники. Обзор имеющихся средств автоматизации контроля знаний и тестирования. Методы построения интеллектуальных систем контроля, модели оценивания знаний.
Рубрика | Педагогика |
Вид | реферат |
Язык | русский |
Дата добавления | 18.10.2010 |
Размер файла | 75,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
58
Калининградский Государственный Технический Университет
Кафедра СУ и ВТ
Реферат
«Методы и модели интеллектуального автоматизированного контроля знаний»
Проверил к.тн., доцент кафедры
Рудинский Игорь Давидович
Выполнил Соловей
Евгений Владимирович
Калининград
2001
Аннотация
Настоящий реферат содержит результаты анализа методов и моделей интеллектуального контроля знаний с применением средств вычислительной техники, существующих на данный момент в области образования. Также рассказывается о новых разработках в этой области и собственных мыслях автора. Узловыми вопросами работы является обзор имеющихся средств автоматизации контроля знаний и тестирования, теоретические разработки различных авторов, методы построения интеллектуальных систем контроля, модели оценивания знаний.
Введение
В последние годы в России в сфере образования наблюдается стремительное усиление интереса к автоматизации промежуточного и финального контроля результатов обучения учащихся самых различных учебных заведений, начиная от школ и заканчивая коммерческими курсами. Самым популярным видом такого контроля является тестирование, основанное на диалоге вычислительной системы с пользователем. Стремительный рост быстродействия компьютерных систем, уменьшение цен на вычислительную технику, появление качественных и мощных систем программирования увеличило потребность в системах, позволяющих объективно, быстро и надежно оценивать знания учащихся, предлагая интересные формы взаимодействия с ними.
Но вопрос создания таких систем является не однозначным, и авторы существующих разработок иногда отходят от педагогической и психологической стороны вопроса, пытаясь максимально увеличить привлекательность своих программных продуктов за счет средств мультимедиа. Иногда программисты просто игнорируют процесс взаимодействия с непосредственно носителями знаний (преподавателями), что отражается на существующих приложениях. Очень часто сами преподаватели не владеют в должной мере методами оценки качества создаваемых тестов (будем говорить о тестировании).
Необходимо отметить, что первые концепции компьютеризации обучения возникли более 30 лет назад под лозунгом “техническое перевооружение педагога, механизация его труда”, “обучающей машины”, имитирующей процесс индивидуальной работы преподавателя с обучаемым. Со временем росло понимание их ограниченности. Определенное распространение получили попытки использовать в учебном процессе системы искусственного интеллекта [1]. Именно применение методов искусственного интеллекта и инженерии знаний, на мой взгляд, поможет превозмочь субъективность и прямолинейность процесса тестирования, поднимая уровень оценивания знаний машинными системами. Дело в том, что применение традиционных методов компьютерного обучения и контроля (прямое тестирование, бальная система, и т.д.) неприемлемо: для того, чтобы оценить знания обучаемого, преподавателю приходится переработать огромное количество информации, и процесс взаимодействия оценивающего и оцениваемого не поддается строгой формализации, поэтому три основные алгоритмические структуры (последовательная, ветвление, цикл) при реализации машинных систем не смогут описать в полной мере данную предметную область. Т.е. осуществление автоматизированного контроля знаний, умений обучаемых, в первую очередь, включает решение проблемы определения совокупности требуемых качеств знаний, без которых критерии оценки знаний и способы определения уровня их усвоения выявить нельзя.
Автор в данной работе попытался показать некоторые существующие методы и модели интеллектуального тестирования (см. 2), описать и оценить качество существующих систем контроля, выдвинуть собственные идеи.
1. Контроль и тестирование
Основная цель контроля знаний и умений состоит в обнаружении достижений, успехов учащихся, в указании путей совершенствования, углубления знаний, умений, с тем, чтобы создавались условия для последующего включения учащихся в активную творческую деятельность. Эта цель в первую очередь связана с определением качества усвоения учащимися учебного материала - уровня овладения знаниями, умениями и навыками предусмотренных программой. Во - вторых, конкретизация основной цели контроля связана с обучением приемам взаимоконтроля и самоконтроля, формированием потребности в самоконтроле и взаимоконтроле.
В - третьих эта цель предполагает воспитание у учащихся таких качеств личности, как ответственность за выполненную работу, проявление инициативы.
Если перечисленные цели контроля знаний и умений учащихся реализовать, то можно говорить о том, что контроль выполняет следующие функции: контролирующую, обучающую (образовательную), диагностическую, прогностическую, развивающую, ориентирующую, воспитывающую [3]. Рассмотрим эти функции более подробно.
1.1 Функции контроля
1.1.1 Контролирующая функция
Контролирующая функция состоит в выявлении состояния знаний и умений учащихся, уровня их умственного развития, в изучении степени усвоения приемов познавательной деятельности, навыков рационального учебного труда.
При помощи контроля определяется исходный уровень для дальнейшего овладения знаниями, умениями и навыками, изучается глубина и объем их усвоения. Сравнивается планируемое с действительными результатами, устанавливается эффективность используемых преподавателем методов, форм и средств обучения.
1.1.2 Обучающая функция
Обучающая функция контроля заключается в совершенствовании знаний и умений, их систематизации. В процессе проверки учащиеся повторяют и закрепляют изученный материал. Они не только воспроизводят ранее изученное, но и применяют знания и умения в новой ситуации. Проверка помогает выделить главное, основное в изучаемом материале, сделать проверяемые знания и умения более ясными и точными. Контроль способствует также обобщению и систематизации знаний.
1.1.3 Диагностическая функция
Сущность диагностической функции контроля - в получении информации об ошибках, недочетах и пробелах в знаниях и умениях учащихся и порождающих их причинах затруднений учащихся в овладении учебным материалом, о числе, характере ошибок. Результаты диагностических проверок помогают выбрать наиболее интенсивную методику обучения, а также уточнить направление дальнейшего совершенствования содержания методов и средств обучения.
1.1.4 Прогностическая функция
Прогностическая функция проверки служит получению опережающей информации об учебно-воспитательном процессе. В результате проверки получают основания для прогноза о ходе определенного отрезка учебного процесса: достаточно ли сформированы конкретные знания, умения и навыки для усвоения последующей порции учебного материала (раздела, темы).
Результаты прогноза используют для создания модели дальнейшего поведения учащегося, допускающего сегодня ошибки данного типа или имеющего определенные пробелы в системе приемов познавательной деятельности.
Прогноз помогает получить верные выводы для дальнейшего планирования и осуществления учебного процесса.
1.1.5 Развивающая функция
Развивающая функция контроля состоит в стимулировании познавательной активности учащихся, в развитии их творческих способностей. Контроль обладает исключительными возможностями в развитии учащихся. В процессе контроля развиваются речь, память, внимание, воображение, воля и мышление школьников. Контроль оказывает большое влияние на развитие и проявление таких качеств личности, как способности, склонности, интересы, потребности.
1.1.6 Ориентирующая функция
Сущность ориентирующей функции контроля - в получении информации о степени достижения цели обучения отдельным учеником и группой в целом - насколько усвоен и как глубоко изучен учебный материал. Контроль ориентирует учащихся в их затруднениях и достижениях.
Вскрывая пробелы, ошибки и недочеты учащихся, он указывает им направления приложения сил по совершенствованию знаний и умений. Контроль помогает учащемуся лучше узнать самого себя, оценить свои знания и возможности.
1.1.7 Воспитывающая функция
Воспитывающая функция контроля состоит в воспитании у учащихся ответственного отношения к учению, дисциплины, аккуратности, честности. Проверка побуждает более серьезно и регулярно контролировать себя при выполнении заданий. Она является условием воспитания твердой воли, настойчивости, привычки к регулярному труду [3].
Выделение функции контроля подчеркивает его роль и значение в процессе обучения. В учебном процессе сами функции проявляются в разной степени и различных сочетаниях. Реализация выделенных функций на практике делает контроль более эффективным, а также эффективней становится и сам учебный процесс.
Итак, контроль знаний является неотъемлемой частью учебного процесса. Существует несколько методов контроля, рассмотрим основные из них.
1.2 Методы контроля
1.2.1 Устная проверка
Устная проверка организуется по-разному, в зависимости от ее цели и от содержания проверяемого материала. Среди целевых установок проверки можно выделить следующие: проверить выполнение домашнего задания, выявить подготовленность учащихся к изучению нового материала, проверить степень понимания и усвоения новых знаний. В зависимости от содержания она проводится по материалу предшествующего урока или по отдельным разделам и темам курса.
Методика устной проверки включает в себя две основные части:
· составление проверочных вопросов и их задание;
· ответ учащихся на поставленные вопросы.
Составление проверочных вопросов и заданий - важный элемент устной проверки. Качество вопросов определяется их содержанием, характером выполняемых учащимися при ответе на вопросы умственных действий, а также словесной формулировкой.
При составлении вопросов всегда исходят из того, что проверять следует те знания, которые являются основными в данном курсе или относительно трудно усваиваются учащимися или которые необходимы для успешного усвоения дальнейших разделов и тем курса. На подбор вопросов оказывает влияние вид проверки: для уточнения содержания вопросов для текущей проверки необходим анализ связей изучаемого материала с ранее пройденным, а для тематической и итоговой проверки - выделение ведущих знаний и способов оперирования ими. Причем устную проверку считают эффективной, если она направлена на выявление осмысленности восприятия знаний и осознанности их использования, если она стимулирует самостоятельность и творческую активность учащихся.
Качество вопросов определяется характером умственных действий, которые выполняют учащиеся при ответе на вопрос. Поэтому среди проверочных заданий выделяют вопросы, активизирующие память (на воспроизведение изученного), мышление (на сравнение, доказательство, обобщение), речь. Большое значение имеют проблемные вопросы, которые заставляют применять полученные знания в практической деятельности.
Качество устной проверки зависит от подбора, последовательности и постановки вопросов, которые предлагаются, во-первых, каждый вопрос должен быть целенаправленным и логически завершенным, а, во-вторых, должен быть предельно сжатым, лаконичным и точным.
Второй составной частью устной проверки является ответ учащегося на вопросы. В дидактической литературе выделяются два условия качественного выявления знаний учащегося:
· ученику никто не мешает (преподаватель и аудитория комментируют ответ потом);
· создается обстановка, которая обеспечивает наилучшую работу его интеллектуальных сил.
Прерывать ученика можно только в том случае, если он не отвечает на вопрос, а уклоняется в сторону. При оценке ответа ученика обращают внимание на правильность и полноту ответа, последовательность изложения, качество речи.
Приемы устной проверки используются на различных этапах урока. Выбор тех или иных приемов во многом предопределяется целью и логикой урока.
1.2.2 Проверка письменно - графических работ
Вторым широко применяемым методом контроля в обучении является проверка письменно - графических работ. Этот метод имеет свои качественные особенности: большая объективность по сравнению с устной проверкой, охват нужного числа проверяемых, экономия времени. Применение письменных работ используется для:
· проверки знания теоретического материала;
· умения применять его к решению задач;
· контроля сформированных навыков.
В методике письменно - графических работ выделяют четыре основных этапа, которым надо уделять внимание, это подготовка, организация, проведение, анализ результатов.
При подготовке нужно: вычленить цель проверки, отобрать содержание объектов проверки, составить проверочные задания. Большую помощь при этом оказывают учебно - методические пособия, образцы проверочных работ в журналах.
При организации проверочной работы учащимся сообщается, какие задания им предназначены, как озаглавить работу, как оформить решение, время выполнения работы. При этом следить за самостоятельностью выполнения работы каждым учеником.
Анализ ответов учащихся эффективен тогда, когда он проводится по определенным схемам (схемам поэлементного анализа). Тщательно проведенный анализ позволяет глубоко изучить пробелы и достижения отдельных учеников, выделить типичные ошибки и основные затруднения учащихся, изучить причины их появления и наметить пути их устранения.
1.2.3 Проверка практических и лабораторных работ
С помощью этого метода получают данные об умении учащихся применять полученные знания при решении практических задач, пользоваться различными таблицами, формулами, чертежными и измерительными инструментами, приборами.
Преподаватель получает отчет ученика, в котором приводится только результат или схематически описаны план практической работы и ее результаты. Это несколько затрудняет проверку и оценку каждого действия ученика. Поэтому на практике в проверочном задании приводится алгоритм его выполнения, что позволяет осуществить такую проверку правильности действий ученика. Все работы проверяются, но оцениваются по-разному, по результатам обзорных работ оценки выставляются, по результатам тренировочных работ можно выставить лишь положительные оценки.
Таким образом, несколько методов контроля, удачно подобранных преподавателем в своей образовательной деятельности, позволят достаточно объективно оценить знания учащихся, проконтролировать то, что было изучено и сделано за определенный период. Средства, применяемые преподавателями в своей практике, очень различны.
1.3 Средства контроля
В настоящее время создаются и распространяются такие средства, которые не требуют больших затрат времени на подготовку, проведение и обработку результатов. Среди них выделяют машинные и безмашинные средства проверки.
1.3.1 Безмашинные средства контроля
Среди безмашинных средств проверки наиболее распространены в практике устный опрос учащихся у доски, проверка учителем тетрадей с домашним заданием, диктант, самостоятельная и контрольная работы.
Проверка домашнего задания
Роль домашних заданий практически обесценивается, если не налажена их проверка. Преподаватели практикуют разные формы учета. Это и устный опрос у доски или с места по домашнему заданию, и короткая письменная работа, но, прежде всего это непосредственная проверка задания в тетрадях - фронтальная при обходе класса в начале и более основательная, выборочная во внеурочное время.
Также существует самопроверка по образцу и применяется на первом уроке после объяснения нового материала. Образец решения домашней работы записан на доске заранее. Учащиеся рассматривают решение образец и устно комментируют его, тетради у всех закрыты. Затем открываются тетради и проверяются свои работы по образцу, подчеркивая ошибки. Этот способ развивает внимание и выявляет ошибки с помощью образца.
Взаимопроверка с помощью образца используется на следующем уроке. В этом случае учащиеся проверяют домашнюю работу своего соседа тоже по образцу. Как и в первом случае, окончательно тетради проверяет преподаватель.
Диктант
Диктант может заменить опрос по теме, заданной для повторения. Его продолжительность обычно 10-20 минут. Он представляет собой систему вопросов, связанных между собой.
Организация самостоятельных работ
При изучении важно, чтобы учащиеся не только знали теоретический материал, но и умели применять его к решению задач и упражнений, обладали бы рядом навыков (вычислительными навыками, умениями преобразовывать выражения и т.д.). Эти умения и навыки могут быть по настоящему проверены только в письменной работе. Обычно самостоятельные работы проводятся после коллективного решения задач новой темы и предшествуют контрольной работе по этой теме.
Организация контрольных работ
Контрольная работа может быть кратковременной и долговременной.
1. Перед проведением контрольной работы необходимо определить объект контроля, цель предстоящей работы и средства контроля. Они должны быть сообщены учащимся;
2. В зависимости от вида заданий нужно продумать, каким образом ученик должен их оформить;
3. Учитель должен продумать что он отнесет к недочетам, а что к ошибкам, из этого будет складываться оценка. Критерии оценки хотя бы в общих чертах должны быть известны учащимся;
4. Контрольная работа должна быть посильной для всех учащихся без исключения. Сильным ученикам нужно дать задания труднее;
5. Каждой контрольной работе должна предшествовать самостоятельная работа с аналогичными упражнениями;
6. Анализ контрольной работы необходимо проводить сразу, для этого необходимо завершать работу за несколько минут до окончания. Желательно фрагменты решения разобрать сразу после написания работы, потому что на следующий день или позже учащиеся уже теряют интерес к содержанию работы и многие интересуются только оценкой;
7. Обязательно нужно проводить количественный и качественный анализ контрольной работы.
1.3.2 Машинные средства проверки
Для контроля знаний учащихся используют персональный компьютер. Для контроля знаний учащихся удобно применять типовые расчеты, которые включают наиболее характерные задания базового курса [3].
В дальнейшем будем говорить о машинных средствах контроля знаний, и, в частности, о тестировании с применением средств вычислительной техники.
1.4 Компьютерное тестирование
Идея компьютерного тестирования напрямую проистекает от идеи программированного контроля знаний. Программированный контроль знаний, в свою очередь, явился неизбежной реакцией на некоторые проблемы прежде всего высшего образования в России. Собственно, примерно те же проблемы распространяются и на школьное образование, но последнее, в силу традиционной косности, очень слабо восприимчиво к новым технологиям.
Основной проблемой любого образования (и не только российского, кстати), является отсутствие четкого контроля за качеством усвоения материала. Причем если в школьной практике учитель еще более-менее имеет возможность с определенной периодичностью проверять уровень текущих знаний ученика, то в ВУЗе преподаватель целый семестр выдает материал и лишь в конце семестра убеждается в уровне его усвоения. Само собой, в системе высшего образования подразумевается, что студенты должны в достаточной степени заниматься и самостоятельным образованием, однако, это предполагаемое самостоятельное получение знаний остается целиком и полностью на совести студента, и преподаватель абсолютно не может знать, кто именно из студентов хоть что-то делает самостоятельно. С получением большим числом обучаемых доступа в Internet положение усугубилось еще и тем, что теперь даже сдача рефератов не подразумевает абсолютно никакой работы с информацией; частенько студенты даже не считают нужным целиком прочесть то, что распечатывают из Сети [4].
Необходимость систематического контроля за усвоением материала сомнений не вызывает. Прежде всего это давало бы экономию времени преподавателя, который при отсутствии обратной связи вынужден или повторять положения, которые студентами давно усвоены, или излагать положения, основанные на фактах, плохо усвоенных студентами. Во вторую очередь, систематический контроль за уровнем знаний учащихся стимулирует повышение качества обучения за счет усиления акцента на трудных для усвоения положениях и повышения ответственности обучаемых за результаты самостоятельной работы (в случае, естественно, когда преподаватель в этом заинтересован).
Важным моментом систематического программированного контроля знаний является его объективность, что обусловлено переносом акцента с карательной функции на информативную. Только в таком случае учащийся не будет бояться контроля и изобретать способы получения повышенной оценки, и только в таком случае преподаватель будет получать реальную картину знаний учащегося.
Технически программированный контроль знаний прост - учащимся выдается некий бумажный носитель (расцвет программированного контроля вызвал к жизни релейно-ламповых "электронных" монстров, которые по сей день можно видеть на экзаменах по сдаче на водительские права), на котором записаны вопросы и варианты ответов, один (или несколько) из которых являются правильными. Учащемуся остается лишь расставить крестики против правильных ответов.
Подобная технология позволила совершить качественный скачок в осуществлении обратной связи между преподавателем и студентом. Программированный контроль, состоящий из 8-10 вопросов, проводится за очень короткий срок - от 5 до 10 минут, и при этом преподаватель может получить полноценную информацию об усвоении пройденного материала всей учебной группой одновременно. Кроме того, техническая реализация программированного контроля позволила полностью избежать списывания, давая возможность предложить каждому учащемуся свой вариант программированной карты.
Недостатком программированного контроля в его до-компьютерном виде являлась высокая трудоемкость создания программированных карт, которые (в идеале) требовались на каждое занятие, и сложность их последующей обработки. С появлением компьютерных технологий у преподавателей появилась возможность резко снизить трудоемкость и подготовки контроля, и обработки результатов.
Выделяют пять общих требований к тестам:
· валидность;
· определенность (общепонятность);
· простота;
· однозначность;
· надежность.
Валидность теста - это адекватность. Различают содержательную и функциональную валидность: первая - это соответствие теста содержанию контролируемого учебного материала, вторая - соответствие теста оцениваемому уровню деятельности.
Выполнение требования определенности (общедоступности) теста необходимо не только для понимания каждым учеником того, что он должен выполнить, но и для исключения правильных ответов, отличающихся от эталона.
Требование простоты теста означает, что тест должен иметь одно задание одного уровня, т.е. не должен быть комплексным и состоять из нескольких заданий разного уровня. Необходимо отличать понятие “комплексный тест” от понятия “трудный тест”. Трудность теста принято характеризовать числом операций P, которое надо выполнить в тесте: P < 3 - первая группа трудности; P = 3-10 - вторая группа трудности. Не следует также смешивать понятия простоты-комплексности и легкости-трудности с понятием сложности.
Однозначность определяют как одинаковость оценки качества выполнения теста разными экспертами. Для выполнения этого требования тест должен иметь эталон. Для измерения степени правильности используют коэффициент
K = P1 / P2,
где P1 - количество правильно выполненных существенных операций в тесте или батарее тестов; P1 - общее количество существенных операций в тесте или батарее тестов. Существенными считают те операции в тесте, которые выполняются на проверяемом уровне усвоения. Операции, принадлежащие к более низкому уровню в число существенных не входят. При K 0.7 считают, что деятельность на данном уровне усвоена.
Понятие надежности тестирования определяют как вероятность правильного измерения величины K. Количественный показатель надежности r [0, 1]. Требование надежности заключается в обеспечении устойчивости результатов многократного тестирования одного и того же испытуемого. Надежность теста или батареи тестов растет с увеличением количества существенных операций P [5].
Итак, при реализации систем компьютерного тестирования необходимо, на мой взгляд, придерживаться именно этих пяти требований к создаваемым тестам. Но проблема компьютерного тестирования стоит намного острее. Реализация в системах тестирования описанных выше пяти требования к тестам не означает того, что созданный комплекс будет отвечать всем требованиям преподавателя и учащегося.
Большинство программных продуктов не дают возможности преподавателю и студенту, учителю и ученику отойти в реальном учебном процессе от традиционных методик: лекционного курса, конспекта, очного контроля знаний, контрольных работ, зачетов, экзаменов. Недостаток этот можно определить следующим: компьютерный курс является авторским по определению, и поэтому обеспечивает высокое качество образования только при соответствующем сопровождении автором (который, в большинстве случаев, не обладает достаточными знаниями в области информационных технологий). Хотя отдельные компоненты компьютерного обучающего, контролирующего или обучающе - контролирующего курса могут использоваться как независимые учебные модули другими преподавателями (а также и при самостоятельном освоении темы), максимальный эффект, скорее всего, может быть достигнут только во взаимодействии с автором- разработчиком курса.
Если же в образовательный процесс, основанный на авторском мультимедиа курсе, включается другой преподаватель, возникает опасность конфликта личностей, так как на едином образовательном поле сталкиваются не только различные способы методической организации учебного процесса, но и разные личностные подходы.
Что касается проверки качества знаний, неформальный характер процесса оценивания знаний требует применения трудно поддающихся обработке преподавателем компьютерных тестов, необходима активная обратная связь, помогающая оценить правильность усвоения материала, должна быть четко выражена определенность и результативность [6].
Именно неформальность знаний как таковых, и процесса проверки знаний в частности, породило множество проблем в области компьютерного тестирования, таких как необъективность оценивания, трудность понимания учащимися подготовленных вопросов, медленная работа компьютерных систем, и т.п.
На мой взгляд, инженерия знаний и методы теории искусственного интеллекта помогут создать систему контроля знаний, позволяющую строить модели знаний преподавателя и тестируемого и объективно оценивать знания и умения последнего.
2. Интеллектуальное тестирование
В понятие «искусственный интеллект» вкладывается различный смысл -- от признания интеллекта у ЭВМ, решающих логические или даже любые вычислительные задачи, до отнесения к интеллектуальным лишь тех систем, которые решают весь комплекс задач, осуществляемых человеком, или еще более широкую их совокупность. Можно выделить две основные линии работ по искусственному интеллекту (ИИ). Первая связана с совершенствованием самих машин, с повышением "интеллектуальности" искусственных систем. Вторая связана с задачей оптимизации совместной работы "искусственного интеллекта" и собственно интеллектуальных возможностей человека.
Идея создания мыслящих машин "человеческого типа", которые, казалось бы, думают, двигаются, слышат, говорят, и вообще ведут себя как живые люди, уходит корнями в глубокое прошлое. Еще древние египтяне и римляне испытывали благоговейный ужас перед культовыми статуями, которые жестикулировали и изрекали пророчества (разумеется, не без помощи жрецов). В средние века и даже позднее ходили слухи о том, что у кого-то из мудрецов есть гомункулы (маленькие искусственные человечки) - настоящие живые, способные чувствовать существа [2]. В настоящее время роботы, системы распознавания образов, экспертные системы и т.д. вызывают у непосвященного тот же трепет и восторг перед «думающей» машиной.
Но не зря в свое время были заморожены некоторые исследования в области ИИ. Попытки создать машинный разум не удавались, и раз за разом энтузиазм ученых угасал, так как существующие на тот момент вычислительные средства не позволяли хотя бы приблизительно воссоздать взаимодействие нейронов головного мозга. Появление многопроцессорных систем и увеличение количества команд микропроцессоров и его тактовой частоты позволяет сейчас, на мой взгляд, «построить» приближенное мышление человека с использованием параллельных процессов и нейронных сетей.
Обращаясь к проблеме роли ИИ в обучении и образовании, будем рассматривает этот процесс как одну из разновидностей взаимодействия человека с ЭВМ, и раскрывать среди перспективных возможностей те, которые направлены на создание так называемых адаптивных обучающихся систем, имитирующих оперативный диалог учащегося и преподавателя-человека.
2.1 Методы и модели
Интеллектуальное тестирование предполагает наличие модели знаний, модели самого процесса тестирования и оценивания. Так можно охарактеризовать в общем все разработки в этой области. Рассмотрим некоторые из них более подробно.
2.1.1 Модели распознавания образа уровня знаний
Традиционная Российская система оценивания знаний обучаемых основана на лингвистических оценках, по которым устанавливается стипендия, производится учет успеваемости, проставляются записи в зачетных книжках за период обучения и др.
Вместе с тем, такая новая образовательная процедура как образовательное тестирование по альтернативному признаку предполагает оценивание уровня знаний в диапазоне от нуля до ста, что порождает проблему распознавания лингвистического образа знаний по результатам такого образовательного тестирования.
Под образом уровня знаний понимаются обучаемые, принадлежащие к множеству (группе), знания которых по “эталону уровня знаний” отнесены к лингвистическим оценкам неудовлетворительно (D), удовлетворительно (C), хорошо (B), отлично (A).
Под распознаванием образа уровня знаний понимается процедура принятия решения о принадлежности конкретного обучаемого к одному из указанных образов на основании сравнения его образовательных достижений при тестировании с характеристиками образа.
При тестировании по альтернативному признаку используется закрытая форма теста, характеристиками которой являются: функция плотности распределения неправильных ответов f(d), приемлемый уровень неправильных ответов q0, неприемлемый уровень неправильных ответов q1, риск заниженной оценки знаний a, риск завышенной оценки знаний b, функция оценивания знаний f(Q), объем образовательной информации N, объем выборки заданий теста n и критерий принятия решений в виде предельного числа неправильных ответов K.
Перечисленные характеристики являются взаимозависимыми, но не обладающими достаточным свойством четкости. В условиях их нечеткости для распознавания образа уровня знаний обучаемых вполне допустимо для нормально реализованной образовательной услуги принять модель распределения неправильных ответов по закону редких случайных событий Пуассона и функцию оценивания уровня знаний сформировать по этому же закону [8].
Поскольку образовательная информация в банке заданий теста N в их выборке n представляется как статистическая совокупность, а задания теста обучаемому в компьютерном варианте всегда для выполнения выдаются последовательно, то для распознавания образа уровня знаний возможно воспользоваться последовательным критерием Вальда. При этом примем дополнительное принципиальное условие, что задания теста однородны по количеству образовательной информации по конкретной учебной дисциплине, поскольку аналитических методов классификации заданий по мере их сложности или трудности пока не разработано.
Будем обозначать гипотезу о приемлемом уровне знаний H0, а гипотезу о неприемлемом уровне знаний H1. Пусть в результате последовательного поступления заданий теста в объеме n получены неправильные ответы d1, d2, d3…dn. При известной функции оценивания знаний по закону Пуассона последовательный критерий Вальда позволяет по выборке объемом n классифицировать обучаемых по уровню знаний на три подобраза по количеству областей принятия решений. Для того, чтобы иметь четыре образа необходимо произвести для каждой из трех областей повторное последовательное тестирование [7].
В предлагаемой процедуре рекомендуется использовать два способа распознавания образа уровня знаний: нормальный и усиленный. При этом задаются только четыре исходные характеристики теста q1, q0, a и b.
По нормальному способу по первой выборке заданий теста n1 производится классификация обучаемых на три предварительные области (уровни): низкая, нормальная и высокая. По второй выборке заданий теста n2=n1 или n2<n1 для уровня низкий ужесточаются исходные характеристики q0 и q1 и обучаемые аттестуются по трем образам D,C и B. Для нормального уровня ужесточаются характеристики a и b и обучаемые аттестуются по трем образам C,B и A. Для высокого уровня тестирование осуществляется без изменения исходным q0, q1, a и b и обучаемые аттестуются на два образа B и A. К достоинствам нормального способа относится то, что обучаемые по второй выборке могут существенно улучшить свои образовательные достижения, что отвечает требованиям закона «О защите прав потребителей продукции и услуг».
По усиленному способу по первой выборке обучаемые классифицируются только на два уровня: низкий и высокий. По второй выборке для низкого уровня ужесточаются характеристики q0 и q1 и обучаемые аттестуются только на два образа D и C. По второй выборке для высокого уровня ужесточаются характеристики a и b и обучаемые аттестуются только на два образа B и A. Достоинством усиленного способа является более уверенное распознавание образа уровня знаний и поэтому его рекомендуется использовать в тех случаях, когда снижено доверие к реализуемой образовательной услуге.
Существенным отличием предлагаемых методов распознавания образа уровня знаний при тестировании от известных является заранее заданная погрешность распознавания, заложенная в рисках принятия решений a и b, использование наиболее мощного критерия Вальда и достаточно простые и апробированные в статистическом приемочном контроле способы ужесточения планов тестирования, что позволяет использовать для решения практических задач распознавания образа уровня знаний международный стандарт ИСО 8423-91 «Статистические методы. Последовательные планы выборочного контроля по альтернативному признаку». Это способствует повышению достоверности компьютерного тестирования, что позволяет использовать предложенные теоретические разработки для обоснования методов оценивания знаний в предлагаемом едином экзамене довузовского образования, в процессе реформирования Российской системы образования [7].
2.1.2 Предметно - критериальная методика составления тестов
В каждом курсе есть ключевые моменты, особенно важные темы, без знания которых невозможно усвоение более сложного материала в процессе учебы или которые будут необходимы в работе по специальности. На устном экзамене при личном контакте со студентом преподаватель обязательно оценивает понимание студентом этих тем. При автоматизированном тестировании можно учесть важность каких-либо разделов курса, увеличив долю вопросов по этим разделам в общем количестве вопросов. Но это не всегда удобно для составителя теста, потому что не всегда наиболее важные разделы содержат больше всего материала.
Предлагаемая методика предусматривает учет таких параметров, как степень важности и объем изучаемого материала в разделах курса.
При составлении теста преподаватель делит курс на темы Т1, T2, …, Tk и оценивает степень важности Si и объем изучаемого материала Vi по каждой теме Ti. Количество вопросов ni по каждой теме Ti должно соответствовать (быть пропорционально) объему изучаемого материала Vi.
Минимальное количество вопросов ni по каждой теме Ti определяется в соответствии с методикой с учетом параметра Vi.
Знания по каждому разделу курса оцениваются по пятибалльной (а фактически по четырехбалльной) системе. Оценке «отлично» (5) соответствует вероятность правильного ответа от p3 до 1; оценке «хорошо» (4) соответствует вероятность правильного ответа от p2 до p3; оценке «удовлетворительно» (3) соответствует вероятность правильного ответа от p1 до p2; оценке «неудовлетворительно» (2) соответствует вероятность правильного ответа менее p1. Следует отметить, что вероятности р1, р2 и р3 (0< p1? p2? p3<1) задаются преподавателем с учетом структуры теста и могут быть изменены. Абсолютное количество (или доля) правильных ответов, достаточное для получения соответствующей оценки, определяется по специальной методике.
Минимальное количество вопросов по темам Т1, Т2, …, Тк определяется пропорционально их объемам, V1,V2, …, Vk.
По ответам студента вычисляется оценка Oi по каждой теме Ti (1 ? i ?k) как результат испытания статистических гипотез
При вычислении итоговой отметки за тест (курс) O учитывается степень важности Si каждого раздела Ti. Получившаяся итоговая оценка О округляется до целых.
Следует отметить, что описанная выше методика позволяет давать студентам тест поэтапно, по мере изучения и усвоения материала отдельных разделов курса, и выводить итоговую оценку с учетом результатов промежуточного тестирования [10].
2.1.3 Метод определения количества образовательной информации
Теория образовательного тестирования должна формироваться на частных законах и закономерностях таких научных направлений как информациология, общая статистика, статистический приемочный контроль, квалиметрия, педагогика, психология, исследование операций, теория принятия решений и др. Прямое применение теоретических разработок из указанных научных направлений не дает заметных практических результатов по оцениванию знаний по причине нематериальности знаний, как объекта исследований. Задачу формирования теории образовательного тестирования можно сформулировать как задачу поиска оптимальной структуры специфических законов и закономерностей тестологии, позволяющую оценить знания с заданной погрешностью.
Для решения задач подобного класса наиболее успешно используются генетические методы, основанные на реализации генетических алгоритмов, позволяющих осуществить направленный перебор частных законов и закономерностей по наиболее приемлемым направлениям для формирования отечественной теории образовательного тестирования.
В отличие от традиционного случайного поиска приемлемых решений, алгоритмы генетического поиска используют аналоги или близость имеющихся решений во многих областях знаний к поиску оптимального набора специфических законов, обеспечивающих объективность, достоверность и точность оценивания уровня знаний, воспроизведенных обучаемыми в процедурах тестирования. Такой направленный перебор частных законов является эволюционным и имеет очень много сходств с операторами, применяемыми в генетических алгоритмах и процедурах, происходящих с живыми организмами в природе.
Рассмотрим применение генетических алгоритмов для формирования специфического закона о количестве образовательной информации. Исходные популяции: Государственный образовательный стандарт, учебная программа, специфическая совокупность учебной информации, банк тестовых заданий. Репродукция: образовательная совокупность. Скрещивание: образовательная совокупность, статистическая совокупность. Мутация: образовательная совокупность информации.
Следующий генетический алгоритм направлен на поиск единицы образовательной информации. Исходные популяции: единица статистической совокупности, единица допуска, информацион. Репродукция: единица образовательной совокупности. Скрещивание: единица образовательной совокупности, единица допуска, информацион. Мутация: условная единица образовательной информации конкретной дисциплины.
Формирование специфического закона тестологии об образовательной информации: образовательная информация является первичной, поскольку независимо от образовательной услуги, формы теста, процедур тестирования и уровня подготовки обучаемых знания по конкретной дисциплине оцениваются только по их соответствию «образу знаний». Вся остальная информация является вторичной и третичной и не может претендовать на такую же роль как образовательная информация.
Любая информация, и в том числе образовательная, для ее последующего применения в заданиях теста должна быть представлена определенным количеством, рассчитанным с использованием условной единицы образовательной информации.
Следующий закон о сохранении образовательной информации определяет, что количество образовательной информации HQ и количество ее энтропии IQ величина всегда постоянная для всех процедур тестирования. Вычисление количества информации и количества энтропии производится по одной и той же формуле. При этом HQ вычисляют только после создания тестов, а IQ до их создания, что позволяет погрешности тестирования определить априорно. Такие вычисления невозможны без условной единицы образовательной информации, под которой понимается наиболее типичное и применяемое понятие в конкретной учебной дисциплине, поскольку обобщенного понятия пока получить не удается. Например, в материаловедении это «свойство материала», в технологии машиностроения это «операция». В последующем количество образовательной информации пересчитывается по аналогии.
Реализация указанных законов об образовательной информации позволяет с достаточной для практической цели точностью определять количество информации в банке тестовых заданий, в одном задании теста, в выборке заданий теста и в выборке выполненных тестов и обеспечивать соблюдение минимально необходимого соотношения между объемом выборки и банком тестовых заданий, соответствующего выбранной погрешности оценивания уровня знаний по образовательным тестам [11].
2.1.4 Информационно-генетические алгоритмы
Основные свойства образовательных тестов предлагается формировать на популяциях частных законов таких научных отраслей как: информациология; психология, педагогика и психодиагностика; логика; теория вероятностей; теория поиска; теория нечетких множеств; теория игр; теория статистических решений; приемочный выборочный контроль.
Эти популяции позволяют реализовать информационно-генетический алгоритм и получить новое поколение специфических законов теории тестирования о (об): первичности образовательной информации; «образе знаний», воссозданном по первичной информации; «образе уровня воспроизведенных знаний»; количестве и энтропии образовательной информации; единстве количества образовательной информации; минимально допустимом соотношении между количеством образовательной информации в «образе знаний» и в выборке заданий теста; условной единице образовательной информации; энтропии нормальной образовательной услуги; не материальности знаний, как объекта исследований; соответствии формы теста и признака оценивания; формах существования функции оценивания знаний; характеристиках доверия к результатам тестирования; правах тестируемых на получение объективной оценки уровня знаний; защите прав тестируемых при воспроизведении ими знаний по образовательным тестам; переходе количественных результатов тестирования в качество «уровня знаний».
В качестве примера рассмотрим применение информационно-генетических алгоритмов на трансформацию международных и отечественных стандартов ГОСТ Р50 779.71-99 и ГОСТ Р50 779.72-99 на статистический приемочный контроль, применительно к задачам тестирования, позволяющих предложить способы выделения «образов уровня знаний» при тестировании по двум независимым выборкам заданий теста закрытой формы, и применению традиционных лингвистических оценок: отлично (I), хорошо (II), удовлетворительно (III) и неудовлетворительно (IV) [12].
Исходные данные для реализации «образа уровня знаний»: N - объем банка заданий (образ знаний); n - объем выборки заданий; a -- риск занижения оценки; b -- риск завышения оценки; AQL(q0) - приемлемый процент неправильных ответов; RQL(q1) - неприемлемый процент неправильных ответов; С1 - приемлемое число неправильных ответов; степень тестирования - абсолютный объем выборки; уровень тестирования - соотношение между объемом выборки n и числом С в зависимости от предшествующих результатов ответа на задания теста; QL - предельный процент неподготовленных обучаемых, которые могут получить завышенную оценку.
Для нормальной образовательной услуги характерен нормальный процесс восприятия и воспроизведения знаний обучаемыми, нормальный «белый шум». В таких условиях неправильные ответы на задания теста предпочтительного соотношения 5-1 (пять ответов, из которых один правильный) вполне оправданно считать как редкие случайные события и функцию оценивания знаний сформировать по закону Пуассона.
Для конкретного примера задаем N=250; AQL=10%; RQL=20%; QL?10%; a<b; степень II по ГОСТ Р50 779.72-99. Объем первой выборки n1 =20 и критерии принятия решений C1<5, C2=6. Для второй выборки применяем усиленное тестирование n1 =20, C3< 3, C4=4, а для нормального тестирования оставляем исходный план n2 =20, C1< 5, C2=6.
По первой выборке уровень тестирования принят нормальный (классификация), а тестируемые разделяются на две группы: y -- недостаточная подготовка и A -- достаточная подготовка. По второй выборке (аттестация) для группы y тестирование производится по усиленному уровню (ужесточенному) и деление производится на два образа IV и III.
Для группы A уровень остается нормальным, но время на выполнение заданий сокращается. Тестируемые делятся на два образа II и I. Из схемы видно, что по второй выборке тестируемые получают возможность на улучшение результата, что реально защищает их права на объективность оценивания уровня знаний. Далее имеем скрещивание частных законов, которые проявляются в мутации специфического закона тестирования о переходе количества неправильных ответов в качество знаний, проявляющихся в лингвистической форме. Риски (ошибки) попадания в образы по второй выборке б=0,03, в=0,16. Предельный процент тестируемых с низким уровнем знаний, но получивших положительные оценки QL=q0=10%. Разработаны также методы выделения «образов уровня знаний» и для количественного признака, когда каждое выполненное задание имеет количественное значение в диапазоне [0, 1000], однако рамки статьи не позволяют привести такие примеры.
Таким образом, использование информационно-генетических алгоритмов для выделения необходимых свойств образовательных тестов в форме законов тестирования и их реализация для выделения «образа уровня знаний» наглядно показывает необходимость дальнейших исследований по их применению для решения новых задач по оценке уровня знаний в предстоящих единых экзаменах с целью повышения их объективности, достоверности, эффективности и социальной значимости [13].
2.1.5 Модель Раша
Система тестирования на основе модели Раша обладает важными достоинствами, среди которых, прежде всего, необходимо отметить следующие.
Модель Раша превращает измерения, сделанные в дихотомических и порядковых шкалах в линейные измерения, в результате качественные данные анализируются с помощью количественных методов. Это позволяет использовать широкий спектр статистических процедур.
Оценка трудности тестовых заданий не зависит от выборки испытуемых, на которых была получена и, аналогично, оценка уровня знаний испытуемых не зависит от используемого набора тестовых заданий.
Пропуск данных для некоторых комбинаций (испытуемый -- тестовое задание) не является критическим.
Сама система тестирования достаточно проста, по сравнению с другими аналогичными системами она характеризуется наименьшим числом параметров -- только один параметр уровня знаний для каждого испытуемого и только один параметр трудности для каждого задания.
Модель Раша опирается на четкие и конструктивные понятия "трудность задания" и "уровень знаний". Так, одно задание считается более трудным, чем другое, если вероятность правильного ответа на первое задание меньше, чем на второе, независимо от того, кто их выполняет. Аналогично, более подготовленный студент имеет большую вероятность правильно ответить на все задания, чем менее подготовленный.
Благодаря простой структуре модели существуют удобные вычислительные процедуры для многоаспектной проверки адекватности модели: для всего набора тестовых результатов, для каждого испытуемого, для каждого задания и для каждого конкретного ответа.
"Остатки", получаемые при аппроксимации результатов тестирования моделью можно использовать для выделения различных типов испытуемых.
Однако, несмотря на 40-летний опыт применения этой системы тестирования за рубежом во многих областях знания, прежде всего в образовании, медицине и психологии, до сих пор продолжаются дискуссии об истинной ценности и эффективности системы тестирования на основе модели Раша. До сих пор существуют две крайние точки зрения на эту модель тестирования.
Наиболее убежденные сторонники модели Раша утверждают следующее: "Можно ли собрать или построить или сформулировать данные так, чтобы они соответствовали определению измерения (модели Раша)? Если нет, -- то такие данные бесполезны".
Их наиболее последовательные оппоненты утверждают следующее: "Данные -- это данные, а модель -- это конструкция исследователя, которая подвержена ошибкам". Например, при построении регрессии, выбрасывая те или иные данные, можно получить любую зависимость, но мы тем самым ограничиваем реальный мир данных. Таким образом, мы создаем искусственную переменную, о которой мало что знаем.
Для практики одним из наиболее важных критериев является точность оценивания. Поэтому выбор темы в значительной степени обусловлен противоречивой информацией относительно точности системы тестирования на основе модели Раша. Кроме того, не удалось найти работы, в которых проведен всесторонний анализ точности модели Раша. В известных работах только даются те или иные общие рекомендации по использованию этих моделей.
Подобные документы
Функции, методы и средства контроля. Компьютерное тестирование. Интеллектуальное тестирование. Модели распознавания образа уровня знаний. Концептуальная модель адаптивного тестового контроля знаний. Организация контрольных работ.
реферат [74,1 K], добавлен 18.06.2007Принципы диагностирования и контролирования обученности (успеваемости) учащихся, последовательность контроля и оценки знаний и умений. Осуществление контроля знаний методом тестирования с использованием технических средств. Рейтинговая система контроля.
курсовая работа [62,4 K], добавлен 30.01.2013Контроль знаний - существенный элемент современного урока. Виды контроля результатов обучения. Методы контроля. Специфика контроля по русскому языку. Формы контроля знаний. Виды контроля знаний на уроках русского языка в национальной школе.
курсовая работа [50,4 K], добавлен 22.02.2007Проблема организации контроля знаний учащихся и правильной оценки уровня их знаний. Виды контроля. Роль и значение тематического контроля, обеспечивающие эффективность учебного процесса, пути и методы проведения тематического контроля знаний учащихся.
дипломная работа [86,3 K], добавлен 01.05.2008Принципы получения объективной оценки знаний студентов. Способы оценивания и контроля результатов их обучения. Методы оценивания практических работ учащихся СПО в дизайн-образовании. Принципы построения системы непрерывного контроля знаний студентов.
курсовая работа [3,3 M], добавлен 17.12.2012Значение, задачи, функции контроля знаний. Содержание, типы и виды, формы и методы контроля знаний. Применение различных форм и методов проведения тестов при изучении раздела "Общая биология". Разработка и апробация вариантов проверки знаний в 9-м классе.
дипломная работа [337,3 K], добавлен 16.03.2014Изучение методов учета и контроля знаний студентов по модульно-рейтинговой системе. Характеристика критериев письменного экзамена и принципов получения объективной оценки. Исследование правил построения системы непрерывного контроля знаний студентов.
курсовая работа [301,9 K], добавлен 27.03.2010Контроль знаний, умений и навыков студентов: виды, методы. Рейтинговая система обучения. Педагогические условия организации эффективного контроля знаний в высших учебных заведениях. Диагностическая, обучающая, развивающая, воспитательная функции контроля.
реферат [645,6 K], добавлен 06.10.2016Качество знаний, его главные параметры. Функции и виды контроля знаний в педагогическом процессе. Экспериментальная проверка знаний и умений учащихся. Контроль знаний учащихся как элемент оценки качества знаний. Уровни контроля и проверки знаний по химии.
курсовая работа [33,0 K], добавлен 04.01.2010Контроль знаний как существенный элемент современного урока. Место контроля знаний и умений учащихся на уроках литературы. Технология контрольно-оценочной деятельности учителя. Традиционные и нетрадиционные формы контроля знаний и умений учащихся.
курсовая работа [107,4 K], добавлен 01.12.2011