Разработка базы данных тестовых заданий по дисциплине "Интерфейсы периферийных устройств"
Целеполагание и планирование при разработке критериально-ориентированного теста. Бально-рейтинговая система. Анализ дидактических единиц и ранжирование материала по уровням сложности. Формирование базы данных. Технико-экономическое обоснование проекта.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 29.08.2012 |
Размер файла | 3,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Введение
При формировании мирового образования (образование перестает быть внутренним делом отдельной страны) необходимо выработать единые стратегии в оценке качества образовательных услуг. Система оценивания знаний и умений, имеющаяся в каждой стране, уже не является статичной, замкнутой в себе самой. Однако реформирование системы образования невозможно без реформирования системы оценивания, контроля качества образования.
В настоящее время важное значение приобретает культура оценки и оценивания качества обучения. Оценивание - это процесс сбора и обработки действенной и надежной информации, которая позволяет участникам образовательного процесса принимать решения, необходимые для совершенствования работы и достижения лучших учебных результатов. Своеобразной базой данных для оценивания являются государственные стандарты, программы для преподавателя и для студента. Механизмами же контроля и оценки эффективности образовательного процесса становятся тесты.
В настоящий момент в системе образования России параллельно с традиционной системой оценки и контроля результатов обучения сложилась новая парадигма - тестирование. Это вызвано потребностью общества в получении независимой, объективной информации об учебных достижениях обучаемых.
Разработками технологий компьютерного обучения и контроля занимаются практически все наиболее оснащенные техникой вузы и центры информационных технологий. Среди основных проблем разработки и внедрения технологий компьютерного обучения и контроля можно выделить несколько:
· неоднозначность терминологии;
· непроработанность методики создания контролирующих материалов для компьютерного тестирования;
· отсутствие единого методического центра компьютерного тестирования, который мог бы взять на себя общее методологическое руководство проблемой исследования.
Требования к программно-дидактическим контролирующим материалам для компьютерного тестирования разработаны в целях осуществления единого подхода в области конструирования контролирующих заданий и формирования фонда контрольных заданий для проведения контроля остаточных знаний и получения объективных оценок уровня знаний, умений и навыков (учебных достижений).
Выработка единых требований способствует унификации компьютерных дидактических материалов.
Проведение компьютерного контроля знаний обучающихся является основой получения объективной независимой оценки уровня учебных достижений (знаний, интеллектуальных умений и практических навыков) обучающихся, а также предоставления органам управления университета достоверных и своевременных результатов оценки уровня подготовленности обучающихся по образовательным программам, составленным в соответствии с Государственным образовательным стандартом (ГОС). Анализ результатов компьютерного контроля остаточных знаний позволяет выработать рекомендации прогностического характера по совершенствованию преподавания проверяемых учебных дисциплин.
С учетом сказанного была сформулирована тема дипломной работы.
Тема дипломной работы: "Разработка тестовых заданий для Интерфейсов периферийных устройств".
Предметом дипломной работы являются теоретические и практические аспекты разработки тестовых заданий по дисциплине «Интерфейсы периферийных устройств» в вузе и условия их реализации на этапе построения теста.
Целью работы является разработка базы данных тестовых заданий по дисциплине «Интерфейсы периферийных устройств» в вузе.
Гипотеза дипломной работы: методика разработки тестов по дисциплине «Интерфейсы периферийных устройств», в основу которой положены принципы отбора содержания тестовых заданий (значимость, научная достоверность, репрезентативность, вариативность), принципы построения тестовых заданий (взаимосвязь содержания и формы задания, логической определенности) позволит улучшить качественные характеристики построенных тестов и получить объективные результаты оценивания знаний обучаемых.
Задачи дипломной работы:
1) анализ методической литературы по теме дипломной работы;
2) проведение анализа содержания учебных пособий по дисциплине «Интерфейсы периферийных устройств»;
3) построение теоретических основ разработки тестов по дисциплине «Интерфейсы периферийных устройств»;
4) построение системы тестовых заданий и тестов по разделам дисциплины «Интерфейсы периферийных устройств».
Научная новизна дипломной работы заключается в разработке базы тестовых заданий, в основу которого положено содержание дисциплины «Интерфейсы периферийных устройств».
Глава 1. Методология разработки тестов для бально-рейтинговой системы
При разработке методики будем исходить из того, что под критериально-ориентированным тестом следует понимать систему заданий, позволяющую измерить уровень учебных достижений относительно полного объема знаний, умений и навыков, которые должны быть усвоены студентами.
Полный объем знаний, умений и навыков, которые должны быть усвоены в результате изучения курса обучения и овладение которыми измеряется тестом, называется областью содержания теста. С ней необходимо соотнести учебные достижения отдельных студентов, чтобы определить, какую долю учебного материала они усвоили. Выполнение критериально-ориентированного теста описывается в терминах содержания учебной дисциплины.
Методика предполагает разработку критериально-ориентированных тестов (mastery tests) используемых для классификации студентов, разделения их на группы на основании заранее выбранного критерия. В качестве таких критерие, рассматривается возможность выделения четырех групп студентов - не усвоивших, слабо усвоивших, хорошо усвоивших и полностью на отлично усвоивших содержание учебной дисциплины. Для отнесения к определенной группе студент должен достичь необходимого минимального для этой группы уровня овладения учебным материалом. Этот уровень устанавливается разработчиком теста и является критерием, на основании которого принимается решение относительно испытуемого. В тесте, критерий выражается определенным количеством заданий, выполнение которых позволяет отнести его в одну из указанных групп.
Целеполагание и планирование при разработке критериально-ориентированного теста
Разработка теста начинается с формулирования его цели, то есть определения того, что тест должен измерять. В случае создания теста по «интерфейсам периферийных устройств» измерению подлежат учебные достижения студентов технического университета по итогам изучения как отдельных разделов, так и всего курса названной дисциплины.
Первоначально цель тестирования формулируется в общем виде. Для того чтобы приступить к разработке тестовых заданий, необходимо ее конкретизировать. Должны быть четко и однозначно описаны все знания, умения и навыки, владение которыми проверяется с помощью теста, т.е. необходимо четкое описание области содержания теста. Если измеряется владение каким-либо одним видом знаний или умений, то такой тест называется гомогенным. Если измеряется владение разнородными знаниями, умениями, навыками, то такой тест называется гетерогенным. Описание области содержания гетерогенного теста обычно бывает намного объемнее, чем описание области содержания гомогенного теста. В любом случае требуется максимально четкое описание того, что должен знать и уметь студент.
При разработке гомогенного теста легче добиться адекватной репрезентации области содержания. Поэтому удобнее разрабатывать тесты для проверки элементарных знаний, умений и навыков. Однако такие тесты имеют узкую сферу применения, когда необходимо оценить степень усвоения небольших разделов учебной дисциплины. Для того чтобы в гетерогенном тесте адекватно отразить область содержания, существуют два способа.
Первый способ состоит в том, что в тест включаются разнородные по содержанию задания и выполняются следующие требования.
Во-первых, в тесте пройденный учебный материал представляется в полном объеме, включаются все разделы изученной дисциплины, проверяются все знания, умения и навыки, которые должны быть приобретены студентами.
Во-вторых, разделы изученной дисциплины представляются в тесте пропорционально их удельному весу в учебном курсе: наиболее важные и объемные разделы представляются большим количеством заданий и наоборот.
В-третьих, тестовые задания должны однозначно относиться к области содержания теста так, чтобы для правильного ответа на задание было достаточно владения только тем материалом, который изучался.
Второй способ заключается в том, что гетерогенный тест составляется из гомогенных субтестов, каждый из которых измеряет владение только отдельным видом знаний или умений. При этом необходимо, чтобы набор cvб-тестов и тестовых заданий удовлетворял тем же требованиям, которые были перечислены выше в первом способе. Суммарный балл получается путем сложения баллов, полученных за выполнение каждого субтеста. Преимущество второго способа состоит в том, что баллы по субтестам позволяют проводить диагностику трудностей в обучении, выявляя разделы, хуже усвоенные студентами.
После формулирования цели теста и ее конкретизации в виде отдельных знаний, умений и навыков, переходят к разработке спецификации теста.
Спецификация теста представляет собой набор описательных схем, которые позволяют установить соответствие между тестовыми заданиями и областью содержания теста. Она обеспечивает репрезентативность заданий по отношению к области содержания. Спецификация пишется на предельно операциональном языке и представляет собой, по сути, правила, по которым могут разрабатываться задания. При разработке спецификации необходимо стремиться сделать эти привила настолько четкими, чтобы их можно было использовать как алгоритмы.
Спецификация является основным нормативным документом теста и выполняет следующие основные функции:
- дает разработчику заданий правила, по которым можно конструировать задания;
- позволяет экспертам оценивать имеющиеся задания на предмет их соответствия области содержания теста и выбраковывать неудачные задания;
- помогает интерпретировать результаты тестирования, так как в ней ясно и конкретно объясняется, что измеряет тест;
- дает студенту (пользователю теста) четкое представление об измеряемых знаниях, умениях и навыках.
Основная проблема при написании спецификации состоит в обратном соотношении между широтой области содержания теста и четкостью спецификации. Если выбирается очень узкая область содержания, то довольно просто создать спецификацию, которая была бы краткой и в то же время четко задавала бы правила для написания заданий. Однако тесты с узкой областью содержания имеют ограниченное применение.
Предлагаемая ниже схема составления спецификации может включать пять (иногда шесть) разделов.
1. Общее описание. Оно состоит из одного-двух предложений, описывающих, что измеряет тест. Более детальное представление о предмете измерения можно получить, ознакомившись со всей спецификацией.
2. Пример инструкции и тестового задания. Здесь дается представление о том, как выглядит тест, и какая форма заданий в нем используется.
3. Характеристика формы заданий. В этом разделе указывается какие формы заданий используются в тесте.
4. Характеристика содержания заданий. Указывается содержание, которое может и должно входить в тестовые задания. Подробно описываются все аспекты содержания, представляющиеся существенными при разработке заданий, в том числе обычно указывается, какое смежное содержание не должно входить в тест.
5. Характеристика ответов. Содержание этого раздела зависит от выбора формы задания. Для заданий закрытой формы даются правила, по которым формулируются правильные ответы и варианты неправильных ответов. Для заданий открытой формы даются, если это необходимо, критерии для оценки ответа испытуемого как правильного. Для заданий на установление соответствия и на установление правильной последовательности данный раздел может не заполняться. Если выполнение заданий оценивается более сложным способом, чем присвоение баллов 0 или 1, то этот способ также указывается в данном разделе.
6. Дополнительный раздел. Он используется в тех случаях, когда в тест входит достаточно большой объем однородного материала. Перечень однородных элементов содержания выносится в данный раздел, чтобы не загромождать другие разделы спецификации.
После составления спецификации разрабатывается план теста. Если, например тест состоит из четырех разделов, то вначале делается примерная раскладка необходимого числа заданий на каждый раздел, исходя из общего предельного числа, обычно не превышающий 30-60 коротких заданий разного уровня сложности. Число заданий, выделяемых на каждый раздел, зависит от его важности в изучении дисциплины (см. пример табл. 1).
Таблица 1. Пример раскладки заданий
Разделы учебной дисциплины |
Количество заданий |
% к общему числу заданий |
|
I |
12 |
20 |
|
II |
18 |
30 |
|
III |
24 |
40 |
|
IV |
6 |
10 |
|
Итого |
60 |
100% |
После разбивки заданий разрабатывается перечень задач, которые ставятся перед тестированием, например: А - умение давать определения; Б - знание законов, принципов, правил; В - умение применять их для решения предложенных примеров; Г - умение находить сходство и различия; Д - умение представлять материал в различных презентабельных формах. Если на проверку умения А отвести, к примеру 10% всех заданий, Б и В - 30%, Г - 20% и Д - 10%, то общая раскладка числа заданий для рассмотренного примера принимает вид, представленный в таблице 2.
Таблица 2. Общая раскладка числа заданий
Умения и % заданий по их проверке |
Номера разделов, процент и число заданий |
Всего для проверки каждого умения |
||||
I-20% |
II-30% |
III-40% |
IV-10% |
|||
А-19% |
1 |
2 |
2 |
1 |
6 |
|
Б-30% |
4 |
5 |
7 |
1 |
17 |
|
В-30% |
4 |
5 |
7 |
2 |
18 |
|
Г-20% |
2 |
4 |
5 |
1 |
12 |
|
Д-29% |
1 |
2 |
3 |
1 |
7 |
|
Итого заданий |
12 |
18 |
24 |
6 |
60 |
Принципы разработки тестовых заданий
При разработке тестовых материалов выделяют следующие принципы:
· Соответствие содержания целям проверки;
· Принцип соответствия содержания заданий материалу, представленному в Государственном образовательном стандарте;
· Принцип полноты и значимости;
· Принцип научности;
· Принцип достоверности тестирования;
· Вариативность содержания тестов;
· Объективности оценки результатов тестирования
Остановимся на выделенных принципах более подробно: Принцип постановки целей обучения. Выделяют следующие основные категории учебных целей:
· Знания-запоминания и воспроизведение учебного материала;
· Понимание-преобразование материала из одной формы выражения в другую;
· Применение-умение использовать изученный материал в конкретных условиях и новых ситуациях;
· Анализ-умение разбить материал на составляющие так, чтобы ясно выступала его структура;
· Синтез-умение комбинировать элементы для получения целого, обладающего новизной;
· Оценка-умение оценить значение того или иного материала для конкретной цели.
Принцип соответствия содержания заданий тестирования материалу, представленному в Государственном образовательном стандарте, является очень важным принципом при разработке тестовых заданий. Следовательно, проверка уровня подготовленности студентов в соответствии с требованиями Государственного образовательного стандарта, что является главной целью контроля остаточных знаний студентов.
Принцип полноты при постановке контролирующих заданий удобно рассматривать в традиционном подходе - контроля знаний, умений, навыков.
Проверка знаний должна включать:
· Знаний научных и иных проблем по изучаемой теме;
· Знаний фактов, их причин, различий;
· Знаний фундаментальных понятий по теме, их определений, представление об объеме и содержании понятий, знаний и практических применений понятий;
· Знание основных знаний, закономерностей и законов, их формулировок, условий и границ проявления, специфики применения;
· Знание теорий, опытных фактов, послуживших основой их разработки, основных положений, уравнений, доказательств, выводов, практических приложений, прогностических возможностей
Проверка умений должна включать:
· Владение фактами: установление их причин, взаимосвязей;
· Владение проблематикой: формулирование проблемы по теме, умение отыскивать возможные пути решения проблемы;
· Владение понятиями: узнавание, определение понятий, раскрытие их объема, характеристика количественного состава объектов, их классификация, взаимосвязи, практическое применение понятий;
· Владение правилами: закономерностями и законами: узнавание, формулирование, раскрытие содержания, раскрытие действий, связанных с применением;
· Владение теориями: узнавание, отыскивание опытных фатов, необходимых для разработки теории, раскрытие содержания теории (характеристика основных положений, уравнений, доказательств, выводов, осуществление на основе теории практических действий).
Проверка навыков должна включать:
· Построение и осуществление алгоритма операций выполнения конкретных действий в структуре умения;
· Моделирование практического выполнения действий, составляющих данное умение;
· Выполнение комплекса действий, составляющих данное умение;
· Самоанализ результатов выполнения действий в соответствии с целью деятельности
Проверка усвоенных способов деятельности:
· Узнавание, раскрытие содержания (характеристика действий и операций, составляющих сущность) методов и процедур;
· Владение методами и процедурами, связанными с получением знаний и их обработкой;
· Применение методов и процедур в различных вариантах последовательности их действий и в новых условиях;
· Характеристика условий и границ применимости методов и процедур;
· Сравнение объектов, характеристик процедур;
· Обобщение признаков явлений, процессов, объектов;
· Объяснение причин выбора определенных технологических условий (сырья, оборудования и т.д.);
· Объяснение следствий изменения условий протекания процессов;
Принцип полноты и значимости теста должны обеспечиваться включением в тест тех элементов знания, которые относятся к ключевым по данной специальности, без этих знаний обучение является неполным, с многочисленными пробелами.
Принцип научности. Безусловно, важный принцип, который должен обеспечивать соответствие тестовых заданий уровню развития науки и требованиям общества, что особенно важно на современном периоде развития информатизации образования и всех сторон жизни мирового сообщества. Включается в тест только то содержание дисциплины, которое является объективно истинным. Субъективное мнение преподавателя, не подкрепленное юридической (имеющей соответствующую нормативную поддержку) стороной и имеющее спорные точки зрения, не должно включаться в тестовые задания.
Принцип достоверности тестирования. Контролирующий материал для любого тестирования должен обеспечивать адекватность результатов проверки изученному материалу, поэтому нужно очень тщательно проработать все тестовые задания, чтобы проверка осуществлялась в соответствии с целями и содержанием обучения. Кроме того, сама система тестирования (компьютерного или бумажного) должна обеспечивать достоверность самого процесса тестирования, в который вкладывают следующий смысл: сведение к минимуму случайности оценки действий студентов; исключение несанкционированного доступа как к материалам тестирования, так и к самому процессу тестирования (защита полученных результатов тестирования); корректный перевод шкалы оценивания результатов тестирования и выставления соответствующей оценки. Вариативность содержания теста. Содержание теста должно зависеть от развития науки, научно-технического прогресса, от нового содержания учебной дисциплины и новых учебников. С изменением содержания учебной дисциплины должно изменяться и тестовое задание в соответствии с контингентом испытуемых, их уровнем подготовленности, степенью обученности и индивидуальными особенностями студентов. Объективность оценки результатов тестирования. Более объективным оцениванием отличается компьютерное тестирование, т.к. по самой сути исключает с одной стороны влияние преподавателя, его эмоциональность, субъективное отношение к студенту, что сказывается положительно на психологический климат самого процесса контроля.
Вместе с этим тест должен удовлетворять всем необходимым критериям, обладать высокой надежностью и удовлетворительной валидностью. Описываемый этап разработки теста включает в себя как само написание заданий, так и их анализ экспертными методами для выявления наилучших и выбраковки неудачных.
Выделяют две группы методов анализа заданий: экспертные и математические. Математические методы применяются после проведения тестирования на основании полученного эмпирического материала, поэтому о них речь пойдет ниже. Сразу же после написания заданий их анализ проводится экспертными методами, которые позволяют оценить, в какой степени задания соответствуют по содержанию предмету измерения, т.е. действительно ли задания позволяют измерить именно те знания, умения и навыки, для которых разрабатывается тест. С другой стороны, экспертные методы анализа позволяют оценить задания с точки зрения их формы. В основе экспертных методов лежит соотнесение содержания и формы заданий с требованиями, изложенными в спецификации.
Приведем наиболее простую и в то же время достаточно эффективную процедуру анализа заданий с помощью экспертных методов. Как следует из названия, оценка заданий проводится экспертами. Чем больше количество экспертов, тем точнее оценка. На практике, если не предполагается очень широкое использование теста, вполне достаточно 4-5, в крайнем случае, 2-3 экспертов. В качестве экспертов должны выступать опытные преподаватели дисциплины, для которой разрабатывается тест. В предлагаемой процедуре в работе экспертов слиты воедино разработка заданий и их анализ.
Работа экспертов начинается с внимательного ознакомления со спецификацией теста. После этого эксперты приступают к разработке заданий на основе спецификации. Каждый должен написать столько заданий, сколько предполагается включить в тест. Таким образом, исходное количество заданий оказывается как минимум на 30% больше нужного, что дает возможность выбраковывать неудачные задания или создавать несколько вариантов теста, называемых тестовыми формами. При этом каждый эксперт отбирает задания по степени их трудности и различающей способности для включения в один из трех разделов теста - задания для слабых, хороших и сильных студентов. После этого каждому эксперту даются задания, разработанные другими экспертами. Он их оценивает на предмет соответствия требованиям спецификации, ГОС ВПО и программе изучения курса, а также включения в один из трех разделов теста. Задания, к которым не высказал замечаний ни один из экспертов, могут включаться в тест. Остальные задания нужно или улучшить путем переформулирования, или совсем исключить из дальнейшей работы.
После разработки и проведения экспертного анализа заданий получается первый вариант теста. Как правило, этот вариант бывает еще очень несовершенным. Чтобы повысить его качество, используются математические методы. Для применения этих методов нужен эмпирический материал - результаты реальной проверки (апробации) теста в студенческих группах, которое называют пилотажным тестированием. После пилотажного тестирования осуществляется анализ тестовых заданий с использованием математических методов. Только после этого окончательно решается вопрос о включении того или иного задания в состав теста.
Оценка качества тестовых заданий
Анализ заданий математическими методами позволяет получить информацию об их скрытых дефектах, которые не удается выявить с помощью экспертных методов. Сведения о характеристиках заданий, получаемые с помощью математического анализа, позволяют конструировать тесты с желаемыми статистическими свойствами. Особенно важна информация о характеристиках заданий при конструировании параллельных или эквивалентных форм теста, которые используются для оценки надежности теста и в практическом тестировании.
Среди многих характеристик, получаемых в результате математического анализа заданий наиболее важными являются две - трудность задания и различающая способность задания.
Трудность задания U является традиционным показателем при анализе задания. Трудность заданий теста - это характеристика задачи (пункта) теста, отражающая статистический уровень ее решаемости в данной выборке стандартизации. Обычно она оценивается при сравнении числа испытуемых, правильно выполнивших задание, к общему числу испытуемых. Этот показатель меняется в пределах от 0 до 1. Его значения тем больше, чем выше трудность задания. При разработке критериально-ориентированных тестов показатель трудности используется с целью конструирования тестов с желаемым уровнем трудности. Для повышения трудности теста в него включают больше заданий высокой трудности, а для понижения трудности - больше заданий низкой трудности.
Принято выделять субъективную и статистическую (объективную) трудности. Субъективная трудность задания связана с индивидуальным барьером, величина которого определяется как обстоятельствами (лимитом времени, доступностью инструкции и т. д.), так и уровнем сформированности необходимых для решения знаний, умений и навыков, психическим состоянием испытуемого и рядом других факторов. Воздействие комплекса этих факторов на результат выполнения теста снижает надежность и достоверность данных, поэтому важно принимать меры для выравнивания их воздействия с помощью направленного комплектования выборки и стандартной процедуры проведения тестирования.
Показателем трудности заданий как статистической трудности является доля лиц выборки, решивших и не решивших задание. Например, если только 15% студентов решили задачу, ее можно оценить как трудную для данной группы, если 85% - как легкую. Трудность заданий теста является относительной характеристикой, поскольку, зависит от особенностей выборки (возрастные, профессиональные, социально-культурные различия).
Подбор заданий по показателю трудности важен для успешного применения диагностической методики. Так, при выборе слишком трудных заданий валидность и надежность теста резко снизятся (ухудшение статистических характеристик оценивания из-за небольшого числа правильных решений, вероятность случайной оценки, влияние неудач на работу испытуемых). Слишком простые задания приведут к однообразию результатов (большинство справляется со всем набором пунктов теста), их незначительной вариативности, затрудняющей оценивание, могут вызвать негативное отношение к тесту.
Основная задача анализа трудности заданий теста сводится к выбору оптимальных по сложности пунктов теста, а значит, и упорядочиванию, отдельных заданий в нем. Обычно, если задачу решает большинство студентов, ее (как легкую) помещают в начале теста, если задачу решает незначительный процент испытуемых, то ее (как трудную) помещают в конце теста. Одну - две самых легких задач ставят перед основными задачами теста и используют в качестве примера. Расположение заданий по возрастанию степеней трудности, выраженных долей или процентом лиц данной выборки, решивших соответствующую задачу, позволяет примерно определить порог трудности для индивидуального испытуемого, характеризующий его место в группе.
Основным показателем трудности заданий теста является индекс трудности (Ui), вычисляемый по формуле:
Ui = (1 - Np/N)*100%,
где Ui - индекс трудности задания в процентах; Np - число студентов, правильно решивших задачу; N - общее число студентов.
Практика тестирования свидетельствует, что максимум информации об индивидуальном уровне знаний, навыков и умений студентов обеспечивают задания средней трудности (50%).
Различающая способность задания при разработке тестов является особенно важной характеристикой, так как от нее в значительной степени зависит валидность теста. Эта характеристика показывает, насколько эффективно тестовое задание различает студентов, овладевших и не овладевших учебным материалом.
Показатели различающей способности задания также вычисляются на основании проведения пилотажного тестирования. Эти показатели требуют для расчета проведения двух серий измерений: повторного тестирования одной группы студентов или проведения теста на двух разных группах. При разработке теста для одной или небольшого количества групп удобнее всего получить две серии измерений путем формирования контрастных групп. Эксперт выбирает из группы только тех студентов, про которых он может определенно утверждать, что они овладели или не овладели учебным материалом. Овладевшие материалом составляют "высокую" контрастную группу, а не овладевшие - "низкую" контрастную группу. Студенты, находящиеся в промежуточной стадии, не включаются в контрастные группы. Важно, чтобы контрастные группы были, по возможности, эквивалентны по составу. Это значит, что в них в одинаковой пропорции должны быть представлены студенты разных возрастов, оба пола, с разным уровнем одаренности, представители разных социальных групп населения и т.д.
К сожалению, метод контрастных групп не может использоваться, если подавляющее большинство студентов твердо овладели или совсем не овладели учебным материалом. Тогда для получения двух серий измерений приходится прибегать к методам, более сложным организационно. Во-первых, можно протестировать одну и ту же группу студентов до и после обучения. Во-вторых, можно протестировать две группы (эквивалентные по составу подобно контрастным группам), одна из которых прошла курс обучения, а вторая - нет.
Самый простой и известный показатель различающей способности задания по отношению к обучению D вычисляется как разность между долей испытуемых из "высокой" группы, правильно выполнивших задание и долей испытуемых из "низкой" группы, тоже правильно выполнивших задание. Данный показатель высчитывается по следующей формуле
D = n1/N1 - n2/N2,
где D - показатель различающей способности; N1, N2 - количество испытуемых, попавших соответственно в "высокую" и "низкую" контрастные группы; n1 и n2 - количество испытуемых, правильно выполнивших задание, соответственно из "высокой" и "низкой" групп.
Показатель может принимать значения от -1 до +1. D - равный «+1» означает, что задание обладает максимальной различающей способностью. D равный «0» означает,что задание совершенно не различает испытуемых, овладевших и не овладевших учебным материалом. Если D - равный «-1», что встречается очень редко, то задание различает испытуемых, но инверсированно: правильно отвечают не овладевшие материалом, а овладевшие материалом отвечают неправильно. Существование таких заданий может свидетельствовать о своеобразной не адекватной структуре знаний у студентов.
Оценка валидности и надежности теста
В тестологии существуют две категории, связанные с качеством теста как инструмента измерения. Это валидность и надежность. Обычно валидность и надежность оцениваются с помощью математических методов и выражаются в специальных показателях.
Валидность теста выражает степень, в которой тест измеряет именно то, что он должен измерять. Разработчики не могут быть a priori уверены, что тест измеряет именно то, что должен. Намного проще формулировать цель, предмет измерения теста, чем подобрать тестовые задания таким образом, чтобы тест действительно измерял именно то, что необходимо разработчикам. Валидность теста - понятие, указывающее, что измеряет тест и насколько хорошо он это делает. Валидность по содержанию, в сущности, означает систематическую проверку содержания теста с тем, чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области знаний, навыков или умений.
Процедура валидизации обычно применяется при оценке педагогических тестов, предназначенных для измерения того, насколько индивид овладел конкретными навыками или учебным предметом. В этом случае возникает проблема адекватности выборки всего множества заданий, поэтому тестируемая область знаний навыков или умений должна систематически проверяться с тем, чтобы существовала уверенность, что задания теста охватывают все ее главные аспекты и в правильной пропорции. Тест легко перенасытить теми аспектами исследуемой области, по которым легче составить объективные задания. Поэтому рассматриваемое содержание следует фиксировать заранее, а не после того, как тест уже составлен. Правильно составленные педагогические тесты должны соответствовать не только предмет обучения, но и его задачам. Содержание, следовательно, необходимо определять достаточно широко, включая в него помимо знания фактического материала такие важнейшие цели обучения, как применение изученных принципов и интерпретацию данных. Кроме того, валидность содержания больше зависит от релевантности тестовых ответов индивида, рассматриваемой в сфере обучения, чем от очевидной релевантности содержания тестовых заданий. Простая проверка теста может и не выявить те процессы, которые действительно обеспечивают выполнение теста студентом. Важно также избежать неоправданного обобщения выбранной темы тестирования. Если, например, орфографический тест с множественным выбором ответов измеряет способность распознавать правильно и неправильно написанные слова, то из этого не следует, что он также измеряет способность правильно написать диктант, количество орфографических ошибок в сочинении и другие аспекты грамотности письма.
В самом общем понимании валидность характеризует сам измерительный инструмент, и проверка этого аспекта валидности называется теоретической валидизацией. Проверка эффективности и точности этого инструмента есть второй аспект валидности и называется прагматической (или практической) валидизацией. При подборе внешнего критерия необходимо соблюдать принцип его релевантности изучаемому признаку, т.е. между диагностируемым свойством и жизненно важным критерием должно быть смысловое соответствие. Если, например, разрабатывается тест для измерения особенностей развития личностных качеств, то для критерия необходимо найти такую деятельность или отдельные операции, где именно эти качества реализуются.
Прогностическая валидность теста зависит не только от надежности теста, но и от надежности критерия. В практике не всегда удается подобрать высоконадежный критерий, а так как тесты подбираются по критерию, то часто возникает вопрос - какой валидностью обладал бы тест, если бы надежность критерия была максимальной, равной единице?
В критериально-ориентированном измерении проблема обеспечения достаточной валидности стоит не очень остро. Валидность теста обуславливается валидностью отдельных заданий. Если составление спецификации, разработка и экспертный анализ тестовых заданий были проведены достаточно качественно, то это уже обеспечивает высокий уровень валидности. Для педагогического тестирования, различающая способность заданий практически тождественна их валидности. Поэтому отбор заданий с высокой различающей способностью также способствует повышению валидности теста.
В критериально-ориентированных тестах критерием их валидности является собственное содержание теста, одобренное опытными экспертами. При этом у эксперта должна быть уверенность в том, что:
· задания теста находятся в соответствии с ГОС ВПО и программой учебной дисциплины;
· задания теста охватывают не один какой-либо раздел, а всю программу курса;
· высока вероятность того, что студент, успешно ответивший на определенные задания теста, знает учебный предмет в соответствии с установленным стандартом.
Перечисленные пункты объединяются общей идеей - содержит ли тест задания, пригодные для оценки знаний по конкретной учебной дисциплине? Если в результате статистической проверки выявляется, что ответы на задания теста позволяют обоснованно судить о знаниях студентов, то считается, что тест валиден по содержанию.
При оценке теста на валидность необходимо выбрать контрольную группу студентов и провести оценку их знаний, навыков и умений по дисциплине как с использованием разработанного теста, так и с помощью экспертных оценок, выставленных преподавателем-экспертом традиционным образом без использования теста. После чего результаты студентов по вопросам теста и по оценкам экспертов оценивают с точки зрения их корреляции. Мера согласованности оценок по тесту и по экспертным суждениям указывает на меру валидности.
Что касается величины коэффициентов валидности. то она по разным причинам всегда ниже, чем коэффициент надежности. По мнению ведущих диагностов, низким признается коэффициент валидности порядка 0.20 - 0.30, средним - 0.30 - 0.50, высоким - выше 0.60.
В дальнейшем, когда отобраны валидные задания, в качестве критерия можно брать суммарный индивидуальный балл испытуемых по всем заданиям. Вновь вводимое в тест задание должно коррелировать с этим критерием.
Надежность теста. Под надежностью понимают согласованность результатов проведения теста на одной и той же группе испытуемых при разных условиях. Согласованность результатов нескольких тестирований - это их идентичность. Категория надежности тесно связана с точностью измерения: чём выше надежность теста, тем точнее результаты измерения.
Существует несколько типов надежности и, соответственно, несколько методов ее определения. Степень надежности теста выражается в специально разработанных показателях надежности.
Следует отметить, что высокое качество проведения отбора содержания для теста, составления спецификации, разработки тестовых заданий и их анализа способно обеспечить достаточно высокую надежность. Поэтому, если нет возможности использовать сложные математические методы, рекомендуется обратить особое внимание на вышеуказанные процедуры. Среди методов оценки надежности критериально-ориентированных тестов встречаются как очень сложные вычислительно и концептуально, так и довольно простые. Этот вид критериально-ориентированных тестов, используемый для разделения учащихся на группы по уровню их учебных достижений, чаще применяется на практике. Поэтому ниже будет дано описание наиболее простых и доступных методов оценки надежности критериально-ориентированных тестов.
Первый метод. Обычно для оценки надежности тест проводят два раза и сравнивают полученные тестовые баллы. Оба тестирование проводятся на одной и той же группе испытуемых, но меняются условия проведения: чаще всего либо время, либо набор заданий.
На основании проведения теста два раза на одной и той же группе испытуемых через некоторый промежуток времени получают оценку так называемой ретестовой надежности. По показателю ретестовой надежности судят, насколько стабильны результаты тестирования во времени. Пользоваться данным методом следует с осторожностью, особенное внимание следует уделять правильному выбору величины временного интервала между двумя тестированиями. Если временной интервал слишком короткий, то студенты будут просто помнить свои предыдущие ответы и, вероятнее всего, повторят, их. Если временной интервал слишком большой, то измеряемое свойство может измениться под влиянием каких-либо факторов. Тогда существенные различия между результатами первого и второго тестирований будут связаны не с низкой надежностью теста, а именно с изменением измеряемого свойства. Например, через значительный промежуток времени студенты могут выполнить тест лучше под влиянием дальнейшего изучения предмета или изучения смежных предметов. Ухудшение результатов может быть связано с забыванием усвоенного материала. Отсюда следуют два практических замечания. Во-первых, промежуток между двумя тестированиями должен быть не слишком большим и не слишком маленьким, например, одна-две недели. Во-вторых, оценка ретестовой надежности имеет смысл только когда предполагается, что степень усвоения учебного материала стабильна во времени. Такая ситуация чаще встречается при итоговом контроле, например, в конце курса обучения.
Второй метод оценки надежности, используемый в критериально-ориентированном измерении, основан на двух формах одного теста. Формы теста представляют собой, по сути, два теста, идентичных по содержанию и формальным характеристикам. Задания для разных форм одного и того же теста разрабатываются на основе одной спецификации. В обе формы входит одинаковое количество заданий. Желательно, чтобы задания были уравнены по таким характеристикам, как трудность и различающая способность, что позволит повысить надежность теста. Формы теста не только используются для оценки его надежности, но и удобны при реальном проведении тестирования. Их использование позволяет снизить вероятность списывания и передачи студентами информации о тесте друг другу.
После проведения тестирования с использованием двух форм одного теста необходимо принять решение относительно того, в какую группу поместить каждого студента. Исходя из того, что ранее были определены четыре таких группы - не усвоившие, слабо усвоившие, хорошо усвоившие и полностью усвоившие программу дисциплины, можно результаты тестирования представить в восьмиклеточной таблице сопряженности (см. таблицу 3). Решение о включении студента в одну из ячеек таблицы является результатом тестирования, поэтому надежность в данном случае выражается не в согласованности тестовых баллов, а в согласованности решений относительно испытуемых.
Таблица 3
|
Форма Б |
|||||
Форма А |
|
Неусвоившиематериал |
Слабоусвоившиематериал |
Хорошоусвоившиематериал |
Полностьюусвоившиематериал |
|
Усвоившиематериалполностью |
Р30 |
Р31 |
Р32 |
Р33 |
||
Хорошоусвоившиематериал |
Р20 |
Р21 |
Р22 |
Р23 |
||
Слабоусвоившиематериал |
Р10 |
Р11 |
Р12 |
Р13 |
||
Неусвоившиематериал |
Р00 |
Р01 |
Р02 |
Р03 |
где P10, Р11, Р00, Р01 и т.д. - вероятности попадания испытуемого в соответствующую клетку таблицы на основании результатов тестирования. Оценки этих, величин рассчитываются как количество студентов, попавших в соответствующую клетку таблицы, де ленное на общее количество испытуемых.
Основываясь на таблице сопряженности, можно вычислить наиболее простые и в то же время полезные показатели согласованности решений, предложенные специально для критериально-ориентированных тестов. Один из них Р - вероятность принятия согласованного решения. Он представляет собой сумму вероятностей принятия согласованных решений по отнесению испытуемых в каждую из групп и вычисляется по формуле
Значения Р изменяются от 0 до +1. Интерпретация показателя очевидна. Например, если Р - 0,7, это значит, что 70% решений относительно испытуемых оказались согласованы, то есть совпали по обеим формам теста, а 30% оказались разными для форм А и Б. Чей выше надежность, тем выше значения показателя. Если Р - 1, то надежность теста максимальна - все решения, принимаемые по двум формам, совпадают.
Существует одна трудность в интерпретации показателя. В зависимости от структуры полученных данных, минимально возможное значение Р может быть больше нуля, в некоторых случаях оно может достигать 0,5. Это явление связано с тем, что согласованное решение относительно испытуемого может быть принято случайно. Если тестовые баллы, полученные по двум тестированиям, статистически независимы, то и решения, принятые на их основе, статистически независимы. Тем не менее некоторые решения оказываются согласованными благодаря случайному совпадению. Вероятность такого совпадения Рс называется случайной согласованностью и вычисляется по формуле
Показатель К (каппа) учитывает вероятность случайного принятия согласованного решения. Он вычисляется по формуле:
Знаменатель формулы для вычисления К показывает, насколько может возрасти согласованность решений по сравнению со случайной согласованностью, если решения по двум тестированиям окажутся статистически зависимыми, делитель формулы показывает, насколько реально возросла согласованность решений по сравнению со случайной согласованностью. Показатель К можно интерпретировать как отношение реального прироста согласованности решений к теоретически возможному приросту. Показатель К может принимать значения от -1 до +1. Так К равное «-1» означает, что решения, принятые на основе двух тестирований, полностью статистически зависимы и, следовательно, полностью согласованны. При K = 0 решения статистически независимы, но из этого не следует, что они не согласованны. Их согласованность может быть довольно высокой, но это будет случайная согласованность. Отрицательные значения K может принимать в редких случаях, когда вероятность согласованного решения оказывается ниже вероятности случайного согласованного решения.
Значения K всегда ниже значений Р и зависят от величины критериального балла. Если выбирается очень низкий или очень высокий критериальный балл, то K принимает минимальные значения, а Р - максимальные, то есть высокая согласованность решений достигается за счет высокой случайной согласованности. Если же критериальный балл находится в области средних значений распределения тестовых баллов, то значения Р и K сближаются за счет снижения вероятности случайной согласованности.
При оценке надежности критериально-ориентированного теста рекомендуется использовать оба показателя Р и K, так как они отличаются друг от друга по смыслу. Вероятность принятия согласованного решения Р показывает реальную согласованность решений, что само по себе важно, однако в эту величину входит и согласованность решений, полученная случайно. Показатель K учитывает случайную согласованность, но не дает представления о реальной согласованности решений.
Какие значения показателей можно считать приемлимыми для качественного теста? На этот вопрос нет однозначного ответа. Во многом ответ зависит от целей, с которыми проводится тестирование, реальных возможностей разработчиков, величины критериального балла и других факторов. Чем более ответственные решения принимаются на основе теста, тем выше должна быть его надежность. В самом общем плане можно рассматривать значения Р, равные 0,8-0,9, как свидетельство высокой надежности теста, однако в ряде случаев допустимы и более низкие значения.
Заключительные этапы разработки теста
После проведения анализа заданий математическими методами и оценки качества теста обычно оказывается, что тест требует доработки - удаления неудачных заданий, включения дополнительных заданий с требуемыми свойствами, повышения валидности или надежности. С учетом выявленных недостатков составляется новый вариант теста и опять проводится пилотажное тестирование, чтобы получить эмпирические данные для нового математического анализа. Цикл пилотажное тестирование - математический анализ должен "прокручиваться" до тех пор, пока не получится вариант теста с удовлетворяющими разработчика характеристиками. Наличие банка заданий, существенно превосходящего по объему количество заданий, используемое для теста, облегчает эту работу.
Если тест предназначается для использования - в рамках одного учебного заведения, - то процесс разработки теста можно упростить. Требования к качеству теста - степени его валидности и надежности могут быть несколько снижены. В этом случае можно прибегнуть к следующему приему. В первый вариант теста включается большее количество заданий, чем это необходимо. После математического анализа заданий и оценки качества теста исключаются неудачные задания, так чтобы повысить качество теста. Получается новый, улучшенный вариант теста. После этого на основании только оставленных заданий пересчитываются индивидуальные баллы испытуемых, которые и принимаются за окончательный результат тестирования. Если тест разрабатывается для проверки учебных достижений по стандартному курсу, то это дает возможность улучшать тест из года в год по результатам тестирования новых учебных групп.
Определение критериев для выставления оценки студентам по результатам тестирования
Для теста из двенадцати заданий, включающего в себя три уровня сложности, оценка “удовлетворительно” выставляется при условии решения студентом не менее 7 заданий (58% от всех заданий), из них не менее 3-х заданий первого уровня и не менее 4 заданий двух других более высоких уровней.
Оценка “хорошо” выставляется при условии решения не менее 9 заданий (75%) при условии решения всех заданий первого уровня и не менее 3 задания второго уровня.
Оценка “отлично” выставляется при условии решения не менее 10 заданий (83%), при условии решения не менее 4 заданий первого уровня, 3 заданий второго уровня и 3 заданий третьего уровня.
1.2 Бально-рейтинговая система
Общие положения
1.1. Настоящее Положение составлено на основе Закона о высшем профессиональном образовании, приказов Минобразования России № 2654 от 11.07.2002 «О проведении эксперимента по введению рейтинговой системы оценки успеваемости студентов вузов», № 3982 от 14.11.2002, № 102 от 17.01.2003, № 4094 от 31.10.2003 «О дополнениях к приказу № 2654 от 11.07.2002».
1.2. Целью введения балльно-рейтинговой системы оценки знаний является комплексная оценка и повышение качества учебной работы студентов на основе регламентации семестровых контрольных мероприятий по каждой учебной дисциплине, структурирования и активизации самостоятельной работы студентов, повышения объективности оценки успеваемости. Повышение качества образования обеспечивается за счет:
· стимулирования систематической и равномерной учебной деятельности студентов (система контрольных точек);
· выделения трех уровней изучения государственного образовательного стандарта (базовый, усложненный и углубленный уровни);
· введения состязательности через замену усредненных категорий оценки знаний (отлично, хорошо, удовлетворительно) более дифференцированной оценкой.
Смыслообразующим фактором обучения является уровень притязаний учащихся. Студент, попадая в высшее учебное заведение, где действует рейтинговая система оценки знаний, претендует на то или иное положение в рейтинге и это создает дополнительную мотивацию овладения знаниями. Познавательно - профессиональную деятельность студента на каждом последующем курсе мотивирует желание добиться более значимых результатов. Его активность приводит не только к усвоению учебных знаний, умений, навыков, выраженных в баллах, но и к саморазвитию, самостоятельности, успешности.
1.3. Положение регламентирует балльно-рейтинговую систему оценивания индивидуальных результатов обучения студентов, используемую при реализации технологии модульного обучения в университете.
1.4. Основой модульного обучения является структурирование учебного процесса и программ дисциплин на логически завершенные по тематике и по времени модули (единицы), несущие определенную функциональную нагрузку и связанные с заданными результатами обучения.
1.5. Балльно-рейтинговая система является основным элементом управления учебным процессом и предназначена для регулярного оценивания качества его результатов. Система обеспечивает:
· упорядочение, прозрачность и расширение возможностей применения различных видов и форм текущего и промежуточного контроля качества процесса и результатов обучения на основе развития накопленного опыта в университете;
· формализацию процесса оценивания с целью структурирования, планирования и реализации непрерывного контроля результатов обучения;
Подобные документы
Схема взаимодействия подразделений предприятия. Выбор и обоснование технологии проектирования базы данных. Описание объектов базы данных. Разработка запросов на выборку, изменение, обновление и удаление данных. Интерфейсы взаимодействия с базой данных.
курсовая работа [1,4 M], добавлен 25.05.2023Проектирование логической структуры базы данных методом нормальных форм, сущность связь. Сравнительный анализ спроектированной базы данных и базы данных существующих информационных систем. Выбор и обоснование состава технических и программных средств.
курсовая работа [3,0 M], добавлен 22.12.2014Создание программ, позволяющих создавать базы данных. Создание таблицы базы данных. Создание схемы данных. Создание форм, отчетов, запросов. Увеличение объема и структурной сложности хранимых данных. Характеристика системы управления базой данных Access.
курсовая работа [2,1 M], добавлен 17.06.2013Ограничения на связи между таблицами базы данных хлебной базы. Проектирование оптимальной структуры базы данных методом синтеза. Исходное множество функциональных зависимостей. Многотабличный запрос на выборку по условию. Расчет сложности запроса.
дипломная работа [488,5 K], добавлен 30.08.2012Основные виды баз данных. Система управления базами данных. Анализ деятельности и информации, обрабатываемой в поликлинике. Состав таблиц в базе данных и их взаимосвязи. Методика наполнения базы данных информацией. Алгоритм создания базы данных.
курсовая работа [3,1 M], добавлен 17.12.2014Понятие базы данных, модели данных. Классификация баз данных. Системы управления базами данных. Этапы, подходы к проектированию базы данных. Разработка базы данных, которая позволит автоматизировать ведение документации, необходимой для деятельности ДЮСШ.
курсовая работа [1,7 M], добавлен 04.06.2015Информационные задачи и круг пользователей системы. Выработка требований и ограничений. Разработка проекта базы данных. Программная реализация проекта базы данных. Разработка хранимых процедур для поддержки сложных ограничений целостности в базе данных.
курсовая работа [706,2 K], добавлен 17.06.2012Разработка информационной системы "Салон портьер" для автоматизации деятельности менеджера фирмы, занимающейся пошивом портьер на заказ. Создание и обоснование проекта базы данных. Создание запросов, форм, отчетов. Тестирование программного приложения.
курсовая работа [4,6 M], добавлен 07.02.2016Концептуальное и инфологическое проектирование базы данных в системе управления базами данных Microsoft Access. Физическое проектирование базы данных "Магазин спорттоваров". Тестирование и отладка базы данных, составление руководства пользователя.
курсовая работа [6,7 M], добавлен 22.11.2022Реализация базы данных для автоматизированной системы, обслуживающей процесс учета ремонта и техобслуживания автотранспорта. Основные функции отдела реализации теплоснабжающей организации. Обоснование выбора SQL. Создание таблиц базы данных, триггеры.
курсовая работа [233,9 K], добавлен 30.11.2008