Методы оценки знаний учащихся средней школы

Функции контроля, психологические аспекты оценочной деятельности учителем знаний учащихся. Дидактические требования к проведению контрольных работ. Критерии оценок на основе нечетких логик, статистических методов. Понятие "выборка", t-критерий Стьюдента.

Рубрика Педагогика
Вид дипломная работа
Язык русский
Дата добавления 12.09.2012
Размер файла 530,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В общем случае показатель размытости нечеткого множества можно определить в виде функционала со значениями в R (положительная полуось), удовлетворяющего условиям:

тогда и только тогда, когда А - обычное множество;

максимально тогда и только тогда, когда ?A для всех .

, если A является заострением B, т.е.

при ;

при ;

- любое при .

- симметричность по отношению к 0,5.

.

Замечание. Приведенная система аксиом при введении конкретных показателей размытости часто используется частично, т.е., например, ограничиваются свойствами P1, P2 и P3, либо некоторые свойства усиливаются или ослабляются в зависимости от решаемой задачи.

Рассмотрим индексы нечеткости (показатели размытости), которые можно определить, используя понятие расстояния.

Обычное множество, ближайшее к нечеткому.

Пусть A - нечеткое множество. Вопрос: какое обычное множество является ближайшим к A, т.е. находится на наименьшем евклидовом расстоянии от нечеткого множества A. Таким подмножеством, обозначаемым A, является подмножеством с характеристической функцией:

Обычно принимают , если .

Используя понятие обычного множества, ближайшего к нечеткому, введем следующие индексы нечеткости нечеткого множества А.

Линейный индекс нечеткости:

Здесь - линейное (хеммингово) расстояние, множитель - обеспечивает выполнение условия .

Квадратичный индекс нечеткости.

, .

Здесь - квадратичное (евклидово) расстояние.

Замечания.

1. Мы ввели линейный и квадратичный индексы нечеткости, используя понятие расстояния и понятие обычного множества, ближайшего к нечеткому. Эти же индексы можно определить, используя операцию дополнения, следующим образом:

- линейный индекс,

- квадратичный индекс.

2. Отметим следующие свойства, связанные с ближайшим обычным множеством:

,

;

а также , откуда для линейного индекса нечеткости имеем:

,

т.е. в этом представлении становится очевидным, что .

Принцип обобщения - одна из основных идей теории нечетких множеств - носит эвристический характер и используется для расширения области применения нечетких множеств на отображения. Пусть - два заданных универсальных множества. Говорят, что имеется функция, определенная на со значением в , если, в силу некоторого закона , каждому элементу соответствует элемент .

Когда функцию называют отображением, значение , которое она принимает на элементе , обычно называют образом элемента .

Образом множества при отображении называют множество тех элементов , которые являются образами элементов множества А.

Замечание. Мы напомнили классическое определение отображения, которое в теории нечетких множеств принято называть четким отображением, т.к. наряду с ним мы введем понятие нечеткого отображения (или нечеткой функции).

Будем говорить, что имеется нечеткая функция , определенная на со значением в , если она каждому элементу ставит в соответствие элемент со степенью принадлежности . Нечеткая функция определяет нечеткое отображение .

Принцип обобщения заключается в том, что при заданном четком или нечетком отображении для любого нечеткого множества , заданного на , определяется нечеткое множество на , являющееся образом A.

Пусть заданное четкое отображение,

а - нечеткое множество в Х. Тогда образом А при отображении f является нечеткое множество на Y с функцией принадлежности:

; , где .

В случае нечеткого отображения , когда для любых и определена двуместная функция принадлежности , образом нечеткого множества А, заданного на Х, является нечеткое множество на Y с функцией принадлежности:

.

Замечание. Я не привожу примеров использования принципа обобщения. Предлагаю подумать, каким образом можно определить нечеткое число и как с помощью принципа обобщения (не забывая декартова произведения) и классических операций возведения числа в степень (одноместная), сложения и умножения (двуместные) получать соответствующие нечеткие результаты. К нечетким отображениям мы вернемся, когда будем рассматривать понятие нечеткого отношения.

2.2 Нечеткие отношения

Пусть - прямое произведение универсальных множеств и М - некоторое множество принадлежностей. Нечеткое n-арное отношение определяется как нечеткое подмножество R на E, принимающее свои значения в . В случае и , нечетким отношением R между множествами и будет называться функция , которая ставит в соответствие каждой паре элементов величину . Обозначение: нечеткое отношение на запишется в виде: , . В случае, когда , т.е. совпадают, нечеткое отношение называется нечетким отношением на множестве .

Примеры:

Пусть , , . Нечеткое отношение может быть задано, к примеру, таблицей:

y1

y2

y3

y4

x1

0

0

0,1

0,3

x2

0

0,8

1

0,7

x3

1

0,5

0,6

1

Пусть , т.е. множество всех действительных чисел. Отношение (x много больше y) можно задать функцией принадлежности:

Отношение R, для которого , при достаточно больших k можно интерпретировать так: "x и y близкие друг к другу числа". В случае конечных или счетных универсальных множеств очевидна интерпретация нечеткого отношения в виде нечеткого графа, в котором пара вершин в случае соединяется ребром с весом , в случае пара вершин соединяется ребром c весом .

Примеры:

Пусть , и задано нечеткое отношение , представимое графом:

Рис. 3

Пусть X={x1,x2} и Y={y1,y2,y3}, тогда нечеткий граф вида:

Рис. 4

задает нечеткое отношение XRY.

Замечание. В общем случае нечеткий граф может быть определен на некотором , где G - множество упорядоченных пар (необязательно всех возможных) такое, что и .

Будем использовать обозначения вместо и вместо .

Пусть .

Носитель нечеткого отношения.

Носителем нечеткого отношения называется обычное множество упорядоченных пар , для которых функция принадлежности положительна:

.

Нечеткое отношение содержащее данное нечеткое отношение, или содержащееся в нем.

Пусть и - два нечетких отношения такие, что:

,

тогда говорят, что R2 содержит R1 или R1 содержится в R2 .

Обозначение: .

Пример:

Отношения R1 , R2 - отношения типа (y много больше x). При отношение R2 содержит R1 .

Операции над нечеткими отношениями.

Объединение двух отношений и . Объединение двух отношений обозначается и определяется выражением: .

Пример:

Ниже изображены отношения действительных чисел, содержательно означающие: - "числа и очень близкие", - "числа x и y очень различны" и их объединение - "числа x и y очень близкие или очень различные".

Функции принадлежности отношений заданы на .

Рис. 5

Пересечение двух отношений.

Пересечение двух отношений обозначается и определяется выражением:

.

Пример:

Ниже изображены отношения: xR1y, означающее "модуль разности |y-x| близок к", xR2y, означающее "модуль разности |y-x| близок к ?", и их пересечение.

Рис. 6

Алгебраическое произведение двух отношений.

Алгебраическое произведение двух отношений обозначается и определяется выражением: .

Алгебраическая сумма двух отношений.

Алгебраическая сумма двух отношений обозначается и определяется выражением: .

Для введенных операций справедливы следующие свойства дистрибутивности:

,

R1?(R2?R3) = (R1?R2)?(R1?R3),

,

,

,

.

Дополнение отношения.

Дополнение отношения обозначается и определяется функцией принадлежности:

Дизъюнктивная сумма двух отношений.

Дизъюнктивная сумма двух отношений обозначается и определяется выражением:

.

Обычное отношение, ближайшее к нечеткому.

Пусть R - нечеткое отношение с функцией принадлежности . Обычное отношение, ближайшее к нечеткому, обозначается R и определяется выражением:

Проекции нечеткого отношения.

Пусть R - нечеткое отношение . Первой проекцией отношения R (проекция на X) называется нечеткое множество, заданное на множестве X, с функцией принадлежности:

.

Аналогично, второй проекцией (проекцией на Y) называется нечеткое множество, заданное на множестве Y, с функцией принадлежности:

Величина называется глобальной проекцией отношения R. Если h(R)=1, то отношение R нормально, в противном случае - субнормально.

Цилиндрические продолжения проекций нечеткого отношения.

Проекции нечеткого отношения в свою очередь определяют в нечеткие отношения и с функциями принадлежности:

при любом y, при любом x,

называемые, соответственно, цилиндрическим продолжением и цилиндрическим продолжением .

Замечание. Очевидно, что для любых нечетких подмножеств , определенных, соответственно, на , можно построить их цилиндрические продолжения .

Композиция двух нечетких отношений.

Пусть R1 - нечеткое отношение между X и Y, и R2 - нечеткое отношение между Y и Z. Нечеткое отношение между X и Z, обозначаемое , определенное через R1 и R2 выражением

, называется (max-min)-композицией отношений R1 и R2.

Свойства max-min композиции

Операция (max-min)-композиции ассоциативна, т.е.

,

дистрибутивна относительно объединения, но недистрибутивна относительно пересечения:

,

.

Кроме того, для (max-min)-композиции выполняется следующее важное свойство: если то,.

(max) - композиция.

В выражении для (max-min)-композиции отношений R1 и R2 операцию можно заменить любой другой, для которой выполняются те же ограничения, что и для : ассоциативность и монотонность (в смысле неубывания) по каждому аргументу. Тогда:

.

В частности, операция может быть заменена алгебраическим умножением, тогда говорят о (max - prod)-композиции.

Очевидно, что из 12 следует R1 R2.

Теорема декомпозиции

Любое нечеткое отношение R представимо в форме:

Условные нечеткие подмножества.

Пусть X и Y - универсальные множества, взаимосвязь которых задана нечетким отношением , т.е. для каждой пары задано значение функции принадлежности .

Пусть А - некоторое нечеткое множество, заданное на Х, т.е. определена функция принадлежности для всех х из Х. Тогда нечеткое множество А и нечеткое отношение R индуцируют в Y нечеткое подмножество B с функцией принадлежности

.

Обозначение: .

Немного о бинарных отношениях вида XRX

Нечеткие отношения вида XRX задаются функцией принадлежности ? R(x,y), но с условием, что x и y - элементы одного и того же универсального множества. В зависимости от своих свойств (основные - симметричность, рефлексивность, транзитивность) конкретные нечеткие отношения задают отношения сходства и различия, порядка или слабого порядка между элементами Х. Они имеют обширную сферу приложений в задачах автоматической классификации и принятия решений (сравнение альтернатив).

2.3 Нечеткая и лингвистическая переменные

Понятие нечеткой и лингвистической переменных используется при описании объектов и явлений с помощью нечетких множеств.

Замечание. Чтобы избежать большого количества символов символ ? используют как для названия самой переменной, так и для всех ее значений пользуются одним и тем же символом для обозначения нечеткого множества и его названия, например терм "умный", являющийся значением лингвистической переменной "количество баллов", одновременно есть и нечеткое множество М ("умный").

Присвоение нескольких значений символам предполагает, что контекст позволяет разрешить возможные неопределенности.

Пример: Пусть эксперт определяет уровень знаний учащихся с помощью понятий "низкий результат", "средний результат" и "высокий результат" выполнения тестового задания, при этом минимальный результат равен 0 баллов, а максимальный - 100 баллов.

М - процедура задания на X = [0, 100] нечетких подмножеств А1="малый результат", А2 = "средний результат", А3="высокий результат", а также нечетких множеств для термов из G(T) в соответствии с правилами трансляции нечетких связок и модификаторов "и", "или", "не", "очень", "слегка" и др. операции над нечеткими множествами вида: А ? В, А? В, , CON А = А2 , DIL А = А0,5 и др.

Рис. 7

Функции принадлежности нечетких множеств:

"малый результат" = А1 , "средний результат"= А2, " высокий результат"= А3.

Рис. 8

Функция принадлежности:

нечеткое множество "малый или средний результат" = А1?А1.

Нечеткие числа

Нечеткие числа - нечеткие переменные, определенные на числовой оси, т.е. нечеткое число определяется как нечеткое множество на множестве действительных чисел R с функцией принадлежности , где x - действительное число, т.е. .

Нечеткое число А нормально, если , выпуклое, если для любых выполняется .

Множество - уровня нечеткого числа А определяется как

.

Подмножество называется носителем нечеткого числа А, если

.

Нечеткое число А унимодально, если условие справедливо только для одной точки действительной оси.

Выпуклое нечеткое число А называется нечетким нулем, если

.

Нечеткое число А положительно, если , x>0

и отрицательно, если , x<0.

Операции над нечеткими числами

Расширенные бинарные арифметические операции (сложение, умножение и пр.) для нечетких чисел определяются через соответствующие операции для четких чисел с использованием принципа обобщения следующим образом.

Пусть А и В - нечеткие числа, и - нечеткая операция, соответствующая операции над обычными числами. Тогда:

Отсюда:

Нечеткие числа (L-R)-типа

Нечеткие числа (L-R)-типа - это разновидность нечетких чисел специального вида, т.е. задаваемых по определенным правилам с целью снижения объема вычислений при операциях над ними.

Функции принадлежности нечетких чисел (L-R)-типа задаются с помощью невозрастающих на множестве неотрицательных действительных чисел функций действительного переменного L(x) и R(x), удовлетворяющих свойствам:

а) , ;

б) .

Очевидно, что к классу (L-R) функций относятся функции, графики которых имеют следующий вид:

Рис. 9

Примерами аналитического задания (L-R) функций могут быть

, p 0;

, p 0 и т.д.

Пусть L(y) и R(y) - функции (L-R)-типа (конкретные). Унимодальное нечеткое число А с модой а (т.е. ?A(a)=1) c помощью L(y) и R(y) задается следующим образом:

где а - мода; - левый и правый коэффициенты нечеткости.

Таким образом, при заданных и нечеткое число (унимодальное) задается тройкой .

Толерантное нечеткое число задается, соответственно, четверкой параметров , где а1 и a2 - границы толерантности, т.е. в промежутке значение функции принадлежности равно 1.

Примеры графиков функций принадлежности нечетких чисел (L-R)-типа приведены ниже.

Рис. 10

Мы не будем здесь рассматривать операции над числами; отметим, что в конкретных ситуациях функции , а также параметры , нечетких чисел и должны подбираться таким образом, чтобы результат операции (сложения, вычитания, деления и т.д.) был точно или приблизительно равен нечеткому числу с теми же L(y) и R(y), а параметры результата не выходили за рамки ограничений на эти параметры для исходных нечетких чисел, особенно если результат в дальнейшем будет участвовать в операциях.

Замечание. Решение задач математического моделирования сложных систем с применением аппарата нечетких множеств требует выполнения большого объема операций надразного рода лингвистическими и другими нечеткими переменными. Для удобства исполнения операций, а также для ввода-вывода и хранения данных, желательно работать с функциями принадлежности стандартного вида.

Нечеткие множества, которыми приходится оперировать в большинстве задач, являются, как правило, унимодальными и нормальными. Одним из возможных методов аппроксимации унимодальных нечетких множеств является аппроксимация с помощью функций (L-R)-типа.

Примеры (L-R)-представлений некоторых лингвистических переменных:

Терм ЛП

(L-R)-представление

Графическое представление

Средний

a b

Малый

Большой

Приблизительно в диапазоне

a1 a2

Определенный

Разнообразный зона полной неопределенности

Видно, что приведенный аппарат нечетких логик вполне может быть применен для построения оценок знаний, на основании данных текущего контроля знаний. Вместе с тем приведенная процедура не исключает другого не менее значимого подхода, это статистических методов оценки по многочисленным данным текущего контроля.

2.4 Понятие выборки

Учитель - экспериментатор в большинстве случаев изучает какую-то определённую выборку людей, которая всегда отбирается из большей по численности группы. Такая выборка отбирается из большей по численности группы. Такая объемлющая группа называется в статистике генеральной совокупностью. Таким образом, генеральная совокупность - это любая группа людей, которую учитель изучает по выборке. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать учителю.

Выборкой называется любая подгруппа элементов (испытуемых), выделенная из генеральной совокупности для проведения эксперимента. При этом отдельный индивид из выборки, с которым работает учитель, называется испытуемым.

К выборке применяется ряд обязательных требований, определенных, прежде всего целями и задачами исследования. Планирование эксперимента должно включать в себя учет, как объема выборки, так и ряда её особенностей. Так, в исследованиях важно требование однородности выборки. Это означает что учитель, изучая, например, учеников 10 класса, не может включать в эту же выборку учеников 8 класса.

В общей статистике имеется понятие повторной и бесповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, может быть выбран снова. При бесповоротном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В исследованиях учеников можно найти аналоги подобного рода способам организации выборочного исследования, поскольку учителю нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. Однако, строго говоря, повторной в этом случае является процедура тестирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всегда будет иметь некоторые отличия, обусловленные функциональной и эмоциональной изменчивостью, присущей всем людям. Подобная выборка по характеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.

Важно подчеркнуть, что все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе учителем на ее основе должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной совокупности.

Состав экспериментальной выборки должен представлять генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем перенести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством - репрезентативностью, позволяющим распространить полученные на ней выводы на всю генеральную совокупность.

Репрезентативная выборка, или, как еще говорят, представительная выборка, - это такая выборка в, которой все основанные признаки генеральной совокупности представлены приблизительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большей долей уверенности считать применимыми ко всей генеральной совокупности. Это распространение результатов называется генерализуемостью.

В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых учителем характеристик была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура формирования выборки должна иметь внутреннюю логику, способную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентативной, представительной. В своей конкретной деятельности учитель действует следующим образом: устанавливает подгруппу (выборку) внутри генеральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, если это позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы учителя с выборкой. Начинающий учитель должен иметь ввиду часто повторяющуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всегда появляется соблазн распространить свои выводы на всю генеральную совокупность. Для того, что бы избежать подобной ошибки, надо не просто обладать здравым смыслом, но, прежде всего, хорошо владеть основными понятиями математической статистики.

Среднее арифметическое ряда из числовых значений обозначается и подсчитывается как:

Здесь величины 1,2…n являются так называемыми индексами. В том случае, если отдельные значения выборки повторяются, среднюю арифметическую выделяют по формуле:

в таком случае называют взвешенной средней, где - частоты повторяющихся значений. Знак является символом операции суммирования. Он означает, что все значения должны быть просуммированы. Числа стоящие под знаком называются пределами суммирования и указывают наибольшее и наименьшее значения индекса суммирования, между которыми расположены его промежуточные значения.

При вычислении величины средней по таблице чисел в дальнейшем будет использоваться следующая формула: где - значения всех переменных, полученных в эксперименте, или все элементы таблицы, при этом индекс j меняется от 1 до , где число столбцов в таблице, а индекс меняется от 1 до , где - число испытуемых. Символическое обозначение очень удобно. Например, пусть перед нами стоит задача - указать конкретный элемент нашей таблицы. Для этого мы должны знать номер столбца, например 4, и номер строки, например 5. Тогда его обозначение будет таково: . Это значит, что выбран пятый элемент в строчке из четвертого столбца. Символ (двойная сумма) означает, что вначале осуществляется суммирования всех элементов таблицы по индексу i - т.е. по строкам, затем полученные суммы по строчкам складываются по столбцам, или, иначе говоря, по индексу . Следует подчеркнуть, что средние величины характеризуют выборку одним (средним) числом. Преимущество, или иначе, информативная значимость, средних величин заключается в их способности аккумулировать или уравновешивать все индивидуальные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеобразие варьирующего объекта, позволяя отличить одну выборку от другой, а на этой основе, например, одно измеренное психологическое свойство от другого.

Разброс (иногда эту величину называют размахом) выборки обозначается буквой . Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е. . Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина , и наоборот. Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Дисперсия представляет собой наиболее часто использующуюся меру рассеяния случайной величины (переменной). Дисперсия это среднее арифметическое квадратов отклонений значений переменной от её среднего значения

,

где n-объем выборки, i - индекс суммирования, - среднее арифметическое.

Пример. Вычислим дисперсию следующего ряда:

Прежде всего, найдем среднее ряда . Оно равно . Рассмотрим величины: для каждого элемента ряда. Полученные величины характеризуют то, насколько каждый элемент отклоняется от средней величины в данном ряду. Обозначим полученную совокупность разностей как множество . Тогда есть:

Так образуется новый ряд чисел. Его особенность в том, что при сложении этих чисел обязательно получится ноль. Проверим: . Отметим, что сумма такого ряда всегда будет равна нулю. Для того чтобы избавиться от нуля, каждое значение разности возводят в квадрат, все их суммируют и затем делят на число элементов. Получится:

Это и есть искомая дисперсия.

Общий алгоритм вычисления дисперсии для одной выборки следующий:

1. Вычисляется среднее по выборке.

2. Для каждого элемента выборки вычисляется его отклонение от средней, т.е получается множество .

3. Каждый элемент множества возводят в квадрат.

4. Находится сумма этих квадратов.

5. Эта сумма, как и в случае вычисления среднего, делится на общее количество членов ряда - n. В ряде случаев, особенно когда величина выборки мала, деление осуществляется не на величину - n, а на величину n - 1.

Величина, получаемая после пятого шага, и есть искомая дисперсия.

Число степеней свободы это число свободно варьирующих единиц в составе выборки. Так если вся выборка состоит из элементов и характеризуется средней , то любой элемент этой совокупности может быть получен как разность между величиной и суммой всех остальных элементов, кроме самого этого элемента.

Пример. Рассмотрим ряд . Мы помним, что среднее этого ряда равна 6. В этом ряду 5 чисел, следовательно . Предположим, что мы хотим получить последний элемент ряда 10, зная все элементы и среднее этого ряда. Тогда: . Предположим, что мы хотим получить первый элемент ряда 2, зная все последующие элементы и среднее этого ряда. Тогда: и.т.д. Следовательно, один элемент выборки не имеет свободы вариации и всегда может быть выражен через другие элементы и среднее. Это означает, что число степеней свободы у выборочного ряда обозначаемое в таких случаях символом будет определятся как , где - общее число элементов ряда(выборки). При наличии не одного, а нескольких ограничений свободы вариации, число степеней свободы, обозначаемое как будет равно , где соответствует числу ограничений свободы вариации. В общем случае для таблицы экспериментальных данных число степеней свободы будет определяться по формуле: где с - число столбцов, а n - число строк.

2.5 Проверка статистических гипотез

Полученные в результате эксперимента, на какой - либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных данных, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Такие предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез.

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные данные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин. Таким образом, статистическая гипотеза это научная гипотеза, а математическая статистика это научная дисциплина задачей которой является научно обоснованная проверка статистических гипотез.

При проверке статистических гипотез используются два понятия: так называемая нулевая (обозначение ) и альтернативная (обозначение ). Принято считать, что нулевая гипотеза - это гипотеза о сходстве, а альтернативная - гипотеза о различии. Таким образом, принятие нулевой гипотезы свидетельствует об отсутствие различий, а гипотезы о наличии различий. Если, например, две выборки извлечены из нормально распределенных генеральных совокупностей, причем одна выборка имеет параметры и , а другая параметры и . то нулевая гипотеза исходит из предположения о том, что и то есть разность двух средних и разность двух стандартных отклонений равны нулю (отсюда и название нулевая). Принятие альтернативной гипотезы свидетельствует о наличии различий и исходит из предположения, что и . Вообще говоря, при принятии или отвержении гипотез возможны различные варианты. Например, учитель провел выборочное тестирование показателей уровня интеллекта у группы подростков из полных и неполных семей. В результате обработки экспериментальных данных установлено, что у подростков из неполных семей показатели интеллекта в среднем ниже, чем у их ровесников из полных семей. Может ли учитель на основе полученных результатов сделать вывод о том, что неполная семья ведет к снижению интеллекта у подростков. Принимаемый в таких случаях вывод носит называние статистического решения.

При обосновании статистического вывода следует решить вопрос, где же проходит линия между принятием и отвержением нулевой гипотезы. В силу влияния в эксперименте случайных влияний эта граница не может быть проведена абсолютно точно. Она базируется на понятии уровня значимости. Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы. Или, иными словами, уровень значимости это вероятность ошибки первого рода при принятии решения. Для обозначения этой вероятности, как правило, этой вероятности, как правило, употребляют либо греческую букву , либо латинскую букву .

Исторически сложилось так, что в прикладных науках, использующих статистику, считается, что низшим уровнем статистической значимости является уровень ; достаточным - уровень и высшим уровень . Величины 0,05, 0,01, и 0,001 - это так называемые стандартные уровни статистической значимости. При статистическом анализе экспериментальных данных учитель в зависимости от задач и гипотез исследования должен выбрать необходимый уровень значимости. Как видим, здесь наибольшая величина, или нижняя граница уровня статистической значимости, равняется 0,05 - это означает, что допускается пять ошибок в выборке из ста элементов. В современных статистических пакетах на ЭВМ используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни могут иметь различное числовое значение в интервале от 0 до 1.

Правило принятия статистического вывода таково: на основе полученных экспериментальных данных учитель подсчитывает по выбранному им статистическому методу так называемою эмпирическую статистику, или эмпирическое значение. Эту величину удобно обозначить, как . Затем эмпирическая статистика сравнивается с двумя критическими величинами, которые соответствуют уровням значимости в и 1% для выбранного статистического метода и которые обозначаются, как . Величины находятся для данного статистического метода по соответствующим таблицам. Эти величины, как правило, всегда различны и их в дальнейшем для удобства можно называть, как и . Найденные по таблицам величины критических значений и удобно представлять в форме записи:

Подчеркнем, что обозначения и использовали как сокращения слова «число».

Теперь необходимо сравнить наше эмпирическое значение с двумя найденными по таблицам критическими значениями. Лучше всего это сделать, расположив все три числа на так называемой «оси значимости». «Ось значимости» представляет собой прямую, на левом конце которой располагается 0, хотя он, как правило, не отмечается на самой прямой, и слева направо идет увеличение числового ряда. По сути дела это привычная школьная ось абсцисс OX декартовой системы координат. Однако особенность этой оси в том, что на ней выделено три участка, «зоны». Левая зона называется зоной незначимости, правая - зоной значимости, а промежуточная зоной неопределенности. Границами всех трех зон являются для и для P=0,01, как это показано ниже:

Рис. 11

Подсчитанное по какому-либо статистическому методу должно обязательно попасть в одну и трех зон.

1. Пусть попало в зону незначимости, тогда рисунок выглядит так:

Рис. 12

В этом случае принимается гипотеза об отсутствии различий.

2. Пусть попало в зону значимости, тогда рисунок выглядит так:

Рис. 13

В этом случае принимается альтернативная гипотеза .

3. Пусть попало в зону неопределенности, тогда рисунок выглядит так:

Рис. 14

В этом случае перед учителем стоит дилемма. Так, в зависимости от важности решаемой задачи он может считать полученную статистическую оценку достоверной на уровне 5%, и принять, тем самым гипотезу , отклонив гипотезу , либо - недостоверной на уровне 1%, приняв тем самым, гипотезу .

Принятие статистического решения разбивается на этапы или шаги:

1. Формулировка нулевой или альтернативной гипотез.

2. Определение объема выборки N.

3. Выбор соответствующего уровня значимости или вероятности отклонения нулевой гипотезы. Это может быть величина меньшая или равная 0,05. В зависимости от важности исследования можно выбрать уровень значимости в 0,1% или даже в 0,001%.

4. Выбор статистического метода, который зависит от типа решаемой задачи.

5. Вычисление соответствующего эмпирического значения по экспериментальным данным, согласно выбранному статистическому методу.

6. Нахождение по таблице для выбранного статистического метода критических значений, соответствующих уровню значимости для P=0,05 и P=0,01.

7. Построение оси значимости и нанесении на нее табличных критических значений и эмпирического значения .

8. Формулировка принятия решения.

знания учащийся проверка гипотеза

2.6 t-критерий Стьюдента

Критерий t Стьюдента направлен на оценку различий величин средних двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок.

Случай несвязных выборок. В общем случае формула для расчета по t-критерию Стьюдента такова:

.

Рассмотрим равночисленные выборки . В этом случае n1=n2=n, тогда Sd будет выражаться следующим образом:

.

В случае неравночисленных выборок , будет вычисляться следующим образом:

.

В обоих случаях подсчет степеней свободы осуществляется по формуле:

где n1 и n2 соответственно величины первой и второй выборки.

Размещено на Allbest.ru


Подобные документы

  • Проблема организации контроля знаний учащихся и правильной оценки уровня их знаний. Виды контроля. Роль и значение тематического контроля, обеспечивающие эффективность учебного процесса, пути и методы проведения тематического контроля знаний учащихся.

    дипломная работа [86,3 K], добавлен 01.05.2008

  • Проблема контроля знаний учащихся в теории и практике школы. Подходы к образовательному процессу на современном этапе. Требования к организации контроля за учебной деятельностью. Системы и технологии контроля знаний учащихся, используемые в школе.

    дипломная работа [122,0 K], добавлен 30.03.2015

  • Критерии оценки знаний и умений учащихся. Методы контроля и самоконтроля. Методы усвоения знаний, умений и навыков в соответствии с требованиями программами. Рейтинговая и тестовая системы оценки знаний как фактор повышения эффективности обучения.

    курсовая работа [45,3 K], добавлен 28.02.2012

  • Функции, принципы, структура контроля знаний и умений учащихся, основные требования к его организации. Специфика контрольных занятий в курсе "Основы безопасности жизнедеятельности". Разработка уроков с использованием разных форм и методов контроля знаний.

    дипломная работа [2,1 M], добавлен 16.08.2016

  • Контроль знаний как существенный элемент современного урока. Место контроля знаний и умений учащихся на уроках литературы. Технология контрольно-оценочной деятельности учителя. Традиционные и нетрадиционные формы контроля знаний и умений учащихся.

    курсовая работа [107,4 K], добавлен 01.12.2011

  • Тест, как форма измерения знаний учащихся. Психолого-педагогические особенности тестовой формы контроля результатов обучения. Опытно-экспериментальная работа по проведению тестов на уроках английского языка с целью контроля и оценки знаний учащихся.

    курсовая работа [81,5 K], добавлен 25.01.2016

  • Качество знаний, его главные параметры. Функции и виды контроля знаний в педагогическом процессе. Экспериментальная проверка знаний и умений учащихся. Контроль знаний учащихся как элемент оценки качества знаний. Уровни контроля и проверки знаний по химии.

    курсовая работа [33,0 K], добавлен 04.01.2010

  • Формы, методы, виды и функции контроля знаний и умений учащихся. Критерии оценки знаний по информатики. Модульно-блочная система обучения как средство формирования творческого мышления детей. Создание компьютерного теста в программе MS PowerPoin.

    дипломная работа [938,0 K], добавлен 07.07.2015

  • Понятие оценки знаний, умений и навыков, дидактические цели и задачи данного процесса. Использование практических заданий при проверке знаний. Значение контрольно-оценочной самостоятельности младшего школьника. Особенности организации контроля достижений.

    курсовая работа [34,2 K], добавлен 16.12.2012

  • Функции, виды, типы и формы контроля знаний учащихся. Характеристика особенностей устного, письменного контроля знаний и некоторых его нетрадиционных форм. Разработка заданий на проверку знаний учащихся по теме "Внутренние воды и водные ресурсы России".

    курсовая работа [1,8 M], добавлен 10.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.