Основы статистики

Фиксация совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Классификация измерительных шкал. Построение частотного ряда. Функции плотности вероятности. Нахождение моды и медианы в дискретном вариационном ряду.

Рубрика Экономика и экономическая теория
Вид шпаргалка
Язык русский
Дата добавления 12.02.2012
Размер файла 1,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Б №1

Шкала - это форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему.

Применение шкал связывается с необходимостью качественной и количественной оценки (с задачей последующего сравнения) определенных признаков и переменных.

Признаки и переменные - это измеряемые психологические явления. Такими явлениями могут быть уровень тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных реакций, социометрический статус и множество других переменных, о которых свидетельствуют особые индикаторы, внешне хорошо различимые показатели измеряемого признака, например, время решения задачи, количество допущенных ошибок, угол поворота корпуса в беседе, показатель социометрического статуса и пр.

Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо них используются понятия показателя или уровня, например, уровень настойчивости, показатель вербального интеллекта и др. Понятия показателя и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения "высокий" или низкий, например, высокий уровень интеллекта, низкие показатели тревожности и др.

Значения признака определяются (измеряются) при помощи специальных шкал измерения. В психологических измерениях используются различные классификации типов шкал. Тип шкалы определяется природой измеряемой величины.

Наиболее общая классификация измерительных шкал предложена С.Стивенсом. В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические (интервальные, шкалы отношений) и неметрические (номинативные, шкалы порядка). Типы шкал обусловливаются видом функции f, осуществляющей допустимые преобразования Y = f (cp). Если f - монотонная функция, то соответствующая шкала является шкалой порядка; если f - линейная функция, то соответствующая шкала - это шкала интервалов; если f определяет преобразование подобия, то соответствующая шкала - шкала отношений.

Кроме этих видов шкал ряд специалистов выделяют также абсолютную шкалу и шкалу разностей.

Б№2. ТАБУЛИРОВАНИЕ ДАННЫХ

Для анализа и интерпретации исходных количественных данных их необходимо обобщить. Чаще всего 1 этапом представления исходных данных является упорядочивание их по величине (по возрастанию или по убыванию). Если исходная выборка упорядочена по возрастанию, т.е. сначала расположено наблюдение, наименьшее по величине, затем 2 по величине и т.д., то такая выборка называется вариационным рядом и обозначается следующим образом: х(1), х(2), …, х(n) - упорядочены, х(1) < х(2) < … < х(n) (некоторые элементы 84, 84, 106, 106 могут совпадать); х1, х2 - не упорядочены, в произвольном порядке.

Когда исходная выборка имеет достаточно большой объем, то используют табулирование данных - т.е. представляют исходную выборку в виде таблицы соответствующего вида. Табулирование обычно осуществляется в 4 этапа:

1 этап - определение размаха выборки. Для этого из максимального элемента выборки вычитают минимальный.

R= хmax - xmin = x(n) - x(1), где R - размах выборки.

2 этап - определение ширины интервала, группирование данных. Прежде чем искать ширину интервала, необходимо определиться с количеством интервалов в группировании. Очень небольшое количество интервалов может слишком упростить и сгладить общую тенденцию, а слишком большое количество интервалов может привести к излишней детализации рассматриваемого явления. Рекомендация: количество интервалов выбирается таким образом, чтобы в каждый интервал попадало в среднем 5-6 элементов выборки. Для этого объем выборки делим на 5 и на 6, в результате получаем два числа.

k1=n/5, k2 = n/6, где n - объем выборки. После этого в качестве требуемого количества интервала выбирается целое число к, находящееся между k1 и k2 . Пример: n=32, k1=32/5=6,4; k2 =32/6=5,3; отсюда получается в качестве к будет 6 (к=6 или к=5). Тогда ширина интервала группирования получается путем деления размаха выборки на количество интервалов.

h= R/k, где h - ширина.

Т.к. в большинстве случаев наши исходные данные являются целыми числами, то ширину интервала можно также округлить до ближайшего целого числа. h=50/6=8,3=8

3 этап - определение границ интервалов группирования данных. При этом нужно обращать внимание на то, чтобы левая граница первого интервала не оказалась справа от наименьшего значения на числовой оси.

левая граница не может быть 44, а может 40, т.е. левая граница первого интервала не может быть больше наименьшего значения. Каждая последующая граница получается путем прибавления ширины интервала к предыдущей границе.

h=8, x min =42. Левая граница 40; 40 - 48; 48 - 56.

4 этап - непосредственно само табулирование данных. На этом этапе мы подсчитываем, сколько элементов выборки попало в каждый интервал. Количество наблюдений, попавших в интервал, называется частотой. Результатом табулирования данных является таблица, состоящая из двух столбцов, первый из которых содержит границы интервала, второй - частоты. Пример: в результате проведения контрольной работы по чтению в классе из 38 учеников были получены следующие результаты: 90, 66, 106, 84, 105, 83, 104, 82, 97, 97, 59, 95, 78, 70, 47, 95. 100, 69, 44, 80, 75, 75, 51, 109, 89, 58, 59, 72, 74, 75, 81, 71, 68, 112, 62, 91, 93, 84. Протабулировать полученные исходные данные. xmin=44; xmax=112; R=112-44=68; n=38; k1=38/5=7,5; k2=38/6=6,3 ; k=7. Находим ширину:h=R/k; h= 68/7=9,7=10.

Границы интервалов

Частоты

40-50

50-60

60-70

70-80

80-90

90-100

100-110

110-120

11 2

1111 4

11111 5

11111111 8

1111111 7

1111111 7

1111 4

1 1

38

Перед непосредственным подсчетом частот мы определяем для себя, в какой интервал будем включать значения, попадающие точно на границу интервала (левую и правую). Для контроля правильности вычисления нужно сложить все полученные частоты, если мы все сделали правильно, то сумма частот должна равняться количеству наблюдений в выборке.

Иногда выборка может быть представлена в виде частотного ряда. Частотным рядом называется таблица следующего вида:

zi

z1

z2

...

zk

ni

n1

n2

...

nk

z1, z2, …, zn - различные значения элементов исходной выборки.

x1, х2, …, хn

k < n

n1, n2, …,nk - частота встречаемости того или иного различного значения в выборке.

Имеет смысл задача построения частотного ряда, если в исходной выборке встречается много одинаковых значений. Пример: на занятиях по статистике проводится эксперимент по регистрации номера месяца рождения каждого из студентов. Опрос проводится по списку. Представить полученную выборку в виде вариационного и частотного рядов, а также определить размах выборки.

4, 12, 12, 6, 5, 1, 8, 6, 12, 8, 7, 1, 10, 6, 10, 8, 12, 12, 10, 1, 11, 12, 2, 4, 10, 12. n=26;

в виде вариационного ряда (по возрастанию):1, 1, 1, 2, 4, 4, 5, 6, 6, 6, 7, 8, 8, 8, 10, 10, 10, 11, 12, 12, 12, 12, 12, 12, 12.

В виде частотного ряда:

z(i)

1

2

4

5

6

7

8

10

11

12

n(i)

3

1

2

1

3

1

3

4

1

7

n=26 (общее количество) ; к=10.

Для контроля правильности вычислений можно просуммировать частоты n1+n2+…+nk=n

Находим размах выборки: R=12-1=11; max -12; min -1; меньше 11 может быть, 1/2 - 26, 1 - 50.

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки . Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат - соответствующие им частоты и соединяют точки отрезками прямых.

Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты .

В случае непрерывного признака строится гистограмма, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала - сумму частот вариант, попавших в i-й интервал.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению . Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (высоте) . Площадь i-го прямоугольника равна - сумме частот вариант i-о интервала, поэтому площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

В случае гистограммы относительных частот по оси ординат откладываются относительные частоты , на оси абсцисс - частичные интервалы, над ними проводят отрезки, параллельные оси абсцисс на высоте . Площадь i-го прямоугольника равна относительной частоте вариант , попавших в i-й интервал. Поэтому площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице.

Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые. Таким образом, высоты прямоугольников должны быть пропорциональны величинам

где ni -- частота i-го интервала группировки; hi -- ширина i-го интервала группировки.

На графике гистограммы основание прямоугольников откладывается по оси абсцисс (x), а высота -- по оси ординат (у) прямоугольной системы координат.

Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины рi, а частоты интервалов ni.

Рис. 1. Гистограмма распределения результатов в предыдущем примере (когда ширина некоторых интервалов группировки неодинакова).

В этом случае чтобы не нарушить принцип построения гистограммы (площади прямоугольников пропорциональны частотам интервалов), по оси ординат уже нельзя откладывать частоты, а надо - высоты прямоугольников (которые должны быть пропорциональны отношениям ).

Полигон частот

Другим распространенным способом графического представления является полигон частот.

Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов, срединные значения откладываются по оси х, а частоты - по оси у.

Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых.

Полигон частот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.

Билет 5

МОДОЙ называется значение случайной величины, которое встречается чаще всего, т.е. имеет наибольшую вероятность или максимум функции плотности вероятности.

Медианой называется значение, которое делит область значений величины на две равные по вероятности части.

Структуру совокупностей характеризуют особыми показателями, называемыми структурными средними величинами. В частности, это мода и медиана..

Среднее выборочное (среднее арифметическое) определяется суммированием всех значений совокупности и последующим делением на их число. Для совокупности индивидуальных баллов .В отличие от моды на величину среднего влияют значения всех результатов. Таким образом, среднее арифметическое характеризует всю совокупность значений. Оно обобщает индивидуальные особенности составляющих распределения, в нем уравниваются отдельные значения рассматриваемой величины.

Мода (Mo) ? величина, наиболее часто встречающаяся в данной совокупности. В вариационном ряду это ? варианта, имеющая наибольшую частоту.

Моду широко используют в коммерческой деятельности, в социологических исследованиях, когда изучают рыночный спрос, регистрируют цену, устанавливают рейтинг популярности лиц или товаров и т. д.

Медианой (Me) называют варианту, которая является серединой упорядоченного (ранжированного) вариационного ряда, т. е. делит его на две равные части: одна часть имеет значения вариационного признака, меньшие средней, другая ? бoльшие. Медиана указывает на значение вариационного признака, которого достигла половина единиц совокупности.

Мода и медиана. в отличие от степенных средних, являются конкретными характеристиками вариационного ряда, имеют определённые значения, поэтому их ещё называют описательными характеристиками. Такое их свойство связано с тем, что в этих величинах погашаются индивидуальные отклонения, как в случае средних. Описательные характеристики всегда соответствуют полному варианту. Мода и медиана не являются типичными характеристиками для исследования однородных совокупностей с большим числом наблюдений.

Нахождение моды и медианы в дискретном вариационном ряду не составляет трудностей, поскольку варианты соответствуют определённым числам.

Иногда встречаются ряды распределения, в которых не одна, а две или больше вариант одинаково модальны, т. е. имеют наибольшие частоты. Это означает, что есть две моды (несколько мод) ? распределение бимодальное (мультимодальное). Такие распределения указывают на качественную неоднородность совокупности по исследуемому признаку.

Медиану в дискретном вариационном ряду определяют по сумме чсех частот, которую нужно поделить на два и к полученному результату прибавить 0,5.

При определении моды и медианы в интервальных вариационных рядах обычно исходят из допущения о равномерном распределении исследуемого признака внутри интервалов. Для учёта же неравномерного распределения признака применяют модель аналитического группирования (МАГ).

Меры центральной тенденции говорят нам о концентрации данных на числовой оси. Каждая такая мера в каком-то смысле наилучшим образом «представляет» данные.

Меры центральной тенденции игнорируют различия между данными.

Для измерения вариабельности данных требуются другие описательные статистики.

Среднее арифметическое, или просто среднее, -- одна из основных характеристик выборки.

Определение. Среднее арифметическое - такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).

Если воспользоваться геометрической интерпретацией, то среднее арифметическое можно определить как точку на оси х, которая является абсциссой центра масс гистограммы.

Среднее принято обозначать той же буквой, что и варианты выборки, с той лишь разницей, что над буквой ставится символ усреднения -- черта. Например, если обозначить исследуемый признак через X, а его числовые значения -- через xi, то среднее арифметическое имеет обозначение .

Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Для несгруппированных данных среднее арифметическое определяется по следующей формуле:

где n -- объем выборки; хi -- варианты выборки.

Если данные сгруппированы, то

где n -- объем выборки; k -- число интервалов группировки; ni -- частота i-ого интервала; хi -- срединное значение i-ого интервала.

Среднее арифметическое - величина того же наименования, что и значения признаков.

Нахождение среднего арифметического непрерывного вариационного ряда осложняется если крайние интервалы не замкнуты (то есть имеют вид “менее 10” ”более 60”). В этом случае считается, что ширина первого интервала равна ширине второго, а ширина последнего - ширине предпоследнего.

Среднее арифметическое, вычисленное по формуле (3.2), называют также взвешенным средним, подчеркивая этим, что в формуле (3.2) xi, суммируются с коэффициентами (весами), равными частотам попадания в интервалы группировки.

Определение. Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина -- больше.

Собственно, этим и ограничивается смысловое значение медианы. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных.

Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как

Пусть, например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12 14 14 18 20 22 22 26 28. Тогда ранг медианы

и медиана, обозначаемая символом Ме, совпадает с пятым членом ряда: Ме = 20.

Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 членов: 6 8 10 12 14 16 18 20 22 24.

Ранг медианы оказывается равным

Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.

Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом.

Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n/2 (n -- объем выборки) или накопленная относительная частота -- больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:

где xMeн -- нижняя граница медианного интервала; -- половина объема выборки; hme -- ширина медианного интервала; -- накопленная частота интервала, предшествующего медианному, nMe -- частота медианного интервала.

Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.

Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, среднее арифметическое теряет свою практическую ценность, поскольку при этом значительно большая часть значений признака оказывается выше или ниже среднего арифметического. В этой ситуации медиана представляет собой лучшую характеристику центра распределения.

Определение. Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто.

Ряд называется унимодальным, если в нем только одно модальное значение и полимодальным, если есть несколько значений признака, которые встречаются одинаково часто. Для полимодального ряда моду не вычисляют.

Для дискретного ряда мода находится по определению.

Интервал группировки с наибольшей частотой называется модальным.

Для определения моды в интервальном ряду используется следующая формула:

где хмон -- нижняя граница модального интервала; h -- ширина интервала группировки; nMo -- частота модального интервала; nMo-1 -- частота интервала, предшествующего модальному; nMo+1 -- частота интервала, следующего за модальным.

Бил№6

Определение. Размах вариации - разность между максимальной и минимальной вариантами выборки:

Как видим, размах вычисляется очень просто, и в этом его главное и единственное достоинство. Информативность этого показателя невелика. Можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. Размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки, Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо откоситься с осторожностью.

Дисперсия и стандартное отклонение являются важнейшими характеристиками рассеяния.

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая но выборочным данным, называется выборочной дисперсией и обозначается .

Выборочную дисперсию вычисляют по приведенным ниже формулам:

Для несгруппированных данных

В этой формуле -- сумма квадратов отклонений значений признака xi от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.

Для сгруппированных в интервальный вариационный ряд данных:

Здесь хi -- срединные значения интервалов группировки; -- взвешенная сумма квадратов отклонений.

Размерность дисперсии не совпадает с единицами измерения варьирующего признака. Дисперсия измеряется в единицами измерения признака в квадрате.

Определение. Стандартным отклонением (или средним квадратическим отклонением) называется корень квадратный из дисперсии:

.

Размерность стандартного отклонения в отличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.

Бил№7

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений).

Не располагая сведениями о всей генеральной совокупности, высказанную гипотезу сопоставляют по определенным правилам, с выборочными сведениями и делают вывод о том, можно принять гипотезу или нет.

Процедура сопоставления высказанной гипотезы с выборочными данными называется проверкой гипотезы.

Определение Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

Пример. Пусть Н0 заключается в том, что математическое ожидание генеральной совокупности а = 3. Тогда возможные варианты Н1: а) а ? 3; б) а > 3; в) а < 3.

Определение. Простой называют гипотезу, содержащую только одно предположение, сложной - гипотезу, состоящую из конечного или бесконечного числа простых гипотез.

Пример. Для показательного распределения гипотеза Н0: ? = 2 - простая, Н0: ? > 2 - сложная, состоящая из бесконечного числа простых ( вида ? = с, где с - любое число, большее 2).

В результате проверки правильности выдвинутой нулевой гипотезы ( такая проверка называется статистической, так как производится с применением методов математичес-кой статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключаю-щаяся в том, что будет принята неверная гипотеза.

Замечание. Какая из ошибок является на практике более опасной, зависит от конкретной задачи. Например, если проверяется правильность выбора метода лечения больного, то ошибка первого рода означает отказ от правильной методики, что может замедлить лече-ние, а ошибка второго рода (применение неправильной методики) чревата ухудшением состояния больного и является более опасной.

Бил№8

Определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U(x1, x2, …, xn) - функции от результатов наблюдений x1, x2, …, xn. В пространстве значений статистики U выделяют критическую область ?, т.е. область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят -отвергают) нулевую гипотезу, в противном случае - не отвергают (т.е. принимают).

Статистику U, используемую при построении определенного статистического критерия, называют статистикой этого критерия.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические - в непараметрических задачах.

Параметрическими называются те статистические критерии, которые используют в процессе расчетов параметры распределения, то есть средние значения и дисперсии (среднеквадратические отклонения). Помимо этого, должно выполняться требование соответствия эмпирического распределения нормальному распределению (по крайней мере, с известной степенью приближенности). Существуют способы проверки такого соответствия, например, . ?2 - критерий Пирсона. Примером параметрического критерия может служить t - критерий Стьюдента, позволяющий непосредственно оценивать различия в средних между двумя выборками (сравнивать среднее значение выборки с каким-либо заданным числом).

Непараметрическими называются критерии, не включающие в формулу расчета параметры распределения, и оперирующие частотами или рангами.

Различают односторонние и двухсторонние критерии. Для одностороннего критерия область принятия основной гипотезы может иметь ограничение только с одной стороны (сверху или снизу). При этом область значений статистики кр разбивается на две: область правдоподобных и область неправдоподобно больших или неправдоподобно малых значений.

Для двухстороннего критерия область принятия гипотезы Н0 имеет два ограничения - сверху и снизу.

Бил №9

Ошибки первого и второго рода

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Вероятность совершить ошибку первого рода принято обозначать через ; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0.05 или 0.01. Если, например, принят уровень значимости, равный 0.05, то это означает, что в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу).

Мощность критерия: -- вероятность отклонить гипотезу , если на самом деле верна альтернативная гипотеза . Мощность критерия является числовой функцией от альтернативной гипотезы .

В статистике величину называют статистимчески знамчимой, если мала вероятность чисто случайного возникновения её или ещё более крайних величин. Здесь под крайностью понимается степень отклонения от нуль-гипотезы. Разница называется «статистически значимой», если имеются данные, появление которых было бы маловероятно, если предположить, что эта разница отсутствует; это выражение не означает, что данная разница должна быть велика, важна, или значима в общем смысле этого слова.

Уровень значимости теста -- это традиционное понятие проверки гипотез в частотной статистике. Он определяется как вероятность принять решение отклонить нуль-гипотезу, если на самом деле нуль-гипотеза верна (решение известное как ошибка первого рода, или ложноположительное решение.) Процесс решения часто опирается на p-величину (читается «пи-величина»): если p-величина меньше уровня значимости, то нуль-гипотеза отвергается. Чем меньше p-величина, тем более значимой называется тестовая статистика. Чем меньше p-величина, тем сильнее основания отвергнуть нуль-гипотезу.

Уровень значимости обыкновенно обозначают греческой буквой ? (альфа). Популярными уровнями значимости являются 5%, 1%, и 0.1%. Если тест выдаёт p-величину меньше ?-уровня, то нуль-гипотеза отклоняется. Такие результаты неформально называют «статистически значимыми». Например, если кто-то говорит, что «шансы того, что случившееся является совпадением, равным одному из тысячи», то имеется в виду 0.1 % уровень значимости.

Бил №10

U - критерий Манна-Уитни.

Назначение критерия.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1 и n2 больше или равны 3 (либо n1 = 2, а n2 тогда больше или равно 5.)

Описание критерия.

Метод определяет, достаточно ли мала зона пересекающихся значений между двумя рядами. Чем меньше эта область, тем более вероятно, что различия достоверны. Эмпирическое (фактически полученное) значение критерия U отражает то, насколько велика зона совпадения между рядами. Чем меньше Uэмп., тем более вероятно, что различия достоверны.

Гипотезы.

Но: Уровень признака в группе 2 не ниже уровня признака в группе 1.

Н1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения критерия U.

1. В каждой выборке должно быть не менее 3 наблюдений или, в крайнем случае, допускается соотношение 2 к 5 или более.

2. В каждой выборке должно быть не более 60 наблюдений.

Алгоритм подсчета критерия U - Манна-Уитни.

1. Перенести все данные выборок на индивидуальные карточки (на которых цветом или как-то еще будет отражено, к какой из выборок принадлежит значение).

2. Разложить все карточки в общий ряд по мере нарастания признака, не считаясь с тем, к какой выборке они относятся.

3. Проранжировать (согласно алгоритму ранжирования) значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов должно быть n1 + n2 (объем первой выборки + объем второй выборки).

4. Заново разложить карточки в два ряда, по признаку принадлежности к выборке 1 или выборке 2.

5. Подсчитать сумму рангов отдельно на карточках группы 1 и группы 2. Проверить совпадение общей суммы рангов с расчетной.

6. Определить большую из двух ранговых сумм.

7. Определить значение U по формуле:

8. Определить из таблиц критические значения U, в соответствии с этим, принять либо отклонить гипотезу Но.

Бил №11 Н - критерий Крускала-Уоллиса

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

Н1: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п=3, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р?0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица предусмотрена только для трех выборок и {n1, n2, n3}?5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия ?2, поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению ?2 (Носенко И.А., 1981; J. Greene, M. D'Olivera, 1982).

Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.

АЛГОРИТМ 5 Подсчет критерия Н Крускала-Уоллиса

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5. Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

6. Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.

7. Подсчитать значение критерия Н по формуле:

шкала частотный ряд вероятность

где N - общее количество испытуемых в объединенной выборке;

n - количество испытуемых в каждой группе;

Т - суммы рангов по каждой группе.

8а. При количестве групп с=3, n1*n2*n3?5 определить критические значения и соответствующий им уровень значимости по Табл. IV Приложения 1.

Если Нэмп равен или превышает критическое значение H0,05, H0 отвергается.

8б. При количестве групп с>3 или количестве испытуемых n1*n2*n3>5, определить критические значения ?2 по Табл. IX Приложения 1.

Если Нэмп равен или превышает критическое значение ?2, H0 отвергается.

Бил №12 S - критерий тенденций Джонкира

Критерий S предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок.

Описание критерия S

Критерий S позволяет нам упорядочить обследованные выборки по какому-либо признаку, например, по креативности, фрустрационной толерантности, гибкости и т.п.

Мы сможем утверждать, что на первом месте по выраженности исследуемого признака стоит выборка, скажем, Б, на втором - А, на третьем - В и т.д. Интерпретация полученных результатов будет зависеть от того, по какому принципу были образованы исследуемые выборки. Здесь возможны два принципиально отличных варианта.

1) Если обследованы выборки, различающиеся по качественным признакам (профессии, национальности, месту работы и т. п.), то с помощью критерия S мы сможем упорядочить выборки по количественно измеряемому признаку (креативности, фрустрационной толерантности, гибкости и т.п.).

2) Если обследованы выборки, различающиеся или специально сгруппированные по количественному признаку (возрасту, стажу работы, социометрическому статусу и др.), то, упорядочивая их теперь уже по другому количественному признаку, мы фактически устанавливаем меру связи между двумя количественными признаками. Например, мы можем показать с помощью критерия S, что при переходе от младшей возрастной группы к старшей фрустрационная толерантность возрастает, а гибкость, наоборот, снижается.

Меру связи между количественно измеренными переменными можно установить с помощью вычисления коэффициента ранговой корреляции или линейной корреляции (см. Главу 6). Однако критерий тенденций S имеет следующие преимущества перед коэффициентами корреляции:

а) критерий тенденций S более прост в подсчете;

б) он применим и в тех случаях, когда один из признаков варьирует в узком диапазоне, например, принимает всего 3 или 4 значения, в то время как при подсчете ранговой корреляции в этом случае мы получаем огрубленный результат, нуждающийся в поправке на одинаковые ранги.

Критерий S основан на способе расчета, близком к принципу критерия Q Розенбаума. Все выборки располагаются в порядке возрастания исследуемого признака, при этом выборку, в которой значения в общем ниже, мы помещаем слева, выборку, в которой значения выше, правее, и так далее в порядке возрастания значений. Таким образом, все выборки выстраиваются слева направо в порядке возрастания значений исследуемого признака.

При упорядочивании выборок мы можем опираться на средние значения в каждой выборке или даже на суммы всех значений в каждой выборке, потому что в каждой выборке должно быть одинаковое 1 количество значений. В противном случае критерий S неприменим j (подробнее об этом см. в разделе "Ограничения критерия S").

Для каждого индивидуального значения подсчитывается ко-\личество значений справа, превышающих его по величине. Если тенденция возрастания признака слева направо существенна, то большая [часть значений справа должна быть выше. Критерий S позволяет определить, преобладают ли справа более высокие значения или нет. Статистика S отражает степень этого преобладания. Чем выше эмпирическое [значение S, тем тенденция возрастания признака является более существенной.

Следовательно, если Sэмп равняется критическому значению или превышает его, нулевая гипотеза может быть отвергнута.

Гипотезы

Н0: Тенденция возрастания значений признака при переходе от выборки к выборке является случайной.

H1: Тенденция возрастания значений признака при переходе от выборки к выборке не является случайной.

Ограничения критерия S

1. В каждой из сопоставляемых выборок должно быть одинаковое число наблюдений. Если число наблюдений неодинаково, то придется искусственно уравнивать выборки, утрачивая при этом часть полученных наблюдений.

Например, если в двух выборках по 7 наблюдений, а в третьей -11, то 4 из них необходимо отсеять. Для этого карточки с индивидуальными значениями переворачиваются лицевой стороной вниз и перемешиваются, а затем из них случайным образом извлекается 7 карточек. Оставшиеся 4 карточки с индивидуальными значениями не включаются в дальнейшее рассмотрение и в подсчет критерия S. Ясно, что при таком подходе часть информации утрачивается, и общая картина может быть искажена.

Если исследователь хочет избежать этого, ему следует воспользоваться критерием Н, позволяющим выявить различия между тремя и более выборками без указания на направление этих различий (см. параграф 2.4).

2. Нижний порог: не менее 3 выборок и не менее 2 наблюдений в каждой выборке. Верхний порог в существующих таблицах: не более 6 выборок и не более 10 наблюдений в каждой выборке (см. Табл. III Приложения 1 для определения критических значений S). При большем количестве выборок или наблюдений в них придется пользоваться критерием Н Крускала-Уоллиса.

АЛГОРИТМ 6 Подсчет критерия S Джонкира

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Если количества испытуемых в группах не совпадают, уравнять группы, ориентируясь на количество наблюдений в меньшей из групп. Например, если в меньшей из групп п=3, то из остальных групп необходимо случайным образом извлечь по три карточки, а остальные отсеять.

Если во всех группах одинаковое количество испытуемых (n<10), можно сразу переходить к п. 3.

3. Разложить карточки первой группы в порядке возрастания признака и занести полученный ряд значений в крайний слева столбец таблицы, затем проделать то же самое для второй группы и занести полученный ряд значений во второй слева столбец, и так далее, пока не будут заполнены все столбцы таблицы.

4. Начиная с крайнего левого столбца подсчитать для каждого индивидуального значения количество превышающих его значений во всех столбцах справа (Si). Полученные суммы записать в скобках рядом с каждым индивидуальным значением.

5. Подсчитать суммы показателей в скобках по столбцам.

6. Подсчитать общую сумму, просуммировав все суммы по столбцам. Эту общую сумму обозначить как А.

7. Подсчитать максимально возможное количество превышающих значений (В), которое мы получили бы, если бы все значения справа были выше значений слева:

где с - количество столбцов (сопоставляемых групп);

n - количество наблюдений в каждом столбце (группе).

8. Определить эмпирическое значение S по формуле:

S=2·A-B

9. Определить критические значения S по Табл. III Приложения 1 для данного количества групп (с) и количества испытуемых в каждой группе (n).

Если эмпирическое значение S превышает или по крайней мере равняется критическому значению, H0 отвергается.

Алгоритм принятия решения о выборе критерия для сопоставлений

Бил №14

Т - критерий Вилкоксона.

Назначение критерия.

Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

Описание критерия.

Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.

Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.

Гипотезы.

Но. Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

Н1. Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

Ограничения критерия.

Объем выборки - от 5 до 50 элементов.

Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)

Алгоритм вычисления Т - критерия Вилкоксона.

Составить список испытуемых в любом порядке, например, алфавитном.

Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.

Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.

Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.

Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. - сдвиг в «типичную» сторону достоверно преобладает.

Бил №15т . Критерий ?2r Фридмана

Назначение критерия

Критерий ?2r применяется для сопоставления показателей, измеренных в трех или более условиях на одной и той же выборке испытуемых.

Критерий позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений.

Описание критерия

Данный критерий является распространением критерия Т Вилкоксона на большее, чем 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения, полученные данным испытуемым в 1, 2, 3 и т. д. замерах.

Например, если у испытуемого в первом замере определена скорость прохождения графического лабиринта 54 сек, во втором замере -42 сек, а в третьем замере - 63 сек, то эти показатели получат ранги, соответственно, 2, 1, 3, поскольку меньшему значению, полученному во втором замере, мы начислим ранг 1, среднему значению, полученному в первом замере - ранг 2, а наибольшему значению, полученному в третьем замере - ранг 3.

После того, как все значения будут проранжированы, подсчитыва-ются суммы рангов по столбцам для каждого из произведенных замеров.

Если различия между значениями признака, полученными в разных условиях, случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если значения признака изменяются в разных условиях каким-то закономерным образом, то в одних условиях будут преобладать высокие ранги, а в других - низкие. Суммы рангов будут достоверно различаться между собой. Эмпирическое значение критерия ?2r и указывает на то, насколько различаются суммы рангов. Чем больше эмпирическое значение ?2r, тем более существенные расхождения сумм рангов оно отражает.

Если ?2r равняется критическому значению или превышает его, различия статистически Достоверны.

Гипотезы

Н0: Между показателями, полученными (измеренными) в разных условиях, существуют лишь случайные различия.

H1: Между показателями, полученными в разных условиях, существуют неслучайные различия.

Ограничения критерия

1. Нижний порог: не менее 2-х испытуемых (n?2), каждый из которых прошел не менее 3-х замеров (с?3).

2. При с=3, n?9, уровень значимости полученного эмпирического значения ?2r определяется по Таблице VII-A Приложения 1; при с=4, n?4, уровень значимости полученного эмпирического значения ?2r определяется по Таблице VII-Б Приложения 1; при больших количествах испытуемых или условий полученные эмпирические значения ?2r сопоставляются с критическими значениями ?2r, определяемыми по Таблице IX Приложения 1. Это объясняется тем, что ?2r имеет распределение, сходное с распределением ?2r. Число степеней свободы v определяется по формуле:

v=c--1,

где с - количество условий измерения (замеров).

АЛГОРИТМ 10

Подсчет критерия ?2r Фридмана

1. Проранжировать индивидуальные значения первого испытуемого, полученные им в 1-м, 2-м, 3-м и т. д. замерах.

2. Проделать то же самое по отношению ко всем другим испытуемым.

3. Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной суммой.

4. Определить эмпирическое значение ?2r по формуле:

где с - количество условии;

п - количество испытуемых;

Ti - суммы рангов по каждому из условий.

5. Определить уровни статистической значимости для ?2r

а) при с=3, n<9 - по Табл. VII-A Приложения 1;

б) при с=4, n<4 - по Табл. VII-Б Приложения 1.

6. При большем количестве условий и/или испытуемых - определить количество степеней свободы v по формуле:

v=c-1,

где с - количество условий (замеров).

По Табл. IX Приложения 1 определить критические значения критерия ?2 при данном числе степеней свободы V.

Если ?2r эмп равен критическому значению ?2 или превышает его, различия достоверны.

Бил №16. L - критерий тенденций Пейджа

Назначение L - критерия тенденций

Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых.

Критерий позволяет выявить тенденции в изменении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмана, поскольку он не только констатирует различия, но и указывает на направление изменений.

Описание критерия тенденций L

Критерий позволяет проверить наши предположения об определенной возрастной или ситуативно обусловленной динамике тех или иных признаков. Он позволяет объединить несколько произведенных замеров единой гипотезой о тенденции изменения значений признака при переходе от замера к замеру. Если бы не его ограничения, критерий был бы незаменим в "продольных", или лонгитюдинальных, исследованиях.

К сожалению, имеющиеся таблицы критических значений рассчитаны только на небольшую выборку (n<12) и ограниченное количество сопоставляемых замеров (с<6).

В случае, если эти ограничения не выполняются, приходится использовать критерий ?2r Фридмана, рассмотренный в предыдущем параграфе.

В критерии L применяется такое же ранжирование условий по каждому испытуемому, как и в критерии ?2r. Если испытуемый в первом опыте допустил 17 ошибок, во втором - 12, а в третьем - 5, то 1-й ранг получает третье условие, 2-й ранг - второе, а 3-й ранг - первое условие. После того, как значения всех испытуемых будут проранжиро-ваны, подсчитываются суммы рангов по каждому условию. Затем все условия располагаются в порядке возрастания ранговых сумм: на первом месте слева окажется условие с меньшей ранговой суммой, за ним -условие со следующей по величине ранговой суммой, и т. д., пока справа не окажется условие с самой большой ранговой суммой. Далее мы с помощью специальной формулы подсчета L проверяем, действительно ли значения возрастают слева направо. Эмпирическое значение критерия L отражает степень различия между ранговыми суммами, поэтому чем выше значение L, тем более существенны различия.

Гипотезы

Н0: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.

H1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, неслучайно.

При формулировке гипотез мы имеем в виду новую нумерацию условий, соответствующую предполагаемым тенденциям.

Ограничения критерия Пейджа

1. Нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в разных условиях. Верхний порог - 12 испытуемых и 6 условий (n?12, c?6). Критические значения критерия L даны по руководству J.Greene, M. D'Olivera (1989). Они предусматривают три уровня статистической значимости: р?0,05; р?0,01; р?0,001.

2. Необходимым условием применения теста является упорядоченность столбцов данных: слева должен располагаться столбец с наименьшей ранговой суммой показателей, справа - с наибольшей. Можно просто пронумеровать заново все столбцы, а потом вести расчеты не слева направо, а по номерам, но так легче запутаться.

АЛГОРИТМ 11

Подсчет критерия тенденций L Пейджа

1. Проранжировать индивидуальные значения первого испытуемого, полученные им в 1-м, 2-м, 3-ми т. д. замерах.

При этом первым может быть любой испытуемый, например первый по алфавиту имен.

2. Проделать то же самое по отношению ко всем другим испытуемым.

3. Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной суммой.

4. Расположить все условия в порядке возрастания их ранговых сумм в таблице.


Подобные документы

  • Понятие моды и медианы как типичных характеристик, порядок и критерии их определения. Нахождение моды и медианы в дискретном и интервальном вариационном ряду. Квартили и децили как дополнительные характеристики вариационного статистического ряда.

    контрольная работа [22,0 K], добавлен 11.09.2010

  • Преобразование эмпирического ряда в дискретный и интервальный. Определение средней величины по дискретному ряду с использованием ее свойств. Расчет по дискретному ряду моды, медианы, показателей вариации (дисперсия, отклонение, коэффициент осцилляции).

    контрольная работа [689,8 K], добавлен 17.04.2011

  • Методические рекомендации для решения задач по общей теории статистики. Формулы для вычисления моды. Расчет медианы для интервального ряда. Определение средней арифметической простой, средней геометрической. Расчет индекса структурных сдвигов.

    методичка [101,6 K], добавлен 22.03.2010

  • Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа [150,6 K], добавлен 15.12.2010

  • Затраты на рабочую силу как объект статистического изучения. Применение индексного метода. Нахождение моды и медианы интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик ряда распределения, средней арифметической.

    курсовая работа [920,1 K], добавлен 04.05.2013

  • Определение для вариационного ряда: средней арифметической, дисперсии, моды, медианы, относительных показателей вариации. Проведение смыкания рядов динамики c использованием коэффициента сопоставимости. Вычисление агрегатных индексов цен и стоимости.

    контрольная работа [23,0 K], добавлен 29.01.2011

  • Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа [218,5 K], добавлен 27.02.2011

  • Группировка единиц наблюдения статистической совокупности по факторному признаку. Расчет средних значений, моды и медианы, показателей вариации. Направление связи между факторной и результативной переменными. Определение вероятности ошибки выборки.

    контрольная работа [634,5 K], добавлен 19.05.2014

  • Показатели признака вариации в ряду. Среднее квадратическое отклонение, линейное отклонение, дисперсия, коэффициент вариации. Нижняя граница модального интервала и его величина. Медиана дискретного вариационного ряда. Определение моды и медианы.

    лабораторная работа [30,8 K], добавлен 21.12.2012

  • Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

    контрольная работа [82,0 K], добавлен 19.05.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.