Меры центральной тенденции
Раскрытие назначения мер центральной тенденции: моды, медианы, среднего арифметического. Приведение примеров и оценка сложности их вычисления. Описание условий применения коэффициента корреляции Фехнера и коэффициента линейной зависимости Пирсона.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 27.02.2016 |
Размер файла | 349,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Раскрыть меры центральной тенденции (Мода, медиана, среднее арифметическое)
Меры центральной тенденции
Назначение М. ц. т. -- служить сводными количественными характеристиками, обеспечивающими наилучшее описание множества наблюдений или оценок одним единственным числом. Термины М. ц. т. и «средняя величина» часто употребляются как равнозначные, хотя некоторые авторы сужают объем понятия «средняя величина» до среднего арифметического. Несмотря на разнообразие М. ц. т., чаще всего встречаются мода, медиана и среднее.
Мода -- это просто наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной.
Медиана -- это значение переменной, делящее упорядоченную совокупность наблюдений пополам, так что одна половина значений в этой совокупности лежит ниже медианы, а др. их половина -- выше медианы. Если совокупность образована нечетным числом значений наблюдаемой переменной, то медиана равна значению переменной, являющемуся серединой упорядоченной совокупности наблюдений. Если же совокупность образована четным числом значений, то медиана определяется значением, лежащим посередине между двумя значениями, находящимися в центре упорядоченной совокупности наблюдений. Медиана -- более полезная мера, чем мода, и часто используется в случае скошенного (асимметричного) распределения данных. Следует, однако, отметить, что медиана нечувствительна к величине крайних значений упорядоченной совокупности наблюдений.
Среднее арифметическое -- самая распространенная мера центральной тенденции -- определяется как сумма значений наблюдаемой переменной, разделенная на их число. (В данной статье под «средним» подразумевается среднее арифметическое.) Использование среднего дает исследователю ряд преимуществ. В отличие от др. М. ц. т., среднее чувствительно к точному положению каждого значения в распределении переменной. Правда, это достоинство среднего арифметического оборачивается недостатком в виде повышенной чувствительности к крайним значениям переменной, и потому его иногда избегают использовать в случае сильно скошенных распределений.
мода медиана фехнер корреляция
2.Укажите в каких случаях используются коэффициент корреляции Фехнера, коэффициент корреляции Пирсона, приведите пример
Коэффициент Фехнера. Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения. Коэффициент это отношение разницы количества совпадения и количества несовпадений к их сумме.
Коэффициент корреляции Фехнера-- это мера взаимосвязи измеренных явлений. Коэффициент корреляции (обозначается «r») рассчитывается по специальной формуле и изменяется от -1 до +1. Показатели близкие к +1 говорят о том, что при увеличении значения одной переменной увеличивается значение другой переменной. Показатели близкие к -1 свидетельствуют об обратной связи, т.е. При увеличении значений одной переменной, значения другой уменьшаются.
Пример. На большой выборке был проведён тест, где по шкале 0 - 10 были оценены Застенчивость и Депрессивность опрашиваемых.
Для наглядности, задаём систему координат, на которой по X будет застенчивость, а по Y -- депрессивность. Таким образом, каждый человек из выборки исследования может быть изображен точкой на этой системе координат. Посчитаем среднее выборок по Застенчивости и среднее выборок по Депрессивности. Посчитаем, у скольки человек при отклонении выборки от среднего по шкале Застенчивости отклонение выборки от среднего по шкале Депрессивности совпадает по знаку. Из десяти опрошенных человек таких оказалось, допустим, 8. Тех, у кого такие отклонения не совпали по знаку, оказалось 2. Тогда коэффициент Фехнера r = (8 - 2)/(8+2) = 0.6.
Таким образом, коэффициент корреляции больший от 0 до 1 говорит о прямопропорциональной связи (чем больше… тем больше…), а коэффициент от -1 до 0 о обратнопропорциональной (чем больше… тем меньше…)
Делаем вывод: между Застенчивостью и Депрессивностью имеется прямопрпорциональная связь, но не полная, а средняя.
Коэффициент Пирсона.
Коэффициент линейной корреляции отражает меру линейной зависимости между двумя переменными. Используя этот коэффициент, следует учитывать, что лучше всего он подходит для оценки взаимосвязи между двумя нормальными переменными. Если распределение переменных отличается от нормального, то он по-прежнему продолжает характеризовать степень взаимосвязи между ними, но к нему уже нельзя применять методы проверки на значимость. Также коэффициент корреляции Пирсона не очень устойчив к выбросам - при их наличии можно ошибочно сделать вывод о наличии корреляции между переменными.
Формула:
Где xi и yi - сравниваемые количественные признаки, n - число сравниваемых наблюдений/
Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
2. Распределения переменных X и Y должны быть близки к нормальному.
3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
4. Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы k = n - 2.
Меры центральной тенденции
В статистике наиболее распространенными являются следующие меры центральной тенденции: мода, медиана, среднее значение.
Мода - это такое значение в выборке, которое встречается наиболее часто. хmod . Например: 4, 2, 8, 8, 4, 8, 10. В данном случае хmod=8, т.к. 8 встречается наиболее часто во всей выборке. Возникают различные ситуации, в которых необходимо найти моду.
1 ситуация. В случае, когда все значения выборки встречаются одинаково часто, то принято считать, что выборка не имеет моды.
4, 2, 6, 7, 5, 10 - не имеет моды.
4, 2, 4, 2, 4, 2, 6, 6, 6 - не имеет моды.
4, 2, 4, 2, 4, 2, - не имеет моды.
4, 4, 4, 4, 4 - мода равняется 4 хmod=4.
2 ситуация. Когда два соседних значения в упорядоченной выборке встречаются одинаково часто и чаще, чем все остальные значения, то в этом случае мода равняется среднему значению этих двух соседних величин.
1, 4, 3, 3, 6, 2, 8, 2, 10
1, 2, 2, 3, 3, 4, 6, 8, 10 - упорядоченная выборка.
Хmod= (2+3):2=2,5
1, 2, 2, 5, 5, 7, 9 (если между ними нет других значений - то соседние значения) хmod= (2+5):2=3,5
1, 4, 3, 3, 6, 6, 8, 2, 10 - это не вторая ситуация, а третья. Выборка здесь не упорядочена.
3 ситуация. Если два не соседних значения в упорядоченной выборке встречаются одинаково часто и чаще, чем все остальные значения, то в этом случае говорят, что выборка имеет две моды и называют выборку бимодальной (тримодальной).
Пример: 4, 2, 3, 6, 4, 2
2, 2, 3, 4, 4, 6
4, 2, 3, 6, 4, 2, 6
2, 2, 3, 4, 4, 6, 6 хmod1=2; xmod2=(4+6):2=5
2, 2, 4, 4, 6, 6, 10, 12 хmod=(2+4+6):3=4
4, 4, 4, 8, 8, 8, 11, 11 xmod=(4+8):2=6
Например: xmod=108 (IQ). Значит, в этой группе наиболее часто встречается 108, но не говорится сколько.
4, 4, 4, 2, 6, 7 - хmod=4
Медиана - это такое значение, которое делит упорядоченную выборку пополам, т.е. половина значений выборки меньше медианы, а вторая половина больше медианы, хmed или Md.
xmed=K0,5(квантиль)=P50(процентиль)=D5(дециль)=Q2(квартиль).
При вычислении медианы возможны две ситуации:
1 ситуация. Количество наблюдений в выборке нечетно. В этом случае медиана равна значению, расположенному точно в серединеупорядоченной выборки.
3, 8, 6, 5, 4
3, 4, 5. 6. 8 - сначала упорядочиваем выборку, Хmed=5.
2 ситуация. Количество наблюдений в выборке четно. В этом случае в качестве медианы выбирается среднее значение двух центральных значений упорядоченной выборки.
2, 3, 5, 8, 7, 10
2, 3, 5, 7, 8, 10 хmed=(5+7):2=6
хmed=108. это говорит о том, что половина клиентов имеет IQ 108 и меньше, а вторая -108 и больше.
Если исходная выборка представлена в виде таблицы, полученной в результате табулирования данных, то медиану можно найти, рассматривая накопленные частоты. Пример: в результате табулирования получилась таблица:
Границы интервалов |
Частоты |
Накопленные частоты |
|
4-6 6-8 8-10 10-12 12-14 |
2 5 4 13 3 |
2 7 11 24 27 |
13+1+13=27 - медианой будет выступать 14-ое значение, Хmed=11.
Среднее значение вычисляется следующим образом: суммируются все элементы выборки и полученная сумма делится на количество элементов в выборке. Обозначается х. хср, х.
x=(x1+x2+…+xn) : n= xi : n
n
xi=x1+x2+...+xn
i=1
48
х6+х7+…+х48= хi
i=6
21
y4+y5+…+y21= yk
k=4
n 2 2 2 2
xi = x1 + x2 +...+ xn
i=1
Если выборка представлена в виде частотного ряда
zi |
z1 |
z2 |
... |
zk |
|
ni |
n1 |
n2 |
... |
nk |
k k
x=(z1 n1+z2 n2+...+zk nk) : (n1+n2+...+nk)= (zi ni) : ni
i=1 i=1
Пример: вычислить моду, медиану и среднее значение следующей выборки: 7, 3, 3, 6, 4, 5, 1, 2, 1, 3
xmod=3
1, 1, 2, 3, 3, 3, 4, 5, 6, 7
n=10
xmed=(3+3):2=3
x= (7+3+3+6+4+5+1+2+1+3):10=35:10=3,5
Пример: вычислить моду, медиану и среднее значение для выборки, представленной в виде следующего частотного ряда:
zi |
2 |
3 |
4 |
5 |
7 |
10 |
||
ni |
3 |
1 |
2 |
3 |
4 |
2 |
=15 |
xmod=7 (самое большое число во второй строчке)
n=15
xmed=5
x=(2 3+3 1+4 2+5 3+7 4+10 2):15=80:15=5,33
Свойства среднего значения.
1. Если выборка состоит из одного и того же значения, то среднее значение этой выборки будет равно этому значению. 1245, 1245, 1245 х=1245.
2. Если к каждому элементу выборки добавить одну и ту же величину с, то среднее значение новой выборки будет равняться среднему значению старой выборки, измененному на эту величину с. хнов.=хстар.+с. с может быть положительным и отрицательным. 220, 221, 223, 225
0 1 3 5
хнов.=(0+1+3+5):4=9:4=2,25
хнов.=хстар.+с хстар.=хнов.-с=2,25-(-220)=2,25+220=222,25
3. Если каждый элемент выборки умножить на одну и ту же величину с, то среднее значение новой выборки будет равно среднему значению старой выборки, измененному в с раз. 2, 3, 5, 8 с=120
х=(2+3+5+8):4=18:4=4,5
240. 360, 600, 960 хнов.=4,5 120=540
Вычисление мер центральной тенденции можно производить с помощью мастера функций, имеющегося вMicrosoft Excel (fx). Мода выборки вычисляется с помощью функции Мода (исходный диапазон). В качестве аргумента указывается диапазон ячеек, в которых находится исходная выборка. Мода (А1:А38) #Н/Д (моды нет)
А |
В |
С |
Д |
||
1 |
… |
… |
|||
2 |
… |
… |
|||
3 |
… |
… |
|||
… |
… |
… |
|||
38 |
… |
… |
К сожалению, в случае нескольких мод у одной выборки в качестве результата выдается только одна из них (не дают информации, что несколько мод).
Для вычисления медианы используется функция Медиана (исходный диапазон) С1:С36. Для вычисления среднего значения используется функция Срзнач (исходный диапазон)
Желательно при обработке исходных данных использовать все 3 меры центральной тенденции. Отметим некоторые особенности рассмотрения мер центральной тенденции.
1. В небольших выборках мода может быть совершенно не стабильной. 1, 1, 1, 3, 5, 7, 7, 8 хmod=1 xmod=7.
2. На медиану не влияют величины самых больших и самых малых значений. 1, 1, 3, 5, 7 хmed=3.
3. На величину среднего значения оказывает влияние каждый элемент выборки, если какой-либо элемент выборки изменится на величину с, то среднее значение изменится в том же направлении, на величину с/n.
4. Некоторые выборки вообще нельзя охарактеризовать с помощью мер центральной тенденции. Особенно это справедливо для выборок, имеющих более, чем 1 моду.
Пусть тест успеваемости, состоящий из 8 различных задач, позволяет разделить исследуемую группу учащихся на тех, кто усвоил определенные понятия и тех, кто не усвоил. Предположим, что усвоившие получают оценки 6,7,8, а не усвоившие 0,1,2. В ходе эксперимента получаемые результаты можно представить в виде следующей гистограммы:
С точки зрения трудности вычисления медиана занимает промежуточное положение между модой и средним значением. Рассмотрим пример, как изменяются меры центральной тенденции, если выборки отличаются хотя бы одним элементом.
1, 3, 3, 5, 6, 7, 8 xmod=3 xmed=5 x=(1+3+3+5+6+7+8):7=33/7
1, 3, 3, 5, 6, 7, 16 xmod=3 xmed=2 x=(1+3+3+5+6+7+16):7=41/7
Мода и медиана являются более устойчивыми характеристиками, чем среднее значение. В общем случае нельзя однозначно сказать, какая из мер центральной тенденции больше, а какая меньше, т.е. имеется в виду если изображать на числовой оси, могут оказаться различные варианты
Список использованной литературы
1. Тарасов С.Г. Основы применения математических методов в психологии. СПб, 1998
2. Артемьева Е. Ю., Мартынов Е. М. Вероятностные методы в психологии. - М.: МГУ, 1975.
3. Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. - СПб.: «Речь», 2004.
Иные информационные источники
1. www.prosvetlenie.org
2. www/psystat.at.ua
Размещено на Allbest.ru
Подобные документы
Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
курсовая работа [593,2 K], добавлен 28.06.2009Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.
курсовая работа [782,6 K], добавлен 19.05.2014Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.
презентация [92,4 K], добавлен 01.11.2013Обобщенные циклотомические последовательности. Цикломатические числа и их свойства. Метод расчета линейной сложности обобщенных циклотомических последовательностей. Примеры вычисления линейной сложности двоичных последовательностей с периодами.
курсовая работа [797,5 K], добавлен 13.06.2013Адекватная линейная регрессионная модель. Правило проверки адекватности. Определение математического ожидания, коэффициента детерминации, множественного коэффициента корреляции по характеристикам случайных величин. Оценка дисперсии случайной ошибки.
контрольная работа [160,0 K], добавлен 13.08.2013Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.
задача [140,0 K], добавлен 17.11.2011Понятие и примеры шкалы отношений. Что такое стратифицированная (или расслоенная) выборка. Определение медианы и мощности критерия. Характеристика термина "процентиль". Влияние коэффициента корреляции на зависимость между исследуемыми величинами.
контрольная работа [51,0 K], добавлен 29.09.2010Понятие, виды, функции средней величины и значение метода средних величин статистике. Особенности уравнения тренда на основе линейной зависимости. Парные и частные коэффициенты корреляции. Сущность предела нахождения среднего процента содержания влаги.
контрольная работа [42,8 K], добавлен 07.12.2008