Математическая статистика

Определение выборки и генеральной совокупности, их числовые характеристики. Понятие признака, частоты признака и кумулятивной частоты. Нахождение среднего арифметического и геометрического. Определение вариации, моды и медианы, коэффициент корреляции.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 19.09.2009
Размер файла 247,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

- 22 -

ХРИСТИАНСКИЙ ГУМАНИТАРНО-ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ

КОНТРОЛЬНАЯ РАБОТА

Студентки 4 сокр. курса гуманитарного факультета

________________________

Учебная дисциплина:

Математическая статистика

Оценка

«___»____________200 г. ___________

Одесса - 2008

ВОПРОСЫ ТЕОРЕТИЧЕСКОЙ ЧАСТИ

1 Дайте определение выборки и генеральной совокупности

Генеральная совокупность - идеализация реальной совокупности (теоретически бесконечная), из которой производится выборка конечного объёма для статистического изучения данной величины, рассматриваемой как случайная величина. Генеральная совокупность состоит из набора всех значений признака, интересующих исследователя.

Выборка - часть генеральной совокупности, элементы которой подвергаются статистическому изучению; предполагается, что элементы этой части выбраны из генеральной совокупности случайным образом.

Число объектов статистической совокупности называется её объёмом.

Объём генеральной совокупности обозначается N, а объём выборочной совокупности n.

Случайная выборка из n элементов - это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным.

Такая выборка называется собственно- случайной.

Различают 2 типа случайных выборок:

· Собственно - случайная повторная выборка (схема возвращённого шара) и

· Собственно - случайная бесповоротная выборка (схема невозвращённого шара).

При осуществлении выборки возможны ошибки наблюдения: ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неточностей, погрешностей при получении сведений о единицах совокупности, когда истинное значение изучаемого признака не совпадает с его зарегистрированным значением.

Для того, чтобы по данным выборки независимо от способа отбора можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы выборка правильно отражала пропорции генеральной совокупности, т.е. выборка должна быть репрезентативной (представительной).

Ошибка репрезентативности представляет собой разность между выборочными и генеральными характеристиками изучаемой совокупности. Если эта разность равна нулю, то ошибки нет. Ошибки репрезентативности бывают:

· Систематическими (возникают из-за того, что нарушается случайность отбора),

· Случайными (возникают потому, что обследуется только часть совокупности).

Если требование случайности отбора выполнено (например, с помощью таблицы случайных чисел), то разность между характеристиками выборочной и генеральной совокупностей называется случайной ошибкой репрезентативности (представительности).

Информация, полученная в результате осуществления выборки будет только тогда надёжной основой для принятия решения относительно тех или иных свойств генеральной совокупности, когда структура образующих выборку элементов будет аналогична структуре элементов в генеральной совокупности.

2 Основные характеристики выборки и генеральной совокупности

Числовые характеристики генеральной совокупности называются генеральными параметрами или просто параметрами.

Например, параметрами нормального распределения являются математическое ожидание и дисперсия. В теории выборочного метода аналогами этих понятий являются генеральная средняя и генеральная дисперсия (поскольку они практически никогда неизвестны, то это теоретические величины) и их обозначают Х, или Хген, уІген = М (Х - Х)І соответственно. Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.

Статистический вывод о параметрах генеральной совокупности основан на анализе значений выборочных характеристик. По данным выборки рассчитывают выборочные числовые характеристики, которые называют статистиками, обозначают Х, или Хвыб, увыб, Sвыб, а выборочная доля обозначается w.

Характеристики, получаемые по различным выборкам, как правило, отличаются друг от друга. Ни при каком n нельзя определить по выборке точное значение неизвестного параметра, можно лишь найти его приближённое значение, которое является оценкой неизвестного параметра по выборке.

Оценка параметра - определённая числовая характеристика, полученная из выборки. Когда одно отдельное значение используется для оценки параметра, то такая оценка называется точечной оценкой генерального параметра.

3 Что такое признак, частота признака, кумулятивная частота

Основной величиной в статистических измерениях является единица статистической совокупности. Единица статистической совокупности характеризуется набором признаков или параметров. Значения каждого параметра или признака могут быть различными и в целом образовывать ряд случайных значений x1, х2, …, хn. Данные - тот критерий, который получаем в ходе исследования, это сведения о том, какие значения принял интересующий аналитика признак. Большинство данных можно отнести к одной из 2 групп:

· Числовые данные, которые имеют смысл в качестве единицы измерения, например, рост человека, IQ, артериальное давление, количество зубов у него, т.е. всё, что можно посчитать (статистики называют числовые данные также количественными данными или данными измерений).

· Категорийные данные представляют собой характеристики, например, пол человека, мнение, раса, т.е. то, что нельзя выразить цифрами и что не имеет конкретного значения (в статистике такие данные ещё называют дискретными данными).

Полученная в результате статистического наблюдения выборка из n значений (вариант) изучаемого количественного признака X образует вариационный ряд. Ранжированный вариационный ряд получают, расположив варианты xj , где , в порядке возрастания значений, то есть . Изучаемый признак X может быть дискретным, то есть его значения отличаются на конечную, заранее известную величину (год рождения, тарифный разряд, число людей), или непрерывным, то есть его значения отличаются на сколь угодно малую величину (время, вес, объем, стоимость).

Частотой mi в случае дискретного признака X называют число одинаковых вариант xi , содержащихся в выборке. В ранжированном вариационном ряду одинаковые варианты очевидно расположены подряд:

Вариационный ряд для дискретного признака X принято наглядно и компактно представлять в виде таблицы, в первой строке которой указаны k различных значений xi изучаемого признака, а во второй строке - соответствующие этим значениям частоты m, где . Такую таблицу называют статистическим (выборочным) распределением.

Переход от исходного вариационного ряда дискретного признака X к соответствующему статистическому распределению можно пояснить на простом примере:

вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) - 7, 17, 14, 17, 10, 7, 7, 14, 7, 14;

ранжированный вариационный ряд -

xj : , где , n = 10;

соответствующее статистическое распределение (, k = 4):

xi

7

10

14

17

mi

4

1

3

2.

Статистическое распределение для непрерывного признака X принято представлять интервальным рядом - таблицей, в первой строке которой указаны k интервалов значений изучаемого признака X вида (xi-1 - xi ), а во второй строке - соответствующие этим интервалам частоты m, где . Обозначение (xi-- xi ) - указывает не разности, а все значения признака X от xi-1 до xi , кроме правой границы интервала xi .

Для непрерывного признака X частота mi - число различных xj , попавших в соответствующий интервал: xj[xi-1 ; xi ):

Переход от исходного вариационного ряда непрерывного признака X к соответствующему статистическому распределению можно пояснить на простом примере:

вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) -3,14; 1,41; 2,87; 3,62; 2,71; 3,95;

ранжированный вариационный ряд -

xj : 1,41; 2,71; 2,87; 3,14; 3,62; 3,95; где , n = 6;

соответствующее статистическое распределение (, k = 3):

xi

1-2

2-3

3-4

mi

1

2

3.

Если число различных значений дискретного признака очень велико, то для удобства дальнейших вычислений и наглядности статистическое распределение такого дискретного признака также может быть представлено в виде интервального ряда.

Вместо частот mi во второй строке могут быть указаны относительные частоты (частости). Очевидно, что сумма частот равна объему выборки (выборочной совокупности) n , а сумма относительных частот (частостей) равна единице:

.

Далее показаны четыре возможных формы представления статистических распределений с соответствующими краткими названиями:

Дискретный ряд частот

Интервальный ряд частот

xi

x1

x2

xk

xi-1-xi

x0-x1

x1-x2

xk-1-xk

mi

m1

m2

mk ,

mi

m1

m2

mk ,

Дискретный ряд частостей

Интервальный ряд частостей

xi

x1

x2

xk

xi-1-xi

x0-x1

x1-x2

xk-1-xk

wi

w1

w2

wk ,

wi

w1

w2

wk .

Если в статистическом распределении вместо частот (относительных частот) указать накопленные частоты (относительные накопленные частоты), то такой ряд распределения называют кумулятивным.

Накопленной частотой называется число значений признака Х, меньших заданного значения x : H(x) = m(Х x), то есть, число вариант xj в выборке, отвечающих условию xj < x.

Переход от дискретного ряда частот к кумулятивному ряду - дискретному ряду накопленных частот задается соотношениями:

или в табличной форме:

xi

x1

x2

x3

xi

xk

xk+1

H(xi)

0

m1

m1+m2

H(xi-1) + mi-1

H(xk-1) + mk-1

H(xk) + mk= n.

Переход от интервального ряда частот к кумулятивному ряду - интервальному ряду накопленных частот задается соотношениями:

или в табличной форме:

xi-1-xi

--x0

x0-x1

x1-x2

xi-1-xi

xk-1-xk

H(xi)

0

m1

m1+m2

H(xi-1) + mi

H(xk-1) + mk= n.

Накопленной относительной частотой (накопленной частостью) называется отношение числа значений признака Х, меньших заданного значения x , к объему выборки : , то есть, доля вариант xj в выборке, отвечающих условию xj < x.

4 Как находятся среднее арифметическое, среднее гармоническое, среднее геометрическое

Среднее арифметическое - числовая характеристика совокупности чисел а1, …. аn , определяемая формулой:

в = (а1 + …..+аn) / n

Среднее гармоническое - числовая характеристика совокупности положительных чисел а1, …. аn, определяемая формулой

n/ (1/а1 + …..+ 1/аn)

Cреднее геометрическое - числовая характеристика совокупности положительных чисел а1, …. аn, определяемая формулой

5 Что называется модой?

Мода (Мо) - наиболее часто встречающееся в данной совокупности значение признака X. Это варианта с наибольшей частотой.

Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д, Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 - мода = 9).

Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»).

6 Что называется медианой?

Медиана (Ме) - это серединное значение признака X; которое приходится на середину ранжированного (упорядоченного ряда), по определению:

.

Если число членов совокупности чётное, то медиана равна полусумме значений признака, занимающих в ранжированном ряду соседние места в центре.

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина -- выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например при описании доходов населения, медиана более удобна, чем среднее. 

Рассмотрим способы определения медианы при различных значениях N. Для нахождения медианы измерения записывают в ряд по возрастанию значений. Если число измерений N нечетное, то медиана численно равна значению этого ряда, стоящему точно в середине, или на (N+1)/2 месте. Например, медиана пяти измерений: 10, 17, 21, 24, 25 - равна 21 - значению, стоящему на третьем месте (N+1)/2=(5+1)/2=3.

Если число измерений четное, то медиана численно равна среднему арифметическому значений ряда, стоящих в середине, или на N/2 и N/2+1 местах. Например, медиана восьми измерений: 5, 5, 6, 7, 8, 8, 9, 9 - равна 7,5 (7+8)/2=7,5 - среднему арифметическому значений ряда, стоящих на четвертом и пятом местах (N/2=8/2=4 и N/2+1=4+1=5).

7 Что называется дисперсией? Что она характеризует?

Мы можем определить вариацию как среднее значение отклонений каждого из вариантов от средней арифметической, согласно свойству средней арифметической, всегда будет равна нулю. Поэтому для нахождения меры вариации мы можем возвести в квадрат каждое отклонение от средней, это изменяет отрицательные знаки отклонений на положительные, и теперь вариация не равна нулю. Сложим полученные значения и разделим сумму на число вариантов ряда. Полученная мера - средняя арифметическая квадратов отклонений называется в статистике дисперсией. Дисперсия - мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего (см. таблицу ниже). Поскольку у - греческая буква, то дисперсию часто просто называют сигма-квадрат, а заглавная греческая буква сигма У используется нами как символ, обозначающий суммирование.

8 Как вычисляется дисперсия и среднее квадратическое отклонение?

Стандартное отклонение (среднее квадратическое) вариационного ряда есть арифметическое значение корня квадратного из дисперсии.

Стандартное отклонение используется в статистике чтобы показатель рассеяния выражался в тех же единицах, что и значение признака (дисперсия этим не обладает). Извлекая квадратный корень из дисперсии мы получаем показатель, имеющий ту же единицу измерения, что и анализируемы й признак.

9 Свойства дисперсии

1. Если значения измеренного признака не отличаются друг от друга (равны между собой) - дисперсия равна нулю. Это соответствует отсутствию изменчивости в данных.

2. Прибавление одного и того же числа к каждому значению переменной не меняет дисперсию.

Dx+c = Dx так как У [(xj + с) - (Mx + c)]І = У (xj - Mx)І.

Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но изменчивость (дисперсия) при этом остается неизменной.

3. Умножение каждого значения переменной на константу с изменяет дисперсию в сІ раз:

Dx·c = Dx·сІ так как У [(xj · с) - (Mx · c)]І = сІУ (xj - Mx)І.

При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается.

10 Что называется полигоном, гистограммой, кумулятой? Как их строить?

Для наглядности принято использовать следующие формы графического представления статистических распределений:

дискретный ряд изображают в виде полигона. Полигон частот - ломаная линия, отрезки которой соединяют точки с координатами (i , i); аналогично, полигон относительных частот - ломаная, отрезки которой соединяют точки с координатами (, w);

Пример 1. Имеется распределение 80 предприятий по числу работающих на них (чел.):

150

250

350

450

550

650

750

1

3

7

30

19

15

5 .

Решение. Признак Х - число работающих (чел.) на предприятии. В данной задаче признак Х является дискретным. Поскольку различных значений признака сравнительно немного - k = 7, применять интервальный ряд для представления статистического распределения нецелесообразно (в прикладной статистике в подобных задачах часто используют именно интервальный ряд). Ряд распределения - дискретный. Построим полигон распределения частот (рис. 1).

Рис. 1

интервальный ряд изображают в виде гистограммы. Гистограмма частот есть ступенчатая фигура, состоящая из прямоугольников, основания которых - интервалы длиной , а высоты - плотности частот . В случае гистограммы относительных частот высоты прямоугольников - плотности относительных частот . Здесь в общем случае  , однако на практике чаще всего полагают величину h одинаковой для всех интервалов: . Очевидно для ранжированного вариационного ряда ; . В скобках указаны индексы j исходного ранжированного вариационного ряда.

Площадь гистограммы есть сумма площадей ее прямоугольников:

таким образом, площадь гистограммы частот равна объему выборки, а площадь гистограммы относительных частот равна единице.

В теории вероятностей гистограмме относительных частот соответствует график плотности распределения вероятностей . Поэтому гистограмму можно использовать для подбора закона распределения генеральной совокупности;

Пример 2. Дано распределение 100 рабочих по затратам времени на обработку одной детали (мин):

xi-1-xi

22-24

24-26

26-28

28-30

30-32

32-34

2

12

34

40

10

2 .

Решение. Признак Х - затраты времени на обработку одной детали (мин). Признак Х - непрерывный, ряд распределения - интервальный. Построим гистограмму частот (рис. 2), предварительно определив (k = 6) и плотность частоты :

xi-1-xi

22-24

24-26

26-28

28-30

30-32

32-34

1

6

17

20

5

1 .

Рис. 2

кумулятивные ряды графически изображают в виде кумуляты. Для ее построения на оси абсцисс откладывают варианты признака или интервалы, а на оси ординат - накопленные частоты Н() или относительные накопленные частоты , а затем точки с координатами (i ; H(i )) или (i ; ) соединяют отрезками прямой. В теории вероятностей кумуляте соответствует график интегральной функции распределения .

Пример 3. В распределении, данном в примере 1, найти накопленные частоты H(i ) и построить кумуляту.

Решение. Используем: H(x1) = 0, H(xi) = H(xi-1) + mi-1 (i=2,3,, k+1 , k = 7).

i

1

2

3

4

5

6

7

8

xi

150

250

350

450

550

650

750

850

mi

1

3

7

30

19

15

5

0

H(i )

0

0+1=1

1+3=4

4+7=11

11+30=41

41+19=60

60+15=75

75+5=80.

На рис. 3 показана кумулята распределения предприятий по числу работающих (чел.).

Рис. 3

Пример 4. В распределении, данном в примере 2, составить эмпирическую функцию распределения и построить кумуляту относительных частот.

Решение. Используем: H(x0) = 0, H(xi) = H(xi-1) + mi (i=1,2,, k , k = 6). ; Проверка: 1.

i

0

1

2

3

4

5

6

xi-1-xi

--22

22-24

24-26

26-28

28-30

30-32

32-34

mi

0

2

12

34

40

10

2

H(i )

0

0+2=2

2+12=14

14+34=48

48+40=88

88+10=98

98+2=100

0

0,02

0,14

0,48

0,88

0,98

1.

Построим кумуляту распределения (см. рис. 4).

Рис. 4

11 Что называется распределением? Какие распределения Вы знаете? Какие параметры распределения Вы знаете? Какое распределение называется нормальным? (Правило 3-х сигм)

Распределением признака называется закономерность встречаемости разных его значений.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно часто. Нормальным называется потому, что оно очень часто встречалось в исследованиях и казалось нормой всякого массового случайного проявления признаков. Закон нормального распределения гласит: Если индивидуальная изменчивостьнекоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения.

Параметры распределения - это его числовые характеристики, указывающие, где в среднем располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определённых значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих двух видов:

средние;

Выборочная средняя:

а) характеризует типичное для выборки значение признака X;

б) приближенно характеризует (оценивает) типичное для генеральной совокупности значение признака X;

- средняя арифметическая; применяется к вариационному ряду (данные наблюдения не сгруппированы);

- взвешенная средняя арифметическая (частоты mi , и частости wi называют весами); используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду).

Структурные (порядковые) средние.

Если  = хмo = хме , то распределение симметричное. При нарушении симметрии равенство нарушается (хотя бы одно).

, если n = 2j - четное;

хме = хj+1 , если = 2j+1 - нечетное.

Медиана - это серединное значение признака X; по определению: .

хмo = xi , если m= mmax (справедливо только для дискретного ряда).

Мода - наиболее часто встречающееся значение признака X.

2) характеристики вариации (рассеяния)

- выборочная дисперсия есть выборочная средняя арифметическая квадратов отклонений значений признака X от выборочной средней (равна среднему квадрату без квадрата средней):

- выборочная дисперсия; применяется к вариационному ряду (данные наблюдения не сгруппированы);

- выборочная взвешенная дисперсия;
используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду);

- средний квадрат есть выборочная средняя арифметическая квадратов значений признака X (для вариационного ряда и для дискретного распределения соответственно).

- выборочное среднее квадратическое отклонение есть арифметическое значение корня квадратного из дисперсии; оно показывает, на сколько в среднем отклоняются значения xj признака X от выборочной средней .

R = хmax - хmin

- размах вариации.

- коэффициент вариации; применяют для сравнения вариации признаков сильно отличающихся по величине, или имеющих разные единицы измерения (разные наименования).

12 Раскройте понятие «показатель асимметрии»

Когда график вариационного ряда (распределение набора данных) скошен в правую сторону больше, чем в левую, то мы говорим, что распределение имеет правостороннюю скошенность (асимметрию). Соответственно, скос в левую сторону даёт левостороннюю скошенность (асимметрию). Для симметричного распределения с одной модой имеет место равенство: мода = медиане = средней арифметической. При правосторонней асимметрии средняя находится справа от моды, при левосторонней наоборот. Чем больше асимметричен график, тем больше асимметричен график, тем больше расхождение между средней арифметической, медианой и модой. Поэтому наиболее простой мерой скошенности вариационного ряда (обозначается Аs) будет разность между средней арифметической и модой (Аs = x - Мо). Если Аs > 0 - асимметрия правосторонняя, если Аs < 0 - левосторонняя. Для сравнения асимметрии в нескольких рядах удобнее пользоваться относительным показателем:

Аs = ( x - Мо) / у

13 Раскройте понятие «показатель эксцесса»

Графики вариационных рядов бывают плосковершинными (низковершинными) и островершинными (высоковершинными). Мерой крутости служит эксцесс (куртозис), который характеризует островершинность или плосковершинность ряда распределения. В качестве показателя эксцесса используется величина:

4

Ех = ( µ4 / у ) - 3.

Если Ех > 0, то эксцесс считают положительным (график ряда распределения островершинный), если Ех < 0, то эксцесс считают отрицательным (график ряда распределения плосковершинный).

14 Что называется квантилем? Что такое квартиль? Сколько их всего? Какой смысл каждого из них?

Квантиль - это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности. К квантилям относятся медиана, квартили, процентили.

Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам (от слова кварта -- четверть).

Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.

Нижнюю квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижней квартили.

Верхнюю квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхней квартили.

Таким образом, три точки -- нижняя квартиль, медиана и верхняя квартиль - делят выборку на 4 равные части.

ј наблюдений лежит между минимальным значением и нижней квартилью, ј - между нижней квартилью и медианой, ј - между медианой и верхней квартилью, ј - между верхней квартилью и максимальным значением выборки.

15 Корреляционная связь - что она характеризует? Чем корреляционная связь отличается от корреляционной зависимости? Что показывает коэффициент корреляции?

Признаки Х и Y находятся в корреляционной зависимости, если каждому значению одного признака xi соответствует определенная условная средняя другого признака.

Коэффициент корреляции - двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных; принимает значения в диапазоне от - 1 до + 1. Это числовая характеристика совместного распределения двух случайных величин x и y, выражающая их взаимосвязь; обозначается с(x,y), и определяется равенством:

с (x, y) = cov (x, y) / vDx·Dy ,

где cov (x, y) - ковариации, Dx и Dy - ненулевые дисперсии x и y.

ПРАКТИЧЕСКАЯ ЧАСТЬ

1. Две группы студентов МГЭУ сдали зачётную сессию со следующими результатами:

1-я группа

студент

1 экз

2 экз

3 экз

4 экз

А1

4

5

3

4

Б1

4

4

4

3

В1

5

3

4

5

Г1

5

5

4

5

Д1

5

4

4

3

Е1

3

3

3

4

И1

4

5

4

5

К1

4

4

4

5

Л1

3

4

3

4

М1

3

3

3

3

Н1

4

3

5

4

2-я группа

студент

1 экз

2 экз

3 экз

4 экз

А2

3

4

5

4

Б2

4

5

4

5

В2

3

2

2

3

Г2

4

3

5

5

Д2

3

2

3

2

Е2

4

5

4

2

И2

3

4

4

4

К2

3

3

3

3

Л2

5

5

5

4

М2

5

4

4

3

Н2

5

5

4

4

Вычислить

1. Средний бал для каждого студента.

2. Средний бал каждой группы

3. Проранжировать студентов каждой группы по успеваемости.

4. Моду и медиану в каждой группе по среднему балу.

5. Дисперсию и среднее квадратичное отклонение оценок в каждой из групп. Сравнить и сделать выводы.

6. Вычислить показатель асимметрии и эксцесса для одной из групп.

7. Построить распределение среднего бала.

Решение:

1 - я группа

студент

1 экз

2 экз

3 экз

4 экз

ср.ст.

Г1

5

5

4

5

4,75

И1

4

5

4

5

4,5

В1

5

3

4

5

4,25

К1

4

4

4

5

4,25

А1

4

5

3

4

4

Д1

5

4

4

3

4

Б1

4

4

4

3

3,75

Л1

3

4

3

4

3,5

Н1

4

3

3

4

3,5

Е1

3

3

3

4

3,25

М1

3

3

3

3

3

ср.ст.группы

3,89

мода 1

медиана 1

дисперсия 1

ср. кв. отк. 1

асим 1

эксц 1

4,250000

4,000000

0,568182

24,43182

0,193047

1,18013

Распределение среднего балла в 1-й группе.

2-я группа

студент

1 экз

2 экз

3 экз

4 экз

ср.ст.

Л2

5

5

5

4

4,75

Б2

4

5

4

5

4,5

Н2

5

5

4

4

4,5

Г2

4

3

5

5

4,25

А2

3

4

5

4

4

М2

5

4

4

3

4

Е2

4

5

4

2

3,75

И2

3

4

4

4

3,75

К2

3

3

3

3

3

В2

3

2

2

3

2,5

Д2

3

2

3

2

2,5

ср.стат.группы

3,78

мода 2

медиана 2

дисперсия 2

ср.кв.отк. 2

асим. 2

эксц. 2

4,5

4

0,970402

41,72727

-0,28119

0,92342

Задание Ч.-2

8 студентов при поступлении в ВУЗ прошли тестирование по 10 методикам. Результаты тестирования приведены в таблице.

студенты

МЕТОДИКИ

1

2

3

4

5

6

7

8

9

10

Васильев

0,5N

1N

1,1N

0,4N

0,8N

0,6N

0,5N

0,3N

0,8N

0,9N

Богданов

0,3N

0,8N

0,9N

0,5N

0,5N

0,3N

1,2N

0,4N

0,6N

0,7N

Антонов

0,4N

0.6N

0,7N

1,4N

0,8N

0,6N

1,2N

0,5N

0,6N

0,8N

Елкин

0,2N

0,7N

0,3N

0,3N

0,8N

0,9N

0,6N

0,8N

0,9N

0.4N

Лесков

0,8N

0,6N

0,5N

1.2N

0.5N

0,6N

0,8N

0,6N

0,7N

0,2N

Гусев

0,3N

0,6N

0,9N

0,4N

0,6N

0,3N

0,6N

0,7N

0,3N

0,8N

Конев

0,4N

0,5N

1,2N

0,2N

0,7N

0,5N

0,7N

0,6N

0,5N

0,6N

Демидов

0,6N

0,5N

1,4N

0,8N

0,6N

0,9N

0,3N

0,8N

0,9N

0,7N

где N - последняя цифра номера зачётной книжки.

Задание:

1. Расположить фамилии студентов по алфавиту (вместе с результатами тестирования).

2. Вычислить средний бал для каждого студента.

3. . Найти дисперсию баллов по всей таблице.

4. Найти дисперсию средних баллов

5. Определить ранг каждого студента по среднему баллу.

6. Найти коэффициент корреляции между тестами 3 и 7. Дать пояснение полученным результатам.

Решение:

студенты

МЕТОДИКИ

1

2

3

4

5

6

7

8

9

10

ср.балл

Антонов

0,43

0,63

0,73

1,43

0,83

0,63

1,23

0,53

0,63

0,83

0,79

Богданов

0,32

0,82

0,92

0,52

0,52

0,32

1,22

0,42

0,62

0,72

0,64

Васильев

0,51

1,1

1,11

0,41

0,81

0,61

0,51

0,31

0,81

0,91

0,709

Гусев

0,36

0,66

0,96

0,46

0,66

0,36

0,66

0,76

0,36

0,86

0,61

Демидов

0,68

0,58

1,48

0,88

0,68

0,98

0,38

0,88

0,98

0,78

0,89

Елкин

0,24

0,74

0,34

0,34

0,84

0,94

0,64

0,84

0,94

0,44

0,63

Конев

0,47

0,57

1,27

0,27

0,77

0,57

0,77

0,67

0,57

0,67

0,66

Лесков

0,85

0,65

0,55

1,25

0,55

0,65

0,85

0,65

0,75

0,25

0,7

Дисперсия - 0,081175

Дисп. ср. балла 0,08911

Коэф. коррел. 3-7 = 0,38722

ЛИТЕРАТУРА

1. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. Пособие для вузов / В.Е. Гмурман. - 9-е изд., стер. - М.: Высш. шк., 2003. - 188 с.

2. Ниворожкина Л.И., Морозова З.А. Теория вероятностей и математическая статистика / М.: Эксмо, 2008. - 432 с.

3. Рамси, Дебора. Статистика для чайников.: Пер. с англ. - М.: ООО «И.Д.Вильямс», 2008. - 320 с.

4. Математико-статистические методы исследования в психологии. / Конспект лекций на правах рукописи / Од.: ХГЭУ, 2005. - 93 с.

5. Микиша А.М. Математика: Основные термины: Толковый словарь: Более 3000 терминов / .М.: ООО «Издательство Астрель»: «Издательство АСТ», 2003. - 448 с.


Подобные документы

  • Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.

    реферат [259,1 K], добавлен 13.06.2011

  • Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.

    творческая работа [17,8 K], добавлен 10.11.2008

  • Средняя величина как обобщенная количественная характеристика признака в статистической совокупности в конкретных условиях места и времени, ее типы и назначение, порядок вычисления. Структурные и арифметическая средние. Определение модального интервала.

    контрольная работа [52,4 K], добавлен 24.11.2010

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Пространство элементарных событий. Понятие совместных и несовместных событий и их вероятностей. Плотность распределения вероятностей системы двух случайных величин. Числовые характеристики системы. Закон генеральной совокупности и его параметры.

    контрольная работа [98,1 K], добавлен 15.06.2012

  • Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.

    курс лекций [759,3 K], добавлен 13.06.2015

  • Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.

    курсовая работа [110,0 K], добавлен 23.07.2009

  • Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.

    курсовая работа [674,3 K], добавлен 03.05.2011

  • Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация [140,3 K], добавлен 01.11.2013

  • Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.

    курсовая работа [1,1 M], добавлен 16.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.