Расчет количества интервалов по формуле Стерджеса
Ранжирование ряда данных сортировкой по значениям от минимального к максимальному. Определение количества, величины и границ интервалов по формуле Стерджеса. Количество единиц совокупности, принадлежащих интервалам. Построить гистограмму распределения.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 28.05.2023 |
Размер файла | 152,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.Ru/
Расчет количества интервалов по формуле Стерджеса
Содержание
- Задания для выполнения рейтинговой работы
- Выполнение задания
- Список использованных источников
Задания для выполнения рейтинговой работы
1. Скопировать данные своего варианта.
2. Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.
3. Рассчитать количество интервалов по формуле Стерджеса, округлив вверх до целых единиц.
4. Рассчитать величину интервала h, округлить до десятков.
5. Рассчитать границы интервалов:
6. Подсчитать количество единиц совокупности, принадлежащих каждому из интервалов.
7. Построить интервальный вариационный ряд в виде таблицы
8. Построить гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.
9. Вычислить среднее арифметическое, моду, медиану, квартили, децили.
10. Вычислить показатели вариации: R, dср, s2, s, Vr, Vd, V. Вычислить асимметрию и эксцесс.
11. Сделать вывод об однородности вариационного ряда, о симметричности и остро- или плоско-вершинности распределения.
1. Скопируем исходные данные
Исходные данные приведены в таблице 1.
Таблица 1
Исходные данные для 12-го варианта
125 |
|
97 |
|
122 |
|
74 |
|
65 |
|
65 |
|
121 |
|
66 |
|
154 |
|
48 |
|
125 |
|
214 |
|
101 |
|
89 |
|
50 |
|
76 |
|
151 |
|
32 |
|
63 |
|
90 |
|
154 |
|
105 |
|
105 |
|
111 |
|
85 |
|
81 |
|
143 |
|
185 |
|
93 |
|
89 |
|
150 |
|
116 |
|
146 |
|
88 |
|
78 |
|
78 |
|
145 |
|
79 |
|
184 |
|
57 |
|
150 |
|
256 |
|
121 |
|
106 |
|
60 |
|
91 |
|
181 |
|
38 |
|
75 |
|
108 |
|
184 |
|
126 |
|
126 |
|
133 |
|
102 |
|
97 |
|
171 |
|
222 |
|
111 |
2. Ранжировать ряд данных сортировкой
Ранжированный ряд представлен в таблице 2.
Таблица 2
Ранжированные данные
32 |
|
38 |
|
48 |
|
50 |
|
57 |
|
60 |
|
63 |
|
65 |
|
65 |
|
66 |
|
74 |
|
75 |
|
76 |
|
78 |
|
78 |
|
79 |
|
81 |
|
85 |
|
88 |
|
89 |
|
89 |
|
90 |
|
91 |
|
93 |
|
97 |
|
97 |
|
101 |
|
102 |
|
105 |
|
105 |
|
106 |
|
108 |
|
111 |
|
111 |
|
116 |
|
121 |
|
121 |
|
122 |
|
125 |
|
125 |
|
126 |
|
126 |
|
133 |
|
143 |
|
145 |
|
146 |
|
150 |
|
150 |
|
151 |
|
154 |
|
154 |
|
171 |
|
181 |
|
184 |
|
184 |
|
185 |
|
214 |
|
222 |
|
256 |
Число наблюдений п = 59.
3. Рассчитаем количество интервалов по формуле Стерджеса:
k = 1 + 3,322 Ч lg n = 1 + 3,322 Ч lg 59 = 6,883
Округляем вверх до целых единиц. Таким образом, будем строить ряд, образовав 7 групп с равными интервалами.
4. Определим величину интервала
При построении интервального ряда с равными интервалами величина интервала h определяется по формуле:
,
где хmax и хmin - наибольшее и наименьшее значения признака в исследуемой совокупности; k- число групп интервального ряда.
Расчет величины интервалов:
Округляя до десятков, получаем h = 30.
5. Рассчитаем границы интервалов
Путем последовательного прибавления величины интервала h = 30 к нижней границе, получаем следующие границы интервалов ряда распределения:
До 3060 - 9090 - 120120 - 150
150 - 180180 - 210210 и более
6, 7. Рассчитаем частоты групп и получим интервальный ряд распределения
Определяем число единиц, входящих в каждую группу, используя принцип полуоткрытого интервала), согласно которому единицы со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов, будем относить ко второму из смежных интервалов. Помимо количества единиц в абсолютном выражении (частот) в таблице 4 рассчитываем относительные частоты (частости) по формуле:
.
Таблица 3
Интервальный ряд распределения
Интервалы групп |
Число наблюдений в группе, единиц |
В % к итогу |
|
До 60 |
5 |
8,5 |
|
60 - 90 |
16 |
27,1 |
|
90 - 120 |
14 |
23,7 |
|
120 - 150 |
11 |
18,6 |
|
150 - 180 |
6 |
10,2 |
|
180 - 210 |
4 |
6,8 |
|
210 и более |
3 |
5,1 |
|
Итого |
59 |
100,0 |
Вывод. Распределение наблюдений по группам не является полностью равномерным. Преобладают наблюдения со значениями признака от 60 до 90 единиц. Это 16 наблюдений, доля которых составляет 27,01% от общего числа наблюдений. Самая малочисленная группа с наибольшим значением признака (свыше 210 единиц). В данную группу попадает 5,1% от общего числа наблюдений (3 единицы).
8. Построим графики ряда распределения
Гистограмма - столбиковая диаграмма, она позволяет визуально оценит симметричность распределения, его близость к нормальному. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения интервалов, а на оси ординат - значения частот или относительных частот Гистограмма строится по 1-му и 2-му столбцу таблицы 3 и представлена на рисунке 1.
Рисунок 1 - Гистограмма распределения
Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты, а на оси ординат - значения частот или относительных частот. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю «левую» точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю «правую» точку также соединяют с точкой оси абсцисс. Для интервального ряда в качестве значений признака принимаем середины интервалов.
Середину интервала находим как среднюю арифметическую из нижней и верхней границ интервалов:
Расчет представлен в таблице 4. Таким образом, полигон строим по 2-му и 3-му столбцу таблицы 4.
Рисунок 2 - Полигон распределения
Кумулята строится по накопленным частотам (расчет представлен в таблице 4). Она начинается с нижней границы 1-го интервала (30), накопленная частота откладывается в верхней границе интервала:
Рисунок 3 - Кумулята распределения
9. Вычислим среднее арифметическое, моду, медиану, квартили, децили
граница интервал серджес совокупность распределение
Для расчета показателей строим вспомогательную таблицу 4.
Таблица 4
Вспомогательная таблица для расчета показателей вариации и центра распределения
Интервалы групп |
Число единиц в группе(частота) |
Середина интервала, |
накопленная частота |
||||
До 60 |
5 |
45 |
225 |
24976,87 |
353,39 |
5 |
|
60 - 90 |
16 |
75 |
1200 |
26475,15 |
650,85 |
21 |
|
90 - 120 |
14 |
105 |
1470 |
1596,27 |
149,49 |
35 |
|
120 - 150 |
11 |
135 |
1485 |
4106,75 |
212,54 |
46 |
|
150 - 180 |
6 |
165 |
990 |
14595,98 |
295,93 |
52 |
|
180 - 210 |
4 |
195 |
780 |
25167,94 |
317,29 |
56 |
|
210 и более |
3 |
225 |
675 |
35853,92 |
327,97 |
59 |
|
Итого |
59 |
6825 |
132772,88 |
2307,46 |
- |
Для расчета среднего в интервальном ряду используется формула средней арифметической взвешенной:
Вывод. В рассматриваемой совокупности среднее значение признака составляет 115,68 единицы.
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо - значение признака, которое встречается наиболее часто в рассматриваемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту).
Конкретное значение моды для интервального ряда рассчитывается по формуле:
,
Где хМo - нижняя граница модального интервала,
h - величина модального интервала,
fMo - частота модального интервала,
fMo-1 - частота интервала, предшествующего модальному,
fMo+1 - частота интервала, следующего за модальным.
Согласно данным модальным интервалом ряда является интервал 60-90, так как его частота максимальна (f1 = 16).
Расчет моды:
85,38
Вывод. Для рассматриваемой совокупности наиболее часто встречаются значения признака равные 85,38 единиц.
Медиана Ме - это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, где
- нижняя граница медианного интервала,
h - величина медианного интервала;
- сумма всех частот ряда;
- частота медианного интервала;
- сумма частот, накопившихся до начала медианного интервала.
Медианным интервалом является интервал 90-120, так как именно в этом интервале накопленная частота S3 =35 впервые превышает величину, равную половине совокупности (0,5?59 = 29,5).
Расчет медианы:
108,21
Вывод. В рассматриваемой совокупности половина значение признак не менее 108,21 единиц, а другая половина - не более 108,21 единиц.
, следовательно, асимметрия правосторонняя, гистограмма сдвинута от центра влево. В совокупности преобладают единицы с более низкими значениями признака, чем среднее значение.
Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.
0-й квартиль - минимальное значение признака;
2-й квартиль - медиана;
1-й и 3-й квартиль рассчитываются аналогично медиане.
Значение Q1 будет находиться в интервале 60-90, т.к. именно в этом интервале накопленная частота равна 21 впервые превышает четверть суммы частот .
78,28
Значение Q3 будет находиться в интервале 120-150, т.к. именно в этом интервале накопленная частота 46 впервые превышает три четверти суммы частот .
145,23
Децили делят совокупность на 10 равных частей. Рассчитываются аналогично медиане и квартилям.
Интервалом 1-го дециля d1 будет является интервал 60-90, т.к. именно в этом интервале накопленная частота 21 впервые превышает 1/10 суммы частот .
61,69
Интервалом 9-го дециля d9 будет интервал 180-210, т.к. в этом интервале накопленная частота 56 впервые превышает 9/10 суммы частот
188,25
10. Вычислим показатели вариации
Вспомогательные расчеты приведены в таблице 5.
Размах вариации характеризует амплитуду колебаний значений признака, рассчитывается как разность максимального и минимального значения признака. Рассчитываем размах по исходным данным:
256 - 32 = 224
Среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Для сгруппированных данных рассчитываем взвешенное среднее линейное отклонение:
38,46
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Для интервального ряда используется формула взвешенной дисперсии:
2212,88
Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Однако является более точной характеристикой. Рассчитывается, как корень квадратный из дисперсии:
47,04
Расчет исправленной (скорректированной) дисперсии:
2212,88Ч59/58 = 2249,76
Расчет исправленного (скорректированного) среднего квадратического отклонения:
47,43
Вывод. Отклонение от среднего значения признака в ту или иную сторону составляет 47,43 единиц. Наиболее характерные значения признака в рассматриваемой совокупности находятся в пределах от 68,25 до 163,11 (диапазон ).
Коэффициент вариации является мерой относительной колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности:
41,0%
Вывод. Значение коэффициента вариации превышает 40%, следовательно, вариация признака в исследуемой совокупности единиц умеренная и совокупность не является однородной. Найденное среднее значение признака не является типичной и надежной характеристикой среднего.
Относительное линейное отклонение
33,2%
Коэффициент осцилляции:
= 193,6%
Вывод. Доля среднего линейного отклонения в среднем значении признака составляет 33,2%. Доля размаха вариации в среднем значении - 193,6%.
11. Рассчитаем показатели формы распределения
К показателям формы распределения относятся коэффициент асимметрии и эксцесса.
Для расчета показателей формы распределения строим вспомогательную таблицу 5.
Рассчитываем центральный момент третьего порядка:
Таблица 5
Вспомогательная таблица для расчета показателей формы распределения
Интервалы групп |
Число единиц в группе(частота) |
Середина интервала, |
|||
До 60 |
5 |
45 |
-1765314,69 |
124768851,57 |
|
60 - 90 |
16 |
75 |
-1076955,29 |
43808350,68 |
|
90 - 120 |
14 |
105 |
-17044,87 |
182004,53 |
|
120 - 150 |
11 |
135 |
79350,78 |
1533218,48 |
|
150 - 180 |
6 |
165 |
719903,33 |
35507096,44 |
|
180 - 210 |
4 |
195 |
1996372,21 |
158356304,07 |
|
210 и более |
3 |
225 |
3919623,60 |
428501223,88 |
|
Итого |
59 |
3855935,08 |
792657049,65 |
Расчет коэффициента асимметрии:
0,612
Вывод. Значение коэффициента асимметрии положительное, что свидетельствует о правосторонней асимметрии распределения, т.е. в совокупности преобладают единицы со значением признака меньшие, чем среднее.
Рассчитываем центральный момент четвертого порядка:
Расчет коэффициента эксцесса:
-0,346
Вывод: Показатель эксцесса отрицательный, т.е. вершина кривой распределения лежит ниже вершины кривой нормального закона распределения, а форма кривой более пологая по сравнению с кривой нормального закона. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону.
Список использованных источников
1. Бережной В.И. Статистика в примерах и задачах [Электронный ресурс]: учебное пособие / В.И. Бережной, О.Б. Бигдай, О.В. Бережная, Киселева О.А. - М.: НИЦ ИНФРА-М, 2016. - 288 с.
2. Глинский, В.В. Статистика: учебник / В.В. Глинский, В.Г. Ионин, Л.К. Серга [и др.]; под ред. В.Г. Ионина. - 4-е изд., перераб. и доп. - М.: ИНФРА-М, 2017. - 355 с.
3. Гужова, О.А. Статистика в управлении социально-экономическими процессами: учеб. пособие / О.А. Гужова, Ю.А. Токарев. - М.: ИНФРА-М, 2017. - 172 с.
4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики / [Текст] Учебник. - М.: ИНФРА - М, 2015. - 416 с.
5. Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. [Текст] 2-е изд. - СПб.: Питер, 2017. - 288 с.: ил.
Размещено на allbest.ru
Подобные документы
Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Объявление торгов администрацией штата на определенное количество строительных подрядов для определенного количества фирм. Экономико-математическая модели для минимизации затрат. Определение количества песцов и лисиц для получения максимальной прибыли.
контрольная работа [18,2 K], добавлен 05.03.2010Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Составление сетевой модели подготовки документации на основании данных проекта прокладки участка нефтепровода. Определение максимального количества квартир, которые можно построить из имеющихся ограниченных ресурсов методом симплексных преобразований.
контрольная работа [56,8 K], добавлен 10.05.2010Задача линейного программирования. Определение количества листов фанеры и по какому способу их следует раскроить так, чтобы было получено не менее нужного количества заготовок при минимальной стоимости. Регрессионный анализ данных доходов и сбережений.
контрольная работа [444,2 K], добавлен 24.11.2013Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.
контрольная работа [441,9 K], добавлен 13.10.2014Расчет доверительных интервалов прогноза для линейного тренда с использованием уравнения экспоненты. Оценка адекватности и точности моделей. Использование адаптивных методов в экономическом прогнозировании. Экспоненциальные средние для временного ряда.
контрольная работа [916,2 K], добавлен 13.08.2010Расчет показателей вариации: среднее арифметическое, мода, медиана, размах вариации, дисперсия, стандартное и среднее линейное отклонения, коэффициенты осцилляции и вариации. Группировка данных по интервалам равной длины, составление вариационного ряда.
курсовая работа [429,7 K], добавлен 09.06.2011Построение адаптивной мультипликативной модели Хольта-Уинтерса с учетом сезонного фактора. Определение эффективной ставки процента по вкладу в банке, номинальной ставки при начислении процента. Расчет дисконта по формуле математического дисконтирования.
контрольная работа [756,3 K], добавлен 05.04.2011Оценка уравнений парной и множественной регрессии. Ковариация, корреляция, дисперсия. Определение доверительных интервалов для параметров. Статистические уравнения зависимостей. Расчет нормативных микроэкономических показателей хозяйственной деятельности.
дипломная работа [1,9 M], добавлен 20.10.2014