Статистическое изучение регионов РФ
Порядок определения структурной равноинтервальной группировки. Методика построения вариационных, частотных и кумулятивных рядов распределения. Расчетная таблица для нахождения медианы, моды, квартилей, дисперсии и среднего квадратического отклонения.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 17.11.2014 |
Размер файла | 705,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
1. На основе данных, (таблица 1) и требованиям преподавателя об интервале наблюдения, составить таблицу исходных данных и выполнить следующее:
1. Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. Результаты группировки необходимо представить в таблице и сделать выводы.
2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.
3. Комбинационную группировку по признаку-фактору и признаку-результату. Сделать выводы
Таблица 1. Социально - экономические показатели по регионам России, 2009 год
№ п/п |
Регионы |
Площадь территории на 1 января 2009г., тыс. км. кв. |
Число дорожно-транспортных происшествий на 100000 населения |
|
1 |
Псковская обл. |
55,4 |
220,9 |
|
2 |
Республика Дагестан |
50,3 |
55,1 |
|
3 |
Кабардино-Балкарская респ. |
12,5 |
86,6 |
|
4 |
Краснодарский край |
75,5 |
134,3 |
|
5 |
Ставропольский край |
66,2 |
103,8 |
|
6 |
Астраханская обл. |
49,0 |
128,0 |
|
7 |
Волгоградская обл. |
112,9 |
122,1 |
|
8 |
Ростовская обл. |
101,0 |
146,4 |
1.1 Структурная равноинтервальная группировка
Структурная группировка - простая группировка (по 1 признаку), которая позволяет представить структуру статистической совокупности. Строится на основе количественного признака.
План построения структурной группировки:
· выбрать группировочный признак;
· определить количество групп разбиения;
· определить шаг построения групп;
· составить макет группировки;
· определить удельный вес для каждой группы;
· сделать вывод.
Для определения оптимального числа групп следует воспользоваться Формулой Стерджесса:
n=1+3,322*lgN,
где n - число групп; N - число единиц совокупности;
N=30
n=1+3,322*lgN = 1+3,322*lg30=1+3,322*1,602=6,322=6
Число групп: n=6.
Признак №1. Площадь территории на 1 января 2009 г., тыс. км. кв.
Х max = 2366,8 тыс. км. кв. - максимальное значение признака (Красноярский край)
Х min = 12,5 тыс. км. кв. - минимальное значение признака (Кабардино-Балкарская респ.)
Интервал разбиения (j):
Таблица 2. Структура регионов РФ по площади территории на 1 января 2009 года
№ п/п |
Группы регионов по площади территории на 1 января 2009г., тыс. км. кв. |
Количество регионов в отдельной группе |
Удельный вес, % |
|
1 |
12,5 - 404,88 |
26 |
86,67 |
|
2 |
404,88 - 797,26 |
2 |
6,67 |
|
3 |
797,26 - 1189,64 |
0 |
0 |
|
4 |
1189,64 - 1582,02 |
1 |
3,33 |
|
5 |
1582,02 - 1974,4 |
0 |
0 |
|
6 |
1974,4 - 2366,8 |
1 |
3,33 |
|
Итого: |
30 |
100 |
Расчёт удельного веса на примере первой группы:
Вывод: регион с наименьшей площадью территории на 1 января 2009г, равной 12,5 тыс. км. В. - это Кабардино-Балкарская респ. Регион с наибольшей площадью - Красноярский край, его площадь равна 2366,8 тыс. км. кв.
Наибольший удельный вес имеет первая группа, и он составляет 86,67% (26 из 30 регионов имеют площадь территории, составляющую от 12,5 до 404,88 тыс. км. кв.), наименьшим удельным весом обладают третья и пятая группы, не имеющие в составе элементов (0%).
Признак №2.Число дорожно-транспортных происшествий на 100 000 населения.
Х max = 220,9
Х min = 55,1
Интервал разбиения:
n=4 (заданное значение).
Таблица 3. Структура числа дорожно-транспортных происшествий в регионах России, 2008 год
№ п/п |
Группы регионов по численности ДТП, на 100 000 населения |
Количество регионов в отдельной группе |
Удельный вес, % |
|
1 |
55,1 - 96,55 |
2 |
6,67 |
|
2 |
96,55 - 138 |
11 |
36,67 |
|
3 |
138 - 179,45 |
13 |
43,33 |
|
4 |
179,45 - 220,9 |
4 |
13,33 |
|
Итого: |
30 |
100 |
Расчёт удельного веса на примере первой группы регионов:
Вывод: Псковская обл.- регион с наибольшим количеством ДТП по данным за 2008г, здесь показатель составил 220,9 ДТП на 100 000 населения. Минимальное число ДТП в 2008г. зарегистрировано в Республике Дагестан (55,1 ДТП на 100 000 населения).
Наибольший удельный вес имеет третья группа регионов (с количеством ДТП в интервале от 137,99 до 165,62 ДТП на 100 000 населения) - 43,33%. Наименьшим удельным весом обладает первая группа (6,67% ) с количеством ДТП в пределах от 55,1 до 82,73 на 100 000 населения.
1.2 Аналитическая группировка
Аналитическая группировка строится по двум и более количественным признакам, характеризуя связь между ними.
План построения:
· определить факторный и результативный признаки;
· определить группы по факторному признаку;
· определить шаг разбиения по факторному признаку;
· построить макет;
· определить среднее значение по группам для результативного признака, заполнить таблицу и определить общее среднее значение результативного признака;
· сделать вывод.
В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно- транспортных происшествий на 100 000 населения.
В пункте №1 первого задания рассчитано оптимальное количество групп для первого признака- n=6, шаг разбиения так же определён (392,38).
Таблица 4. Взаимосвязь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий
№ п/п |
Площадь территории на 1 января 2009г., тыс. км. кв. |
Число дорожно-транспортных происшествий на 100 000 населения |
|||
Группы регионов |
Количество регионов |
Среднее значение |
Итого |
||
1 |
12,5 - 404,88 |
26 |
139,03 |
3614,7 |
|
2 |
404,88 - 797,26 |
2 |
145,65 |
291,3 |
|
3 |
797,26 - 1189,64 |
0 |
0 |
0 |
|
4 |
1189,64 - 1582,02 |
1 |
195,4 |
195,4 |
|
5 |
1582,02 - 1974,4 |
0 |
0 |
0 |
|
6 |
1974,4 - 2366,8 |
1 |
176,0 |
176,0 |
|
Итого: |
30 |
- |
4277,4 |
Итого: для 1 группы = 220,9+55,1+86,6+134,3+103,8+128,0+122,1+146,4+132,2+142,0+158,2+117,2+148,3+149,9+187,8+179,9+158,1+124,0+147,5+98,5+156,7+167,9+147,9+157,4+127,6+116,4= 3614,7
для 2 группы = 131,6+159,7 = 291,3
Рассчитаем среднее значение (на примере первой группы):
Ср. знач.= = 3614,7/26=139,03
Среднее число дорожно-транспортных происшествий на 100 000 населения: 4277,4/30 = 142,59 - ДТП на 100 000 населения.
Вывод: связи между признаками выявить не удалось, т.к. число дорожно-транспортных происшествий не зависит от площади территории. Хаотичная.
1.3 Комбинационная группировка по признаку-фактору и признаку- результату
Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.
План построения:
· определить факторный и результативный признаки. Если группировка однофакторная, в наличии имеют 2 признака (один - факторный, другой - результативный);
· определить количество групп по факторному и результативному признакам;
· определить шаг разбиения по факторному и результативному признакам;
· построить макет;
· заполнить внутренние ячейки таблицы;
· определить контрольное число и сделать вывод.
В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно-транспортных происшествий на 100 000 населения.
Оптимальное число групп n=6 (для факторного признака); n=4 (для результативного признака) уже определено ранее.
Шаг разбиения также высчитан в задании: для факторного признака это - 392,38, для результативного - 41,45.
Таблица 5. Связь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий на 100 000 населения
Группы по площади территории на 1 января 2009г.,тыс.км.кв. |
Группы по числу ДТП на 100 000 населения |
Итого: |
||||
55,1 - 96,55 |
96,55 - 138 |
138 - 179,45 |
179,45 - 220,9 |
|||
12,5 - 404,88 |
2 |
10 |
11 |
3 |
26 |
|
404,88 - 797,26 |
0 |
1 |
1 |
0 |
2 |
|
797,26 - 1189,64 |
0 |
0 |
0 |
0 |
0 |
|
1189,64 - 1582,02 |
0 |
0 |
0 |
1 |
1 |
|
1582,02 - 1974,4 |
0 |
0 |
0 |
0 |
0 |
|
1974,4 - 2366,8 |
0 |
0 |
1 |
0 |
1 |
|
Итого: |
2 |
11 |
13 |
4 |
30 |
Вывод: так как элементы расположены хаотично, много ячеек остались незаполненными, связи между площадью территории регионов и численностью дорожно-транспортных происшествий (на 100 000 населения) не существует.
2. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.
Проанализировать вариационные ряды распределения, вычислив для каждого из них:
· среднее арифметическое значение признака;
· медиану, квартили и моду;
· среднее квадратическое отклонение;
· коэффициент вариации.
Проверить теорему о разложении дисперсии, используя данные аналитической группировки.
Изобразить корреляционное поле. Построить уравнение регрессии. определить тесноту связи между признаками, используя дисперсионный и корреляционный анализ.
Сделать выводы.
2.1 Построение вариационных, частотных и кумулятивных рядов распределения
Объем совокупности: N = 30.
Таблица 6. Вариационный частотный и кумулятивный ряд распределения по площади территории на 1 января 2009г.,тыс.км.кв.
Площадь территории на 1 января 2009г., тыс. км. кв. |
Количество регионов в отдельной группе |
Среднее значение |
Показатель накопленной частоты |
|
12,5 - 404,88 |
26 |
208,69 |
26 |
|
404,88 - 797,26 |
2 |
601,07 |
28 |
|
797,26 - 1189,64 |
0 |
993,45 |
28 |
|
1189,64 - 1582,02 |
1 |
1385,83 |
29 |
|
1582,02 - 1974,4 |
0 |
1778,21 |
29 |
|
1974,4 - 2366,8 |
1 |
2170,6 |
30 |
|
Итого: |
30 |
- |
- |
Среднее значение (необходимо для построения полигона):
= (на примере второй группы с показателями 404,88 - 797,26).
Гистограмма - столбиковая диаграмма для представления интервального ряда распределения. Строится на осях (xi; fi).
Рис. 2.1. Гистограмма вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.
Полигон - служит для наглядного изображения дискретного ряда. Ломаная линия, построенная на осях (xi; fi).
Рис. 2.2. Полигон по площади территории регионов на 1 января 2009г., тыс. км. кв.
Кумулята - ломаная линия, служащая для представления кумулятивного ряда распределения (ряда по накопленным частотам).
Строится на осях (xi; Si).
Рис. 2.3. Кумулята вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.
Таблица 7. Вариационный частотный и кумулятивный ряд распределения по числу дорожно-транспортных происшествий на 100 000 населения
Число дорожно-транспортных происшествий на 100 000 населения |
Количество регионов в отдельной группе |
Среднее значение |
Показатель накопленной частоты |
|
55,1 - 96,55 |
2 |
75,83 |
2 |
|
96,55 - 138 |
11 |
117,28 |
13 |
|
138 - 179,45 |
13 |
158,73 |
26 |
|
179,45 - 220,9 |
4 |
200,18 |
30 |
|
Итого: |
30 |
- |
- |
Среднее значение:
= (на примере второй группы с показателями 96,55 - 138).
Рис. 2.4. Гистограмма вариационного ряда по численности дорожно-транспортных происшествий на 100 000 населения
Рис. 2.5. Полигон по числу дорожно-транспортных происшествий на 100 000 населения
Рис. 2.6. Кумулята вариационного ряда по числу дорожно-транспортных происшествий на 100 000 населения
2.2 Анализ вариационных рядов
Таблица 8. Расчётная таблица для нахождения среднего арифметического признака, медианы ,моды, квартилей, дисперсии, среднего квадратического отклонения
Площадь территории на 1 января 2009г., тыс. км. кв. |
Количество регионов в отдельной группе |
Cередина интервала |
Показатель накопленной частоты |
|||
12,5 - 404,88 |
26 |
208,69 |
5425,94 |
444756,52 |
26 |
|
404,88 - 797,26 |
2 |
601,07 |
1202,14 |
136858,66 |
28 |
|
797,26 - 1189,64 |
0 |
993,45 |
0 |
0 |
28 |
|
1189,64 - 1582,02 |
1 |
1385,83 |
1385,83 |
1094848,32 |
29 |
|
1582,02 - 1974,4 |
0 |
1778,21 |
0 |
0 |
29 |
|
1974,4 - 2366,8 |
1 |
2170,6 |
2170,6 |
3353000,45 |
30 |
|
Итого: |
30 |
- |
10184,51 |
5029463,95 |
- |
9558,44 тыс. км. кв.
1) тыс.км. кв. - среднее арифметическое (взвешенное, т.к. данные сгруппированы) значение площади территории на 1 января 2009г.
2) Дисперсия (D) - средний квадрат отклонения индивидуальных значений признака от средней величины. Для вариационного ряда она определяется по формуле:
D=,
где - отдельное значение; - частота или частость; - среднее значение.
Если ряд интервальный, то в качестве xi , так же как при расчёте средней, берется середина интервала.
Среднее квадратическое отклонение () - показатель, который представляет собой квадратный корень из дисперсии. Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения и выражается в тех же единицах, что и варианты признака.
==
(т.к. данные сгруппированы, необходимо использовать взвешенную формулу).
= 409,44тыс. км. кв.
3) Коэффициент вариации:
=*100%= %
102,6%60%.
Вывод: так как kв больше 60%, то статистическая совокупность регионов по площади территории считается неоднородной, необходимо исключить аномальные значения.
4) Медиана (Ме ) - это такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.
Численное значение медианы определяется по ряду накопленных частот.
условие для нахождения медианной группы.
- первый интервал для данной группировки является медианным.
12,5+392,38(тыс. км. кв.)
- нижняя граница интервала, содержащего медиану;
- шаг интервала, содержащего медиану;
- накопленная частота интервала, который стоит перед медианным;
- объем совокупности;
- частота того интервала, в котором расположена медиана.
Вывод: встречаются регионы со значением площади ниже 240,08 тыс. км. кв.и выше 240,08 тыс. км. кв.
Мода (Мо ) - наиболее часто встречающееся значение признака в совокупности.
Если ряд равноинтервальный, то используется формула:
=12,5+392,38
(тыс. км. кв.)
Вывод: чаще всего встречаются регионы с площадью 216,54 тыс. км. кв.
Квартили делят совокупность на 4 равные части.
Общая формула расчёта квантилей:
- нижняя граница интервала, содержащего квантиль;
- шаг в квантильном интервале;
iqi -индекс квартили;
Sqi-1 - накопленная частота перед данным квантильным интервалом;
fqi - частота данного квантильного интервала.
iq1=1/4
iq2 =2/4=1/2 - квартиль является медианой =(тыс. км. кв.)
iq3=3/4
100% / 4=25%
=(тыс. км. кв.)
=(тыс. км. кв.)
=352,06 (тыс. км. кв.)
Вывод: 25% регионов имеют площадь территории в среднем менее ; 75% регионов имеют площадь территории в среднем менее 352,06 тыс. км. кв.
Таблица 9. Расчетная таблица для нахождения среднего арифметического признака, медианы, моды, квартилей, дисперсии, среднего квадратического отклонения
Число дорожно-транспортных происшествий на 100000 населения |
Количество регионов в отдельной группе |
Cередина интервала |
Показатель накопленной частоты |
|||
55,1 - 96,55 |
2 |
75,83 |
151,66 |
9166,58 |
2 |
|
96,55 - 138 |
11 |
117,28 |
1290,08 |
7579,66 |
13 |
|
138 - 179,45 |
13 |
158,73 |
2063,49 |
3003,52 |
26 |
|
179,45 - 220,9 |
4 |
200,18 |
800,72 |
12836,88 |
30 |
|
Итого: |
30 |
- |
4305,95 |
32586,64 |
- |
1) (ДТП на 100000 населения) - среднее арифметическое значение признака.
2) == = ==32,96 - среднее квадратическое отклонение.
Вывод: в среднем, количество ДТП на 100000 населения отличается от среднего числа ДТП на 32,96 ДТП на 100 000 населения.
3) Коэффициент вариации:
=*100%= %
22,96%30% т.е. совокупность однородна.
4) - условие для нахождения медианной группы.
Для данной группировки медианным является интервал - 3-й: 138- 179,45 (ДТП на 100000 населения).
138+41,45141,32
- нижняя граница интервала, содержащего медиану;
- шаг интервала, содержащего медиану;
- накопленная частота интервала, который стоит перед медианным;
- объем совокупности;
- частота того интервала, в котором расположена медиана.
Вывод: встречаются регионы с количеством дорожно-транспортных происшествий больше, чем 131,32 ДТП на 100 000 населения, и меньше.
Квартили:
=(ДТП на 100000 населения)
=(ДТП на 100000 населения)
=153,15 (ДТП на 100000 населения).
Вывод: 25% регионов имеют показатели ДТП в среднем менее 210,54 на 100000 населения, 75% регионов имеют показатели в среднем менее 153,15 ДТП на 100000 населения.
=138+41,45 (ДТП на 100 000 населения).
- нижняя граница интервала, содержащего моду;
- шаг интервала, содержащего моду;
-накопленная частота интервала, который стоит перед модальным;
- объем совокупности;
- частота того интервала, в котором расположена мода.
Вывод: чаще всего встречаются регионы с числом ДТП, равным на 100000 населения.
2.3 Проверка теоремы о разложении дисперсий
D= - общая дисперсия;
Dx - межгрупповая дисперсия. Характеризует вариацию, которая возникает только из-за факторного признака (систематическая вариация).
Dx =
- средняя из внутригрупповых.
1) Общая дисперсия D для несгруппированных данных:
=
- общее среднее значение признака;
n - количество элементов.
Таблица 10. Расчётная таблица для нахождения общей дисперсии
№ п/п |
Число дорожно-транспортных происшествий на 100000 населения, yi |
|||
1 |
220,9 |
78,32 |
6134,02 |
|
2 |
55,1 |
-87,48 |
7652,75 |
|
3 |
86,6 |
-55,98 |
3133,76 |
|
4 |
134,3 |
-8,28 |
68,56 |
|
5 |
103,8 |
-38,78 |
1503,89 |
|
6 |
128,0 |
-14,58 |
212,58 |
|
7 |
122,1 |
-20,48 |
419,43 |
|
8 |
146,4 |
3,82 |
14,59 |
|
9 |
132,2 |
-10,38 |
107,74 |
|
10 |
142,0 |
-0,58 |
0,34 |
|
11 |
158,2 |
14,62 |
213,74 |
|
12 |
117,5 |
-25,08 |
629,01 |
|
13 |
148,3 |
5,72 |
32,72 |
|
14 |
149,9 |
7,32 |
53,58 |
|
15 |
187,8 |
45,22 |
2044,85 |
|
16 |
179,9 |
37,32 |
1392,78 |
|
17 |
158,1 |
15,52 |
240,87 |
|
18 |
124,0 |
-18,58 |
345,22 |
|
19 |
147,5 |
4,92 |
24,21 |
|
20 |
98,5 |
-44,08 |
1943,05 |
|
21 |
156,7 |
14,12 |
199,37 |
|
22 |
167,9 |
25,32 |
641,1 |
|
23 |
195,4 |
52,82 |
2789,95 |
|
24 |
147,9 |
5,32 |
28,3 |
|
25 |
157,4 |
14,17 |
200,79 |
|
26 |
131,6 |
-10,98 |
120,56 |
|
27 |
176,0 |
33,42 |
1116,9 |
|
28 |
159,7 |
17,12 |
293,09 |
|
29 |
127,6 |
-14,98 |
224,4 |
|
30 |
116,4 |
-26,18 |
685,39 |
|
Итого: |
4277,7 |
- |
32467,54 |
D = = = 1082,25
2) Межгрупповая дисперсия Dx:
Таблица 11. Расчётная таблица для нахождения межгрупповой дисперсии
Площадь территории на 1 января 2009г., тыс. км. кв. |
Число дорожно-транспортных происшествий на 100 000 населения |
||||||
Группы регионов |
Количество элементов, |
Среднее значение |
Итого |
||||
12,5 - 404,88 |
26 |
139,03 |
3614,7 |
-3,55 |
12,6 |
327,67 |
|
404,88 - 797,26 |
2 |
145,65 |
291,3 |
3,07 |
9,4249 |
18,85 |
|
797,26 - 1189,64 |
0 |
0 |
0 |
-142,58 |
20329,06 |
0 |
|
1189,64 - 1582,02 |
1 |
195,4 |
195,4 |
52,82 |
2789,95 |
2789,95 |
|
1582,02 - 1974,4 |
0 |
0 |
0 |
-142,58 |
20329,06 |
0 |
|
1974,4 - 2366,8 |
1 |
176,0 |
176,0 |
33,42 |
1116,9 |
1116,9 |
|
Итого: |
30 |
- |
4277,4 |
- |
- |
4253,37 |
Dx = 141,78
3) Внутригрупповые дисперсии Di:
Внутригрупповая дисперсия характеризует вариацию внутри отдельной группы, которая обусловлена случайными (неучтёнными) факторами.
Таблица 12. Расчетная таблица для нахождения внутригрупповой дисперсии
Группы по площади территории на 1 января 2009г., тыс. км. кв. |
Число дорожно-транспортных происшествий на 100 000 населения, |
|||||
12,5 - 404,88 |
220,9 |
139,04 |
81,86 |
6701,06 |
27870,02 |
|
55,1 |
-83,94 |
7045,92 |
||||
86,6 |
-52,44 |
2749,95 |
D1= 1071,92
D2= 197,4
D3= -
D4= 0
D5= -
D6= 0
940,47
- общее среднее значение признака;
- количество элементов.
141,78+940,47= 1083,94
1082,25 = 1082,25
Показана выполнимость Теоремы о разложении дисперсий.
Определение силы влияния факторного признака на результативный с помощью эмпирического коэффициента детерминации:
0,13*100%=13%
Вывод: вариация результативного признака на 13% обусловлена площадью территории региона на 1 января 2009 г.
Вывод: связь между площадью территории и количеством ДТП на 100 000 населения умеренная (по соотношениям Чеддока).
2.4 Корреляционное поле, уравнение регрессии, теснота связи между признаками
Таблица 13. Таблица для определения тесноты связи между признаками: площадью территории на 1 января 2009 г. и числом ДТП на 100000 населения
№ п/п |
Площадь территории на 1 января 2009 г., тыс. км. кв., x |
Число дорожно-транспортных происшествий на 100000 населения, y |
x2 |
xy |
||||
1 |
55,4 |
220,9 |
3069,16 |
12237,86 |
150,07 |
34927,87 |
6132,456 |
|
2 |
50,3 |
55,1 |
2530,09 |
2771,53 |
36860,16 |
7654,5 |
||
3 |
12,5 |
86,6 |
156,25 |
1082,5 |
139,77 |
52803,44 |
3134,88 |
|
4 |
75,5 |
134,3 |
5700,25 |
10139,65 |
27818,9 |
68,7241 |
||
5 |
66,2 |
103,8 |
4382,44 |
6871,56 |
152,66 |
31007,69 |
1504,664 |
|
6 |
49,0 |
128,0 |
2401 |
6272 |
148,53 |
37361,02 |
212,8681 |
|
7 |
112,9 |
122,1 |
12746,41 |
13785,09 |
163,87 |
16741,77 |
419,8401 |
|
8 |
101,0 |
146,4 |
10201 |
14786,4 |
161,01 |
19962,86 |
14,5161 |
|
9 |
142,9 |
132,2 |
20420,41 |
18891,38 |
171,07 |
9878,372 |
107,9521 |
|
10 |
26,1 |
142,0 |
681,21 |
3706,2 |
143,03 |
46738,12 |
0,3481 |
|
11 |
67,8 |
158,2 |
4596,84 |
10725,96 |
153,04 |
30446,76 |
243,6721 |
|
12 |
42,1 |
117,5 |
1772,41 |
4946,75 |
146,87 |
40076,04 |
629,5081 |
|
13 |
18,3 |
148,3 |
334,89 |
2713,89 |
141,16 |
50171,52 |
32,6041 |
|
14 |
160,2 |
149,9 |
25664,04 |
24013,98 |
175,22 |
6738,768 |
53,4361 |
|
15 |
120,4 |
187,8 |
14496,16 |
22611,12 |
165,67 |
14857,17 |
2043,944 |
|
16 |
76,6 |
179,9 |
5867,56 |
13780,34 |
155,15 |
27453,18 |
1392,036 |
Корреляционное поле:
Рис. 2.7 Корреляционное поле по площади территории на 1 января 2009 г. и числу ДТП на 100000 населения. Линия регрессии
Гипотеза: регрессия выражена через линейную функцию: =+x
* (-242,29) первое уравн-е.
Сложить 2 уравнения, получаем систему:
=136,77
=0,24
=136,77+0,24x
Определение теоретического значения результата (на примере 2 и 4 групп):
(50,3;148,84)
(75,5;154,89)
Построение линии регрессии на рис. 2.7
Определение линейного коэффициента корреляции r:
=
0,35
- связь слабая.
Вывод: если площадь территории в среднем увеличить на 1 тыс. км. кв, то средняя численность дорожно-транспортных происшествий на 100 000 населения возрастёт на 0,24 шт.
Между площадью территории (на 1 января 2009г.) и числом дорожно-транспортных происшествий на 100000 населения наблюдается слабая связь.
3. Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно - случайного 40% бесповторного отбора, определить:
a) пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;
b) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
Используя результаты расчетов, выполненных в задании №2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
a) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);
b) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%
3.1 Выборочное наблюдение признака Х (площадь территории на 1 января 2009 г., тыс. км. кв.)
a) Дано: р=0,954;
t=2;
n=30;
=339,48 тыс. км. кв;
;
40% - собственно-случайный бесповторный отбор
Найти:
Решение:
1) 100% - N
40% - 30
2) Т.к. отбор бесповторный
*2=5,72
n - объем выборочной совокупности;
N - объем генеральной совокупности;
t - коэффициент доверия;
- средняя ошибка выборки.
Границы, в которых будет изменяться значение средней генеральной совокупности:
339,48 -
345,2
Вывод: с вероятностью 0,954 можно утверждать, что среднее значение признака генеральной совокупности располагается в интервале от до 345,2тыс. км. кв.
b) Дано: ;
N=75;
t=2;
.
Найти:
Решение:
Если принять
54,5655
n - объем выборочной совокупности;
t2 - коэффициент доверия в квадрате;
N - объем генеральной совокупности;
- предельная ошибка;
- среднее квадратическое отклонение.
Вывод: чтобы снизить предельную ошибку средней величины на 50 % нужно увеличить объем выборки до 55 элементов.
3.2 Выборочное наблюдение признака Y (число ДТП на 100000 населения)
а) Дано: р=0,954;
t=2;
n=30;
М0= ДТП на 100 000 населения; m= 16(количество элементов выборочной совокупности, превышающих моду);
Повторный отбор.
Найти:
Решение:
Доля регионов, у которых индивидуальные значения признака превышают моду:
- пределы, в которых будет находиться генеральная доля, где:
W - доля элементов выборки;
Д - предельная ошибка выборки;
p - доля элементов с признаком в генеральной совокупности;
коэффициент доверия;
средняя ошибка.
0,350,46
Вывод: значение доли регионов генеральной совокупности, у которых индивидуальные значения признака превышают моду, находится в интервале от 0,35 до 0,46 (от 35% до 46%).
b) Дано: t=2;
=;
W=0,53.
Найти: n
Решение:
,
где n - объем выборочной совокупности; W - доля элементов выборки с признаком; t - коэффициент доверия; - предельная ошибка.
Если снизить предельную ошибку на 30%, то она станет равна:
=(1-0,3)=(1-0,3)*0,18=0,13,
тогда:
n1====49,8250 (регионов).
Вывод: для того, чтобы снизить предельную ошибку на 30%, необходимо увеличить объем выборки до 50 регионов.
4. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально-экономических показателей по районам Псковской области.
Районы и направление определяются для каждого студента по последним цифрам номера зачетной книжки.
Рассчитать:
а) Среднегодовой уровень динамики;
б) Цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста; абсолютное значение 1% прироста;
в) Средний абсолютный прирост, средний темп роста, средний темп прироста.
Произвести сглаживание ряда динамики трехлетней скользящей средней. Отобразить графически.
Произвести аналитическое выравнивание ряда динамики.
Изобразить фактический и выровненный ряды динамики графически.
Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данному направлению
4.1 Динамические ряды для характеристики изменения социально-экономических показателей по районам Псковской области
Таблица 14. Численность населения (на 1 января)
Район |
Численность населения, чел. |
|||||||
2005г. |
2006г. |
2007г. |
2008г. |
2009г. |
2010г. |
2011г. |
||
Гдовский |
16616 |
16353 |
16115 |
15943 |
15810 |
15439 |
12674 |
|
Невельский |
28928 |
28266 |
27728 |
27246 |
26831 |
26459 |
26531 |
4.2 Расчёты показателей
а) Расчёт среднегодового уровня динамики:
Используется средняя хронологическая простая, так как ряд моментный с равноотстоящими промежутками.
,
где - уровень ряда динамики; n - число уровней.
Среднегодовой уровень динамики в Гдовском районе:
= чел.
Вывод: средний уровень численности населения в Гдовском районе составил человек.
Среднегодовой уровень динамики в Невельском районе:
= чел.
Вывод: средний уровень численности населения в Невельском районе составил человек.
б) Расчёт цепных и базисных показателей динамики:
Абсолютный прирост на цепной основе:
,
где - значение уровня ряда по i-тому периоду; - значение уровня ряда по предшествовавшему периоду.
Абсолютный прирост на базисной основе:
,
где - значение уровня ряда по 1 периоду.
Темп роста на цепной основе: Темп роста на базисной основе:
Темп прироста на цепной основе: Темп прироста на базисной основе:
Абсолютное значение (содержание) 1% прироста - результат деления абсолютного прироста на соответствующий темп прироста.
Таблица 15. Динамика численности населения и расчёт аналитических показателей в Гдовском районе
Годы |
Численность населения на 1января |
Абсолютный прирост |
Темп роста, % |
Темп прироста, % |
Абсолютное значение прироста на1% |
|||||
1% |
1%, |
|||||||||
2005 |
16616 |
- |
- |
- |
- |
- |
- |
- |
- |
|
2006 |
16353 |
-263 |
-263 |
98,42 |
98,42 |
-1,58 |
-1,58 |
166,46 |
166,46 |
|
2007 |
16115 |
-501 |
-238 |
96,98 |
98,54 |
-3,02 |
-1,46 |
165,89 |
163,01 |
|
2008 |
15943 |
-673 |
-172 |
95,95 |
98,93 |
-4,05 |
-1,07 |
166,17 |
160,75 |
|
2009 |
15810 |
-806 |
-133 |
95,15 |
99,17 |
-4,85 |
-0,83 |
166,19 |
160,24 |
|
2010 |
15439 |
-1177 |
-371 |
92,92 |
97,65 |
-7,08 |
-2,35 |
166,24 |
157,87 |
|
2011 |
12674 |
-3942 |
-2765 |
76,28 |
82,09 |
-23,72 |
-17,91 |
166,19 |
154,38 |
|
Итого |
108817 |
- |
- |
- |
- |
- |
- |
- |
- |
Для 2009 года:
= 15810 - 16616= - 80
i = 15810 - 15943 = -133
= = 95,15%
= = 99,17%
=95,15-100= - 4,85%
= 99,17-100= -0,83%
1%,== 166,19
1%, = =160,24
Вывод (по постоянной базе сравнения): численность населения в Гдовском районе в 2009 году относительно 2005 уменьшилась на 806 чел., численность населения в 2009 г составила 95,15% от базового, т.е. уменьшилась на 4,85%; в 2009 г. в среднем 166,19 чел. приходилось на 1% абсолютного прироста;
(по переменной базе сравнения): в 2009г. по сравнению с 2008 годом численность населения уменьшилась на 133 чел., численность населения района в 2009г. составила 99,17% от 2008г., т.е. уменьшилась на 0,83%; в 2009г. в среднем 160,24 чел. приходилось на 1% абсолютного прироста.
В течение всего рассматриваемого периода (с 2005 года по 2011 год) наблюдается постоянное уменьшение численности населения в районе. По сравнению с 2005 годом в 2011 году численность населения района снизилась на 23,72%. Наибольшее снижение численности населения наблюдалось в 2011 году по сравнению с 2010 годом, наименьшее снижение - в 2009 по сравнению с 2008 годом (всего на 0,83%).
Таблица 16. Динамика численности населения и расчёт аналитических показателей в Невельском районе
Годы |
Численность населения на 1января |
Абсолютный прирост |
Темп роста, % |
Темп прироста, % |
Абсолютное значение 1% прироста |
|||||
1%, |
1%, |
|||||||||
2005 |
28928 |
- |
- |
- |
- |
- |
- |
- |
- |
|
2006 |
28266 |
-662 |
-662 |
97,71 |
97,71 |
-2,29 |
-2,29 |
289,08 |
289,08 |
|
2007 |
27728 |
-1200 |
-538 |
95,85 |
98,10 |
-4,15 |
-1,90 |
289,16 |
283,16 |
|
2008 |
27246 |
-1682 |
-482 |
94,19 |
98,26 |
-5,81 |
-1,74 |
289,50 |
277,01 |
|
2009 |
26831 |
-2097 |
-415 |
92,75 |
98,48 |
-7,25 |
-1,52 |
289,24 |
273,03 |
|
2010 |
26459 |
-2469 |
-372 |
91,47 |
98,61 |
-8,53 |
-1,39 |
289,45 |
267,63 |
|
2011 |
26531 |
-2397 |
72 |
91,71 |
100,27 |
-8,29 |
0,27 |
289,14 |
266,67 |
|
Итого |
191989 |
- |
- |
- |
- |
- |
- |
- |
- |
Вывод: в течение всего рассматриваемого периода (с 2005 года по 2010 год) наблюдается уменьшение численности населения в районе, небольшой рост замечен в 2011г. По сравнению с 2005 годом в 2011 году численность населения района снизилась на 8,29%. Наибольшее снижение численности населения наблюдалось в 2006 году по сравнению с 2005 годом, рост - в 2011 по сравнению с 2010 годом (всего на 0,27%).
в) средний абсолютные прирост, средний темп роста, средний темп прироста.
Средний абсолютный прирост:
- уровни рядов динамики; n - число уровней.
Средний абсолютный прирост численности населения для Гдовского района:
Вывод: средняя численность населения Гдовского района за 2005-2011 гг. уменьшилась на 657 человек.
Средний абсолютный прирост численности населения для Невельского района:
Вывод: средняя численность населения Невельского района за 2005-2011 гг. уменьшилась на 399,5 человек.
Средний темп роста:
- уровни рядов динамики; n - число уровней.
Средний темп роста численности населения для Гдовского района:
*100%=95,53%
Вывод: в Гдовском районе за 2005-2011 гг. изменение средней численности населения составило 95,53%.
Средний темп роста численности населения для Невельского района:
*100%=98,62%
Вывод: в Невельском районе за 2005-2011 гг. изменение средней численности населения составило 98,62%.
Средний темп прироста:
Средний темп прироста для Гдовского района:
Вывод: в общем в Гдовском районе за 2005-2011 гг. средняя численность населения снизилась на 4,47%.
Средний темп прироста для Невельского района:
Вывод: в общем в Невельском районе за 2005-2011 гг. средняя численность населения снизилась на %.
4.3 Сглаживание ряда динамики трёхлетней скользящей средней. Графическое отображение
Таблица 17. Динамика численности населения и расчёт трехлетней скользящей средней по Гдовскому району
Годы |
Численность населения района, чел. |
Трёхлетняя скользящая средняя () |
|
2005 |
16616 |
- |
|
2006 |
16353 |
16361,33 |
|
2007 |
16115 |
16137 |
|
2008 |
15943 |
15956 |
|
2009 |
15810 |
15730,67 |
|
2010 |
15439 |
14641 |
|
2011 |
12674 |
- |
|
Итого: |
108817 |
- |
Расчёт трёхлетней скользящей средней:
2006г.: 16361,33
2007г.: = 16137
2008г.:= 15956
2009г.:= 15730,67
2010г.:= 14641
Рис. 4.1. Фактический ряд динамики и трёхлетняя скользящая средняя по численности населения в Гдовском районе
Таблица 18. Динамика численности населения и расчёт трехлетней скользящей средней по Невельскому району
Годы |
Численность населения района, чел. |
Трёхлетняя скользящая средняя () |
|
2005 |
28928 |
- |
|
2006 |
28266 |
28307,33 |
|
2007 |
27728 |
27986,67 |
|
2008 |
27246 |
27768,33 |
|
2009 |
26831 |
27245,33 |
|
2010 |
26459 |
26607 |
|
2011 |
26531 |
- |
|
Итого: |
191989 |
- |
Рис. 4.2 Фактический ряд динамики и трёхлетняя скользящая средняя по численности населения в Невельском районе
4.4 Аналитическое сглаживание ряда динамики
1. Предположим, что функция имеет вид:
2. Используя принцип наименьших квадратов, получаем систему двух нормальных уравнений:
Где y- исходный уровень ряда динамики; n - количество уровней; t - показатель времени.
3. , из чего следует:
Таблица 19. Расчётная таблица для аналитического выравнивания ряда динамики по Гдовскому району
Годы |
Численность населения (на 1 января), чел. |
усл |
усл |
|||
2005 |
16616 |
-3 |
9 |
-49848 |
15097,75 |
|
2006 |
16353 |
-2 |
4 |
-32706 |
14599,21 |
|
2007 |
16115 |
-1 |
1 |
-16115 |
14100,67 |
|
2008 |
15943 |
0 |
0 |
0 |
13602,13 |
|
2009 |
15810 |
1 |
1 |
15810 |
13103,59 |
|
2010 |
15439 |
2 |
4 |
30878 |
12605,05 |
|
2011 |
12674 |
3 |
9 |
38022 |
12106,51 |
|
Итого: |
108817 |
0 |
28 |
-13959 |
95214,91 |
y= 13602,13 -498,54x -уравнение тренда.
Вывод: в среднем численность населения в Гдовском районе составляет 13602,13 чел. Ежегодно в Гдовском районе происходит уменьшение численности населения в среднем на 498,54 чел.
4. Изобразим линию тренда на графике:
Рис. 4.3. Динамика численности населения в Гдовском районе
Вывод: отмечается тенденция к снижению численности населения в Гдовском районе.
Таблица 20. Расчётная таблица для аналитического выравнивания ряда динамики по Невельскому району
Годы |
Численность населения (на 1 января), чел. |
усл |
усл |
|||
2005 |
28928 |
-3 |
9 |
-86784 |
25252,42 |
|
2006 |
28266 |
-2 |
4 |
-56532 |
24834,49 |
|
2007 |
27728 |
-1 |
1 |
-27728 |
24406,56 |
|
2008 |
27246 |
0 |
0 |
0 |
23988,63 |
|
2009 |
26831 |
1 |
1 |
26831 |
23570,7 |
|
2010 |
26459 |
2 |
4 |
52918 |
23152,77 |
|
2011 |
26531 |
3 |
9 |
79593 |
22734,84 |
|
Итого: |
191989 |
0 |
28 |
-11702 |
167940,4 |
Вывод: в среднем численность населения в Невельском районе составляет 23988,63 чел. Ежегодно в Невельском районе происходит уменьшение численности населения в среднем на 417,93 чел.
Изобразим линию тренда на графике:
Рис. 4.4. Динамика численности населения в Невельском районе
Вывод: отмечается тенденция к снижению численности населения в Невельском районе.
4.5 Сравнительные выводы по районам и их общая характеристика развития по направлению - численность населения
равноинтервальный вариационный дисперсия медиана
На основании вычислений, произведённых в задании №4 можно сделать вывод, что среднегодовой уровень динамики численности населения в Невельском районе (составил человек) выше, чем в Гдовском ( человек). Средний темп прироста в Невельском районе (-1,38%) выше среднего темпа прироста в Гдовском районе (-4,47%).
Используя аналитическое выравнивание, можно выявить основные тенденции изменения численности населения в Невельском и Гдовском районах. В рассматриваемых районах наблюдается тенденция к снижению численности населения. Имеются несколько причин снижения численности: во - первых, это высокие показатели смертности; во-вторых, это миграции населения, причём не в пользу трудоспособной его части. Кроме того влияние оказывает довольно низкая продолжительность жизнь населения, процессы его старения, низкая рождаемость, обезлюдивание сельских территорий и др.
Учитывая то, что население эмигрирует в другие районы, более экономически-развитые, с крупными городами- центрами, можно говорить о неэффективности социальной политики в регионах. В первую очередь стоит развивать такие сферы, как: здравоохранение, образование, жилищное строительство, сельское хозяйство.
Всё это требует разработки и реализации долгосрочных целевых программ, действия власти должны быть ориентированы не только на решение существующих проблем, но и рассматривать демографическую ситуацию в перспективе.
Список использованной литературы
1. Теория статистики, под ред. Проф. Р.А. Шмойловой, 5-е издание, Финансы и статистика, - М.: 2009 год.
2. Практикум по теории статистики: учебное пособие под ред. Проф. Р.А. Шмойловой, второе издание, переработанное и дополненное, Финансы и статистика, - М.: 2004 год.
3. Районы Псковской области: статистический сборник в двух томах, первый том, второй: Псковоблкомстат, 2010 год.
4. Районы Псковской области: социально-экономические показатели: статистический сборник: Псковстат, 2008 год.
5. Районы Псковской области: статистический сборник в двух томах, первый том, второй, Псковоблкомстат, 2009 г.
Размещено на Allbest.ru
Подобные документы
Построение группировки магазинов математическим путем с использованием формулы Стерджесса по размеру товарооборота. Нахождение моды и медианы распределения работников по уровню заработной платы. Определение дисперсии, среднего квадратического отклонения.
контрольная работа [44,8 K], добавлен 09.07.2013Cущность аналитической, комбинационной и структурной равноинтервальной группировок, их практическое применение в статистике. Построение рядов распределения и их гистограммы. Проверка теоремы о разложении дисперсии. Расчет коэффициента детерминации.
курсовая работа [268,2 K], добавлен 07.04.2010Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.
курсовая работа [1,4 M], добавлен 22.11.2013Понятие и сущность типологической группировки. Расчет динамики и структуры изменения объема продукции в квартальном разрезе и в целом за год. Вычисление показателей вариации, дисперсии, среднего квадратичного отклонения. Определение моды и медианы.
контрольная работа [135,8 K], добавлен 24.09.2012Социально-экономические показатели по регионам России, комбинационная группировка. Построение рядов распределения и их анализ. Проверка теоремы о разложении дисперсии. Методика расчета коэффициента корреляции, а также индекса структурного сдвига.
контрольная работа [1,6 M], добавлен 02.10.2014Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.
контрольная работа [226,8 K], добавлен 31.07.2011Возрастание объемов продаж. Определение среднего, медианы и моды. Распределение цен на акции фармацевтической компании. Определение межквартильного размаха, среднего квадратичного отклонения, коэффициента вариации, дисперсии, показателя асимметрии.
курсовая работа [28,3 K], добавлен 03.12.2010Составление закона распределения случайной величины X—числа студентов, успешно сдавших экзамен. Расчет математического ожидания, дисперсии и среднего квадратического отклонения случайной величины. Таблица накопленных частот для сгруппированной выборки.
курсовая работа [1,8 M], добавлен 11.01.2015Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.
курсовая работа [599,0 K], добавлен 06.12.2013Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.
курсовая работа [218,5 K], добавлен 27.02.2011