Статистическое изучение регионов РФ

Порядок определения структурной равноинтервальной группировки. Методика построения вариационных, частотных и кумулятивных рядов распределения. Расчетная таблица для нахождения медианы, моды, квартилей, дисперсии и среднего квадратического отклонения.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 17.11.2014
Размер файла 705,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

1. На основе данных, (таблица 1) и требованиям преподавателя об интервале наблюдения, составить таблицу исходных данных и выполнить следующее:

1. Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. Результаты группировки необходимо представить в таблице и сделать выводы.

2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.

3. Комбинационную группировку по признаку-фактору и признаку-результату. Сделать выводы

Таблица 1. Социально - экономические показатели по регионам России, 2009 год

№ п/п

Регионы

Площадь территории на 1 января 2009г., тыс. км. кв.

Число дорожно-транспортных происшествий на 100000 населения

1

Псковская обл.

55,4

220,9

2

Республика Дагестан

50,3

55,1

3

Кабардино-Балкарская респ.

12,5

86,6

4

Краснодарский край

75,5

134,3

5

Ставропольский край

66,2

103,8

6

Астраханская обл.

49,0

128,0

7

Волгоградская обл.

112,9

122,1

8

Ростовская обл.

101,0

146,4

1.1 Структурная равноинтервальная группировка

Структурная группировка - простая группировка (по 1 признаку), которая позволяет представить структуру статистической совокупности. Строится на основе количественного признака.

План построения структурной группировки:

· выбрать группировочный признак;

· определить количество групп разбиения;

· определить шаг построения групп;

· составить макет группировки;

· определить удельный вес для каждой группы;

· сделать вывод.

Для определения оптимального числа групп следует воспользоваться Формулой Стерджесса:

n=1+3,322*lgN,

где n - число групп; N - число единиц совокупности;

N=30

n=1+3,322*lgN = 1+3,322*lg30=1+3,322*1,602=6,322=6

Число групп: n=6.

Признак №1. Площадь территории на 1 января 2009 г., тыс. км. кв.

Х max = 2366,8 тыс. км. кв. - максимальное значение признака (Красноярский край)

Х min = 12,5 тыс. км. кв. - минимальное значение признака (Кабардино-Балкарская респ.)

Интервал разбиения (j):

Таблица 2. Структура регионов РФ по площади территории на 1 января 2009 года

№ п/п

Группы регионов по площади территории на 1 января 2009г., тыс. км. кв.

Количество регионов в отдельной группе

Удельный вес, %

1

12,5 - 404,88

26

86,67

2

404,88 - 797,26

2

6,67

3

797,26 - 1189,64

0

0

4

1189,64 - 1582,02

1

3,33

5

1582,02 - 1974,4

0

0

6

1974,4 - 2366,8

1

3,33

Итого:

30

100

Расчёт удельного веса на примере первой группы:

Вывод: регион с наименьшей площадью территории на 1 января 2009г, равной 12,5 тыс. км. В. - это Кабардино-Балкарская респ. Регион с наибольшей площадью - Красноярский край, его площадь равна 2366,8 тыс. км. кв.

Наибольший удельный вес имеет первая группа, и он составляет 86,67% (26 из 30 регионов имеют площадь территории, составляющую от 12,5 до 404,88 тыс. км. кв.), наименьшим удельным весом обладают третья и пятая группы, не имеющие в составе элементов (0%).

Признак №2.Число дорожно-транспортных происшествий на 100 000 населения.

Х max = 220,9

Х min = 55,1

Интервал разбиения:

n=4 (заданное значение).

Таблица 3. Структура числа дорожно-транспортных происшествий в регионах России, 2008 год

№ п/п

Группы регионов по численности ДТП, на 100 000 населения

Количество регионов в отдельной группе

Удельный вес, %

1

55,1 - 96,55

2

6,67

2

96,55 - 138

11

36,67

3

138 - 179,45

13

43,33

4

179,45 - 220,9

4

13,33

Итого:

30

100

Расчёт удельного веса на примере первой группы регионов:

Вывод: Псковская обл.- регион с наибольшим количеством ДТП по данным за 2008г, здесь показатель составил 220,9 ДТП на 100 000 населения. Минимальное число ДТП в 2008г. зарегистрировано в Республике Дагестан (55,1 ДТП на 100 000 населения).

Наибольший удельный вес имеет третья группа регионов (с количеством ДТП в интервале от 137,99 до 165,62 ДТП на 100 000 населения) - 43,33%. Наименьшим удельным весом обладает первая группа (6,67% ) с количеством ДТП в пределах от 55,1 до 82,73 на 100 000 населения.

1.2 Аналитическая группировка

Аналитическая группировка строится по двум и более количественным признакам, характеризуя связь между ними.

План построения:

· определить факторный и результативный признаки;

· определить группы по факторному признаку;

· определить шаг разбиения по факторному признаку;

· построить макет;

· определить среднее значение по группам для результативного признака, заполнить таблицу и определить общее среднее значение результативного признака;

· сделать вывод.

В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно- транспортных происшествий на 100 000 населения.

В пункте №1 первого задания рассчитано оптимальное количество групп для первого признака- n=6, шаг разбиения так же определён (392,38).

Таблица 4. Взаимосвязь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий

№ п/п

Площадь территории на 1 января 2009г., тыс. км. кв.

Число дорожно-транспортных происшествий на 100 000 населения

Группы регионов

Количество регионов

Среднее значение

Итого

1

12,5 - 404,88

26

139,03

3614,7

2

404,88 - 797,26

2

145,65

291,3

3

797,26 - 1189,64

0

0

0

4

1189,64 - 1582,02

1

195,4

195,4

5

1582,02 - 1974,4

0

0

0

6

1974,4 - 2366,8

1

176,0

176,0

Итого:

30

-

4277,4

Итого: для 1 группы = 220,9+55,1+86,6+134,3+103,8+128,0+122,1+146,4+132,2+142,0+158,2+117,2+148,3+149,9+187,8+179,9+158,1+124,0+147,5+98,5+156,7+167,9+147,9+157,4+127,6+116,4= 3614,7

для 2 группы = 131,6+159,7 = 291,3

Рассчитаем среднее значение (на примере первой группы):

Ср. знач.= = 3614,7/26=139,03

Среднее число дорожно-транспортных происшествий на 100 000 населения: 4277,4/30 = 142,59 - ДТП на 100 000 населения.

Вывод: связи между признаками выявить не удалось, т.к. число дорожно-транспортных происшествий не зависит от площади территории. Хаотичная.

1.3 Комбинационная группировка по признаку-фактору и признаку- результату

Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.

План построения:

· определить факторный и результативный признаки. Если группировка однофакторная, в наличии имеют 2 признака (один - факторный, другой - результативный);

· определить количество групп по факторному и результативному признакам;

· определить шаг разбиения по факторному и результативному признакам;

· построить макет;

· заполнить внутренние ячейки таблицы;

· определить контрольное число и сделать вывод.

В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно-транспортных происшествий на 100 000 населения.

Оптимальное число групп n=6 (для факторного признака); n=4 (для результативного признака) уже определено ранее.

Шаг разбиения также высчитан в задании: для факторного признака это - 392,38, для результативного - 41,45.

Таблица 5. Связь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий на 100 000 населения

Группы по площади территории на 1 января 2009г.,тыс.км.кв.

Группы по числу ДТП на 100 000 населения

Итого:

55,1 - 96,55

96,55 - 138

138 - 179,45

179,45 - 220,9

12,5 - 404,88

2

10

11

3

26

404,88 - 797,26

0

1

1

0

2

797,26 - 1189,64

0

0

0

0

0

1189,64 - 1582,02

0

0

0

1

1

1582,02 - 1974,4

0

0

0

0

0

1974,4 - 2366,8

0

0

1

0

1

Итого:

2

11

13

4

30

Вывод: так как элементы расположены хаотично, много ячеек остались незаполненными, связи между площадью территории регионов и численностью дорожно-транспортных происшествий (на 100 000 населения) не существует.

2. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.

Проанализировать вариационные ряды распределения, вычислив для каждого из них:

· среднее арифметическое значение признака;

· медиану, квартили и моду;

· среднее квадратическое отклонение;

· коэффициент вариации.

Проверить теорему о разложении дисперсии, используя данные аналитической группировки.

Изобразить корреляционное поле. Построить уравнение регрессии. определить тесноту связи между признаками, используя дисперсионный и корреляционный анализ.

Сделать выводы.

2.1 Построение вариационных, частотных и кумулятивных рядов распределения

Объем совокупности: N = 30.

Таблица 6. Вариационный частотный и кумулятивный ряд распределения по площади территории на 1 января 2009г.,тыс.км.кв.

Площадь территории на 1 января 2009г., тыс. км. кв.

Количество регионов в отдельной группе

Среднее значение

Показатель накопленной частоты

12,5 - 404,88

26

208,69

26

404,88 - 797,26

2

601,07

28

797,26 - 1189,64

0

993,45

28

1189,64 - 1582,02

1

1385,83

29

1582,02 - 1974,4

0

1778,21

29

1974,4 - 2366,8

1

2170,6

30

Итого:

30

-

-

Среднее значение (необходимо для построения полигона):

= (на примере второй группы с показателями 404,88 - 797,26).

Гистограмма - столбиковая диаграмма для представления интервального ряда распределения. Строится на осях (xi; fi).

Рис. 2.1. Гистограмма вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.

Полигон - служит для наглядного изображения дискретного ряда. Ломаная линия, построенная на осях (xi; fi).

Рис. 2.2. Полигон по площади территории регионов на 1 января 2009г., тыс. км. кв.

Кумулята - ломаная линия, служащая для представления кумулятивного ряда распределения (ряда по накопленным частотам).

Строится на осях (xi; Si).

Рис. 2.3. Кумулята вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.

Таблица 7. Вариационный частотный и кумулятивный ряд распределения по числу дорожно-транспортных происшествий на 100 000 населения

Число дорожно-транспортных происшествий на 100 000 населения

Количество регионов в отдельной группе

Среднее значение

Показатель накопленной частоты

55,1 - 96,55

2

75,83

2

96,55 - 138

11

117,28

13

138 - 179,45

13

158,73

26

179,45 - 220,9

4

200,18

30

Итого:

30

-

-

Среднее значение:

= (на примере второй группы с показателями 96,55 - 138).

Рис. 2.4. Гистограмма вариационного ряда по численности дорожно-транспортных происшествий на 100 000 населения

Рис. 2.5. Полигон по числу дорожно-транспортных происшествий на 100 000 населения

Рис. 2.6. Кумулята вариационного ряда по числу дорожно-транспортных происшествий на 100 000 населения

2.2 Анализ вариационных рядов

Таблица 8. Расчётная таблица для нахождения среднего арифметического признака, медианы ,моды, квартилей, дисперсии, среднего квадратического отклонения

Площадь территории на 1 января 2009г., тыс. км. кв.

Количество регионов в отдельной группе

Cередина интервала

Показатель накопленной частоты

12,5 - 404,88

26

208,69

5425,94

444756,52

26

404,88 - 797,26

2

601,07

1202,14

136858,66

28

797,26 - 1189,64

0

993,45

0

0

28

1189,64 - 1582,02

1

1385,83

1385,83

1094848,32

29

1582,02 - 1974,4

0

1778,21

0

0

29

1974,4 - 2366,8

1

2170,6

2170,6

3353000,45

30

Итого:

30

-

10184,51

5029463,95

-

9558,44 тыс. км. кв.

1) тыс.км. кв. - среднее арифметическое (взвешенное, т.к. данные сгруппированы) значение площади территории на 1 января 2009г.

2) Дисперсия (D) - средний квадрат отклонения индивидуальных значений признака от средней величины. Для вариационного ряда она определяется по формуле:

D=,

где - отдельное значение; - частота или частость; - среднее значение.

Если ряд интервальный, то в качестве xi , так же как при расчёте средней, берется середина интервала.

Среднее квадратическое отклонение () - показатель, который представляет собой квадратный корень из дисперсии. Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения и выражается в тех же единицах, что и варианты признака.

==

(т.к. данные сгруппированы, необходимо использовать взвешенную формулу).

= 409,44тыс. км. кв.

3) Коэффициент вариации:

=*100%= %

102,6%60%.

Вывод: так как kв больше 60%, то статистическая совокупность регионов по площади территории считается неоднородной, необходимо исключить аномальные значения.

4) Медиана (Ме ) - это такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.

Численное значение медианы определяется по ряду накопленных частот.

условие для нахождения медианной группы.

- первый интервал для данной группировки является медианным.

12,5+392,38(тыс. км. кв.)

- нижняя граница интервала, содержащего медиану;

- шаг интервала, содержащего медиану;

- накопленная частота интервала, который стоит перед медианным;

- объем совокупности;

- частота того интервала, в котором расположена медиана.

Вывод: встречаются регионы со значением площади ниже 240,08 тыс. км. кв.и выше 240,08 тыс. км. кв.

Мода (Мо ) - наиболее часто встречающееся значение признака в совокупности.

Если ряд равноинтервальный, то используется формула:

=12,5+392,38

(тыс. км. кв.)

Вывод: чаще всего встречаются регионы с площадью 216,54 тыс. км. кв.

Квартили делят совокупность на 4 равные части.

Общая формула расчёта квантилей:

- нижняя граница интервала, содержащего квантиль;

- шаг в квантильном интервале;

iqi -индекс квартили;

Sqi-1 - накопленная частота перед данным квантильным интервалом;

fqi - частота данного квантильного интервала.

iq1=1/4

iq2 =2/4=1/2 - квартиль является медианой =(тыс. км. кв.)

iq3=3/4

100% / 4=25%

=(тыс. км. кв.)

=(тыс. км. кв.)

=352,06 (тыс. км. кв.)

Вывод: 25% регионов имеют площадь территории в среднем менее ; 75% регионов имеют площадь территории в среднем менее 352,06 тыс. км. кв.

Таблица 9. Расчетная таблица для нахождения среднего арифметического признака, медианы, моды, квартилей, дисперсии, среднего квадратического отклонения

Число дорожно-транспортных происшествий на 100000 населения

Количество регионов в отдельной группе

Cередина интервала

Показатель накопленной частоты

55,1 - 96,55

2

75,83

151,66

9166,58

2

96,55 - 138

11

117,28

1290,08

7579,66

13

138 - 179,45

13

158,73

2063,49

3003,52

26

179,45 - 220,9

4

200,18

800,72

12836,88

30

Итого:

30

-

4305,95

32586,64

-

1) (ДТП на 100000 населения) - среднее арифметическое значение признака.

2) == = ==32,96 - среднее квадратическое отклонение.

Вывод: в среднем, количество ДТП на 100000 населения отличается от среднего числа ДТП на 32,96 ДТП на 100 000 населения.

3) Коэффициент вариации:

=*100%= %

22,96%30% т.е. совокупность однородна.

4) - условие для нахождения медианной группы.

Для данной группировки медианным является интервал - 3-й: 138- 179,45 (ДТП на 100000 населения).

138+41,45141,32

- нижняя граница интервала, содержащего медиану;

- шаг интервала, содержащего медиану;

- накопленная частота интервала, который стоит перед медианным;

- объем совокупности;

- частота того интервала, в котором расположена медиана.

Вывод: встречаются регионы с количеством дорожно-транспортных происшествий больше, чем 131,32 ДТП на 100 000 населения, и меньше.

Квартили:

=(ДТП на 100000 населения)

=(ДТП на 100000 населения)

=153,15 (ДТП на 100000 населения).

Вывод: 25% регионов имеют показатели ДТП в среднем менее 210,54 на 100000 населения, 75% регионов имеют показатели в среднем менее 153,15 ДТП на 100000 населения.

=138+41,45 (ДТП на 100 000 населения).

- нижняя граница интервала, содержащего моду;

- шаг интервала, содержащего моду;

-накопленная частота интервала, который стоит перед модальным;

- объем совокупности;

- частота того интервала, в котором расположена мода.

Вывод: чаще всего встречаются регионы с числом ДТП, равным на 100000 населения.

2.3 Проверка теоремы о разложении дисперсий

D= - общая дисперсия;

Dx - межгрупповая дисперсия. Характеризует вариацию, которая возникает только из-за факторного признака (систематическая вариация).

Dx =

- средняя из внутригрупповых.

1) Общая дисперсия D для несгруппированных данных:

=

- общее среднее значение признака;

n - количество элементов.

Таблица 10. Расчётная таблица для нахождения общей дисперсии

№ п/п

Число дорожно-транспортных происшествий на 100000 населения, yi

1

220,9

78,32

6134,02

2

55,1

-87,48

7652,75

3

86,6

-55,98

3133,76

4

134,3

-8,28

68,56

5

103,8

-38,78

1503,89

6

128,0

-14,58

212,58

7

122,1

-20,48

419,43

8

146,4

3,82

14,59

9

132,2

-10,38

107,74

10

142,0

-0,58

0,34

11

158,2

14,62

213,74

12

117,5

-25,08

629,01

13

148,3

5,72

32,72

14

149,9

7,32

53,58

15

187,8

45,22

2044,85

16

179,9

37,32

1392,78

17

158,1

15,52

240,87

18

124,0

-18,58

345,22

19

147,5

4,92

24,21

20

98,5

-44,08

1943,05

21

156,7

14,12

199,37

22

167,9

25,32

641,1

23

195,4

52,82

2789,95

24

147,9

5,32

28,3

25

157,4

14,17

200,79

26

131,6

-10,98

120,56

27

176,0

33,42

1116,9

28

159,7

17,12

293,09

29

127,6

-14,98

224,4

30

116,4

-26,18

685,39

Итого:

4277,7

-

32467,54

D = = = 1082,25

2) Межгрупповая дисперсия Dx:

Таблица 11. Расчётная таблица для нахождения межгрупповой дисперсии

Площадь территории на 1 января 2009г., тыс. км. кв.

Число дорожно-транспортных происшествий на 100 000 населения

Группы регионов

Количество элементов,

Среднее значение

Итого

12,5 - 404,88

26

139,03

3614,7

-3,55

12,6

327,67

404,88 - 797,26

2

145,65

291,3

3,07

9,4249

18,85

797,26 - 1189,64

0

0

0

-142,58

20329,06

0

1189,64 - 1582,02

1

195,4

195,4

52,82

2789,95

2789,95

1582,02 - 1974,4

0

0

0

-142,58

20329,06

0

1974,4 - 2366,8

1

176,0

176,0

33,42

1116,9

1116,9

Итого:

30

-

4277,4

-

-

4253,37

Dx = 141,78

3) Внутригрупповые дисперсии Di:

Внутригрупповая дисперсия характеризует вариацию внутри отдельной группы, которая обусловлена случайными (неучтёнными) факторами.

Таблица 12. Расчетная таблица для нахождения внутригрупповой дисперсии

Группы по площади территории на 1 января 2009г., тыс. км. кв.

Число дорожно-транспортных происшествий на 100 000 населения,

12,5 - 404,88

220,9

139,04

81,86

6701,06

27870,02

55,1

-83,94

7045,92

86,6

-52,44

2749,95

D1= 1071,92

D2= 197,4

D3= -

D4= 0

D5= -

D6= 0

940,47

- общее среднее значение признака;

- количество элементов.

141,78+940,47= 1083,94

1082,25 = 1082,25

Показана выполнимость Теоремы о разложении дисперсий.

Определение силы влияния факторного признака на результативный с помощью эмпирического коэффициента детерминации:

0,13*100%=13%

Вывод: вариация результативного признака на 13% обусловлена площадью территории региона на 1 января 2009 г.

Вывод: связь между площадью территории и количеством ДТП на 100 000 населения умеренная (по соотношениям Чеддока).

2.4 Корреляционное поле, уравнение регрессии, теснота связи между признаками

Таблица 13. Таблица для определения тесноты связи между признаками: площадью территории на 1 января 2009 г. и числом ДТП на 100000 населения

№ п/п

Площадь территории на 1 января 2009 г., тыс. км. кв., x

Число дорожно-транспортных происшествий на 100000 населения, y

x2

xy

1

55,4

220,9

3069,16

12237,86

150,07

34927,87

6132,456

2

50,3

55,1

2530,09

2771,53

36860,16

7654,5

3

12,5

86,6

156,25

1082,5

139,77

52803,44

3134,88

4

75,5

134,3

5700,25

10139,65

27818,9

68,7241

5

66,2

103,8

4382,44

6871,56

152,66

31007,69

1504,664

6

49,0

128,0

2401

6272

148,53

37361,02

212,8681

7

112,9

122,1

12746,41

13785,09

163,87

16741,77

419,8401

8

101,0

146,4

10201

14786,4

161,01

19962,86

14,5161

9

142,9

132,2

20420,41

18891,38

171,07

9878,372

107,9521

10

26,1

142,0

681,21

3706,2

143,03

46738,12

0,3481

11

67,8

158,2

4596,84

10725,96

153,04

30446,76

243,6721

12

42,1

117,5

1772,41

4946,75

146,87

40076,04

629,5081

13

18,3

148,3

334,89

2713,89

141,16

50171,52

32,6041

14

160,2

149,9

25664,04

24013,98

175,22

6738,768

53,4361

15

120,4

187,8

14496,16

22611,12

165,67

14857,17

2043,944

16

76,6

179,9

5867,56

13780,34

155,15

27453,18

1392,036

Корреляционное поле:

Рис. 2.7 Корреляционное поле по площади территории на 1 января 2009 г. и числу ДТП на 100000 населения. Линия регрессии

Гипотеза: регрессия выражена через линейную функцию: =+x

* (-242,29) первое уравн-е.

Сложить 2 уравнения, получаем систему:

=136,77

=0,24

=136,77+0,24x

Определение теоретического значения результата (на примере 2 и 4 групп):

(50,3;148,84)

(75,5;154,89)

Построение линии регрессии на рис. 2.7

Определение линейного коэффициента корреляции r:

=

0,35

- связь слабая.

Вывод: если площадь территории в среднем увеличить на 1 тыс. км. кв, то средняя численность дорожно-транспортных происшествий на 100 000 населения возрастёт на 0,24 шт.

Между площадью территории (на 1 января 2009г.) и числом дорожно-транспортных происшествий на 100000 населения наблюдается слабая связь.

3. Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно - случайного 40% бесповторного отбора, определить:

a) пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;

b) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.

Используя результаты расчетов, выполненных в задании №2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:

a) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);

b) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%

3.1 Выборочное наблюдение признака Х (площадь территории на 1 января 2009 г., тыс. км. кв.)

a) Дано: р=0,954;

t=2;

n=30;

=339,48 тыс. км. кв;

;

40% - собственно-случайный бесповторный отбор

Найти:

Решение:

1) 100% - N

40% - 30

2) Т.к. отбор бесповторный

*2=5,72

n - объем выборочной совокупности;

N - объем генеральной совокупности;

t - коэффициент доверия;

- средняя ошибка выборки.

Границы, в которых будет изменяться значение средней генеральной совокупности:

339,48 -

345,2

Вывод: с вероятностью 0,954 можно утверждать, что среднее значение признака генеральной совокупности располагается в интервале от до 345,2тыс. км. кв.

b) Дано: ;

N=75;

t=2;

.

Найти:

Решение:

Если принять

54,5655

n - объем выборочной совокупности;

t2 - коэффициент доверия в квадрате;

N - объем генеральной совокупности;

- предельная ошибка;

- среднее квадратическое отклонение.

Вывод: чтобы снизить предельную ошибку средней величины на 50 % нужно увеличить объем выборки до 55 элементов.

3.2 Выборочное наблюдение признака Y (число ДТП на 100000 населения)

а) Дано: р=0,954;

t=2;

n=30;

М0= ДТП на 100 000 населения; m= 16(количество элементов выборочной совокупности, превышающих моду);

Повторный отбор.

Найти:

Решение:

Доля регионов, у которых индивидуальные значения признака превышают моду:

- пределы, в которых будет находиться генеральная доля, где:

W - доля элементов выборки;

Д - предельная ошибка выборки;

p - доля элементов с признаком в генеральной совокупности;

коэффициент доверия;

средняя ошибка.

0,350,46

Вывод: значение доли регионов генеральной совокупности, у которых индивидуальные значения признака превышают моду, находится в интервале от 0,35 до 0,46 (от 35% до 46%).

b) Дано: t=2;

=;

W=0,53.

Найти: n

Решение:

,

где n - объем выборочной совокупности; W - доля элементов выборки с признаком; t - коэффициент доверия; - предельная ошибка.

Если снизить предельную ошибку на 30%, то она станет равна:

=(1-0,3)=(1-0,3)*0,18=0,13,

тогда:

n1====49,8250 (регионов).

Вывод: для того, чтобы снизить предельную ошибку на 30%, необходимо увеличить объем выборки до 50 регионов.

4. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально-экономических показателей по районам Псковской области.

Районы и направление определяются для каждого студента по последним цифрам номера зачетной книжки.

Рассчитать:

а) Среднегодовой уровень динамики;

б) Цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста; абсолютное значение 1% прироста;

в) Средний абсолютный прирост, средний темп роста, средний темп прироста.

Произвести сглаживание ряда динамики трехлетней скользящей средней. Отобразить графически.

Произвести аналитическое выравнивание ряда динамики.

Изобразить фактический и выровненный ряды динамики графически.

Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данному направлению

4.1 Динамические ряды для характеристики изменения социально-экономических показателей по районам Псковской области

Таблица 14. Численность населения (на 1 января)

Район

Численность населения, чел.

2005г.

2006г.

2007г.

2008г.

2009г.

2010г.

2011г.

Гдовский

16616

16353

16115

15943

15810

15439

12674

Невельский

28928

28266

27728

27246

26831

26459

26531

4.2 Расчёты показателей

а) Расчёт среднегодового уровня динамики:

Используется средняя хронологическая простая, так как ряд моментный с равноотстоящими промежутками.

,

где - уровень ряда динамики; n - число уровней.

Среднегодовой уровень динамики в Гдовском районе:

= чел.

Вывод: средний уровень численности населения в Гдовском районе составил человек.

Среднегодовой уровень динамики в Невельском районе:

= чел.

Вывод: средний уровень численности населения в Невельском районе составил человек.

б) Расчёт цепных и базисных показателей динамики:

Абсолютный прирост на цепной основе:

,

где - значение уровня ряда по i-тому периоду; - значение уровня ряда по предшествовавшему периоду.

Абсолютный прирост на базисной основе:

,

где - значение уровня ряда по 1 периоду.

Темп роста на цепной основе: Темп роста на базисной основе:

Темп прироста на цепной основе: Темп прироста на базисной основе:

Абсолютное значение (содержание) 1% прироста - результат деления абсолютного прироста на соответствующий темп прироста.

Таблица 15. Динамика численности населения и расчёт аналитических показателей в Гдовском районе

Годы

Численность населения на 1января

Абсолютный прирост

Темп роста, %

Темп прироста, %

Абсолютное значение прироста на1%

1%

1%,

2005

16616

-

-

-

-

-

-

-

-

2006

16353

-263

-263

98,42

98,42

-1,58

-1,58

166,46

166,46

2007

16115

-501

-238

96,98

98,54

-3,02

-1,46

165,89

163,01

2008

15943

-673

-172

95,95

98,93

-4,05

-1,07

166,17

160,75

2009

15810

-806

-133

95,15

99,17

-4,85

-0,83

166,19

160,24

2010

15439

-1177

-371

92,92

97,65

-7,08

-2,35

166,24

157,87

2011

12674

-3942

-2765

76,28

82,09

-23,72

-17,91

166,19

154,38

Итого

108817

-

-

-

-

-

-

-

-

Для 2009 года:

= 15810 - 16616= - 80

i = 15810 - 15943 = -133

= = 95,15%

= = 99,17%

=95,15-100= - 4,85%

= 99,17-100= -0,83%

1%,== 166,19

1%, = =160,24

Вывод (по постоянной базе сравнения): численность населения в Гдовском районе в 2009 году относительно 2005 уменьшилась на 806 чел., численность населения в 2009 г составила 95,15% от базового, т.е. уменьшилась на 4,85%; в 2009 г. в среднем 166,19 чел. приходилось на 1% абсолютного прироста;

(по переменной базе сравнения): в 2009г. по сравнению с 2008 годом численность населения уменьшилась на 133 чел., численность населения района в 2009г. составила 99,17% от 2008г., т.е. уменьшилась на 0,83%; в 2009г. в среднем 160,24 чел. приходилось на 1% абсолютного прироста.

В течение всего рассматриваемого периода (с 2005 года по 2011 год) наблюдается постоянное уменьшение численности населения в районе. По сравнению с 2005 годом в 2011 году численность населения района снизилась на 23,72%. Наибольшее снижение численности населения наблюдалось в 2011 году по сравнению с 2010 годом, наименьшее снижение - в 2009 по сравнению с 2008 годом (всего на 0,83%).

Таблица 16. Динамика численности населения и расчёт аналитических показателей в Невельском районе

Годы

Численность населения на 1января

Абсолютный прирост

Темп роста, %

Темп прироста, %

Абсолютное значение 1% прироста

1%,

1%,

2005

28928

-

-

-

-

-

-

-

-

2006

28266

-662

-662

97,71

97,71

-2,29

-2,29

289,08

289,08

2007

27728

-1200

-538

95,85

98,10

-4,15

-1,90

289,16

283,16

2008

27246

-1682

-482

94,19

98,26

-5,81

-1,74

289,50

277,01

2009

26831

-2097

-415

92,75

98,48

-7,25

-1,52

289,24

273,03

2010

26459

-2469

-372

91,47

98,61

-8,53

-1,39

289,45

267,63

2011

26531

-2397

72

91,71

100,27

-8,29

0,27

289,14

266,67

Итого

191989

-

-

-

-

-

-

-

-

Вывод: в течение всего рассматриваемого периода (с 2005 года по 2010 год) наблюдается уменьшение численности населения в районе, небольшой рост замечен в 2011г. По сравнению с 2005 годом в 2011 году численность населения района снизилась на 8,29%. Наибольшее снижение численности населения наблюдалось в 2006 году по сравнению с 2005 годом, рост - в 2011 по сравнению с 2010 годом (всего на 0,27%).

в) средний абсолютные прирост, средний темп роста, средний темп прироста.

Средний абсолютный прирост:

- уровни рядов динамики; n - число уровней.

Средний абсолютный прирост численности населения для Гдовского района:

Вывод: средняя численность населения Гдовского района за 2005-2011 гг. уменьшилась на 657 человек.

Средний абсолютный прирост численности населения для Невельского района:

Вывод: средняя численность населения Невельского района за 2005-2011 гг. уменьшилась на 399,5 человек.

Средний темп роста:

- уровни рядов динамики; n - число уровней.

Средний темп роста численности населения для Гдовского района:

*100%=95,53%

Вывод: в Гдовском районе за 2005-2011 гг. изменение средней численности населения составило 95,53%.

Средний темп роста численности населения для Невельского района:

*100%=98,62%

Вывод: в Невельском районе за 2005-2011 гг. изменение средней численности населения составило 98,62%.

Средний темп прироста:

Средний темп прироста для Гдовского района:

Вывод: в общем в Гдовском районе за 2005-2011 гг. средняя численность населения снизилась на 4,47%.

Средний темп прироста для Невельского района:

Вывод: в общем в Невельском районе за 2005-2011 гг. средняя численность населения снизилась на %.

4.3 Сглаживание ряда динамики трёхлетней скользящей средней. Графическое отображение

Таблица 17. Динамика численности населения и расчёт трехлетней скользящей средней по Гдовскому району

Годы

Численность населения района, чел.

Трёхлетняя скользящая средняя ()

2005

16616

-

2006

16353

16361,33

2007

16115

16137

2008

15943

15956

2009

15810

15730,67

2010

15439

14641

2011

12674

-

Итого:

108817

-

Расчёт трёхлетней скользящей средней:

2006г.: 16361,33

2007г.: = 16137

2008г.:= 15956

2009г.:= 15730,67

2010г.:= 14641

Рис. 4.1. Фактический ряд динамики и трёхлетняя скользящая средняя по численности населения в Гдовском районе

Таблица 18. Динамика численности населения и расчёт трехлетней скользящей средней по Невельскому району

Годы

Численность населения района, чел.

Трёхлетняя скользящая средняя ()

2005

28928

-

2006

28266

28307,33

2007

27728

27986,67

2008

27246

27768,33

2009

26831

27245,33

2010

26459

26607

2011

26531

-

Итого:

191989

-

Рис. 4.2 Фактический ряд динамики и трёхлетняя скользящая средняя по численности населения в Невельском районе

4.4 Аналитическое сглаживание ряда динамики

1. Предположим, что функция имеет вид:

2. Используя принцип наименьших квадратов, получаем систему двух нормальных уравнений:

Где y- исходный уровень ряда динамики; n - количество уровней; t - показатель времени.

3. , из чего следует:

Таблица 19. Расчётная таблица для аналитического выравнивания ряда динамики по Гдовскому району

Годы

Численность населения (на 1 января), чел.

усл

усл

2005

16616

-3

9

-49848

15097,75

2006

16353

-2

4

-32706

14599,21

2007

16115

-1

1

-16115

14100,67

2008

15943

0

0

0

13602,13

2009

15810

1

1

15810

13103,59

2010

15439

2

4

30878

12605,05

2011

12674

3

9

38022

12106,51

Итого:

108817

0

28

-13959

95214,91

y= 13602,13 -498,54x -уравнение тренда.

Вывод: в среднем численность населения в Гдовском районе составляет 13602,13 чел. Ежегодно в Гдовском районе происходит уменьшение численности населения в среднем на 498,54 чел.

4. Изобразим линию тренда на графике:

Рис. 4.3. Динамика численности населения в Гдовском районе

Вывод: отмечается тенденция к снижению численности населения в Гдовском районе.

Таблица 20. Расчётная таблица для аналитического выравнивания ряда динамики по Невельскому району

Годы

Численность населения (на 1 января), чел.

усл

усл

2005

28928

-3

9

-86784

25252,42

2006

28266

-2

4

-56532

24834,49

2007

27728

-1

1

-27728

24406,56

2008

27246

0

0

0

23988,63

2009

26831

1

1

26831

23570,7

2010

26459

2

4

52918

23152,77

2011

26531

3

9

79593

22734,84

Итого:

191989

0

28

-11702

167940,4

Вывод: в среднем численность населения в Невельском районе составляет 23988,63 чел. Ежегодно в Невельском районе происходит уменьшение численности населения в среднем на 417,93 чел.

Изобразим линию тренда на графике:

Рис. 4.4. Динамика численности населения в Невельском районе

Вывод: отмечается тенденция к снижению численности населения в Невельском районе.

4.5 Сравнительные выводы по районам и их общая характеристика развития по направлению - численность населения

равноинтервальный вариационный дисперсия медиана

На основании вычислений, произведённых в задании №4 можно сделать вывод, что среднегодовой уровень динамики численности населения в Невельском районе (составил человек) выше, чем в Гдовском ( человек). Средний темп прироста в Невельском районе (-1,38%) выше среднего темпа прироста в Гдовском районе (-4,47%).

Используя аналитическое выравнивание, можно выявить основные тенденции изменения численности населения в Невельском и Гдовском районах. В рассматриваемых районах наблюдается тенденция к снижению численности населения. Имеются несколько причин снижения численности: во - первых, это высокие показатели смертности; во-вторых, это миграции населения, причём не в пользу трудоспособной его части. Кроме того влияние оказывает довольно низкая продолжительность жизнь населения, процессы его старения, низкая рождаемость, обезлюдивание сельских территорий и др.

Учитывая то, что население эмигрирует в другие районы, более экономически-развитые, с крупными городами- центрами, можно говорить о неэффективности социальной политики в регионах. В первую очередь стоит развивать такие сферы, как: здравоохранение, образование, жилищное строительство, сельское хозяйство.

Всё это требует разработки и реализации долгосрочных целевых программ, действия власти должны быть ориентированы не только на решение существующих проблем, но и рассматривать демографическую ситуацию в перспективе.

Список использованной литературы

1. Теория статистики, под ред. Проф. Р.А. Шмойловой, 5-е издание, Финансы и статистика, - М.: 2009 год.

2. Практикум по теории статистики: учебное пособие под ред. Проф. Р.А. Шмойловой, второе издание, переработанное и дополненное, Финансы и статистика, - М.: 2004 год.

3. Районы Псковской области: статистический сборник в двух томах, первый том, второй: Псковоблкомстат, 2010 год.

4. Районы Псковской области: социально-экономические показатели: статистический сборник: Псковстат, 2008 год.

5. Районы Псковской области: статистический сборник в двух томах, первый том, второй, Псковоблкомстат, 2009 г.

Размещено на Allbest.ru


Подобные документы

  • Построение группировки магазинов математическим путем с использованием формулы Стерджесса по размеру товарооборота. Нахождение моды и медианы распределения работников по уровню заработной платы. Определение дисперсии, среднего квадратического отклонения.

    контрольная работа [44,8 K], добавлен 09.07.2013

  • Cущность аналитической, комбинационной и структурной равноинтервальной группировок, их практическое применение в статистике. Построение рядов распределения и их гистограммы. Проверка теоремы о разложении дисперсии. Расчет коэффициента детерминации.

    курсовая работа [268,2 K], добавлен 07.04.2010

  • Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.

    курсовая работа [1,4 M], добавлен 22.11.2013

  • Понятие и сущность типологической группировки. Расчет динамики и структуры изменения объема продукции в квартальном разрезе и в целом за год. Вычисление показателей вариации, дисперсии, среднего квадратичного отклонения. Определение моды и медианы.

    контрольная работа [135,8 K], добавлен 24.09.2012

  • Социально-экономические показатели по регионам России, комбинационная группировка. Построение рядов распределения и их анализ. Проверка теоремы о разложении дисперсии. Методика расчета коэффициента корреляции, а также индекса структурного сдвига.

    контрольная работа [1,6 M], добавлен 02.10.2014

  • Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.

    контрольная работа [226,8 K], добавлен 31.07.2011

  • Возрастание объемов продаж. Определение среднего, медианы и моды. Распределение цен на акции фармацевтической компании. Определение межквартильного размаха, среднего квадратичного отклонения, коэффициента вариации, дисперсии, показателя асимметрии.

    курсовая работа [28,3 K], добавлен 03.12.2010

  • Составление закона распределения случайной величины X—числа студентов, успешно сдавших экзамен. Расчет математического ожидания, дисперсии и среднего квадратического отклонения случайной величины. Таблица накопленных частот для сгруппированной выборки.

    курсовая работа [1,8 M], добавлен 11.01.2015

  • Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.

    курсовая работа [599,0 K], добавлен 06.12.2013

  • Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа [218,5 K], добавлен 27.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.