Основы статистики
Применение методов статистического анализа при исследовании различных сфер экономики. Методы расчета обобщающих показателей, выявления тенденций и закономерностей социально-экономических процессов. Анализ математических свойств средней арифметической.
Рубрика | Экономика и экономическая теория |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 12.10.2012 |
Размер файла | 880,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
25
35
70
90
120
90
130
140
60
95
30 000 - 50 000
30
45
40
5
80
30
60
75
20
115
свыше 50 000
15
10
30
25
50
15
25
5
10
5
С вероятностью 0,954 определить:
1) средний размер вклада во всем банке;
2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;
3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;
4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.
Тема 4. Ряды динамики
Методические указания по теме
Задача 1. Смертность от болезней системы кровообращения в России за период 1995-2004 гг. характеризуется следующим рядом динамики.
Год |
1995 |
1996 |
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
|
Умершие, тыс. чел. |
1163,5 |
1113,7 |
1100,3 |
1094,1 |
1187,8 |
1231,4 |
1253,1 |
1308,1 |
1330,5 |
1287,7 |
Вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на 2005 год с вероятностью 95%.
Решение. Любое изменение уровней ряда динамики определяется базисным (сравнение с первым уровнем) и цепным (сравнение с предыдущим уровнем) способами. Оно может быть абсолютным (разность уровней ряда) и относительным (соотношение уровней).
Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда (47), а цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда (48).
(47)(48)
По знаку абсолютного изменения делается вывод о характере развития явления: при > 0 -- рост, при < 0 -- спад, при = 0 -- стабильность.
В нашей задаче эти изменения определены в 3-м и 4-м столбцах таблицы 5. Для проверки правильности расчетов применяется правило, согласно которому сумма цепных абсолютных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =124,2 и =124,2.
Базисное относительное изменение представляет собой соотношение конкретного и первого уровней ряда (49), а цепное относительное изменение представляет собой соотношение конкретного и предыдущего уровней ряда (50).
(49)(50)
Относительные изменения уровней -- это по существу индексы динамики, критериальным значением которых служит 1. Если они больше ее, имеет место рост явления, меньше ее -- спад, а при равенстве единице наблюдается стабильность явления.
В нашей задаче эти изменения определены в 5-м и 6-м столбцах таблицы 5.
Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. При положительном темпе изменения имеет место рост явления, при отрицательном -- спад, а при нулевом темпе изменения наблюдается стабильность явления. В нашей задаче темпы изменения определены в 7-м и 9-м столбцах таблицы 5, а в 8-м и 10-м сделан вывод о характере развития изучаемого явления. Для проверки правильности расчетов применяется правило, согласно которому произведение цепных относительных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =1,107 и =1,107.
Таблица 5. Вспомогательные расчеты для решения задачи
Обобщенной характеристикой ряда динамики является средний уровень ряда . Способ расчета зависит от того, моментный ряд или интервальный (см. рис.3):
Размещено на http://www.allbest.ru/
15
Размещено на http://www.allbest.ru/
Рис.3. Методы расчета среднего уровня ряда динамики.
В нашей задаче ряд динамики интервальный, значит, применяем формулу средней арифметической простой (17): = 12070,2 / 10 = 1207,02 (тыс. чел.). То есть за период 1995-2004 в России в среднем за год от болезней системы кровообращения умирало 1207,02 тыс. чел.
Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели - среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.
Базисное среднее абсолютное изменение - это частное от деления последнего базисного абсолютного изменения на количество изменений уровней (51). Цепное среднее абсолютное изменение уровней ряда - это частное от деления суммы всех цепных абсолютных изменений на количество изменений (52).
Б =(51)Ц =(52)
По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность. Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными. В нашей задаче = 124,2/9 = 13,8, то есть ежегодно в среднем смертность от болезней системы кровообращения растет на 13,8 тыс. чел.
Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (53), а цепное среднее относительное изменение - по формуле (54):
Б== (53)Ц=(54)
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашей задаче = = 1,0114, то есть ежегодно в среднем смертность от болезней системы кровообращения растет в 1,0114 раза.
Вычитанием 1 из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики. В нашей задаче = 1,0114 - 1 = 0,0114, то есть ежегодно в среднем смертность от болезней системы кровообращения растет на 1,14%.
Проверка ряда динамики на наличие в нем тренда (тенденции развития ряда) возможна несколькими способами (метод средних, Фостера и Стюарта, Валлиса и Мура и пр.), но наиболее простым является графическая модель, где на графике по оси абсцисс откладывается время, а по оси ординат - уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. Тренд может представлять собой прямую линию, параболу, гиперболу и т.п. В итоге приходим к трендовой модели вида:
,(55)
где - математическая функция развития; - случайное или циклическое отклонение от функции; t - время в виде номера периода (уровня ряда). Цель такого метода - выбор теоретической зависимости в качестве одной из функций:
- прямая линия; - гипербола; - парабола;- степенная; - ряд Фурье.
Для выявления тренда (тенденции развития ряда) в нашей задаче построим график Y(t) (рис.4):
Рис.4. График динамики смертности от болезней системы кровообращения в РФ.
Из данного графика видно, что есть все основания принять уравнение тренда в виде линейной функции.
Определение параметров в этих функциях может вестись несколькими способами, но самые незначительные отклонения аналитических (теоретических) уровней ( - читается как «игрек, выравненный по t») от фактических () дает метод наименьших квадратов - МНК. При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней от теоретических уровней :
.(56)
В нашей задаче при выравнивании по прямой вида параметры и отыскиваются по МНК следующим образом. В формуле (55) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные - оставив в левой, получим систему нормальных уравнений:
(57)
где n - количество уровней ряда; t - порядковый номер в условном обозначении периода или момента времени; y - уровни эмпирического ряда.
Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда. Например, при нечетном числе уровней серединная точка (год, месяц) принимается за нуль. Тогда предшествующие периоды обозначаются соответственно -1, -2, -3 и т.д., а следующие за средним (центральным) - соответственно 1, 2, 3 и т.д. При четном числе уровней два серединных момента (периода) времени обозначают -1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д.
При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:
(58)
Как видим, при такой нумерации периодов параметр представляет собой средний уровень ряда. Определим по формуле (58) параметры уравнения прямой, для чего исходные данные и все расчеты необходимых сумм представим в таблице 6.
Из таблицы получаем, что = 12070,2/10 = 1207,02 и = 4195/330 = 12,7121. Отсюда искомое уравнение тренда =1207,02+12,7121t. В 6-м столбце таблицы 6 приведены трендовые уровни, рассчитанные по этому уравнению. Для иллюстрации построим график эмпирических (маркеры-кружочки) и трендовых уровней (рис.5).
Рис.5. График эмпирических и трендовых уровней смертности от болезней системы кровообращения в РФ.
По полученной модели для каждого периода (каждой даты) определяются теоретические уровни тренда () и оценивается надежность (адекватность) выбранной модели тренда. Оценку надежности проводят с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическими значениями FТ (приложение 1). При этом расчетный критерий Фишера определяется по формуле:
,(59)
где k - число параметров (членов) выбранного уравнения тренда; ДА - аналитическая дисперсия, определяемая по формуле (61); До - остаточная дисперсия (62), определяемая как разность фактической дисперсии ДФ (60) и аналитической дисперсии:
;(60)
;(61)
.(62)
Сравнение расчетного и теоретического значений критерия Фишера ведется обычно при уровне значимости с учетом степеней свободы и . Уровень значимости связан с вероятностью следующей формулой . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.
Таблица 6. Вспомогательные расчеты для решения задачи
Год |
y |
t |
t2 |
yt |
|
(y -)2 |
(-)2 |
(y - )2 |
|
1995 |
1163,5 |
-9 |
81 |
-10471,5 |
1092,611 |
5025,263 |
13089,44 |
1893,9904 |
|
1996 |
1113,7 |
-7 |
49 |
-7795,9 |
1118,035 |
18,79354 |
7918,3033 |
8708,6224 |
|
1997 |
1100,3 |
-5 |
25 |
-5501,5 |
1143,459 |
1862,733 |
4039,9506 |
11389,1584 |
|
1998 |
1094,1 |
-3 |
9 |
-3282,3 |
1168,884 |
5592,592 |
1454,3822 |
12750,9264 |
|
1999 |
1187,8 |
-1 |
1 |
-1187,8 |
1194,308 |
42,35249 |
161,59803 |
369,4084 |
|
2000 |
1231,4 |
1 |
1 |
1231,4 |
1219,732 |
136,1394 |
161,59803 |
594,3844 |
|
2001 |
1253,1 |
3 |
9 |
3759,3 |
1245,156 |
63,10136 |
1454,3822 |
2123,3664 |
|
2002 |
1308,1 |
5 |
25 |
6540,5 |
1270,581 |
1407,705 |
4039,9506 |
10217,1664 |
|
2003 |
1330,5 |
7 |
49 |
9313,5 |
1296,005 |
1189,915 |
7918,3033 |
15247,3104 |
|
2004 |
1287,7 |
9 |
81 |
11589,3 |
1321,429 |
1137,652 |
13089,44 |
6509,2624 |
|
Итого |
12070,2 |
0 |
330 |
4195 |
12070,2 |
16476,25 |
53327,348 |
69803,596 |
Проверим тренд в нашей задаче на адекватность по формуле (59), для чего в 7-м столбце таблицы 6 рассчитан числитель остаточной дисперсии, а в 8-м столбце - числитель аналитической дисперсии. В формуле (59) можно использовать их числители, так как оба они делятся на число уровней n (n сократятся): FР = 53327,348*8/(16476,25*1) = 25,893 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ= 5,32 находим по приложению 1 в 1-ом столбце [= k - 1 = 1] и 8-й строке [= n - k = 8]).
При составлении прогнозов уровней социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (63):
,(63)
где - точечный прогноз, рассчитанный по модели тренда; - коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n-1 (приложение 2); - ошибка аппроксимации, определяемая по формуле (64):
,(64)
где и - соответственно фактические и теоретические (трендовые) значения уровней ряда динамики; n - число уровней ряда; k - число параметров (членов) в уравнении тренда.
Определим доверительный интервал в нашей задаче на 2005 год с уровнем значимости = (1-0,95) = 0,05. Для этого найдем ошибку аппроксимации по формуле (64): == 45,38. Коэффициент доверия по распределению Стьюдента = 2,2622 при = 10 - 1=9.
Прогноз на 2005 с вероятностью 95% осуществим по формуле (63):
Y2005=(1207,02+12,7121*11)2,2622*45,38 или 1244,19<Y2005<1449,51 (тыс.чел.).
Контрольные задания по теме
По статистическим данным по России за 2000 - 2005 гг. вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на 2006 год с вероятностью 95%.
Год |
Вариант |
||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
Валовой сбор сахарной свеклы, млн.т. |
Валовой сбор картофеля, млн.т. |
Число заключенных браков, тыс. |
Число построенных жилых домов, млн.м2 |
Поголовье крупного рогатого скота, млн.голов (на конец года) |
Производство мяса, млн.т. |
Производство яиц, млрд.шт. |
Численность населения, тыс.чел. (на начало года) |
Среднегодовая численность занятых в экономике, тыс.чел. |
Доля расходов на оплату ЖКХ в бюджете домохозяйств, % |
||
2000 |
14,1 |
34 |
897,3 |
30,3 |
16,5 |
4,4 |
34,1 |
146890 |
64327 |
4,6 |
|
2001 |
14,6 |
35 |
1001,6 |
31,7 |
15,8 |
4,5 |
35,2 |
146304 |
64710 |
5,2 |
|
2002 |
15,7 |
32,9 |
1019,8 |
33,8 |
15,0 |
4,7 |
36,3 |
145649 |
65359 |
6,2 |
|
2003 |
19,4 |
36,7 |
1091,8 |
36,4 |
13,5 |
4,9 |
36,5 |
144964 |
65666 |
7,2 |
|
2004 |
21,8 |
35,9 |
979,7 |
41,0 |
12,1 |
5,0 |
35,8 |
144168 |
66407 |
7,7 |
|
2005 |
21,4 |
37,3 |
1066,4 |
43,6 |
11,1 |
4,9 |
36,8 |
143474 |
66939 |
8,3 |
Тема 5. Индексы
Методические указания по теме
Задача 1. Имеются следующие данные о продажах торговой точкой двух видов товара:
Товар |
Цена за кг, руб. |
Объем продаж, тыс. кг |
|||
Январь |
Февраль |
Январь |
Февраль |
||
Апельсины |
20 |
18 |
100 |
160 |
|
Бананы |
22 |
25 |
150 |
120 |
Определить: 1) индивидуальные индексы цен, физического объема и выручки; 2) общие индексы цен, физического объема и выручки; 3) абсолютное изменение выручки за счет изменений цен, структурного сдвига и объемов продаж (для каждого фактора в отдельности) по всей продукции и по каждому товару в отдельности. По итогам расчетов сделать аргументированные выводы.
Решение. В основе решения задачи лежит формула (65):
Q = pq,(65)
где p - цена товара, q - физический объем (количество), Q - выручка (товарооборот).
Применив формулу (65) к нашей задаче, рассчитаем выручку по каждому товару в январе (Q0j) и феврале (Q1j) в таблице 7.
Таблица 7. Расчет выручки и ее изменения по каждому товару
Товар j |
Январь Q0j |
Февраль Q1j |
Изменение выручки ?Qj= Q1j- Q0j |
|
Апельсины |
20*100 = 2000 |
18*160 = 2880 |
880 |
|
Бананы |
22*150 = 3300 |
25*120 = 3000 |
-300 |
|
Итого |
5300 |
5880 |
580 |
Из таблицы видно, что абсолютное изменение общей выручки составило:
= ?Q1-?Q0 = 5880-5300 = 580 тыс. руб., то есть она выросла на 580 тыс. руб.
Общий индекс изменения выручки равняется:
= ?Q1/?Q0 = 5880/5300 = 1,1094,
то есть выручка от продажи фруктов увеличилась в 1,1094 раза или на 10,94% в феврале по сравнению с январем.
Определим индивидуальные индексы цен (ip), физического объема (iq), выручки (iQ) и доли товара (id) по формуле (2), используя в качестве Xi цены (p), физический объем (q), выручки (Q) и доли товара (d=q/?q) каждого вида фруктов соответственно. Результаты расчетов представим в таблице 8.
Таблица 8. Расчет индивидуальных индексов
Индивидуальный индекс |
апельсины |
бананы |
|
количества iq |
160/100 = 1,6 |
120/150 = 0,8 |
|
отпускных цен ip |
18/20 = 0,9 |
25/22 = 1,136 |
|
выручки iQ |
2880/2000=1,44 |
3000/3300=0,909 |
|
доли товара id |
(160/280)/(100/250) = 1,429 |
(120/280)/(150/250) = 0,714 |
Правильность выполненных расчетов проверяется следующим образом:
1) общее изменение выручки должно равняться сумме ее частных (по каждому товару в отдельности) изменений: = 880+(-300) = 580 (тыс. руб.);
2) произведение факторных индивидуальных индексов по периодам должно равняться соответствующему индивидуальному индексу выручки: iQА=1,6*0,9 =1,44; iQБ= 0,8*1,136 = 0,909.
Из таблицы видно, что в феврале по сравнению с январем:
- количество проданных апельсинов увеличилось в 1,6 раза или на 60%, а бананов - уменьшилось в 0,8 раза или на 20%;
- цена апельсинов понизилась в 0,9 раза или на 10%, а бананов - повысилась в 1,136 раза или на 13,6%;
- выручка по апельсинам выросла в 1,44 раза или на 44%, а по бананам - снизилась в 0,909 раза или на 9,1%;
- доля проданных апельсинов увеличилась в 1,429 раза или на 42,9%, а бананов - уменьшилась в 0,714 раза или на 28,6%.
Агрегатный общий индекс физического объема Ласпейреса определяется по формуле (66):
=(66)
В нашей задаче == 5840/5300 = 1,10189, то есть количество проданных фруктов в базисных (январских) ценах выросло в 1,10189 раза или на 10,189% в феврале по сравнению с январем.
Агрегатный общий индекс цен Пааше рассчитывается по формуле (67):
=(67)
В нашей задаче = = 5880/5840 = 1,00685, то есть цена проданных фруктов при объемах продаж отчетного (февральского) периода выросла в 1,00685 раза или на 0,685% в феврале по сравнению с январем.
Контроль осуществляется по формуле: IQ = = 1,10189*1,00685 = 1,1094.
Агрегатный общий индекс цен Ласпейреса вычисляется по формуле (68):
=(68)
В нашей задаче = = 5550/5300 = 1,04717, то есть цена проданных фруктов при объемах продаж базисного (январского) периода выросла в 1,04717 раза или на 4,717% в феврале по сравнению с январем.
Агрегатный общий количественный индекс Пааше рассчитывается по формуле (69):
=(69)
В нашей задаче = 5880/5550 =1,05946, то есть количество проданных фруктов в отчетных (февральских) ценах выросло в 1,05946 раза или на 5,946% в феврале по сравнению с январем.
Контроль осуществляется по формуле: IQ = = 1,04717*1,05946 =1,1094.
Средняя геометрическая величина определяется из индексов Ласпейреса и Пааше (по методике Фишера) по формуле (70) для количества товаров и по формуле (71) - для цен:
=(70)=(71)
В нашей задаче ==1,0805, то есть в среднем количество проданных фруктов выросло в 1,0805 раза или на 8,05%; ==1,0268, то есть в среднем цена проданных фруктов выросла в 1,0268 раза или на 2,68%.
Далее выполняется факторный анализ общей выручки. В его основе лежит следующая трехфакторная мультипликативная модель выручки:
IQ =,(72)
где =, - индекс структурных сдвигов, показывающий как изменилась выручка под влиянием фактора изменения долей проданных фруктов в отчетном периоде по сравнению с базисным периодом. Он определяется по формуле (73):
==.(73)
В нашей задаче == 0,9838, то есть структурный сдвиг должен был уменьшить отчетную выручку в базисных ценах в 0,9838 раза или на 1,62%.
Тогда изменение выручки за счет изменения общего количества фруктов определяется по формуле (74):
=.(74)
В нашей задаче = (1,12-1)*5300 = 636 (тыс. руб.), то есть изменение количества проданных фруктов увеличило выручку на 636 тыс. руб. Изменение общей выручки за счет структурных сдвигов находится по формуле (75):
=.(75)
В нашей задаче = 1,12*(0,9838-1)*5300 = -96 (тыс. руб.), то есть структурный сдвиг в количестве проданных фруктов уменьшил выручку на 96 тыс. руб.
Изменение общей выручки за счет изменения отпускных цен рассчитывается по формуле (76):
=.(76)
В нашей задаче =1,12*0,9838*(1,00685-1)*5300 = 40 (тыс. руб.), то есть изменение цен на фрукты увеличило выручку на 40 тыс. руб.
Контроль правильности расчетов производится по формуле (77), согласно которой общее изменение выручки равно сумме ее изменений за счет каждого фактора в отдельности.
=-=++.(77)
В нашей задаче = 636 + (-96) + 40 = 580 тыс. руб.
Результаты факторного анализа общей выручки заносятся в последнюю строку факторной таблицы 9.
Таблица 9. Результаты факторного анализа выручки
Товар j |
Изменение выручки, тыс. руб. |
В том числе за счет |
|||
количества продукта |
структурных сдвигов |
отпускных цен |
|||
А |
880 |
240 |
960 |
-320 |
|
Б |
-300 |
396 |
-1056 |
360 |
|
Итого |
580 |
636 |
-96 |
40 |
Наконец, ведется факторный анализ изменения частной (по каждому j-му товару в отдельности) выручки на основе следующей трехфакторной мультипликативной модели:
=.(78)
Тогда изменение частной выручки за счет каждого из 3-х факторов (количество, структурный сдвиг и цена) по j-му виду товара определяется соответственно по формулам (79) - (81).
=;(79)
=;(80)
=.(81)
Так, по апельсинам изменение выручки за счет первого фактора (изменения общего количества проданных фруктов) по формуле (79) равно:
=(1,12-1)*2000 = 240 (тыс. руб.).
Аналогично по бананам: = (1,12-1)*3300 = 396 (тыс. руб.)
Контроль правильности расчетов:
= ,
то есть 240 + 396 = 636 (тыс. руб.).
Так, по апельсинам изменение выручки за счет второго фактора (структурных сдвигов в количестве проданных фруктов) по формуле (80) равно:
=1,12*(1,429-1)*2000 = 960 (тыс. руб.).
Аналогично по бананам: =1,12*(0,714-1)*3300 = -1056 (тыс. руб.).
Контроль правильности расчетов:
=,
то есть 960 + (-1056) = -96 (тыс. руб.).
И, наконец, по апельсинам изменение выручки за счет 3-го фактора (изменения отпускной цены) по формуле (81) равно:
=1,12*1,429*(0,9-1)*2000 = -320 (тыс. руб.).
Аналогично по бананам: =1,12*0,714*(1,136-1)*3300 = 360 (тыс. руб.).
Контроль правильности расчетов:
= ,
то есть (-320) + 360= 40 (тыс. руб.)
Результаты факторного анализа частной выручки также заносятся в таблицу 9, в которой все числа оказались взаимно согласованными.
Контрольные задания по теме
Имеются следующие данные о продажах минимаркетом 3-х видов товаров (A, B и C):
Товар |
Цена за единицу продукта, руб. |
Объем продаж, тыс. штук |
|||
1 квартал |
2 квартал |
1 квартал |
2 квартал |
||
1 вариант |
|||||
А |
102 |
105 |
205 |
195 |
|
В |
56 |
51 |
380 |
423 |
|
С |
26 |
30 |
510 |
490 |
|
2 вариант |
|||||
А |
112 |
109 |
202 |
260 |
|
В |
51 |
48 |
365 |
420 |
|
С |
22 |
26 |
477 |
316 |
|
3 вариант |
|||||
А |
99 |
103 |
198 |
182 |
|
В |
55 |
59 |
370 |
361 |
|
С |
20 |
18 |
502 |
456 |
|
4 вариант |
|||||
А |
99 |
109 |
188 |
182 |
|
В |
55 |
56 |
380 |
385 |
|
С |
20 |
21 |
508 |
444 |
|
5 вариант |
|||||
А |
120 |
110 |
170 |
220 |
|
В |
60 |
58 |
350 |
390 |
|
С |
19 |
20 |
550 |
490 |
|
6 вариант |
|||||
А |
130 |
125 |
138 |
198 |
|
В |
50 |
56 |
339 |
264 |
|
С |
20 |
21 |
613 |
511 |
|
7 вариант |
|||||
А |
107 |
110 |
220 |
189 |
|
В |
46 |
44 |
490 |
550 |
|
С |
18 |
20 |
720 |
680 |
|
8 вариант |
|||||
А |
95 |
98 |
264 |
197 |
|
В |
48 |
50 |
360 |
294 |
|
С |
26 |
25 |
448 |
640 |
|
9 вариант |
|||||
А |
89 |
92 |
360 |
294 |
|
В |
58 |
56 |
410 |
482 |
|
С |
24 |
25 |
558 |
593 |
|
10 вариант |
|||||
А |
120 |
125 |
150 |
108 |
|
В |
44 |
46 |
513 |
461 |
|
С |
16 |
19 |
891 |
550 |
Определить:
Индивидуальные индексы цен, физического объема и товарооборота;
Общие индексы цен, физического объема и товарооборота;
Абсолютные приросты товарооборота за счет изменений цен, структурного сдвига и объемов продаж (для каждого фактора в отдельности) по всей продукции и по каждому товару в отдельности.
По итогам расчетов сделать аргументированные выводы.
Тема 6. Статистическое изучение взаимосвязей
Задача 1. По условным данным таблицы 10 о стоимости основных фондов х и валовом выпуске продукции у (в порядке возрастания стоимости основных фондов) выявить наличие и характер корреляционной связи между признаками x и y.
Таблица 10. Стоимость основных фондов и валовой выпуск по 10 однотипным предприятиям
Предприятия i |
Основные производственные фонды, млн. руб. xi |
Валовой выпуск продукции, млн. руб. yi |
|
||
1 2 3 4 5 6 7 8 9 10 |
12 16 25 38 43 55 60 80 91 100 |
28 40 38 65 80 101 95 125 183 245 |
- - - - - + + + + + |
- - - - - + - + + + |
|
Итого |
520 |
1000 |
Решение. Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов.
1. Графический метод, когда корреляционную зависимость для наглядности можно изобразить графически. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. Соединяя последовательно нанесенные точки, получают ломаную линию, именуемую эмпирической линией регрессии (см. рисунок справа). Анализируя эту линию, визуально можно определить характер зависимости между признаками x и y. В нашей задаче эта линия похожа на восходящую прямую, что позволяет выдвинуть гипотезу о наличии прямой зависимости между величиной основных фондов и валовым выпуском продукции.
2. Рассмотрение параллельных данных (значений x и y в каждой из n единиц). Единицы наблюдения располагают по возрастанию значений факторного признака х и затем сравнивают с ним (визуально) поведение результативного признака у. В нашей задаче в большинстве случаев по мере увеличения значений x увеличиваются и значения y (за несколькими исключениями - 2 и 3, 6 и 7 предприятия), поэтому, можно говорить о прямой связи между х и у (этот вывод подтверждает и эмпирическая линия регрессии). Теперь необходимо ее измерить, для чего рассчитывают несколько коэффициентов.
3. Коэффициент корреляции знаков (Фехнера) - простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины отклонений () и (), а их знаки («+» или «-»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:
.(82)
Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то КФ=1, что характеризует наличие прямой связи. Если все знаки не совпадут, то КФ=-1 (обратная связь). Если же С=Н, то КФ=0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ=1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.
В нашей задаче
; .
В двух последних столбцах таблицы 10 приведены знаки отклонений каждого х и у от своей средней величины. Число совпадений знаков - 9, а несовпадений - 1. Отсюда КФ==0,8. Обычно такое значение показателя тесноты связи характеризует сильную зависимость, однако, следует иметь в виду, что поскольку КФ зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.
4. Линейный коэффициент корреляции применяется в случае линейной зависимости между двумя количественными признаками x и y. В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t:
и .
Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:
,(83)
или.(84)
Числитель формулы (84), деленный на n, т.е.
,
представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений. Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:
.(85)
Линейный коэффициент корреляции может принимать значения от -1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле (85) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) - обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 - функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.
В нашей задаче для расчета r построим вспомогательную таблицу 11.
Таблица 11. Вспомогательные расчеты линейного коэффициента корреляции
i |
xi |
yi |
|
|
tx |
ty |
tx ty |
|
|
|
1 |
12 |
28 |
1600 |
5184 |
-1,36526 |
-1,10032 |
1,502223 |
288 |
33,6 |
|
2 |
16 |
40 |
1296 |
3600 |
-1,22873 |
-0,91693 |
1,126667 |
216 |
64 |
|
3 |
25 |
38 |
729 |
3844 |
-0,92155 |
-0,9475 |
0,873167 |
167,4 |
95 |
|
4 |
38 |
65 |
196 |
1225 |
-0,47784 |
-0,53488 |
0,255587 |
49 |
247 |
|
5 |
43 |
80 |
81 |
400 |
-0,30718 |
-0,30564 |
0,093889 |
18 |
344 |
|
6 |
55 |
101 |
9 |
1 |
0,102394 |
0,015282 |
0,001565 |
0,3 |
555,5 |
|
7 |
60 |
95 |
64 |
25 |
0,273052 |
-0,07641 |
-0,02086 |
-4 |
570 |
|
8 |
80 |
125 |
784 |
625 |
0,955681 |
0,382056 |
0,365124 |
70 |
1000 |
|
9 |
91 |
183 |
1521 |
6889 |
1,331128 |
1,268425 |
1,688436 |
323,7 |
1665,3 |
|
10 |
100 |
245 |
2304 |
21025 |
1,638311 |
2,215924 |
3,630373 |
696 |
2450 |
|
Итого |
520 |
1000 |
8584 |
42818 |
9,516166 |
1824,4 |
7024,4 |
В нашей задаче: = =29,299; ==65,436. Тогда по формуле (83) r = 9,516166/10 = 0,9516. Аналогичный результат получаем по формуле (84): r = 1824,4/(29,299*65,436) = 0,9516 или по формуле (85): r = (7024,4 - 52*100) / (29,299*65,436) = 0,9516, то есть связь между величиной основных фондов и валовым выпуском продукции очень близка к функциональной.
Проверка коэффициента корреляции на значимость (существенность). Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения x и y, на основе которых он рассчитан.
Другими словами, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями.
Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции ?r. Оценка существенности (значимости) r основана на сопоставлении значения r с его средней квадратической ошибкой:
.
Существуют некоторые особенности расчета ?r в зависимости от числа наблюдений (объема выборки) - n. Если число наблюдений достаточно велико (n>30), то ?r рассчитывается по формуле (86):
.(86)
Обычно, если >3, то r считается значимым (существенным), а связь - реальной. Задавшись определенной вероятностью, можно определить доверительные пределы (границы) r = (), где t - коэффициент доверия, рассчитываемый по интегралу Лапласа (см. таблицу 4).
Если число наблюдений небольшое (n<30), то ?r рассчитывается по формуле (87):
,(87)
а значимость r проверяется на основе t-критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (88) и сопоставляется c tТАБЛ.
.(88)
Табличное значение tТАБЛ находится по таблице распределения t-критерия Стьюдента (см. приложение 2) при уровне значимости ?=1-? и числе степеней свободы ?=n-2. Если tРАСЧ> tТАБЛ , то r считается значимым, а связь между х и у - реальной. В противном случае (tРАСЧ< tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.
В нашей задаче число наблюдений небольшое, значит, оценивать существенность (значимость) линейного коэффициента корреляции будем по формулам (87) и (88): = 0,3073/2,8284 = 0,1086; = 0,9516/0,1086 = 8,7591. При вероятности 95% tтабл=2,306, а при вероятности 99% tтабл=3,355, значит, tРАСЧ> tТАБЛ, что дает возможность считать линейный коэффициент корреляции r = 0,9516 значимым.
5. Подбор уравнения регрессии представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х.
Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими. Они обычно обозначаются (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x). (Иногда для простоты записи вместо пишут .)
Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, -- одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.
Для аналитической связи между х и у могут использоваться следующие простые виды уравнений:
- прямая линия; - парабола;
- гипербола; - показательная функция;
- логарифмическая функция и др.
Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные -- криволинейными зависимостями.
Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным.
Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.
.
Поставив данное условие, легко определить, при каких значениях , и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Данный метод уже использовался нами в методических указаниях к теме 4 «Ряды динамики», поэтому, воспользуемся формулой (57) для нахождения параметров теоретической линии регрессии в нашей задаче, заменив параметр t на x.
(89)
Исходные данные и все расчеты необходимых сумм представим в таблице 12.
Таблица 12. Вспомогательные расчеты для решения задачи
i |
x |
y |
x*x |
y*x |
y' |
|
|
|
1 |
12 |
28 |
144 |
336 |
15 |
5184 |
7225 |
|
2 |
16 |
40 |
256 |
640 |
23,5 |
3600 |
5852,25 |
|
3 |
25 |
38 |
625 |
950 |
42,625 |
3844 |
3291,891 |
|
4 |
38 |
65 |
1444 |
2470 |
70,25 |
1225 |
885,0625 |
|
5 |
43 |
80 |
1849 |
3440 |
80,875 |
400 |
365,7656 |
|
6 |
55 |
101 |
3025 |
5555 |
106,375 |
1 |
40,64063 |
|
7 |
60 |
95 |
3600 |
5700 |
117 |
25 |
289 |
|
8 |
80 |
125 |
6400 |
10000 |
159,5 |
625 |
3540,25 |
|
9 |
91 |
183 |
8281 |
16653 |
182,875 |
6889 |
6868,266 |
|
10 |
100 |
245 |
10000 |
24500 |
202 |
21025 |
10404 |
|
Итого |
520 |
1000 |
35624 |
70244 |
1000 |
42818 |
38762,125 |
;;
;
;;;=100-52*2,125 = - 10,5.
Отсюда искомая линия регрессии:=-10,5+2,125x. Для иллюстрации построим график эмпирической (маркеры-кружочки) и теоретической (маркеры-квадратики) линий регрессии.
Рис.6. График эмпирической и теоретической линий регрессии.
6. Теоретическое корреляционное отношение представляет собой универсальный показатель тесноты связи. Измерить тесноту связи между коррелируемыми величинами - это значит определить, насколько вариация результативного признака обусловлена вариацией факторного признака. Ранее были рассмотрены показатели, с помощью которых можно выявить наличие корреляционной связи между двумя признаками x и y и измерить тесноту этой связи: коэффициент Фехнера и линейный коэффициент корреляции.
Наряду с ними существует универсальный показатель - корреляционное отношение (или коэффициент корреляции по Пирсону), применимое ко всем случаям корреляционной зависимости независимо от формы этой связи. Следует различать эмпирическое и теоретическое корреляционные отношения. Эмпирическое корреляционное отношение рассчитывается на основе правила сложения дисперсий как корень квадратный из отношения межгрупповой дисперсии к общей дисперсии, т.е.
.(90)
Теоретическое корреляционное отношение определяется на основе выравненных (теоретических) значений результативного признака , рассчитанных по уравнению регрессии. представляет собой относительную величину, получаемую в результате сравнения среднего квадратического отклонения в ряду теоретических значений результативного признака со средним квадратическим отклонением в ряду эмпирических значений. Если обозначить дисперсию эмпирического ряда игреков через , а теоретического ряда - , то каждая из них выразится формулами:
,(91)
.(92)
Сравнивая вторую дисперсию с первой, получим теоретический коэффициент детерминации:
,(93)
который показывает, какую долю в общей дисперсии результативного признака занимает дисперсия, выражающая влияние вариации фактора x на вариацию y. Извлекая корень квадратный из коэффициента детерминации, получаем теоретическое корреляционное отношение:
.(94)
Оно может находиться в пределах от 0 до 1. Чем ближе его значение к 1, тем теснее связь между вариацией y и x. При <0,3 говорят о малой зависимости между коррелируемыми величинами, при 0,3<<0,6 - о средней, при 0,6<<0,8 - о зависимости выше средней, при >0,8 - о большой, сильной зависимости. Корреляционное отношение применимо как для парной, так и для множественной корреляции независимо от формы связи. При линейной зависимости . В нашей задаче расчет необходимых сумм для использования в формуле (93) приведен в последних двух столбцах таблицы 12. Тогда теоретический коэффициент детерминации по формуле (93) равен:2теор = 38762,125 / 42818 = 0,9053, то есть дисперсия, выражающая влияние вариации фактора x на вариацию y, составляет 90,53%. Теоретическое корреляционное отношение по формуле (94) равно: теор== 0,9515, что совпадает со значением линейного коэффициента корреляции и, следовательно, можно говорить о большой, сильной зависимости между коррелируемыми величинами.
Контрольные задания по теме На основе исходных данных контрольных заданий по теме 2 определить наличие и характер корреляционной связи между признаками x и y 6-ю методами.
Приз-нак |
Вариант |
||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
x |
Рост |
Доход |
Возраст |
IQ |
Доход |
Возраст |
рост/вес |
Стаж |
Доход |
IQ |
|
y |
Вес |
Вес |
Доход |
Доход |
Тетрадь |
рост/вес |
Кол-во друзей |
Доход |
Кол-во друзей |
Время решения |
Часть 2. Социально-экономическая статистика
Тема 1. Социально-демографическая статистика
Методические указания по теме
Задача 1. Численность населения города составляла 3000 тыс. чел. на начало года. На конец года она возросла до 3050 тыс. чел. Число родившихся за год составило 35 тыс.чел., число умерших - 15 тыс.чел. Определить:
1) коэффициенты естественного, механического и общего движения населения, установить его тип;
2) перспективную численность населения через 4 года при условии, что коэффициент общего движения населения будет: а) сохраняться на прежнем уровне; б) снижаться ежегодно на 1%0.
Решение. Численность населения (S) в конкретном пункте существенно меняется с течением времени, поэтому, рассчитывается ее среднегодовое значение по разным формулам средних величин в зависимости от полноты исходных данных. В нашей задаче среднегодовая численность определяется по формуле средней арифметической простой (17) как полусумма S в начале и конце года: = (Sн + Sк)/2 = (3000 + 3050)/2 = 3025 (тыс. чел.).
Изменение численности населения за счет рождений и смертей называется естественным движением населения, которое характеризуется рядом коэффициентов: рождаемости (95), смертности (96) и естественного движения (97):
Кр = N / *1000%0, (95)
Ксм = M / *1000%0, (96)
КЕД = (N - M)/*1000%0 = Кр - Ксм,(97)
где N - число родившихся за год, M - число умерших за год.
В нашей задаче по формуле (95) получаем: Кр = 35 / 3025 * 1000%0 = 11,57%0, то есть на каждую 1000 населения приходится 11 младенцев.
По формуле (96) получаем: Ксм = 15 / 3025*1000%0 = 4,96%0, то есть на каждую 1000 населения приходится 5 умерших.
И, наконец, по формуле (97) получаем:
КЕД = Кр - Ксм,= 11,57%0 - 4,96%0 = 6,61%0,
то есть рождаемость превышает смертность на 6,61 промилле (это естественный прирост населения).
Движением населения может происходить и за счет миграции, показывающей, куда и откуда, в каком количестве происходит перемещение населения в стране и в международном масштабе. Основными показателями миграции населения являются: сальдо миграции (98) и коэффициент механического движения населения (99):
?V = V+ - V-, (98)
КМД = ?V / *1000%0,(99)
где V+ и V- - численность, соответственно, прибывшего и выбывшего на постоянное жительство населения.
В нашей задаче число прибывших и выбывших неизвестно, но можно найти сальдо миграции, так как данные о миграционном сальдо вместе с данными об естественном движении населения служат основой для расчета коэффициента общего движения населения (100):
КОД = КЕД + КМД = (Sк - Sн)/*1000%0. (100)
В нашей задаче по формуле (100) получаем: КОД =(3050 - 3000) / 3025 * 1000%0 = 16,53%0, тогда КМД = КОД - КЕД = 16,53%0 - 6,61%0 = 9,92%0, то есть численность прибывших в город больше выбывших на 9,92 промилле (это механический приток или прирост населения).
В социально-демографической статистике различают 8 типов общего движения населения:
Естественный прирост превышает механический отток;
Естественный прирост превышает механический приток;
Механический приток больше естественного прироста;
Механический приток больше естественной убыли;
Естественная убыль превышает механический приток;
Естественная убыль превышает механический отток;
Механический отток больше естественной убыли;
Механический отток больше естественного прироста.
Их можно изобразить графически (см. рис. 7), если по оси абсцисс отложить КМД, а по оси ординат - КЕД.
Типы 1 - 4 (выше жирной диагонали) свидетельствуют о росте населения территории, а типы 5 - 8 (серый цвет) о сокращении ее населения.
В нашей задаче механический приток больше естественного прироста (¦КМД¦>¦КЕД¦), значит это 3-й тип общего движения.
Рис. 7. Типы движения населения.
Перспективную численность населения через t лет можно определить по формуле (101):
Sн+t = .(101)
В нашей задаче, считая, что КОД сохранится на прежнем уровне, определим S через 4 года по формуле (101):
S4 = 3050*(1+16,53/1000)4 = 3256,27 (тыс. чел.).
Считая, что КОД будет ежегодно снижаться на 1%0:
S1 = 3000*(1+16,53/1000) = 3050 (тыс. чел.);
S2 = 3050*(1+15,53/1000) = 3097,363 (тыс. чел.);
S3 = 3097,363*(1+14,53/1000) = 3142,364 (тыс. чел.);
S4 = 3142,364*(1+13,53/1000) = 3184,877 (тыс. чел.).
Задача 2. Определить среднюю продолжительность предстоящей жизни по следующим данным о числе умирающих из 100 000 человек при переходе от возраста x к x+1 лет (dx):
Возраст х, лет |
0-1 |
1-4 |
5-9 |
10-14 |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
|
dx |
1802 |
316 |
184 |
183 |
550 |
749 |
681 |
766 |
1061 |
1583 |
Возраст х, лет |
45-49 |
50-54 |
55-59 |
60-64 |
65-69 |
70-74 |
75-79 |
80-84 |
85 и более |
|
dx |
2454 |
3631 |
5341 |
7171 |
9480 |
11562 |
14192 |
14751 |
23543 |
Решение. Исходные данные - это элементы укрупненной в интервалы таблицы смертности. Эти данные показывают, как постепенно с увеличением возраста население выбывает под влиянием смертности. На их основе рассчитываются частные коэффициенты смертности по отдельным возрастным группам. Для определения средней продолжительности предстоящей жизни необходимо рассчитать следующие показатели для каждого возраста х:
1) lx - число доживающих до возраста х, которое показывает, сколько из 100 000 лиц условного поколения доживают до каждого следующего года (102):
lx+1 = lx - dx; (102)
2) dx - число умирающих возрасте x; 3) px - вероятность дожить до возраста x+1, которая показывает, какая доля из достигших данного возраста х проживает еще полный год и достигнет очередного возраста х+1 (103):
;(103)
4) qx - вероятность умереть в возрасте х (104) (при этом должно выполняться условие: px+qx=1):
;(104)
5) Lx - среднее число живущих в возрастном интервале от х до x+1 года (105):
;(105)
6) Тx - число человеко-лет, которые проживет население, достигшее х лет до максимального возраста w (106):
; (106)
7) Ex - средняя продолжительность предстоящей жизни, которая показывает, сколько лет в среднем предстоит прожить лицам, достигшим возраста х (107):
;(107)
Показатель (107) является важнейшим обобщающим демографическим показателем, зависящим от социальной ситуации в стране.
В нашей задаче расчет перечисленных показателей приведен в таблице 13. Поскольку возраст задан интервально, то во втором столбце этой таблицы рассчитаны середины интервалов Xсер как полусумма нижней и верхней границы интервала, а формула (106) примет следующий вид:
Tх = (87,5 - Xсер)*Lх.
Таблица 13. Таблица смертности с укрупненными возрастными интервалами в 10 лет
Возраст X, лет |
Xсер |
lx |
dx |
px |
qx |
Lx |
Тx |
Ex |
|
0-1 |
0,5 |
100000 |
1802 |
0,982 |
0,018 |
99099,0 |
8621613,0 |
86,216 |
|
1-4 |
3 |
98198 |
316 |
0,997 |
0,003 |
98040,0 |
8284380,0 |
84,364 |
|
5-9 |
7,5 |
97882 |
184 |
0,998 |
0,002 |
97790,0 |
7823200,0 |
79,925 |
|
10-14 |
12,5 |
97698 |
183 |
0,998 |
0,002 |
97606,5 |
7320487,5 |
74,930 |
|
15-19 |
17,5 |
97515 |
550 |
0,994 |
0,006 |
97240,0 |
6806800,0 |
69,803 |
|
20-24 |
22,5 |
96965 |
749 |
0,992 |
0,008 |
96590,5 |
6278382,5 |
64,749 |
|
25-29 |
27,5 |
96216 |
681 |
0,993 |
0,007 |
95875,5 |
5752530,0 |
59,788 |
|
30-34 |
32,5 |
95535 |
766 |
0,992 |
0,008 |
95152,0 |
5233360,0 |
54,780 |
|
35-39 |
37,5 |
94769 |
1061 |
0,989 |
0,011 |
94238,5 |
4711925,0 |
49,720 |
|
40-44 |
42,5 |
93708 |
1583 |
0,983 |
0,017 |
92916,5 |
4181242,5 |
44,620 |
|
45-49 |
47,5 |
92125 |
2454 |
0,973 |
0,027 |
90898,0 |
Подобные документы
Анализ обобщающих показателей и закономерностей социально-экономических явлений и процессов в конкретных условиях места и времени. Описание количественной стороны массовых социально-экономических явлений, отражаемых посредством показателей статистики.
контрольная работа [761,6 K], добавлен 22.01.2015Общая тенденции развития как направление в исследовании закономерностей динамики социально-экономических процессов. Основная тенденция - составляющий элемент динамики. Выявление типа тенденции. Методы анализа основной тенденции развития в рядах динамики.
курсовая работа [553,6 K], добавлен 07.04.2015Обзор методов статистического обеспечения качества. Применение семи традиционных японских методов анализа качества. Разработка идеи статистического приемочного контроля. Основы и применение математического аппарата, используемого для статистики.
методичка [58,3 K], добавлен 18.08.2009Теоретико-методологические основы методов и принципов социально-экономического планирования и прогнозирования. Анализ и прогнозирование социально-экономических процессов МО Улан-Удэ. Прогноз основных показателей социально-экономических процессов.
курсовая работа [180,6 K], добавлен 04.12.2013Виды, типы и методы исследования экономических и политических процессов. Анализ состояния и тенденций развития социальных процессов. Сущность метода структуризации. Изучение социальной системы, освоение взаимосвязей и взаимозависимостей ее элементов.
курсовая работа [158,0 K], добавлен 24.10.2014Рассмотрение форм (отчетность, регистр), методов организации сбора, обработки данных статистического наблюдения, их структурного и содержательного анализа с помощью обобщающих показателей, способов статистического моделирования и прогнозирования.
методичка [3,0 M], добавлен 10.04.2010Сущность анализа, его виды и особенности применения в бизнесе (для достижения организацией стратегических целей), экономике (для выявления основных тенденций и закономерностей развития экономики) и финансах (для оценки финансового состояния предприятия).
реферат [21,1 K], добавлен 03.02.2013Теоретические основы и направления международной статистики. Современный этап ее развития в рамках статистического органа Лиги Наций — Секции экономики и финансов. Особенности функций анализа мирового развития. Обзор норм международной статистики.
курсовая работа [25,2 K], добавлен 02.10.2013Статистическое наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования. Под статистическими данными понимают совокупность количественных характеристик социально-экономических процессов.
контрольная работа [8,0 K], добавлен 23.03.2004Понятие и сущность цен и инфляции, их значение. Задачи статистики цен. Характеристика системы показателей статистики цен. Принципы и методы регистрации цен. Особенности методов расчета и анализа их индексов. Методы оценки уровня и динамики инфляции.
курсовая работа [70,9 K], добавлен 01.12.2010