Средние величины. Вариационные ряды распределения. Ряды динамики. Индексы
Понятие средних величин, область их применения. Вариационные ряды распределения как способ обобщения статистических данных. Ряды динамики и их показатели. Понятие индекса в статистике. Статистический анализ взаимосвязи социально-экономических явлений.
Рубрика | Экономика и экономическая теория |
Вид | методичка |
Язык | русский |
Дата добавления | 13.03.2017 |
Размер файла | 182,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
СРЕДНИЕ ВЕЛИЧИНЫ
Средняя величина представляет собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени [35]. Она должна вычисляться с учетом экономического содержания определяемого показателя и качества исходных данных. В каждом конкретном случае используется одна из средних величин:
- средняя геометрическая;
- средняя гармоническая;
- средняя арифметическая;
- средняя квадратическая;
- средняя кубическая и др.
Эти средние относятся к классу степенных средних и объединяются общей формулой (при различной величине k):
статистика индекс ряд величина
,
где - средняя величина исследуемого явления;
- отдельное значение исследуемого явления (вариант);
- показатель степени средней величины.
Когда значения каждого варианта встречаются неоднократно, необходимо исчисление взвешенных средних. В общем виде взвешенные степенные средние описываются выражением:
,
где - частота повторений отдельных значений исследуемого явления (вес).
Частотами могут быть абсолютные и относительные величины, взятые в процентах или коэффициентах. Метод расчета средней и конечный результат от этого не изменится.
Если исследователь имеет дело с данными в виде интервальных рядов распределения, то средняя взвешенная величина определяется:
.
Чтобы применить эту формулу необходимо варианты признака в интервальном ряду выразить одним числом (дискретным), за такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения интервала. Так, для первой группы дискретная величина х будет равна:
,
где хн, хв - нижнее и верхнее значение признака в интервале соответственно.
Применяемые в статистическом исследовании средние величины представлены в таблице 2.
Таблица 2
Виды и область применения средних величин
Значение k |
Вид средней величины |
Формула средней величины |
Область применения |
|
k=-1 |
Средняя гармоническая |
простая:взвешенная:, где |
Средняя гармоническая взвешенная применяется в случаях, когда частота повторений отдельных значений неизвестна, а в исходных данных присутствует произведение . Средняя гармоническая простая может использоваться вместо взвешенной в тех случаях, когда значения для всех единиц совокупности равны [21]. |
|
k=0 |
Средняя геометрическая |
простая:взвешенная:, где П - произве-дение |
Применяется для определения средних темпов роста в рядах динамики; простая - в условиях ряда с равноотстоящими уровнями, взвешенная - в условиях ряда с неравноотстоящими уровнями. |
|
k=1 |
Средняя арифметическая |
простая:взвешенная: |
Средняя арифметическая простая применяется в случае несгруппи-рованных данных (каждое значение исследуемого явления индивидуа-льно), взвешенная - если отдельные значения повторяются по нескольку раз. |
|
k=2 |
Средняя квадратическая |
простая:взвешенная: |
Средняя квадратическая и средняя кубическая величины имеют ограниченное применение в статистике, чаще всего используются для расчета средних значений признака, выраженного в квадратных или кубических единицах измерения. |
|
k=3 |
Средняя кубическая |
простая:взвешенная: |
ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ
Группировка позволяет получить такие результаты, по которым выявляется состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.
Первым и наиболее простым способом обобщения статистических данных являются ряды распределения. Статистическим рядом распределения называют численное распределение единиц совокупности по изучаемому признаку. В зависимости от вида признака ряды могут быть вариационные (количественные) и атрибутивные. Атрибутивные ряды распределения построены по качественному признаку (признаку, не имеющему количественной меры).
Вариационные ряды построены по количественному признаку и могут быть дискретными или непрерывными. Любой вариационный ряд содержит основные элементы: варианты (х) и частоты (f) или частости (частоты, выраженные в процентах - d). Дискретный ряд распределения - это ряд, в котором численное распределение признака выражено одним конечным числом, например, распределение рабочих по разрядам.
Таблица 3
Дискретный ряд распределения рабочих по тарифному разряду
Тарифный разряд (варианты) |
Число рабочих, чел. (частота) |
Число рабочих, % к итогу (частость) |
|
1 |
10 |
5,3 |
|
2 |
30 |
15,8 |
|
3 |
60 |
31,6 |
|
4 |
30 |
15,8 |
|
5 |
40 |
21,1 |
|
6 |
20 |
10,5 |
|
Итого |
190 |
100,0 |
Дискретный ряд распределения отражается графически с помощью полигона. При построении графика по оси абсцисс откладываются варианты, по оси ординат - частоты или частости.
Рис. 1. Полигон распределения рабочих по тарифному разряду
Непрерывные ряды распределения - это ряды, в которых непрерывные признаки могут отличаться друг от друга на сколь угодно малую величину и в определенных границах принимать любые значения, например, заработная плата рабочих, стоимость основных производственных фондов и др. Когда число вариант рядов велико для дискретного признака и значения вариант не повторяются для непрерывного признака, строятся интервальные ряды распределения.
Интервальный ряд распределения - ряд, в котором значения признака заданы в виде интервала, например, предыдущий пример можно представить в виде интервала:
Таблица 4
Интервальный ряд распределения рабочих по заработной плате
Группы по оплате труда, тыс. руб. |
Число рабочих, чел. |
Число рабочих, в % к итогу |
|
10 - 15 |
40 |
21,0 |
|
15 - 20 |
90 |
47,4 |
|
20 - 25 |
60 |
31,6 |
|
Итого |
190 |
100,0 |
Для отображения интервального ряда распределения применяется гистограмма. При построении графика по оси абсцисс откладываются границы интервалов, по оси ординат - частоты или частости.
Рис. 2. Гистограмма распределения рабочих по оплате труда
При построении интервальных рядов распределения необходимо определить число групп, какие взять интервалы (равные, неравные, закрытые, открытые).
Число групп можно определить по формуле Стерджесса:
n = 1 + 3,322 lg N,
где N = число единиц совокупности;
n = число групп.
Специальные методические исследования позволили установить, что наиболее четко закономерности выступают в количественных группировках, в которых не более 7 - 10 групп.
Для определения оптимального числа групп в зависимости от количества наблюдений можно воспользоваться следующей шкалой:
Таблица 5
Шкала определения оптимального числа групп
Число наблюдений |
Оптимальное число групп |
|
до 40 |
3 |
|
40 - 60 |
3 - 4 |
|
60 - 100 |
4 - 5 |
|
100 - 300 |
5 - 7 |
|
свыше 300 |
8 - 10 |
Равные интервалы применяют в том случае, когда максимальное значение признака превышает не более, чем в 10 раз, минимальное значение и интервал определяют:
При большом колебании группировочного признака используют неравные интервалы, построенные на принципе кратности. Обычно последующие интервалы возрастают в 2-3 раза. Их недостаток заключается в том, что объекты с разным уровнем экономического развития часто попадают в одну группу. Избежать этого можно путем применения специализированных интервалов, т.е. интервалов, отображающих экономическое содержание групп.
По построению интервалы бывают замкнутые и открытые. В замкнутых (закрытых) интервалах верхняя и нижняя границы их имеют определенное числовое выражение, например, заработная плата на одного рабочего 600 - 700 рублей, 700 - 800 рублей, 800 - 900 рублей и т.д.
В открытых интервалах первая и последняя группы не имеют строго очерченных численных границ, например:
Таблица 6
Интервальный ряд распределения магазинов по объему товарооборота
Группы магазинов по объему товарооборота, млн. руб. |
Количество магазинов |
|
до 25 |
147 |
|
25-50 |
260 |
|
50-120 |
394 |
|
120-180 |
162 |
|
180 и более |
313 |
|
Итого |
1276 |
После образования интервалов необходимо образовать группы частот (повторяемости явлений). Это возможно на основе различных методик. Наиболее простая сводится к тому, что предварительно составляется ранжированный ряд распределения, то есть ряд, в котором значение признака располагается в возрастающем или убывающем порядке и счет ведется по группам.
Применение средних и индивидуальных величин для характеристики изучаемой совокупности - необходимый прием разработки рациональных группировок. Абсолютные величины каждой изучаемой единицы совокупности различны, что связано с влиянием на нее большого количества различных факторов. Свойство единиц отличаться друг от друга называют изменчивостью признака. Для погашения индивидуальных отклонений используют средние величины, характеризующие основные свойства изучаемых объектов.
Для дискретного ряда распределения средняя арифметическая исчисляется по формуле:
, (простая средняя арифметическая).
Для интервальных рядов распределения средняя арифметическая определяется:
, (взвешенная средняя арифметическая),
где - варианты;
n - число наблюдений;
f - частота (вес или повторение).
Вариационный ряд характеризуется еще двумя средними показателями - медианой и модой. Медиана делит ранжированный ряд на две равные части по числу единиц, и определяется по формуле:
,
где хme - нижняя граница медианного интервала;
fme - частота медианного интервала;
i - величина интервала;
Sme-1 - сумма накопленных частот до медианного интервала.
Медианным является первый интервал, в котором накопленная частота либо равна, либо превышает половину всех частот.
Мода - значение признака в вариационном ряду, встречающееся с наибольшей вероятностью. Она определяется по формуле:
,
где хМо - нижняя граница модального интервала;
iМо - модальный интервал;
fMo, fMo-1, fMo+1 - частоты в модальном, предыдущем и следующим за модальным интервалах (соответственно). Модальный интервал определяется по наибольшей частоте.
Однако средняя величина не позволяет выявить, как группируются признаки вокруг средней величины, поэтому используются показатели среднего линейного отклонения, среднего квадратического отклонения и коэффициента вариации.
Среднее линейное отклонение представляет собой среднюю арифметическую абсолютных отклонений отдельных вариантов от их средних арифметических и определяется по формуле:
- для дискретного ряда
- для интервального ряда
Среднее квадратическое отклонение характеризует степень изменчивости признака в абсолютных величинах и определяется по формуле:
- для дискретного ряда
- для интервального ряда
Изменчивость признака в вариационных рядах можно определить не только в абсолютных, но и в относительных величинах. Коэффициент вариации определяется по формуле:
Он показывает, на сколько процентов в среднем отклоняются значения признака ряда от средней величины. Изменчивость признака считается незначительной, если коэффициент вариации не более 10%. При коэффициенте вариации от 11 до 20% изменчивость будет средней, а от 21 до 30 - сильной. Если коэффициент вариации более 30%, совокупность считается количественно неоднородной, и ее нельзя использовать в дальнейших исследованиях. По мнению других авторов [11, 13] эти границы могут несколько отличаться, но не существенно.
РЯДЫ ДИНАМИКИ
Ряд динамики - это ряд изменяющихся во времени числовых значений статистического показателя, расположенных в хронологическом порядке.
В зависимости от характера отображаемого явления ряды динамики подразделяются на ряды абсолютных, относительных и средних величин.
Скорость и интенсивность развития явления во времени осуществляется с помощью показателей, которые получаются в результате сравнения уровней между собой. Если сравнивается текущее значение с предыдущим, получаем цепные показатели, если текущее значение сравнивается с начальным (базисным) значением, получаем базисные показатели.
Таблица 7
Показатели анализа ряда динамики
Показатель |
Формула расчета |
Характеристика показателя |
||
базисный |
цепной |
|||
Абсолютный прирост |
Показывает абсолютный размер увеличения (или уменьшения) уровня явления за определенный промежуток времени |
|||
Абсолютное ускорение |
- |
Показывает насколько данная скорость изменения показателя больше (меньше) предыдущей |
||
Относительное ускорение |
- |
Показывает коэффициент прироста абсолютного прироста. Вычисляется лишь в том случае, если абсолютный прирост, принятый за базу сравнения, число положительное |
||
Коэффициент роста (темп роста) |
Показывает относительную скорость изменения уровня явления. Показатель, выраженный в процентах, называется темпом роста. |
|||
Коэффициент прироста (темп прироста) |
Показывает, на сколько единиц (процентов) произошло увеличение (снижение) данного показателя |
|||
Абсолютное значение 1% прироста |
- |
Показывает абсолютную величину показателя, содержащуюся в 1% прироста |
||
Коэффициент наращивания(темп наращивания) |
- |
Показывает относительную скорость изменения экономического потенциала относительно базы сравнения |
где уi - текущий уровень ряда;
у0 - базисный уровень;
уi - 1 - предшествующий уровень;
i - номер уровня.
Средние показатели анализа ряда динамики необходимы для обобщения характеристик тенденции за длительный период времени. К ним относятся: средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста.
Таблица 8
Средние показатели анализа ряда динамики
Показатель |
Формула расчета |
Характеристика показателя |
|
Средний уровень ряда |
- интервальный ряд с равноотстоящими уровнями- интервальный ряд с неравноотстоящими уровнями- моментный ряд с равноотстоящими уровнями- моментный ряд с неравноотстоящими уровнями |
Показывает усредненную величину изменения ряда динамики. |
|
Средний абсолютный прирост |
- по цепной системе- по базисной системе |
Показывает, на сколько единиц в среднем происходило увеличение (снижение) анализируемого показателя в единицу времени. |
|
Средний коэффициент роста |
- по цепной системе- по базисной системе |
Показывает среднюю относительную скорость изменения уровня явления (в долях единицы - коэффициент роста, в процентах - темп роста). |
|
Средний темп роста |
|||
Средний темп прироста |
Показывает, на сколько процентов произошло увеличение (снижение) показателя в среднем в единицу времени. |
где - уровни ряда динамики;
- интервалы времени между смежными датами;
n - число уровней ряда;
m - число коэффициентов роста;
уn- последний уровень временного ряда;
у0 - базисный (начальный) уровень ряда.
При анализе рядов динамики необходимо определить общую тенденцию развития. На развитие явления во времени могут оказывать влияние различные факторы, одни из них могут формировать в рядах динамики определенную тенденцию в развитии, другие - оказывают кратковременное воздействие.
При выявлении общей тенденции развития явления применяются различные приемы и методы выравнивания:
а) усреднение по левой и правой половине;
б) укрупнение интервалов;
в) сглаживание рядов динамики на основе скользящих средних;
г) аналитическое выравнивание и др.
Рассмотрим два последних метода. Сглаживание рядов динамики на основе скользящих средних основана на вычислении звеньев подвижной средней из такого числа уровней ряда, которая соответствует длительности наблюдаемых в ряду динамики циклов. То есть изначально выбирается период скольжения, равный двум, трем, четырем и т.д. периодам.
Например, трехчленная скользящая средняя исчисляется по следующей схеме:
(первая средняя),
(вторая средняя),
(третья средняя) и т.д.
А для ряда внутригодовой динамики применяется чаще всего четырехчленные скользящие средние. Их расчет состоит в определении средних величин из четырех уровней ряда с отбрасыванием при вычислении каждой новой средней одного уровня ряда слева и присоединением одного уровня справа:
(первая средняя),
(вторая средняя),
(третья средняя) и т.д.
Чтобы отнести скользящую среднюю к определенному периоду необходимо провести центрирование расчетных средних, определяемых как простая средняя арифметическая из 2-х рядом лежащих скользящих средних:
(1-й сглаженный средний уровень),
(2-й сглаженный средний уровень)
(3-й сглаженный средний уровень) и т.д.
Таблица 9
Имеются данные о производстве деталей на заводе, тыс. штук.
Месяц |
у, тыс.штук |
Четырехмесячная скользящая средняя |
||
нецентрированная |
центрированная |
|||
январь |
15,3 |
|||
февраль |
16,8 |
16,4 |
||
март |
16,4 |
16,9 |
16,6 |
|
апрель |
16,9 |
16,9 |
16,9 |
|
май |
17,5 |
17,1 |
17,0 |
|
июнь |
16,9 |
17,3 |
17,2 |
|
июль |
17,1 |
17,1 |
17,2 |
|
август |
17,5 |
17,4 |
17,2 |
|
сентябрь |
16,9 |
17,7 |
17,5 |
|
октябрь |
17,9 |
18,0 |
17,8 |
|
ноябрь |
18,5 |
|||
декабрь |
18,6 |
Центрированные средние наносят на график с эмпирическими данными.
Рис. 3. Динамика производства деталей на заводе, тыс. штук
Особенность способа сглаживания рядов динамики на основе скользящих средних заключается в том, что полученные средние не дают теоретических рядов, в основе которых лежала бы определенная математическая закономерность.
Более совершенным приемом изучения общей тенденции в рядах динамики является аналитическое выравнивание. Оно основано на допущении, что изменения в рядах динамики могут быть выражены определенным математическим законом. На основе теоретического анализа выявляется характер явления во времени и на этой основе выбирается то или иное математическое выражение типа закономерности изменения явления:
- линейная функция
- полином второго порядка
- полином третьего порядка
- степенная функция
- показательная функция
и другие.
Данный прием сводится к следующему:
а) на основе экономического анализа явления за рассматриваемый период времени выявляется его характер;
б) исходя из характера явления выбирается то или иное математическое уравнение;
в) определяются параметры уравнения;
г) рассчитываются теоретические (выровненные) уровни ряда динамики, которые наносятся на график эмпирических значений;
д) прогнозируются уровни динамического ряда на основе аппроксимирующей модели на предстоящий период.
Рассмотрим выравнивание ряда динамики по прямой (таблица 10). Задача аналитического выравнивания решается с помощью метода наименьших квадратов, смысл которого состоит в том, что вычисленная линия теоретических уровней должна проходить в максимальной близости к фактическим уровням ряда, то есть
где y - исходные (эмпирические) уровни динамического ряда;
- расчетные (теоретические) уровни ряда динамики.
Выравнивание по прямой осуществляется по формуле:
где y - исходные (эмпирические) уровни ряда динамики
a и b - параметры уравнения,
t - время
Параметры уравнения находятся на основе системы уравнений:
Расчет параметров заметно упрощается, если перенести начало отсчета времени в середину исходного ряда (что бы ). Причем, если число уровней ряда нечетное, нумерация t следующая: …-3, -2, -1, 0, +1, +2, +3…. ; а если число уровней ряда четное, нумерация t будет следующая: …-5, -3, -1, +1, +3, +5….
При условии, что ?t=0 (графа В таблицы 10) исходные нормальные уравнения принимают вид:
,
отсюда .
Необходимые величины рассчитаны в графах Г и Д таблицы 10.
Параметризованное уравнение имеет вид
В полученное параметризованное уравнение подставляют значения t и получают теоретические значения исследуемого признака (графа Е таблицы 10), которые и являются тенденцией данного явления. Их наносят на график с эмпирическими данными.
Таблица 10
Расчетная таблица для аналитического выравнивания ряда динамики по прямой
Год |
Эмпирические уровни ряда (y) |
Условные обозначения времени (t) |
t2 |
y*t |
||
А |
Б |
В |
Г |
Д |
Е |
|
1 |
221 |
-4 |
16 |
-884 |
219,32 |
|
2 |
235 |
-3 |
9 |
-705 |
241,24 |
|
3 |
272 |
-2 |
4 |
-544 |
263,16 |
|
4 |
285 |
-1 |
1 |
-285 |
285,08 |
|
5 |
304 |
0 |
0 |
0 |
307,0 |
|
6 |
320 |
+1 |
1 |
320 |
328,92 |
|
7 |
360 |
+2 |
4 |
720 |
350,84 |
|
8 |
371 |
+3 |
9 |
1113 |
372,76 |
|
9 |
395 |
+4 |
16 |
1580 |
394,68 |
|
Всего |
2763 |
0 |
60 |
1315 |
2763 |
Рис. 4. Динамика эмпирических и теоретических уровней ряда динамики
Аналогично рассматриваются другие виды функций. При оценке параметров полиномов используется МНК, степенная и показательная функции приводятся к линейному виду путем линеаризации.
Критерием выбора параметризованного (лучшего для прогнозирования) уравнения является наименьшая ошибка аппроксимации:
Средняя ошибка аппроксимации не должна превышать 10%.
Для выполнения прогноза в параметризованную модель подставляют перспективные значения t и получают расчетное значение .
,
где - дисперсия y;
n - число уровней ряда.
Таким образом, прогнозные значения должны быть даны в интервале:
Для нашего примера выполним прогноз на десятый год (t=5). Точечный прогноз составит: . Интервальный прогноз выполним с вероятностью 95,4% (коэффициент доверия равен 2), дисперсия равна . Отсюда ошибка репрезентативности:
Таким образом, прогнозные значения будут лежать в интервале:
.
Таким образом, с вероятностью 95,4% можно утверждать, что прогнозные значения будут находиться в интервале от 379 до 455 ед.
ИНДЕКСЫ
Под индексом в статистике понимают относительный показатель, характеризующий изменения величины какого-либо явления (простого или сложного, состоящего из соизмеримых или несоизмеримых элементов) во времени, в пространстве или по сравнению с любым эталоном (нормативом, планом, прогнозом и т.д.). В российской статистике общепризнанными являются правила построения агрегатных индексов, представленные в таблице 12.
Таблица 12
Построение индексов
Индекс |
Индивидуальный индекс, i |
Агрегатный индекс, I |
|
Цен |
|||
Физического объема |
|||
Себестоимости |
|||
Производительности труда |
Статистики большинства западных стран отстаивают многовариантность индексных формул. Некоторые из них приведены в таблице 13.
Таблица 13
Расчетные формулы для определения индексов цен и физического объема продукции
Название формулы |
Индексные формулы |
||
Индекс цен, Ip |
Индекс физического объема продукции, Iq |
||
Ласпейреса, L |
|||
Пааше, P |
|||
Фишера, F |
Агрегатный индекс является основной формой индекса. "Агрегатным" он называется потому, что его числитель и знаменатель представляют собой набор - "агрегат" (от латинского aggregatus - складываемый, суммируемый) непосредственно несоизмеримых и неподдающихся суммированию элементов - сумму произведений двух величин, одна из которых меняется (индексируется), а другая -остается неизменной в числителе и знаменателе (вес индекса). Вес индекса служит для соизмерения индексируемых величин.
Так как весами служат показатели, экономически тесно связанные с индексируемыми величинами, то произведения в числителе и знаменателе образуют определенные экономические категории. Так, в индексах объема производства (физического объема) индексируется натуральные количества (q) произведенной (проданной) продукции, в качестве весов могут выступать цены (р), а полученные произведения образуют стоимости (pq) отдельных видов произведенной (проданной) продукции. В индексах себестоимости индексируются себестоимости единицы продукции (z), в качестве весов выступают количества производимой продукции (q), а полученные произведения показывают затраты производства на отдельные виды продукции.
Существуют два способа расчета индексов: цепной и базисный. При цепном способе расчета за базу отношения принимается индексируемая величина соседнего прошлого периода. В этом случае база расчета в ряду постоянно меняется. При базисном способе расчета за базу принимается индексируемая величина какого-то одного периода. Индексы, рассчитанные цепным способом, называются цепными, рассчитанные базисным способом - базисными.
Многие экономические индексы тесно связаны между собой и образуют индексные системы. Так, индекс себестоимости продукции может быть записан в следующем виде:
Индекс физического объема продукции по себестоимости:
Произведение индексов представим в следующей форме:
, или
Произведение индекса себестоимости продукции на индекс физического объема дает индекс затрат в производстве.
Индексный метод применяется в статистике так же для изучения динамики средних величин и выявления факторов, влияющих на динамику средних. Эти задачи решаются с помощью системы взаимосвязанных индексов переменного, постоянного состава и структурных сдвигов.
Индекс переменного состава представляет собой соотношение средних величин какого-либо признака в отчетном и базисном периодах:
Индекс переменного состава характеризует изменение среднего уровня признака за счет влияния двух факторов:
изменения значений осредняемого признака (z) у отдельных единиц совокупности;
структурных изменений, под которыми понимается изменение доли отдельных единиц совокупности в общей их численности.
Индекс постоянного (фиксированного) состава отражает изолированное действие первого фактора - показывает средний размер изменения изучаемого признака у отдельных единиц совокупности.
Индекс структурных сдвигов характеризует влияние изменения структуры изучаемой совокупности на динамику среднего уровня признака:
Индексы переменного, постоянного состава и структурных сдвигов увязываются в следующую систему:
СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ
Чтобы выявить особенности в развитии явлений, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных. Для этой цели выбирается группировочный признак и разрабатывается система показателей сводки, которыми будут характеризоваться выделенные группы, для чего составляется макет таблицы.
Макетом таблицы называется таблица, состоящая из строк и граф, которые не заполнены цифрами. Каждая статистическая таблица (или макет) имеет подлежащее и сказуемое. Подлежащее - это объект изучения. Сказуемое - это система показателей, которыми характеризуется объект изучения. Подлежащее располагается слева в виде наименования горизонтальных строк, а сказуемое - справа, в виде наименования вертикальных граф.
В зависимости от построения подлежащего различают следующие виды таблиц: простые, групповые, комбинационные.
Групповыми таблицами называются такие, в подлежащем которых содержится группировка единиц совокупности по одному признаку.
В общественном производстве все процессы находятся в тесной взаимосвязи. Различают функциональную и корреляционную взаимосвязь между признаками. Под функциональными понимают такие взаимосвязи, при которых величина изучаемого признака определяется одним или несколькими факторами. Причем, с изменением факториальных признаков результативный признак всегда изменяется на одну и ту же величину. Однако в общественном производстве такого рода зависимости встречаются редко.
Взаимосвязи признаков экономических явлений, как правило, носят корреляционный характер. При корреляционных взаимосвязях одному значению изучаемого признака может соответствовать много значений другого или других признаков, причем, с изменением одного признака другие признаки варьируют в различных направлениях.
Различают корреляционные связи: однофакторные (если рассматривается один результативный и один факторный признак) и множественные (рассматривается один результативный и два и более факторных); прямые (если с возрастанием факторного признака возрастает и результативный, и, наоборот, с уменьшением факторного сокращается и результативный) и обратные (если с возрастанием факторного признака происходит сокращение результативного); прямолинейные (выраженные линейной функцией) и криволинейные (выраженные всеми остальными функциями: гиперболой, параболой, степенной и др.).
Простая корреляция отображает связи между двумя признаками. При множественной корреляции экономическое явление рассматривается как совокупность влияния многих факторов.
В процессе корреляционного анализа используют: линейный коэффициент корреляции, применяемый в случае линейной связи результативного и факторного признаков (r), индекса корреляции, применяемый в случае нелинейной зависимости (R), множественный коэффициент корреляции, применяемый в случае многофакторных связей (Ryx1x2..xn).
При малых выборках линейный коэффициент корреляции исчисляют по формуле:
,
или
,
где r - коэффициент корреляции;
x, y - значения изучаемых признаков;
- средние величины по каждому признаку;
- средняя величина произведения признаков x и y;
n - численность совокупности.
Наиболее удобной формулой для расчета коэффициента корреляции является следующая:
Коэффициент корреляции изменяется от -1 до +1. Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее. Если коэффициент корреляции меньше нуля, то вязь признается обратной, больше нуля - прямой.
Существенность связи можно оценить укрупненно по таблицам Чэддока, но часто возникает необходимость дать более точную оценку существенности либо на основе t - критерия (при малых выборках), либо F критерия Фишера. Вероятностная оценка существенности коэффициента корреляции при малой выборке предпочтительно осуществляется на основе расчета значения t - критерия Стьюдента
,
где r - коэффициент корреляции;
n - число сопоставляемых пар наблюдений.
Полученное расчетное значение t - критерия Стьюдента сравнивают с его теоретической величиной в зависимости от 5% и 1% уровень значимости и n-1 числа степеней свободы (приложение В).
Если tрасч. > tтабл., то связь между фактором и результатом существенная и наоборот, если tрасч.< tтабл., то связь несущественная и данный фактор исключается из дальнейшего исследования.
Если численность выборки более 30, то вначале определяется случайная ошибка выборочного коэффициента корреляции по формуле:
,
где 2 - общая дисперсия;
S2 - дисперсия разностей между эмпирическими данными и линией регрессии (остаточная дисперсия).
,
где y - эмпирические значения результативного признака;
- расчетные значения результативного признака.
Расчетные значения t - критерия Стьюдента определится:
tрасч.=
Далее сравнение расчетной величины с табличным значением t - критерия осуществляется аналогично вышеописанному.
В процессе изучения явления важно установить не только тесноту связи , но и рассчитать показатели, характеризующие взаимосвязь между признаками. Это осуществляется с помощью решения определенных регрессионных уравнений. Для аналитического выражения прямолинейной регрессии используют формулу прямой линии:
,
где - выровненное значение результативного признака;
a, b - параметры, представляющие средние значения постоянных показателей;
Параметры уравнения a и b определяют на основе метода наименьших квадратов, для чего решают систему нормальных уравнений.
.
После нахождения параметров а и b записывается параметризованное уравнение прямой линии.
Параметры а и b должны быть оценены по статистическим критериям (t - критерий Стьюдента, F - критерий Фишера). Особое внимание должно быть уделено параметру b, называемому коэффициентом регрессии. Это связано с тем, что этот показатель, являясь мерой изменений зависимого признака, рассматриваемого как фактор, приобретает значения основания для операции экстраполирования.
Оценка существенности параметра b производиться на основе ошибки коэффициента регрессии:
,
где S2 - остаточная дисперсия;
x - варианты ряда (факторный признак);
- среднее значение ряда;
Расчетное значение t - критерия определяется:
.
Расчетное значение t - критерия сравнивается с его теоретическим значением по таблицам Стьюдента (приложение В) при n-2 степенях свободы при 5% и 1% уровне значимости. Если tрасч.>tтабл., то параметр b признается существенным.
Параметр а оценивается по формуле:
.
Расчетное значение t - критерия для параметра a определяется:
Аналогично с вышеописанным сравнивается с теоретическим значением и делается вывод о существенности параметра а.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ К РЕШЕНИЮ ТИПОВЫХ ЗАДАЧ
Статистическое исследование может осуществляться по данным сплошного и не сплошного наблюдения. Наиболее распространенным методом, применяющим не сплошное наблюдение, является выборочный метод.
Под выборочным методом понимается статистическое исследование, при котором обобщающие показатели совокупности устанавливаются по некоторой ее части на основе отбора. При выборочном методе обследованию подвергается небольшая часть совокупности (5-10 %, реже 20-25 %)
Совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная часть единиц из нее, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой.
Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборки может отличаться от состава генеральной совокупности. Это расхождение составляет ошибку выборки. Способы ее определения различны в зависимости от приема формирования выборочных совокупностей и распространение характеристик выборки на генеральную совокупность составляют основное содержание методологии выборочного метода. Обобщающими характеристиками совокупностей являются средние. Средняя в генеральной совокупности обозначается - , в выборочный - . В генеральной совокупности доля единиц, обладающих признаком, обозначается - р и называется генеральной долей.
В выборочной совокупности долю изучаемого признака называют выборочной долей или частотой и обозначают - ?, которая определяется
,
где m - доля единиц, обладающих данным признаком;
n - общая численность единиц выборочной совокупности.
Отбор единиц совокупности осуществляется на основе различных способов:
- случайного,
- механического,
- типичного,
- серийного, комбинированного.
В зависимости от способа выборки и определяются следующие показатели:
- средняя ошибка,
- предельная ошибка,
- необходимая численность выборки.
Для случайного и механического отбора формулы по вычисленным показателям одинаковые, но они отличаются схемами: схемой повторной выборки, когда общая численность генеральной совокупности в процессе выборки остается неизменной, то есть единица совокупности, попавшая в выборку, после регистрации возвращается в генеральную совокупность. Повторную выборку используют редко, чаще используется схема бесповторной выборки, при которой единица совокупности, попавшая в выборку, после регистрации в генеральную совокупность не возвращается.
Средняя ошибка выборки показывает расхождения выборочной и генеральной средней.
Она определяется для бесповторного случайного отбора по формуле:
,
для случайного повторного отбора:
,
где - средняя ошибка выборочной средней;
n - численность выборки;
N - численность генеральной совокупности;
2 - дисперсия выборочной совокупности.
Для измерения ошибки доли альтернативного признака выборочной совокупности используются другие формулы:
(при повторном случайном отборе),
(при бесповторном случайном отборе),
Эти формулы характеризуют среднюю величину отклонения сводных характеристик генеральной совокупности. Поскольку признак варьирует, следует определять предельную ошибку выборки. Она для повторного и бесповторного отбора определяется:
Значит, с определенной вероятностью можно утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины и пределы, в которых находится генеральная средняя составят:
то есть генеральная средняя будет находиться в доверительном интервале . Доверительные границы определяются значениями лежащих по обе стороны от оценки средней наблюдений, между которыми заключен тот или иной процент площади графика распределения. Диапазон значений, в который попадает показатель генеральной совокупности с некоторой вероятностью, величина которой, как правило, устанавливается равной 95 или 99 %. Для вероятности 95 % кратность ошибки t составляет 1,96 для 99 % - t = 2,58.
Приведенные формулы для определения величины ошибки выборки дают возможность дополнительно определить численность выборки, чтобы ошибка выборки не превышала определенные заданные размеры. На практике при использовании выборочного наблюдения всегда определяют его численность по формуле:
(для повторного отбора),
(для бесповторного отбора).
Для определения доли с заданной точностью применяются следующие формулы:
(для повторного отбора),
(для бесповторного отбора).
Размещено на Allbest.ru
Подобные документы
Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.
курсовая работа [498,5 K], добавлен 09.01.2011Технико-экономические показатели групп заводов; ряды распределения. Относительные величины интенсивности, цепные и базисные индексы товарооборота. Расчет средней величины, моды и медианы. Среднее квадратическое отклонение; дисперсия, коэффициент вариации.
контрольная работа [88,8 K], добавлен 06.10.2013Основные приемы и методы обработки и анализа статистических данных. Исчисление арифметической, гармонической и геометрической средних величин. Ряды распределения, их основные характеристики. Методы выравнивания рядом динамики. Система национальных счетов.
курсовая работа [1,2 M], добавлен 24.10.2014Статистическое наблюдение; классификация признаков явлений; сводка и группировка. Ряды распределения и их графическое изображение; уровневые и интегральные графики. Динамические ряды, статистические таблицы, абсолютные, относительные и средние величины.
учебное пособие [217,1 K], добавлен 23.12.2009Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.
контрольная работа [226,8 K], добавлен 31.07.2011Виды временных рядов. Требования, предъявляемые к исходной информации. Описательные характеристики динамики социально-экономических явлений. Прогнозирование по методу экспоненциальных средних. Основные показатели динамики экономических показателей.
контрольная работа [84,3 K], добавлен 02.03.2012Арифметическая, гармоническая и геометрическая средняя величина. Задача на определение среднемесячной оплаты труда рабочих. Моментный и интервальный ряд динамики. Общее понятие об индивидуальных и сводных индексах. Объемные показатели перевозки грузов.
контрольная работа [604,4 K], добавлен 24.03.2013Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Географическое положение и экономический потенциал Сочинской таможни. Средние величины и показатели вариации. Сопоставления уровней социально-экономических явлений во времени. Ряды динамики. Анализ динамики внешней торговли в зоне деятельности таможни.
курсовая работа [63,9 K], добавлен 22.11.2013Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013