Показатели вариации в статистике

Показатели вариации: понятие, виды, формулы для вычислений. Расчет размаха, дисперсии и среднего отклонения статистических показателей. Группировка предприятий по разным признакам. Ранжированный ряд в статистике. Виды степенных средних и их применение.

Рубрика Экономика и экономическая теория
Вид реферат
Язык русский
Дата добавления 29.11.2015
Размер файла 720,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Показатели вариации: понятие, виды, формулы для вычислений. Примеры решения задач

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц, которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию, являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака:

R = Xmax - Xmin.

Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение:

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

- формула для расчета коэффициента вариации.

2. Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1. При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:

1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;

2) средний размер вклада за месяц для двух банков вместе;

3) Дисперсию вклада для 2-х банков, зависящую от рекламы;

4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;

5) Общую дисперсию используя правило сложения;

6) Коэффициент детерминации;

7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой. Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

= 29 000/50 = 580 руб.

Аналогичные действия произведем для банка без рекламы:

2) Найдем средний размер вклада для двух банков вместе. Хср =(580Ч50+542,8Ч50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле:

у2=pq

(формула дисперсии альтернативного признака). Здесь р=0,5 - доля факторов, зависящих от рекламы; q=1-0,5, тогда у2=0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

у2 = у2факт + у2ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации

з2 = у2факт / у2 = 345,96/898,04 = 0,39 = 39% -

размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение

з = ?з2 = v0,39 = 0,62

- связь достаточно тесная.

Задача 2. Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х'). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей - суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = kЧ((У((х'-a):k)Чf):Уf)+a.

Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)Ч200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

у2 = (33/37)*2002-(472,97-500)2 = 35 675,67- 730,62 = 34 945,05

3) среднее квадратическое отклонение:

у = ±?у2 = ±v34 945,05 ? ±186,94 тыс. руб.

4) коэффициент вариации:

V = (у /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения.

Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда.

Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения.

Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

- абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (?2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (?) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны.

Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации.

Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане).

Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:

- наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Задача 1. Имеются следующие данные о возрастном составе студентов группы заочного отделения ВУЗа (лет): 19; 19; 19; 20; 20; 20; 20; 20; 20; 20; 20; 20; 21; 21; 21; 22; 23; 23; 24; 25; 25; 25; 26; 27; 29.

Для анализа распределения студентов по возрасту требуется:

1) построить интервальный ряд распределения и его график;

2) рассчитать модальный, медианный и средний возраст, установить его типичность с помощью коэффициентов вариации;

3) проверить распределение на нормальность с помощью коэффициентов асимметрии и эксцесса.

Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):

n = 1 +3,322 lg N,

где N - число величин в дискретном ряде.

В нашей задаче

n = 1 + 3,322lg25 = 1 + 3,322*1,398 = 5,64.

Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 6.

После определения оптимального количества интервалов определяем размах интервала по формуле:

h = H / n,

где H - размах вариации.

H = Хмах -Хmin,

Xмax и Xmin -- максимальное и минимальное значения в совокупности.

В нашей задаче h = (29 - 19)/6 = 1,67.

Интервальная группировка данных приведена в первом столбце таблицы 1, которая содержит также алгоритм и промежуточные расчеты.

Вспомогательные расчеты для решения задачи

Xi , лет

fi

Хи

Хиfi

Хи-

(Хи-)2

(Хи-)^2*fi

(Хи-)^3 *fi

(Хи-)^4 *fi

до 20,67

12

19,833

237,996

-2,134

25,602

4,552

54,623

-116,539

248,638

20,67-22,33

4

21,5

86,000

-0,467

1,866

0,218

0,871

-0,406

0,189

22,33-24

3

23,167

69,501

1,200

3,601

1,441

4,323

5,190

6,231

24-25,67

3

24,833

74,499

2,866

8,599

8,217

24,650

70,659

202,543

25,67-27,33

2

26,5

53,000

4,533

9,067

20,552

41,105

186,348

844,806

более 27,33

1

28,167

28,167

6,200

6,200

38,446

38,446

238,383

1478,091

Итого

25

--

549,163

--

54,937

--

164,018

383,636

2780,498

На основе этой группировки строится график распределения возраста студентов:

Мода - это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (13):

,

где ХMo - нижнее значение модального интервала; fMo - число наблюдений или объем взвешивающего признака (вес признака) в модальном интервале; fMo-1 - то же для интервала, предшествующего модальному; fMo+1 - то же для интервала, следующего за модальным; h - величина интервала изменения признака в группах.

В нашей задаче чаще всего повторяется (12 раз) первый интервал возраста (до 20,67), значит, это и есть модальный интервал. Используя формулу (13), определяем точное значение модального возраста:

Мо = 19 + 1,667*(12-0)/(2*12-4-0) = 20 (лет).

Медиана - это такое значение признака, которое приходится на середину ранжированного ряда. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака больше медианы, другая - меньше медианы. Для интервального ряда с равными интервалами величина медианы определяется так:

,

где XMe - нижняя граница медианного интервала; h - его величина (размах);

- сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

fMe - число наблюдений или объем взвешивающего признака в медианном интервале.

В нашей задаче второй интервал возраста (от 20,67 до 22,33) является медианным, так как на него приходится середина ряда распределения возраста.

Определяем точное значение медианного возраста:

Ме = 20,67 + 1,667*(12,5-12)/4 = 20,878 (года).

Средняя величина - это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса.

Средние величины могут быть простыми и взвешенными.

Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных впроизвольном (несгруппированном) порядке, по общей формуле (15).

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (16).

=

=.

При этом обозначено: Xi - значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин.

Виды степенных средних и их применение

вариация дисперсия статистика ранжированный

m

Название средней

Формула расчета средней

Когда применяется

простая

взвешенная

1

Арифметическая

=

=

Чаще всего, кроме тех случаев, когда должны применяться другие виды средних

-1

Гармоническая

ГМ =

ГМ =

Для осреднения величин с дробной размерностью при наличии дополнительных данных по числителю дробной размерности

0

Геометрическая

Для осреднения цепных индексов динамики

2

Квадратическая

=

=

Для осреднения вариации признака (расчет средних отклонений)

3

Кубическая

=

=

Для расчета индексов нищеты населения

1

Хронологическая

Для осреднения моментных статистических величин

В нашей задаче, применяя формулу (18) и подставляя вместо середины интервалов возраста ХИ, определяем средний возраст студентов: = 549,163/25 = 21,967 (года). Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3.

Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.

Среднее линейное отклонение определяется по формулам:

-простое; - взвешенное.

Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (31):

= .

Дисперсия определяется по формулам:

-простая; -взвешенная.

В нашей задаче, применяя формулу (30), определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 54,937/25 = 2,198 (года). Разделив это значение на средний возраст, получим линейный коэффициент вариации:

= 2,198/21,967 = 0,100.

По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,100 < 0,333).

Применяя формулу (33), получим в итоге дисперсию: Д = 164,018/25 = 6,561. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение:

= = 2,561 (года).

Разделив это значение на средний возраст, получим квадратический коэффициент вариации:

= 2,561/21,967 = 0,117.

По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,117 < 0,333).

В качестве показателей асимметрии используются: коэффициент асимметрии - нормированный момент третьего порядка (34) и коэффициент асимметрии Пирсона (35):

, .

Если значение коэффициента асимметрии положительно, то в ряду преобладают варианты, которые больше средней (правосторонняя скошенность), если отрицательно - левосторонняя скошенность. Если коэффициент асимметрии равен 0, то вариационный ряд симметричен.

В нашей задаче

==383,636/25 = 15,345; =2,5613= 16,797; =15,345/16,797 = 0,914 > 0,

значит, распределение студентов по росту с правосторонней асимметрией. Это подтверждает и значение коэффициента асимметрии Пирсона: As = (21,967-20)/2,561 = 0,768.

Список использованных источников

1. Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;

2. Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. - М., 2003;

3. Сизова Т.М. Статистика: Учебное пособие. - СПб.: СПб ГУИТМО, 2005;

4. Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;

Размещено на Allbest.ru


Подобные документы

  • Группировка предприятий по факторному признаку, расчет размаха вариации и длины интервала. Виды и формулы расчета средних величин и дисперсии. Расчет абсолютного прироста, темпов роста и темпов прироста, среднегодовых показателей численности населения.

    контрольная работа [219,7 K], добавлен 24.02.2011

  • Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

    лекция [985,6 K], добавлен 13.02.2011

  • Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

    реферат [162,6 K], добавлен 04.06.2010

  • Группировка указанных данных с равными интервалами. Вычисление среднего арифметического, дисперсии и среднего квадратичного отклонения. Расчет коэффициентов вариации. Определение базисных показателей динамики. Построение столбиковых и круговых диаграмм.

    контрольная работа [281,7 K], добавлен 24.09.2012

  • Понятие объекта, единицы наблюдения и единицу совокупности специальных статистических обследований. Группировка предприятий по годовому объему продукции. Расчет дисперсии и среднего квадратического отклонения для вычисления коэффициента вариации.

    практическая работа [119,1 K], добавлен 17.12.2010

  • Понятие и сущность типологической группировки. Расчет динамики и структуры изменения объема продукции в квартальном разрезе и в целом за год. Вычисление показателей вариации, дисперсии, среднего квадратичного отклонения. Определение моды и медианы.

    контрольная работа [135,8 K], добавлен 24.09.2012

  • Средняя величина в статистике, ее виды и формы. Средняя арифметическая, средняя гармоническая и условия их применения. Понятие, виды и показатели вариации. Правило сложения дисперсий. Изучение формы распределения признака, ее основные характеристики.

    курсовая работа [148,5 K], добавлен 22.12.2010

  • Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.

    контрольная работа [438,8 K], добавлен 06.11.2010

  • Группировка магазинов по признакам. Определение среднемесячной заработной платы работника, средней продолжительности проживания в месте жительства, дисперсии, среднего квадратического отклонения, коэффициента вариации, средней численности населения.

    контрольная работа [156,0 K], добавлен 05.01.2012

  • Вычисление средней арифметической заработных плат, моды и медианы, размаха вариации, дисперсии и среднего квадратичного отклонения. Статистический анализ товарооборота, его динамики и показателей. Оценка стоимости продукции, средней цены, удельного веса.

    контрольная работа [152,5 K], добавлен 08.01.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.