Общая теория статистики

Понятие статистической сводки, средней величины и группировки. Виды статистических показателей (абсолютные, относительные и средние). Определение дисперсии и коэффициента вариации. Основные понятия и предпосылки корреляционно-регрессионного анализа.

Рубрика Экономика и экономическая теория
Вид реферат
Язык русский
Дата добавления 13.11.2011
Размер файла 293,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

81

1. СВОДКА И ГРУППИРОВКА

Понятия статистической сводки и группировки. Виды группировок

Собранный в результате статистического наблюдения статистический материал подвергается логическому и арифметическому контролю (проверке смысловой согласованности сведений первичного документа и проверке счетной согласованности). Затем приступают к статистической сводке.

Статистическая сводка - систематизация единичных фактов, позволяющая перейти к обобщающим показателям, относящимся ко всей изучаемой совокупности и ее частям, и осуществлять анализ и прогнозирование изучаемых явлений и процессов.

Сводка определяет общий размер изучаемого явления по заданным показателям, представляя общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала.

Статистическая сводка в широком ее понимании предполагает систематизацию и группировку данных, характеристику образованных групп системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединение изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называются группировочными признаками, или основанием группировки.

С помощью метода группировок решаются задачи: выделение социально-экономических типов явлений; изучение структуры явления и структурных сдвигов, происходящих в нем; выявление связи и зависимости между явлениями. Для решения этих задач применяют соответственно типологические, структурные и аналитические группировки. Данная классификация видов статистических группировок по выполняемым ими задачам имеет несколько условный характер, поскольку на практике они применяются в комплексе.

Типологическая группировка - это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явления. При использовании метода типологических группировок важное значение имеет правильный выбор группировочного признака. При атрибутивном признаке с незначительным разнообразием его значений число групп определяется свойствами изучаемого явления (например, группировка предприятий по формам собственности). Выделение типов на основе количественного признака состоит в определении групп с учетом значений изучаемых признаков.

Структурная группировка предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку. Другими словами, выделенные с помощью типологической группировки типы явления могут изучаться с точки зрения их структуры и состава. Однако нередко структурные группировки применяются и без предварительного расчленения совокупности на части.

Для изучения связи между отдельными признаками явления используются аналитические группировки.

Образование групп по двум и более признакам называется комбинированной группировкой.

2. Построение статистических группировок

1. Выбор группировочного признака - признака, по которому производится разбиение совокупности на отдельные группы. В качестве признака необходимо использовать существенные обоснованные признаки.

По форме выражения группировочные признаки бывают атрибутивными (не имеющими количественного выражения, например, профессия) и количественными (например, число филиалов, величина дохода). При этом количественные признаки могут быть дискретными (прерывными, значения которых выражаются только целыми числами, например, число филиалов) и непрерывными (принимающими как целые, так и дробные значения, например, величина дохода).

По характеру колеблемости группировочные признаки бывают альтернативными, которыми одни единицы обладают, а другие - нет (например, товары - качественные или некачественные), и имеющими множество количественных значений (например, число филиалов, величина дохода).

По роли во взаимосвязи изучаемых явлений признаки подразделяются на факторные, воздействующие на другие признаки, и результативные, испытывающие на себе влияние других.

2. Выбор количества групп. Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки - количественный признак, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. В каждом конкретном случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования. Если совокупность состоит из большого числа единиц и распределение единиц по группировочному признаку близко к нормальному, используют формулу Стерджесса:

n= 1+3,322 * lg N

3. Определение интервала группировки. Интервал - это значение варьирующего признака, лежащее в определенных границах. Под величиной интервала понимают разность между максимальным и минимальным значениями признака в группе. При этом максимальное значение признака в группе называется верхней границей интервала, а минимальное - нижней границей. В зависимости от степени колеблемости группировочного признака, характера распределения статистической совокупности устанавливаются интервалы равные или неравные. Если вариация признака происходит в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами; величина интервала определяется по формуле:

где xmax - максимальное значение признака в изучаемой совокупности

xmin - минимальное значение признака в изучаемой совокупности

n - количество групп

В экономической практике чаще применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает, когда колеблемость признака осуществляется неравномерно и в больших пределах.

3. Статистические ряды распределения

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения и таблиц. Ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. Другими словами, это группировка, в которой для характеристики групп применяется численность группы.

Атрибутивные ряды распределения - ряды распределения, построенные по качественным признакам.

Вариационные ряды распределения - ряды распределения, построенные по количественным признакам. Вариационный ряд состоит из двух элементов: варианты и частота. Варианта (обозначается х)- отдельное значение варьирующего признака, которое он принимает в ряду распределения. Частота (обозначается f)- численность отдельных вариант, т.е. частота повторения каждого варианта. Частота, выраженная в долях единицы или в процентах к итогу, называется частость (обозначается w).

По способу построения вариационные ряды бывают дискретными и интервальными.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Для его построения следует перечислить все встречающиеся варианты значений признака и подсчитать частоту повторения. При графическом изображении дискретных вариационных рядов используется полигон распределения, или полигон частот. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяются прямыми линиями, в результате чего получают ломаную линию.

Интервальный вариационный ряд строится в случае непрерывной вариации признака у единиц совокупности (величина может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую величину), а также в случае, когда число вариант дискретного признака достаточно велико. Для графического изображения интервального вариационного ряда применяется гистограмма. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате мы получим график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.

В ряде случаев для изображения вариационных рядов (как дискретным, так и интервальным) используется кумулятивная кривая (или кумулята). Для ее построения надо рассчитать накопленные частоты или частости. Накопленные частоты (обозначаются S) показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое, и определяются последовательным суммированием частот интервалов. При построении кумуляты интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней границе - частота данного интервала.

4. Примеры решения задач

Пример 1. Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность сотрудников составляет 120 человек, а минимальный и максимальный доход соответственно равен 500 и 6500 руб.

Решение.

Количество групп равно n=1+3,322*lg120=8

Величина интервала руб.

Интервалы выглядят следующим образом:

№ группы

Величина интервала группировки

1

500-1250

2

1250-2000

3

2000-2750

4

2750-3500

5

3500-4250

6

4250-5000

7

5000-5750

8

5750-6500

Пример 2. Имеются следующие данные о количестве филиалов каждого из двадцати банков в городе.

Количество филиалов в городе у разных банков: 2, 4, 3, 5, 4, 4, 6,5,4, 3, 4, 3, 4, 5, 3, 4, 6, 3, 5, 4

Построить ряд распределения по имеющимся данным. Дать графическое изображение ряда распределения.

Решение.

Вариация признака носит дискретный характер, число вариант дискретного признака невелико, и значения признака у отдельных единиц совокупности повторяются. Поэтому строится дискретный ряд распределения. Для его построения следует перечислить все встречающиеся варианты значений признака и подсчитать частоту повторения.

Дискретный ряд распределения, построенный по данным, выглядит следующим образом

Количество филиалов в городе организации, х

Число банков

(или частота, f)

Частость, w

Накопленная частота, S

2

1

1/20=0,05

1

3

5

5/20=0,25

1+5 = 6

4

8

8/20=0,40

6+8 = 14

5

4

4/20=0,20

14+4 = 18

6

2

2/20=0,10

18+2 = 20

Итого

20

1,00

Частость w рассчитана как отношение соответствующей частоты к общей сумме частот.

По полученному дискретному ряду распределения строится полигон частот.

Для построения кумуляты следует рассчитать накопленные частоты S. Накопленная частота первой варианты равна частоте первого интервала, т.е. всего 1 банк в городе имеет не больше двух филиалов. Накопленная частота второй варианты равна сумме частот первой и второй вариант (или сумме накопленной частоты первой варианты и частоты второй варианты), т.е. не больше трех филиалов имеют 6 городских банков: у пяти из них по 3 филиала, у одного - 2 филиала. Остальные накопленные частоты определяются аналогично. Накопленная частота последней варианты равна сумме всех частот ряда: все банки в городе имеют не больше 6 филиалов.

Пример 3. Имеются следующие данные о размере прибыли двадцати коммерческих банков. Прибыль, млн. руб.:

3,7 4,3 6,7 5,6 5,1 8,1 4,6 5,7 6,4 5,9 5,2 6,2 6,3 7,2 7,9 5,8 4,9 7,6 7,0 6,9

Построить ряд распределения по имеющимся данным. Дать графическое изображение ряда распределения.

Решение. Вариация признака носит непрерывный характер, значения признака у отдельных единиц совокупности не повторяются. Поэтому строится интервальный ряд распределения. Для его построения следует определить количество интервалов и величину интервала.

Т.к. количество интервалов заранее не задано, определим его по формуле Стерджесса: n=1+3,322*lg20=1+3,322*1,3= 5,3 Дробное число, характеризующее количество интервалов, желательно округлять в меньшую сторону. Т.о., n=5

Величина интервала h=(8,1-3,7)/5=0,88 Число, характеризующее величину интервала, округляется с той же точностью, что и исходные данные. В нашем случае следует округлить до 0,1: h=0,9.

Строим интервальный ряд распределения:

№ группы

Группы по размеру прибыли х

Число банков (частота) f

Частость, w

Накопленная частота S

1

3,7 - 4,6

3

0,15

3

2

4,6 - 5,5

3

0,15

6

3

5,5 - 6,4

7

0,35

13

4

6,4 - 7,3

4

0,2

17

5

7,3 - 8,2

3

0,15

20

Итого

20

1

При подсчете частот воспользуемся принципом «включительно», согласно которому единица совокупности, имеющая значение признака, равное границе двух смежных групп (например, банк с прибылью 4,6 млн. руб.), включается в интервал, где он служит верхней границей (банк с прибылью 4,6 млн. руб. включим в группу с размером прибыли от 3,7 до 4,6 млн. руб.).

Расчет частостей и накопленных частот производится аналогично расчету в дискретных рядах распределения.

По полученным значениям частот строится гистограмма распределения, по накопленным частотам - кумулята.

5. Задачи для самостоятельного решения

Задача 1. Пользуясь формулой Стерджесса, определите интервалы групп, полученных в результате группировки работников магазина по среднемесячной выработке, если общая численность работников составляет 22 человека, а минимальная и максимальная среднемесячная выработка соответственно равны 100 тыс. руб. и 250 тыс. руб.

2. ОБОБЩАЮЩИЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ

Статистическое исследование независимо от его масштабов и целей всегда завершается расчетом и анализом различных по виду и форме выражения статистических показателей.

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определенности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого процесса, его сущностью.

В отличие от признака статистический показатель получается расчетным путем. Это может быть простой подсчет единиц совокупности, суммирование их значений признака, сравнение двух или нескольких величин или более сложные расчеты. Признак - это свойство, присущее единице совокупности. Признак входит в качественное содержание показателя, он существует объективно. Показатель - характеристика группы единиц или совокупности в целом; его построение зависит от цели исследования

Все статистические показатели по охвату единиц совокупности разделяются на индивидуальные и сводные по форме выражения - на абсолютные, относительные и средние.

1. Абсолютные показатели

Исходной, первичной формой выражения статистических показателей являются абсолютные величины. Статистические показатели в форме абсолютных величин характеризуют абсолютные размеры изучаемых статистикой процессов и явлений: их массу, площадь, объем, протяженность; отражают их временные характеристики, а также могут представлять объем совокупности, т.е. число составляющих ее единиц. В отличие от математического понятия абсолютной величины, абсолютные показатели в статистике могут быть представлены как положительными, так и отрицательными числами.

Индивидуальные абсолютные показатели, как правило, получают непосредственно в процессе статистического наблюдения как результат замера, взвешивания, подсчета и оценки интересующего количественного признака.

Сводные объемные показатели, характеризующие объем признака или объем совокупности как в целом по изучаемому объекту, так и по какой-либо его части, получают в результате сводки и группировки индивидуальных значений.

Абсолютные статистические показатели всегда являются именованными числами. В зависимости от социально-экономической сущности исследуемых явлений, их физических свойств они выражаются в натуральных (тонны, килограммы, метры, штуки), условно-натуральных (так, различные виды топлива переводят в условное топливо с определенной теплотой сгорания; перевод в условные единицы осуществляется на основе специальных коэффициентов), стоимостных или трудовых (человеко-дни, и человеко-часы) единицах измерения.

2 . Относительные показатели

Относительный показатель в статистике - это обобщающий показатель, который дает числовую меру соотношения двух сопоставляемых абсолютных величин.

Величина, с которой производится сравнение (знаменатель дроби), называется базой сравнения или основанием. В зависимости от базы сравнения относительный показатель может быть представлен в различных долях единицы, процентах, промилле, продецимилле и т.д. По способу получения относительные величины - всегда производные, результат отношения может быть выражен либо в форме коэффициента и процента, либо в форме промилле и продецимилле. Существуют также именованные относительные величины (например, показатель фондоотдачи).

Общие принципы построения относительных показателей.

1) Сравниваемые в относительном показателе абсолютные (или, в свою очередь, относительные) показатели должны быть объективно связаны в реальной жизни.

2) При построении относительного статистического показателя сравниваемые исходные показатели могут различаться только одним атрибутом: или видом признака (при одинаковом объекте, периоде времени, плановом или фактическом характере показателей), или временем (при том же признаке, объекте и т.п.), или только фактическим, плановым, нормативным характером показателей (при том же объекте, признаке, периоде времени) и т.д. Нельзя сопоставлять показатели, различные по двум или более атрибутам (например, добычу угля в США в 1980 г. с выплавкой стали в России в 1992 г.).

3) Необходимо знать возможные границы существования относительного показателя. Например, если исходные показатели в текущем и базисном периодах имеют разные знаки, то теряет смысл и не может применяться относительная величина динамики

По своему содержанию относительные величины подразделяются на следующие виды:

1). Относительный показатель динамики (ОПД) характеризует изменение уровня развития явления во времени. Представляет собой отношение уровня исследуемого процесса или явления за данный период времени (по состоянию на данный момент времени) к уровню этого же процесса или явления в прошлом.

Обозначим уровень показателя через y:

у0 - уровень показателя в базисном периоде,

у1 - уровень показателя в отчетном периоде

ОПД= у1/ у0

Относительная величина динамики может быть представлена в трех формах: коэффициента (индекса), темпов роста либо прироста.

Показатели динамики могут определяться с использованием постоянной либо переменной базы сравнения. При расчете показателей на постоянной базе каждый уровень сравнивается с одним и тем же базисным уровнем, т.е. вычисляются делением сравниваемого уровня (уi) на уровень, принятый за постоянную базу сравнения, :

Исчисляемые при этом показатели называются базисными.

Для расчета показателей на переменной базе каждый последующий уровень сравнивается с предыдущим, т.е. вычисляются делением сравниваемого уровня уi на предыдущий уровень уi-1:

Вычисленные таким образом показатели называются цепными.

Между базисными и цепными относительными показателями динамики имеется взаимосвязь: произведение последовательных цепных относительных показателей динамики равно базисной величине, исчисленной за тот же период, а частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста.

2. Относительный показатель планового задания (ОПП) рассчитывается как отношение уровня, запланированного на предстоящий период, к уровню, фактически сложившемуся в предшествующем периоде.

ОПП = упл / у0

3. Относительный показатель выполнения задания (ОПВП) рассчитывается как отношение фактически достигнутого в данном периоде уровня к запланированному.

ОПВП.= у1 / упл.

Относительные величины динамики, планового задания и выполнения связаны соотношением

ОПД=ОПП*ОПВП

4. Относительные показатели структуры (ОПС) характеризуют доли, удельные веса составных элементов в общем итоге. Как правило, в форме процентного содержания.

Обозначим через Y уровень части совокупности, Y - суммарный уровень совокупности

Расчет относительных величин структуры за несколько периодов позволяет выявить структурные сдвиги.

Показатели структуры используют для выявления соотношения части и целого.

5. Относительные показатели координации (ОПК) характеризуют отношений частей данной совокупности к одной из них, принятой за базу сравнения. В качестве базы сравнения как правило, выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-либо другой точки зрения. Относительные величины координации показывают, во сколько раз одна часть совокупности больше другой, либо сколько единиц одной части приходится на 1, 10, 100, 1000 … единиц другой части.

6. Относительные показатели сравнения (наглядности) характеризуют результаты сопоставления одноименных абсолютных величин, относящихся к одному и тому же периоду либо моменту времени, но к различным объектам или территориям.

7. Относительные показатели интенсивности (ОПИ) характеризуют степень распределения или развития данного явления в той или иной среде. Это отношение абсолютного уровня одного показателя, свойственного изучаемой среде, к другому абсолютному показателю, также присущему данной среде, и, как правило, являющемуся для первого показателя факторным признаком. Напр., показатели рождаемости, смертности, естественного прироста, которые рассчитываются как отношение к среднегодовой численности населения данной территории (на 1000 чел.).

В отличие от относительных показателей, получаемых в результате сопоставления одноименных показателей и представляемых в виде коэффициентов и процентов, относительные показатели интенсивности являются именованными числами. Относительными показателями интенсивности выступают, напр., показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, трудоемкости, эффективности использования производственных фондов и т.д.

Разновидностью относительных показателей интенсивности являются относительные показатели уровня экономического развития, характеризующие производство продукции в расчете на душу населения и играющие важную роль в оценке развития экономики государства.

3. Примеры решения задач

Пример 1. Уставный капитал банка в 1998 г. составлял 5,08 млн. руб., а в 2001 г. - 6,15 млн. руб. Найти относительную величину динамики.

Решение.

ОПД = 6,15 / 5,08 = 1,211

т.е. размер уставного фонда вырос за 3 года в 1,211 раза - это коэффициент роста (или индекс роста). В процентном выражении это 121,1% - это темп роста. За три года размер уставного фонда увеличился на 21,1% - это темп прироста

Пример 2. По плану на 2000 год предполагалось увеличить производство продукции с 5650 шт. до 6100 шт. В действительности в 2000 году было произведено продукции 5850 шт. Найти относительные величины планового задания, выполнения планового задания.

Решение.

ОПП = 6100 / 5650 = 1,08

т.е. по плану предполагалось увеличить производство продукции в 1,08 раза,это - плановый коэффициент роста (плановый индекс роста).

В процентном выражении это 108% - это плановый темп роста т.е. планировалось увеличить пр-во на 8% - это плановый темп прироста

В действительности в 2000 году было произведено продукции 5850 шт. при плане 6100 шт.

ОПВП = 5850 / 6100 = 0,959, или 95,9 %

т.е. плановое задание было недовыполнено на 4,1%

Фактический ОПД составил ОПД= ОПП* ОПВП=1,08*0,959=1,035, или 103,5%

(или ОПД=5850/5650=1,035, или 103,5%)

Внешнеторговый оборот России в 1997-1998 годах характеризовался следующими данными

Период

Внешнетор-говый оборот, всего, млрд. долл.

В том числе

Экспорт

Импорт

1997 г.

I кв.

36,7

21,1

15,6

II кв.

37,9

20,4

17,5

III кв.

40,4

21,6

18,8

IV кв.

46,9

25,1

21,8

Итого за год

161,9

88,2

73,7

1998 год

I кв.

36,7

18,4

18,3

II кв.

36,4

18,7

17,7

III кв.

31,5

17,8

13,7

IV кв.

28,7

19,3

9,4

Итого за год

133,3

74,2

59,1

а) Рассчитать относительные величины структуры, характеризующие доли экспорта и импорта во внешнеторговом обороте России.

б) Рассчитать относительные величины координации, характеризующие соотношение экспорта и импорта.

Решение. Относительные показатели структуры используют для выявления соотношения части и целого. В нашем случае целое - это внешнеторговый оборот, его части - экспорт и импорт, т.е. требуется сопоставить величины экспорта (импорта) и внешнеторгового оборота в целом.

Период

Внешнеторговый оборот, всего,

млрд. долл.

В том числе

Удельный вес, %

Стоимость импорта на 1000 руб. экспорта

Экспорт

Импорт

Экспорта

Импорта

1997 г.

I кв.

36,7

21,1

15,6

21,1/36,7=57,49

15,6/36,7= 42,51

(15,6/21,1)*1000=739

II кв.

37,9

20,4

17,5

20,4/37,9=53,83

17,5/37,9= 46,17

(17,5/20,4)*1000=858

III кв.

40,4

21,6

18,8

21,6/40,4=53,47

18,8/40,4= 46,53

(18,8/21,6)*1000=870

IV кв.

46,9

25,1

21,8

25,1/46,9=53,52

21,8/46,9= 46,48

(21,8/25,1)*1000=869

Итого за год

161,9

88,2

73,7

88,2/161,9=54,48

73,7/161,9= 45,52

(73,7/88,2)*1000=836

1998 год

I кв.

36,7

18,4

18,3

50,14

49,86

995

II кв.

36,4

18,7

17,7

51,37

48,63

947

III кв.

31,5

17,8

13,7

56,51

43,49

770

IV кв.

28,7

19,3

9,4

67,25

32,75

487

Итого за год

133,3

74,2

59,1

55,66

44,34

796

Относительные показатели координации характеризуют соотношение частей целого между собой, т.е. требуется сопоставить величины импорта и экспорта между собой.

При расчете относительной величины координации за базу сравнения принимаем величину экспорта как показатель, обладающий большим социально-экономическим значением и большей величиной. Найдем, сколько импорта приходится на 100 р. экспорта.

Пример 4. Объем кредитов, выданный банками предприятиям, в области А составил 73,2 млн. руб., а в области Б - 38,8 млн. руб. Рассчитайте относительную величину сравнения.

Решение. ОПС = 38,8/73,2=0,53. Т.о. уровень кредитования банками предприятий в области Б составляет от уровня области А 53%.

Пример 5. Производство электроэнергии в области составило 17,2 млрд. квт.-ч. при среднегодовой численности населения 8,4 млн. чел. Определить относительную величину интенсивности, характеризующую производство электроэнергии на душу населения.

Решение. ОПИ=17,2 / 8,4 = 2,05 тыс. квт.-ч. на душу населения.

3. СРЕДНИЕ ВЕЛИЧИНЫ

Средние величины - это обобщающие показатели, в которых находят выражение действие общих условий, закономерность изучаемого явления. Сущность средней величины состоит в том, что она отражает общие черты, закономерности, тенденции, присущие данной совокупности, погашая влияние индивидуальных (случайных факторов) и поэтому является обобщающей характеристикой варьирующего признака качественно однородной совокупности.

Признак, по которому находится средняя, называется осредняемым признаком, обозначается .

Все виды средних величин, используемые в статистических исследованиях, подразделяются на 2 категории: степенные и структурные.

1. Степенные средние

Наиболее распространены следующие виды степенных средних:

- средняя арифметическая

- средняя гармоническая

- средняя геометрическая

- средняя квадратическая

ь Средняя арифметическая исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

Некоторые свойства средней арифметической:

1. Сумма отклонений индивидуальных значений признака от их средней величины равна нулю.

2. Сумма квадратов отклонений индивидуальных значений признака от их средней величины есть величина минимальная.

, где А= (т.е. А - любое число, отличное от )

3. Если все частоты разделить на одно и то же число, средняя арифметическая останется без изменений. Т.е. для расчета средней можно воспользоваться не только значениями частот, но и значениями частостей.

Средняя арифметическая простая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Равна сумме отдельных значений признака, деленной на число этих значений.

Средняя арифметическая взвешенная в дискретном ряду распределения применяется в случаях, когда данные представлены в виде рядов распределения или группировок. Одни и те же значения признака повторяются несколько раз.

где f - число одинаковых значений признака в рядах распределения, т.е. частота, или вес.

Средняя арифметическая взвешенная зависит не только от значений признака, но и от частот, т.е. от состава совокупности, от ее структуры.

Средняя арифметическая взвешенная в интервальном ряду распределения. В интервальном ряду распределения с закрытыми интервалами варианты осредняемого признака представлены не одним числом, а виде интервала «от - до». Таким образом, каждая группа ряда распределения имеет нижнее и верхнее значение вариант. Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной.

Чтобы применить эту формулу, варианты признака надо выразить одним числом (дискретным). За такое число принимается средняя арифметическая простая из верхнего и нижнего значения интервала. Дальнейший расчет производится обычным методом определения средней арифметической взвешенной.

ь Средняя гармоническая - это величина, обратная средней арифметической. Когда статистическая информация не содержит частот по отдельным вариантам, а представлена как их произведение, применяется формула средней гармонической взвешенной. В том случае, когда объемы явлений (т.е. произведения) по каждому признаку равны, применяется средняя гармоническая простая.

Средняя гармоническая простая

Средняя гармоническая взвешенная

ь Средняя геометрическая - это величина, используемая как средняя из отношений. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел, т.е. когда индивидуальные значения признака - относительные величины. Например, средняя геометрическая используется при расчете среднего коэффициента роста.

Средняя геометрическая простая

2. Структурные средние

Для характеристики структуры совокупности применяются особые показатели, которые называются структурными средними. К таким показателям относятся мода и медиана.

Мода - величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Другими словами, модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения. Мода отражает типичный, наиболее распространенный вариант значения признака.

В дискретном ряду распределения мода - это варианта, которой соответствует наибольшая частота.

В интервальном ряду распределения сначала определяют модальный интервал (т.е. интервал, содержащий моду), которому соответствует наибольшая частота. Конкретное значение моды определяется формулой:

xMo - начальное значение модального интервала

iMo - величина модального интервала

fMo - частота модального интервала

fMo-1 - частота интервала, предшествующего модальному

fMo+1 - частота интервала, следующего за модальным

При этом мода будет несколько неопределенной, т.к. ее значение будет зависеть от величины групп, точного положения границ групп.

Медиана -это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения, не большие, чем средний вариант, а другая - не меньшие. Справедливо соотношение: сумма абсолютных отклонений членов ряда от медианы есть величина наименьшая

? х-Ме < ? х-A , где А=Ме (т.е. А - любое число, отличное от Ме)

Для ранжированного (выстроенного в порядке возрастания или убывания значения признака) ряда с нечетным числом членов медианой является варианта, расположенная в центре ряда. Для ранжированного ряда с четным числом членов медиана рассчитывается как средняя арифметическая из двух вариант, расположенных в центре ряда.

Для дискретного ряда медиана рассчитывается с помощью накопленных частот: медианой является варианта, которой соответствует накопленная частота, впервые превысившая половину общей суммы частот.

Для интервального ряда с помощью накопленных частот определяют медианный интервал (т.е. интервал, содержащий медиану), которому соответствует накопленная частота, впервые превысившая половину общей суммы частот. Затем конкретное значение медианы рассчитывают по формуле

,

где

хМе - начальное значение медианного интервала

iMe - величина медианного интервала

SMe-1 - сумма накопленных частот, предшествующих медианному интервалу

fMe - частота медианного интервала

Моду и медиану можно также определить графически.

Размещено на http://www.allbest.ru/

81

Мода определяется по полигону (рис.1) или гистограмме (рис.2) распределения. В первом случае мода соответствует наибольшей ординате. Во втором - правую вершину модального прямоугольника соединяют с правым углом предыдущего прямоугольника, а левую вершину - с левым углом последующего прямоугольника. Абсцисса точки пересечения - этих прямых будет модой распределения.

Медиана определяется по кумуляте (рис.3). Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

3. Примеры решения задач

Задача 1. По имеющимся данным о ценах товара в различных фирмах города определить среднюю цену.

4,4 4,3 4,4 4,5 4,3 4,3 4,6 4,2 4,6 4,1

Решение.

Поскольку имеются отдельные значения признака, данные не сгруппированы, применим формулу средней арифметической простой.

Пример 2. Определить среднее количество филиалов банка

Количество филиалов в городе организации, х

Число банков f

xf

Частость, w

xw

2

1

2

0,05

0,1

3

5

15

0,25

0,75

4

8

32

0,4

1,6

5

4

20

0,2

1

6

2

12

0,1

0,6

Итого

20

81

1

4,05

Решение. Данные представлены в виде дискретного ряда распределения, одни и те же значения группировочного признака повторяются несколько раз. Поэтому применим формулу средней арифметической взвешенной. Для расчета заполним столбец хf, и рассчитаем итог по столбцу.

Используя свойства средней арифметической, для расчета вместо частот можно использовать значения частостей.

Пример 3. Рассчитать средний размер прибыли банка.

№ группы

Размер прибыли, х

Число банков (частота) f

x'

x'f

1

3,7

-

4,6

3

4,15

12,45

2

4,6

-

5,5

3

5,05

15,15

3

5,5

-

6,4

7

5,95

41,65

4

6,4

-

7,3

4

6,85

27,4

5

7,3

-

8,2

3

7,75

23,25

Итого

20

119,9

Решение. Варианты осредняемого признака (размера прибыли) представлены не одним числом, а виде интервала «от - до». Для расчета по формуле средней арифметической взвешенной исчисляются середины интервалов x'. Дальнейший расчет производится обычным методом определения средней арифметической взвешенной.

млн. руб.

При расчете можно, так же, как в предыдущем случае, воспользоваться значениями частостей.

Пример 4. По трем обменным пунктам известен курс доллара и выручка от продажи валюты. Рассчитать средний курс доллара по этим обменным пунктам.

Номер обменного пункта

Валютный курс х

Выручка от продажи валюты В

1

28,70

232,47

2

28,68

298,27

3

28,73

149,40

Итого

680,14

Решение.

Статистическая информация не содержит частот по отдельным вариантам, а представлена как их произведение, поскольку выручка от продажи валюты - это произведение валютного курса (х) на объем продаж. Поэтому применим формулу средней гармонической взвешенной.

руб.

Пример 5. Двое рабочих в течение рабочего дня заняты изготовлением одинаковых деталей. Один рабочий тратит на изготовление детали 3 минуты, другой - 6 мин. Определить средние затраты времени на изготовление детали.

Решение.

На первый взгляд, следует применить формулу средней арифметической простой, но в течение рабочего дня ими было изготовлено разное число деталей.

Средние затраты времени на 1 деталь должны определяться по формуле

Затраты времени представляют собой произведение количества изготовленных деталей (f) и времени на изготовление одной детали (x). Поскольку затраты рабочего времени (xf) у обоих рабочих равны (рабочий день), то применим формулу средней гармонической простой.

Итак,

мин.

Пример 6. По имеющимся данным о ценах товара в различных фирмах города определить моду и медиану.

а) 4,4 4,3 4,4 4,5 4,3 4,3 4,6 4,2 4,6

б) 4,4 4,3 4,4 4,5 4,3 4,3 4,6 4,2 4,6 4,1

Решение. В обоих случаях данные не сгруппированы.

а) в данной совокупности чаще всего повторяется значение 4,3, поэтому Мо=4,3

Для определения медианы надо провести ранжирование:

4,2 4,3 4,3 4,3 4,4 4,4 4,5 4,6 4,6

В данном ряду нечетное число членов, варианта, расположенная посередине, является медианой. Ме=4,4

б) в данной совокупности чаще всего повторяется значение 4,3, поэтому Мо=4,3

Для определения медианы проведем ранжирование:

4,1 4,2 4,3 4,3 4,3 4,4 4,4 4,5 4,6 4,6

В данном ряду четное число членов (10), поэтому медиана рассчитывается как средняя арифметическая из двух вариант, расположенных в центре ряда, т.е. Ме=(4,3+4,4)/2=4,35

Пример 7. По имеющимся данным определить моду и медиану

Количество филиалов в городе организации, х

Число банков f

Накопленные частоты S

2

1

1

3

5

6

4

8

14

5

4

6

2

Итого

20

Решение. Данные представлены в виде дискретного ряда распределения.

Наибольшая частота f=8 соответствует варианте х=4, поэтому Мо = 4.

Для нахождения медианы следует рассчитать накопленные частоты. S=14, впервые превысившая 10 (половину общей суммы частот), соответствует варианте х=4. Значит, Ме=4.

Пример 8. По имеющимся данным определить моду и медиану

№ группы

Размер прибыли, х

Число банков (частота) f

Накопленные частоты S

1

3,7

-

4,6

3

3

2

4,6

-

5,5

3

6

3

5,5

-

6,4

7

13

4

6,4

-

7,3

4

5

7,3

-

8,2

3

Итого

20

Решение. Данные представлены в виде интервального ряда распределения ряда распределения.

Для расчета моды требуется сначала определить модальный интервал: наибольшая частота f=7 соответствует интервалу 5,5 - 6,4. Значит, это модальный интервал. Конкретное значение моды определяется по формуле:

Для расчета медианы определим медианный интервал. Для этого рассчитаем накопленные частоты, пока они не превысят половину суммы частот (т.е. 10). S=13 соответствует интервалу 5,5-6,4, значит, это медианный интервал. Конкретное значение медианы найдем по формуле:

4. ПОКАЗАТЕЛИ ВАРИАЦИИ

Различие индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Средняя величина - это абстрактная обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности. Для характеристики совокупностей и исчисленных средних величин важно знать, какая вариация признака скрывается за средними. В некоторых случаях отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются, в таких случаях средняя хорошо представляет всю совокупность. В других случаях, наоборот, отдельные значения далеко отстоят от средней, и средняя плохо представляет совокупность. Колеблемость отдельных значений, степень их близости к средней характеризуют показатели вариации.

1. Абсолютные и средние показатели вариации.

Наиболее простой показатель вариации - размах вариации, определяемый как разность между наибольшим (xmax) и наименьшим (xmin) значениями вариант

R = xmax - xmin

Этот показатель прост в вычислении и указывает на общие размеры вариации, но он не дает представления о степени колеблемости внутри совокупности, т.к. улавливает только крайние отклонения.

Различие всех единиц изучаемой совокупности учитывает среднее линейное отклонение. Среднее линейное отклонение есть средняя арифметическая из отклонений индивидуальных значений от средней (без учета знака этих отклонений):

или

На практике меру вариации более объективно отражает показатель дисперсии. Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической. Другими словами, это средний квадрат отклонений. Дисперсия вычисляется по формуле:

или

Корень квадратный из дисперсии представляет собой среднее квадратическое отклонение. Достоинством этого показателя является то, что он выражается в тех же единицах измерения, что и признак.

или

Дисперсия и среднее квадратическое отклонение являются основными обобщающими показателями вариации. Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше этот показатель, тем лучше средняя арифметическая отражает всю представляемую совокупность.

2. Относительные показатели вариации

Относительные показатели вариации позволяют сравнивать характер рассеивания в различных совокупностях, например, при сравнении разноименных совокупностей, при различных значениях средней. Расчет относительных показателей вариации осуществляют как отношение абсолютного показателя вариации к средней арифметической. Как правило, они рассчитываются в процентах.

Коэффициент осцилляции отражает относительную колеблемость крайних значений вокруг средней

.

Линейный коэффициент вариации характеризует долю усредненного значения абсолютных отклонений от средней величины

Коэффициент вариации - наиболее распространенный показатель колеблемости, используемый для оценки типичности средней.

Чем больше разброс значений признака вокруг средней, тем больше коэффициент вариации и тем менее представительна средняя. Как правило, считают, что если >33%, то это говорит о большой колеблемости признака в совокупности, и совокупность неоднородна.

3. Правило сложения дисперсий

Определить влияние отдельных факторов, характеризующих колеблемость индивидуальных значений признака можно при помощи группировок, подразделив изучаемую совокупность на группы, однородные по изучаемому признаку. При этом можно исчислить следующие виды дисперсий: общую дисперсию, внутригрупповые дисперсии, среднюю из внутригрупповых дисперсий и межгрупповую дисперсию.

Внутригрупповые дисперсии (у1, у2, … ) отражают случайную вариацию, т.е. часть вариации, происходящую влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки.

Средняя из внутригрупповых дисперсий () - это средняя арифметическая взвешенная из внутригрупповых дисперсий.

Межгрупповая дисперсия () - это средний квадрат отклонений групповых средних от общей средней. Характеризует систематическую вариацию, т.е. различия в величине изучаемого (результативного) признака за счет признака-фактора, положенного в основание группировки.

Общая дисперсия () характеризует вариацию признака, которая зависит от всех условий в данной совокупности.

Между указанными видами дисперсий существует соотношение: общая дисперсия равна сумме величин средней из внутригрупповых дисперсий и межгрупповой дисперсии. Формула правила сложения дисперсий:

=+

Правило сложения дисперсий позволяет выявить зависимость результативного признака от определяющих факторов путем соотношения межгрупповой и общей дисперсии:

Здесь - коэффициент детерминации, который показывает долю вариации результативного признака, объясненную влиянием вариации факторного признака.

4. Дисперсия альтернативного признака

Альтернативные признаки - это признаки, которыми обладают одни единицы совокупности и не обладают другие (например, работники либо имеют высшее образование, либо не имеют, т.е. это два взаимоисключающих варианта). При статистическом выражении колеблемости альтернативного признака, наличие признака обозначается 1, а доля единиц совокупности, обладающих данным признаком, обозначается р. Отсутствие признака обозначается 0, доля единиц, не обладающих данным признаком, - q. Очевидно, p+q=1.

Отсюда,

т.е.

Т.о., дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.

5. Характеристика закономерности рядов распределения

В вариационных рядах существует определенная связь в изменении частот и значений варьирующего признака: с увеличением варьирующего признака величина частот вначале возрастает до определенной величины, а затем уменьшается. Такого рода изменения называются закономерностями распределения.

Положение кривой на оси абсцисс и ее рассеивание являются двумя наиболее существенными свойствами кривой. Другими словами, фактическая форма кривой для любого распределения зависит от значений и у. Наряду с ними существует ряд других важных свойств кривой распределения: степень асимметрии, высоко- или низковершинность, которые в совокупности характеризуют форму, или тип, кривой распределения. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисления показателей асимметрии и эксцесса.

Распределение является симметричным, если частоты двух любых вариант, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричного распределения средняя арифметическая, мода и медиана равны между собой:

=Ме=Мо.

Чем больше разница между средней арифметической и модой (медианой), тем больше асимметрия ряда.

Коэффициент асимметрии исчисляется по формуле

Коэффициент асимметрии изменяется от -3 до +3. Если As>0, то кривая распределения имеет длинный правый «хвост», т.е. налицо правосторонняя асимметрия. При этом выполняется соотношение Мо < Ме < .

Если As<0, то асимметрия левосторонняя, кривая распределения имеет длинный левый «хвост». При этом >Ме>Мо.

На практике асимметрия считается значительной, если коэффициент асимметрии превышает по модулю 0,25.

Эксцесс представляет собой вершины распределения вверх или вниз от вершины нормального распределения. Коэффициент эксцесса рассчитывается по формуле

,

где - центральный момент четвертого порядка, или . При нормальном распределении =3, эксцесс нормального распределения равен 0. Обычно, если эксцесс положителен, то распределение островершинное, если отрицательный - то плосковершинное.

6. Примеры решения задач

Пример 1. По имеющимся данным о ценах товара в различных фирмах города рассчитать абсолютные и относительные показатели вариации:

4,4 4,3 4,4 4,5 4,3 4,3 4,6 4,2 4,6 4,1

Решение.

Абсолютные показатели вариации.

R = xmax - xmin= 4,8-4,1=0,7

Для расчета остальных показателей вариации заполним в таблице дополнительные расчетные графы, зная, что =4,4

Цены товара в разных фирмах, х

4,1

0,3

0,09

4,2

0,2

0,04

4,3

0,1

0,01

4,3

0,1

0,01

4,3

0,1

0,01

4,4

0

0

4,4

0

0

4,5

0,1

0,01

4,6

0,2

0,04

4,8

0,4

0,16

Итого

1,4

0,37

Поскольку имеются отдельные значения признака, данные не сгруппированы, применим невзвешенные формулы показателей вариации:

Относительные показатели вариации:

Колеблемость признака в совокупности небольшая, совокупность можно считать однородной по данному признаку.

Пример 2. По имеющимся данным рассчитать абсолютные и относительные показатели вариации:

Количество филиалов в городе организации, х

Число банков f

2

1

2

2

4

4

3

5

1

5

1

5

4

8

0

0

0

0

5

4

1

4

1

4

6

2

2

4

4

8

Итого

20

15

21

Решение.

R = xmax - xmin=6-2=4

Для расчета остальных показателей вариации заполним в таблице дополнительные расчетные графы.

Поскольку данные представлены в виде дискретного ряда распределения, применим взвешенные формулы показателей вариации.

Для удобства расчетов округлим значение =4,05 до =4

Относительные показатели вариации:

Колеблемость признака в совокупности достаточно высокая, но <33%, поэтому совокупность можно считать однородной по данному признаку.

Пример 3. Имеются следующие данные о выработке рабочих и их квалификации.

Выработка

Рабочие

3 разряда

Рабочие

4 разряда

101

5

102

4

103

3

1

104

1

2

105

4

106

3

Определить, влияет ли фактор квалификации рабочего на его выработку, рассчитать коэффициент детерминации.

Решение.

Для расчета коэффициента детерминации воспользуемся правилом сложения дисперсий. Дополним таблицу дополнительными расчетными графами.

Выработка, х

Рабочие

3 разряда, f

xf

Рабочие

4 разряда, f

xf

101

5

505

1

1

5

102

4

408

0

0

0

103

3

309

1

1

3

1

103

2

4

4

104

1

104

2

4

4

2

208

1

1

2

105

4

420

0

0

0

106

3

318

1

1

3

Итого

13

1326

12

10

1049

9

1) Для расчета внутригрупповых дисперсий рассчитаем сначала внутригрупповые средние (по формуле средней взвешенной)

Внутригрупповые дисперсии:

2) Средняя из внутригрупповых дисперсий рассчитывается как средняя арифметическая взвешенная из внутригрупповых дисперсий, где весами выступает численность групп:


Подобные документы

  • Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

    учебное пособие [276,4 K], добавлен 23.11.2010

  • Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

    лекция [985,6 K], добавлен 13.02.2011

  • Понятие статистики, история ее развития. Организация статистики в Российской Федерации. Понятие о статистическом наблюдении. Виды экономических индексов. Виды статистических показателей. Абсолютные и относительные величины. Этапы построения группировки.

    лекция [92,0 K], добавлен 20.10.2010

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

    курсовая работа [667,1 K], добавлен 14.05.2013

  • Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.

    методичка [2,2 M], добавлен 16.02.2011

  • Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.

    реферат [33,9 K], добавлен 20.01.2010

  • Рассмотрение процесса ревизии в бухгалтерии предприятия налоговыми органами с точки зрения статистического наблюдения. Выбор из исходных данных абсолютной статистической величины. Представление статистических данных. Средние величины. Показатели вариации.

    контрольная работа [139,5 K], добавлен 28.05.2015

  • Понятие абсолютной и относительной величины в статистике. Виды и взаимосвязи относительных величин. Средние величины и общие принципы их применения. Расчет средней через показатели структуры, по результатам группировки. Определение показателей вариации.

    лекция [29,1 K], добавлен 25.09.2011

  • Сводка и группировка. Абсолютные и относительные величины. Расчет соотношения потребленного и вывезенного сахара. Сущность и значение средних показателей. Исчисление средней из интервального ряда распределения по методу моментов. Показатели вариации.

    контрольная работа [75,7 K], добавлен 20.09.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.