Теория статистики

Понятие статистики и структура современной статистической науки. Основные организационные формы статистического наблюдения. Показатели вариации, их значение в статистике. Распространение выборочных результатов на генеральную совокупность, ошибки выборки.

Рубрика Финансы, деньги и налоги
Вид курс лекций
Язык русский
Дата добавления 12.12.2011
Размер файла 664,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Число магазинов

Величина интервала,

тыс. руб.

Плотность распределения, ед. (гр.2/гр.3)

1

2

3

4

До 50

25

50

0,5

50 - 120

45

70

0,64

120 - 250

65

130

0,5

250 - 450

80

200

0,4

450 - 980

20

530

0,04

Итого

235

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

4. Статистические показатели

4.1 Понятие, формы выражения и виды статистических показателей.

4.2 Абсолютные показатели.

4.3 Относительные показатели.

4.4 Средние величины.

4.1 Понятие, формы выражения и виды статистических показателей

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определенности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью.

Все статистические показатели разделяются:

1) по охвату единиц совокупности на:

индивидуальные,

сводные,

2) по форме выражения на:

абсолютные,

относительные,

средние,

3) в зависимости от временного фактора на:

- моментные,

- интервальные.

Индивидуальные показатели характеризуют отдельный объект или отдельную совокупность - предприятие, банк и т.д. Примером индивидуального абсолютного показателя является оборот торговой фирмы, совокупный доход домохозяйства и т.д.

На основе соотнесения 2-х индивидуальных абсолютных показателей, характеризующих один и тот же объект или единицу, получают индивидуальный относительный показатель.

Сводные показатели характеризуют группу единиц, представляющую собой часть статистической совокупности или всю совокупность в целом. Сводные показатели подразделяются на: объемные и расчетные.

Объемные показатели получают путем сложения значений признака отдельных единиц совокупности. Различают абсолютные (стоимость основных фондов предприятий отрасли), относительные (фондовооруженность) и средние (средняя стоимость основных фондов) объемные показатели.

Расчетные показатели вычисляются по различным формулам и служат для решения отдельных статистических задач анализа - измерения вариации, характеристики структурных сдвигов и т.д. Расчетные показатели также подразделяются на: абсолютные, относительные и средние.

В зависимости от временного фактора различают моментные и интервальные показатели.

Статистические показатели, характеризующие социально-экономические явления и процессы по состоянию на определенный момент времени (на определенную дату, начало и конец месяца, года) называются моментными. Например, численность населения на 1.01.2009 г., дебиторская задолженность на 15.07.2010 г.

Статистические показатели, характеризующие социально-экономические явления и процессы за определенный период - день, неделю, месяц, квартал, год называются интервальными. Например, производство продукции, сумма страховых выплат и т.д.

4.2 Абсолютные показатели

Исходной, первичной формой выражения статистических показателей являются абсолютные величины. Статистические показатели в форме абсолютных величин характеризуют абсолютные размеры изучаемых процессов и явлений: их массу, площадь, объем и т.д.

Абсолютные статистические показатели всегда являются именованными числами, имеющими определенную размерность, единицы измерения. Они выражаются в натуральных, стоимостных и трудовых единицах измерения.

В международной практике используются следующие натуральные единицы измерения: тонны, килограммы, метры, (кв.м, куб.м), км, шт., литры и т.д.

Условно-натуральные показатели используются, когда какой-либо продукт имеет несколько разновидностей, и общий объем можно определить исходя из общего для всех разновидностей потребительского свойства. Например, различные виды органического топлива переводят в условное топливо с теплотой сгорания 29,3 МДж/г, (7000 Ккал/кг).

В отдельных случаях для измерения используется произведение двух единиц. Например, производство электроэнергии, измеряемое в киловатт-часах и т.д.

В условиях рыночной экономики наибольшее применение имеют стоимостные единицы измерения, дающие денежную оценку социально-экономическим явлениям и процессам (ВВП).

К трудовым единицам измерения, позволяющим учитывать как общие затраты труда на предприятии, так и трудоемкость отдельных операций технологического процесса, относятся человеко-дни и человеко-часы.

4.3 Относительные показатели

Относительный показатель представляет собой результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками социально-экономических процессов и явлений.

При расчете относительного показателя абсолютный показатель, находящийся в числителе, называется текущим (сравниваемым), а показатель, который находится в знаменателе - основанием или базой.

Относительные показатели могут выражаться в коэффициентах, процентах или быть именованными.

Относительные показатели можно разделить на следующие виды:

динамики,

плана,

структуры,

координации,

интенсивности развития,

сравнения.

1) Относительный показатель динамики (ОПД) - это отношение уровня исследуемого процесса или явления за данный период времени (по состоянию на данный момент времени) к уровню этого же процесса или явления в прошлом.

. (4.1)

ОПД показывает во сколько раз текущий уровень превышает предшествующий или какую долю от последнего составляет. Если данный показатель выражен кратным отношением, он называется коэффициентом роста, при домножении этого коэффициента на 100% получают темп роста.

2) Относительный показатель плана (ОПП) используется предприятиями с целью перспективного планирования своей деятельности.

. (4.2)

3) Относительный показатель реализации плана (ОПРП)

. (4.3)

Между рассмотренными выше показателями существует следующая взаимосвязь:

ОПД=ОПП•ОПРП. (4.4)

4) Относительный показатель структуры (ОПС) представляет собой соотношение структурных частей изучаемого объекта и их целого.

. (4.5)

ОПС выражается в долях единицы или в %-х. Структура внешнеторгового оборота в 2010г. представлена в таблице 4.1.

Таблица 4.1

Структура внешнеторгового оборота в 2010г.

Трлн. руб.

% к итогу

А

1

2

Внешнеторговый оборот - всего

в том числе:

экспорт

импорт

896,7

505,6

391,1

100

56,4

43,6

Рассчитанные в графе 2 проценты представляют собой относительные показатели структуры. Сумма всех удельных весов всегда должна быть строго равна 100%.

5) Относительный показатель координации (ОПК) - характеризует соотношение отдельных частей целого между собой.

. (4.6)

При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной. В результате получают, сколько единиц каждой структурной части приходится на 1 единицу (иногда на 100, 1000 и т.д. единиц) базисной структурной части. Из таблицы 4.1 видно, что на каждый триллион рублей импорта приходилось 1,29 трлн. руб. экспорта (505,6 / 391,1).

6) Относительный показатель интенсивности (ОПИ) - всегда является именованной величиной, характеризующей результат сопоставления разноименных показателей. Например:

. (4.7)

7) Относительный показатель сравнения (ОПСр) - представляет собой соотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области и т.п.), но относящихся к одному и тому же периоду.

. (4.8)

4.4 Средние величины

Наиболее распространенной формой статистических показателей, используемой в социально-экономических исследованиях, является средняя величина.

Средняя величина представляет собой обобщенную количественную характеристику статистической совокупности в конкретных условиях места и времени. Сущность средней состоит в том, что она отражает типичный уровень признака и абстрагируется от индивидуальных особенностей, присущих отдельным единицам. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности.

Определить среднюю во многих случаях можно через исходное соотношение средней (ИСС) или ее логическую формулу:

. (4.9)

В каждом конкретном случае для реализации исходного соотношения требуется одна из форм средней величины. Все виды средних объединяются в общей формуле средней степенной (при различной величине ):

1) простая:

, (4.10)

2) взвешенная:

, (4.11)

где - показатель степени, определяющий вид средней величины;

- средняя величина исследуемого явления;

- -ый вариант осредняемого признака ;

- вес -го варианта.

В зависимости от различают следующие виды средних величин:

- средняя гармоническая;

- средняя геометрическая;

- средняя арифметическая;

- средняя квадратическая.

4.4.1 Средняя арифметическая и ее свойства

Наиболее распространенным видом средних величин является средняя арифметическая, которая в зависимости от характера имеющихся данных может быть простой или взвешенной.

Средняя арифметическая простая применяется, когда значение вариантов встречается по одному числу раз.

. (4.12)

Средняя арифметическая взвешенная применяется, когда отдельное значение признака повторяется неодинаковое количество раз, т.е. она используется в расчетах средней по сгруппированным данным или вариационным рядам, которые могут быть дискретными и интервальными.

. (4.13)

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений переходят от интервалов к их серединам.

Например, по данным таблицы 4.2 определим величину среднедушевого дохода по городу.

Таблица 4.2

Распределение населения города в 1-м квартале 2010г. по уровню среднедушевых денежных доходов

Среднедушевой денежный доход в среднем за месяц, тыс. руб.

Численность населения, % к итогу

До 5000

10,5

5000-10000

30,2

10000 - 15000

24,3

15000 - 20000

16,7

20000 - 25000

13,2

Свыше 25000

5,1

Итого

100

. (4.14)

Так как мы имеем интервальный ряд, то определяем середины интервалов. При этом величину первого интервала условно приравниваем к величине второго, а величину последнего интервала приравниваем к величине предпоследнего. В результате получаем следующие середины интервалов:

Роль численности населения выполняет его доля в общем итоге, выраженная в процентах. Для расчета воспользуемся формулой средней арифметической взвешенной:

Средняя арифметическая обладает следующими свойствами:

1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты:

. (4.15)

2. Свойство для отклонений: сумма отклонений вариант от средней арифметической равно нулю:

. (4.16)

3. Свойство для вариант: если все осредняемые уменьшить или увеличить на постоянное число , то средняя арифметическая соответственно уменьшится или увеличится на ту же величину:

. (4.17)

4. Если варианту увеличить или уменьшить в какое-то число раз, то в то же число раз увеличится или уменьшится среднее арифметическое:

. (4.18)

5. Свойство для частот: если частоты (веса) ряда увеличить или уменьшить на произвольное число, то средняя арифметическая от этого не изменится:

. (4.19)

6. Если веса или частоты всех вариант равны между собой, то средняя арифметическая взвешенная будет равна средней арифметической простой:

, если . (4.20)

Знание основных свойств средней арифметической позволяет упростить ее вычисление, особенно для вариационного ряда с равными интервалами, т.е. способом моментов:

, (4.21)

где - интервал;

- серединное значение интервала;

- условная величина;

- частота признака.

За условную величину () принимают варианту, занимающую серединное положение в данном ряду и имеющую наибольшую частоту.

Доминирующее серединное положение в ряду:

, (4.22)

.

Серединное из значений называется моментом первого порядка.

4.4.2 Другие виды средних

1. Средняя гармоническая - это величина, обратная средней арифметической, когда . Когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, применяется формула средней гармонической взвешенной:

, где . (4.23)

Когда объемы явлений, т.е. произведения (), по каждому признаку равны, применяется средняя гармоническая простая:

, (4.24)

где - сумма обратных значений вариант;

- число вариант.

Например, по данным таблицы 4.3 рассчитаем среднюю заработную плату в целом по трем предприятиям.

Таблица 4.3

Заработная плата на предприятиях АО в 2010 г.

Предприятие

Численность промышленно-производственного персонала, чел.

Средняя заработная плата, руб.

1

540

8500

2

275

12600

3

458

15100

Итого

1273

?

Определим исходное соотношение средней для показателя «Средняя заработная плата»:

. (4.25)

Нам известен знаменатель исходного соотношения, но не известен числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на численность ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной:

Допустим, что нам известны только данные о фонде заработной платы и средней заработной плате персонала (таблица 4.4), т.е. известен числитель исходного соотношения, но не известен его знаменатель.

Таблица 4.4

Месячный фонд заработной платы и средняя заработная плата на предприятиях АО в 2010 г.

Предприятие

Месячный фонд заработной платы, тыс. руб.

Средняя заработная плата, руб.

1

4590,0

8500

2

3465,0

12600

3

6915,8

15100

Итого

14970,8

?

Численность работников по каждому предприятию можно получить делением фонда заработной платы на среднюю заработную плату. Тогда для расчета средней заработной платы мы будем использовать формулу средней гармонической взвешенной:

2. Средняя геометрическая - это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда , . Средняя геометрическая используется в расчетах среднегодовых темпов роста и для определения равноудаленной величины от минимального и максимального значений признака.

1) средняя геометрическая простая:

, (4.26)

2) средняя геометрическая взвешенная:

. (4.27)

В ряде случаев в экономической практике возникает потребность расчета среднего размера признака, выраженного в квадратических и кубических единицах измерения (например, для вычисления средней величины квадратных участков; средних диаметров труб и т.п.) средняя кубическая (при определении средней длины кубов).

3. Средняя квадратическая:

- простая является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

, (4.28)

- взвешенная:

. (4.29)

4. Средняя кубическая:

- простая:

, (4.30)

- взвешенная:

. (4.31)

Заметим, что средние квадратическая и кубическая имеют ограниченное применение в практике статистики.

4.4.3 Структурные средние величины

Для характеристики структуры совокупности применяются особые показатели - структурные средние. К таким показателям относятся мода и медиана.

Модой () называется чаще всего встречающийся вариант.

В дискретном ряду мода - это варианта с наибольшей частотой. В интервальном ряду модой считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частотность).

Мода для интервального ряда определяется по формуле:

, (4.32)

где - нижняя граница модального интервала;

- величина модального интервала;

- частота, соответствующая модальному интервалу;

- частота, предшествующая модальному интервалу;

- частота интервала, следующего за модальным.

Медиана () - это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньше, чем средний вариант, а другая - больше.

Для ранжированного ряда (т.е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является варианта, расположенная в центре ряда. Например, данные о стаже работы семи продавцов: 1,2,2,3,5,7,10 - медианой является 4-ая варианта - 3г.

Для ранжированного ряда с четным числом членов медианой будет средняя арифметическая из двух смежных вариант. Например: в бригаде продавцов из 6 человек распределение по стажу работы следующее: 1,3,4,5,7,9 - медиана = (4+5)/2 =4,5г.

. (4.33)

Для интервального вариационного ряда медиана определяется по формуле:

, (4.34)

где - нижняя граница медианного интервала;

- величина медианного интервала;

- полусумма частот ряда;

- сумма накопленных частот, предшествующих медианному интервалу;

- частота медианного интервала.

Медианный интервал - это интервал, где сумма накопленных частот составляет половину (или больше) всей суммы частот ряда.

Пример: Для приведенного в таблице 4.5 распределения рабочих по размеру заработной платы (гр.1, 2) определить моду и медиану.

Перепишем этот ряд и рассчитаем в нем накопленные частоты:

Таблица 4.5

Распределение рабочих по размеру заработной платы

Месячная заработная

плата, руб.

Число рабочих,

Накопленная частота,

8000-8500

10

10

8500-9000

20

30

9000-9500

48

78

9500-10000

60

138

10000-10500

42

180

10500-11000

20

200

Итого

200

-

Для нахождения моды в данном ряду определяем наибольшую частоту - 60. Этому значению частоты соответствует интервал 9500 - 10000. Следовательно, это и есть модальный интервал. В соответствии с формулой (4.32) мода будет равна:

т.е. наиболее часто в данной совокупности рабочих встречается заработная плата в размере 9700 руб.

Для нахождения медианы сначала определяем ее порядковый номер:

По накопленным частотам видим, что 100-я единица находится также в интервале 9500 - 10000. Ее значение определяется по формуле (4.34):

т.е. делаем вывод по медиане, что половина рабочих получает заработную плату ниже 9683,3 руб., а половина - выше.

5. Показатели вариации

5.1 Понятие вариации и ее значение.

5.2 Показатели вариации и их значение в статистике.

5.3 Дисперсия: свойства, методы расчета.

5.4 Виды дисперсии и закон сложения дисперсий.

5.1 Понятие вариации и ее значение

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Исследование вариации в статистике имеет большое значение, т.к. помогает познать сущность изучаемого явления. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.д.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Поэтому для характеристики колебания признака используют показатели вариации.

5.2 Показатели вариации и их значение в статистике

Для измерения вариации признака в совокупностях используют следующие обобщающие показатели вариации: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

1. Самым распространенным абсолютным показателем является размах вариации (), определяемый как разность между наибольшим () и наименьшим () значениями вариантов.

. (5.1)

Этот показатель прост для расчета, что и обусловило его широкое распространение. Однако он улавливает только крайние отклонения и не отражает отклонений всех вариант в ряду.

2. Для обобщающей характеристики распределения отклонений рассчитывают среднее линейное отклонение , определяемое как средняя арифметическая из отклонений индивидуальных значений от средней, без учета знака этих отклонений:

- невзвешенное среднее линейное отклонение:

, (5.2)

- взвешенное среднее линейное отклонение:

. (5.3)

В этих формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль. Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко, только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

3. Меру вариации более объективно отражает показатель дисперсии ( - средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат:

- невзвешенная:

, (5.4)

- взвешенная:

. (5.5)

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия.

4. Корень квадратный из дисперсии «среднего квадрата отклонений» представляет собой среднее квадратическое отклонение:

. (5.6)

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Чем меньше значения дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

В статистической практике часто возникает необходимость сравнения вариаций различных признаков (например, сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы).

Для осуществления такого рода сравнений используют следующие относительные показатели:

Коэффициент осциляции - отражающий относительную колеблемость крайних значений признака вокруг средней:

. (5.7)

Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:

. (5.8)

Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средней величины:

. (5.9)

Если , то это говорит о большой колеблемости признака в изучаемой совокупности.

5.3 Дисперсия: свойства и методы расчета

Дисперсия обладает рядом свойств, которые позволяют упростить ее расчеты.

1) Если из всех значений вариант отнять какое-то постоянное число , то средний квадрат отклонений от этого не изменится:

. (5.10)

2) Если все значения вариант разделить на какое-то постоянное число , то средний квадрат отклонений уменьшится от этого в раз, а среднее квадратическое отклонение - в раз.

. (5.11)

3) Если исчислить средний квадрат отклонений от любой величины , которая в той или иной степени отличается от средней арифметической , то он всегда будет больше среднего квадрата отклонений , исчисленного от средней арифметической:

. (5.12)

А именно средний квадрат отклонений при этом будет больше на квадрат разности средней и этой условно взятой величиной, т.е. на :

. (5.13)

Дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда приравнивается к нулю, формула принимает вид:

. (5.14)

Значит, средний квадрат отклонений равен среднему квадрату значений признака минус квадрат среднего значения признака.

Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

, (5.15)

где - дисперсия, исчисленная по способу моментов;

- величина интервала,

- новые (преобразованные) значения вариантов ( - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой),

- момент второго порядка,

- квадрат момента первого порядка.

Расчет дисперсии по формуле (5.15) менее трудоемок, чем по формулам (5.4) и (5.5).

5.4 Виды дисперсий и закон сложения дисперсий

Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

Выделяют общую, межгрупповую и внутригрупповую дисперсии.

Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности:

, (5.16)

где - общая средняя для всей изучаемой совокупности.

Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней :

, (5.17)

где - средняя по отдельным группам;

- общая средняя;

- численность отдельных групп.

Средняя внутригрупповая дисперсия характеризует случайную вариацию в каждой группе. Эта вариация возникает под влиянием других неучитываемых факторов и не зависит от условия (признака-фактора), положенного в основу группировки:

. (5.18)

Существует закон, связывающий три вида дисперсии (правило сложения дисперсий): общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

. (5.19)

Очевидно, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (например, квалификационного разряда) на изучаемый признак (количество изготовленных деталей).

Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации ():

. (5.20)

Эмпирический коэффициент детерминации показывает долю вариации результативного признака под влиянием факторного признака (остальная часть общей вариации обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент равен нулю, а при функциональной связи - единице.

Например, если , это значит, что на 66,6% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 33,4% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это корень квадратный из эмпирического коэффициента детерминации:

. (5.21)

Оно показывает тесноту связи между группировочным и результативным признаками , как и , может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование вариации.

Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае, , т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к 1, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношением Чэддока:

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Сила связи

слабая

умеренная

заметная

тесная

весьма тесная

, что свидетельствует о тесной связи между квалификацией рабочих и их производительностью труда.

6. Выборочный метод в статистике

6.1 Понятие о выборочном наблюдении, его задачи.

6.2 Ошибки выборки.

6.3 Распространение выборочных результатов на генеральную совокупность.

6.1 Понятие о выборочном наблюдении, его задачи

статистика вариация совокупность выборка

В статистической практике самым распространенным является выборочное наблюдение. Выборочное наблюдение - это такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.

Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели - генеральными.

Совокупность отобранных единиц именуют выборочной совокупностью, и все ее обобщающие показатели - выборочными.

Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:

- экономия времени и средств в результате сокращения объема работы;

- сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

- необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

- достижение большей точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе - качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборки. При повторной выборке ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует, т.е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.

В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.

Собственно - случайный отбор относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие-либо группы) посредством жеребьевки. Примером собственно- случайного отбора могут служить тиражи выигрышей.

Механический отбор состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные группы, производится таким образом, что из каждой группы в выборку отбирается лишь одна единица. Чтобы избежать систематической ошибки, отбираться должны единица, которая находится в середине каждой группы.

При организации механического отбора единицы генеральной совокупности располагаются по порядку (по алфавиту, местоположению, в порядке возрастания и т.д.). Затем отбирают заданное число единиц механически, через определенный интервал. При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному.

Типический отбор - отбор, при котором неоднородная генеральная совокупность предварительно разбивается на однородные (типические) группы (при обследовании предприятий такими группами могут быть отрасль, подотрасль, форма собственности), из которых случайно производят отбор необходимой численности выборки.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность

Серийный отбор - это случайный отбор не отдельных единиц, а их равновеликих групп (серий). Осуществляется для того, чтобы в таких группах подвергались наблюдению все единицы без исключения.

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:

- объем генеральной совокупности (число входящих в нее единиц);

- объем выборки (число обследованных единиц);

- генеральная средняя (среднее значение признака в генеральной совокупности);

- выборочная средняя;

- генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);

- выборочная доля;

- генеральная дисперсия (дисперсия признака в генеральной совокупности);

- выборочная дисперсия того же признака;

- среднее квадратическое отклонение в генеральной совокупности;

- среднее квадратическое отклонение в выборке.

Доля выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

. (6.1)

Так, при 5% - ной выборке из партий деталей в 1000 ед. объем выборки составляет 50 ед., а при 10% - ной выборке - 100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальным значениям, в результате - выборочное наблюдение становится достаточно точным.

Собственно - случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода, и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).

Выборочная доля (), или частость, определяется отношением числа единиц, обладающих изучаемым признаком , к общему числу единиц выборочной совокупности :

. (6.2)

Например, если из 100 деталей выборки (), 95 деталей оказались стандартными (), то выборочная доля

6.2 Ошибки выборки

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:

- для средней количественного признака:

, (6.3)

- для доли (альтернативного признака):

(6.4)

Чем больше значение ошибки выборки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок - среднюю ошибку выборки.

При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего, объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией или - для альтернативного признака. Чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выработки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (, ) неизвестны, и, следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (6.3), (6.4).

При случайном повторном отборе средние ошибки теоретически рассчитываются по следующим формулам:

- для средней количественного признака:

, (6.5)

- для доли (альтернативного признака):

(6.6)

Поскольку практически дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются значением дисперсии , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно воспроизводит характеристики генеральной совокупности.

Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:

- для средней количественного признака:

, (6.7)

- для доли (альтернативного признака):

. (6.8)

Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и, следовательно, средние ошибки выборки, рассчитанные по формулам (6.7) и (6.8), будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборочную следующим соотношением:

. (6.9)

Так как при достаточно больших - величина, близкая к единице, то можно принять, что , а, следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (6.7) и (6.8). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент и исчислять среднюю ошибку малой выборки по формуле:

. (6.10)

При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на , поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:

- для средней количественного признака:

, (6.11)

- для доли (альтернативного признака):

. (6.12)

Так как всегда меньше , то дополнительный множитель всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5% - ной выборке он равен 0,95; при 2% - ной - 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (6.7) и (6.8) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности неизвестно или безгранично, или когда очень мало по сравнению с , и введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокупности предварительно располагают (обычно в списке) в определенном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого - либо показателя, не связанного с изучаемым свойством, и т.д.), после отбирают заданное число единиц механически, через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2% - ной выборке отбирается и проверяется каждая 50-я единица (1:0,02), при 5% - ной выборке - каждая 20-я единица (1:0,05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно - случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно - случайной бесповторной выборки (6.11), (6.12).

Для отбора единиц из неоднородной совокупности применяется, так называемая типическая выборка, которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно - случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдельных отраслях экономики, производительности труда рабочих предприятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

При определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

- для средней количественного признака:

а) повторный отбор:

, (6.13)

б) бесповторный отбор:

, (6.14)

- для доли (альтернативного признака):

а) повторный отбор:

, (6.15)

б) бесповторный отбор:

, (6.16)

где - средняя из внутригрупповых дисперсий по выборочной совокупности;

- средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.

Серийная выборка предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

а) повторный отбор:

, (6.17)

б) бесповторный отбор:

, (6.18)

где - число отобранных серий;

- общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют следующим образом:

(6.19)

где - средняя - й серии;

- общая средняя по всей выборочной совокупности.

Средняя ошибка выборки для доли (альтернативного признака) при серийном отборе:

а) повторный отбор

, (6.20)

б) бесповторный отбор

, (6.21)

Межгрупповую (межсерийную) дисперсию доли серийной выборки определяют по формуле:

(6.22)

где - доля признака в -й серии;

- общая доля признака во всей выборочной совокупности.

В практике статистических обследований помимо рассмотренных ранее способов отбора применяется их комбинация (комбинированный отбор).

6.3 Распространение выборочных результатов на генеральную совокупность

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.

Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной, т.е. может быть меньше средней ошибки , равно ей или больше ее.

Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью ().

Предельную ошибку выборки для средней () при повторном отборе можно рассчитать по формуле:

, (6.23)

где - нормированное отклонение - «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;

- средняя ошибка выборки.

Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:

(6.24)

При случайном бесповторном отборе в формулах расчета предельных ошибок выборки (6.23) и (6.24) необходимо умножить подкоренное выражение на .

Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.

На основании теоремы П.Л. Чебышева (с уточнениями А.М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.

Применительно к нахождению среднего значения признака эта теорема может быть записана так:

(6.25)

а для доли признака:

(6.26)

где . (6.27)

Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.

Значения функции при различных значениях как коэффициента кратности средней ошибки выборки, определяется на основе специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема (см. табл.6.1), которыми воспользуемся в дальнейшем при решении задач.

Таблица 6.1

Наиболее часто применяемые значения для выборок ()

1,000

1,960

2,000

2,580

3,000

0,683

0,950

0,954

0,990

0,997

Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95).

Так, при предельная ошибка составит , следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3 % случаев ошибка репрезентативности не выйдет за пределы . При с вероятностью 0,954 она не выйдет за пределы , при c вероятностью 0,997 - за пределы и т.д.

Как видно из приведенных выше значений функции (см. последние значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т.е. , крайне мала и равна 0,003, т.е. 1 - 0,997. такие маловероятные события считаются практически невозможными, а потому величину можно принять за предел возможной ошибки выборки.

Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

- для средней:

, (6.28)

- для доли:

(6.29)

Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .

Аналогичным образом может быть записан доверительный интервал генеральной доли:

Наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:

- для средней, %:

, (6.30)

- для доли, %:

. (6.31)

Рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах.

Задача 6.1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням () со стандартным отклонением 6 дней ().

Необходимо с вероятностью определить предельную ошибку выборочной средней продолжительности расчетов предприятий данной корпорации.

Решение:

Предельную ошибку определяем по формуле повторного отбора (6.23), так как численность генеральной совокупности неизвестна. Из представленных значений (см. табл.6.1) для вероятности необходим .

Следовательно, предельная ошибка выборки, дней:

Предельная относительная ошибка выборки, %:

.

Генеральная средняя будет равна , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:

.

Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.

Задача 6.2. Среди выборочного обследованных 1000 семей региона по уровню душевого дохода (выборка 2% - ная, механическая) малообеспеченных оказалось 300 семей.


Подобные документы

  • Загальна характеристика Управління статистики в Сумській області. Аналіз роботи відділу статистики фінансів управління міжгалузевої статистики підприємств. Методика заповнення і перевірки форм звітності по статистиці. Заходи поліпшення умов праці.

    отчет по практике [327,9 K], добавлен 24.12.2012

  • Задачи статистики цен. Система показателей статистики цен. Принципы и методы регистрации цен. Методы расчета и анализа индексов цен. Основная задача статистики цен - отразить и проанализировать состояние и поведение цен.

    курсовая работа [55,0 K], добавлен 26.05.2006

  • Понятие и задачи статистики финансов предприятий и организаций. Система показателей статистики финансов. Определение валовой прибыли, стоимости реализованной продукции, уровня общей рентабельности. Прирост прибыли за счет изменения себестоимости.

    лекция [30,8 K], добавлен 13.02.2011

  • Экономическая сущность инвестиций, показатели теории статистики и методология их исчисления. Источники статистической информации об инвестициях. Практический анализ и группировка предприятий по факторному признаку, оценка статистических показателей.

    курсовая работа [108,4 K], добавлен 20.10.2009

  • Предмет, метод и задачи статистики финансов. Современная организация статистики финансов. Основы финансово-экономических расчетов. Статистика государственного бюджета. Статистика финансовых результатов хозяйственной деятельности. Банковская статистика.

    методичка [77,3 K], добавлен 10.10.2008

  • Понятие и сущность денежного обращения, основные показатели финансовой статистики. Статистическое исследование, сводка и группировка данных. Изучение динамики социально-экономических явлений. Использование выборочного и индексного метода в исследованиях.

    контрольная работа [105,9 K], добавлен 03.02.2011

  • Новая форма статистической или периодической статистической декларации, подаваемой в центр статистического декларирования или в пункт таможенного оформления товаров. Сведения, подлежащие указанию в данном документе и порядок его заполнения и регистрации.

    реферат [39,5 K], добавлен 19.01.2013

  • Предмет, метод та показники статистики фінансів. Статистика державного бюджету. Поняття та завдання статистики державного бюджету. Система показників статистики державного бюджету. Статистика кредиту. Предмет кредиту та завдання його вивчення.

    контрольная работа [47,3 K], добавлен 03.01.2009

  • Понятие, сущность, признаки, классификация и основные причины возникновения налоговых правонарушений, их отличия от налоговых преступлений. Анализ статистики налоговых правонарушений в РФ, а также практическое изображение наиболее распространенных из них.

    курсовая работа [44,6 K], добавлен 02.06.2010

  • Национальное богатство: понятие и содержание, структура и элементы. Статистика природных ресурсов и охраны окружающей среды. Понятие, виды рядов динамики, основные показатели изменения их уровня, вариации. Расчет показателей состояния основных фондов РФ.

    курсовая работа [136,1 K], добавлен 17.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.