Статистика, предмет и задачи
Предмет и задачи статистики, основные понятия. Основные организационные формы, виды, способы статистического наблюдения, сводка, группировка. Изучение динамики социально-экономических процессов и явлений. Статистические методы прогнозирования и анализа.
Рубрика | Экономика и экономическая теория |
Вид | курс лекций |
Язык | русский |
Дата добавления | 19.02.2010 |
Размер файла | 563,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
1. Основные виды статистических показателей
На самой первой лекции уже давалось определение понятия «статистический показатель». (Студентам предлагается его вспомнить).
Статистический показатель - количественная характеристика свойств (признаков) статистических единиц или всей статистической совокупности.
Статистические показатели делятся на индивидуальные и обобщающие.
Индивидуальный показатель характеризует свойства отдельной единицы.
Обобщающий показатель характеризует всю статистическую совокупность в целом по одному или нескольким признакам.
Обобщающие показатели делятся на учетно-оценочные, аналитические и прогнозные.
Кроме того, обобщающие показатели подразделяются на абсолютные и относительные.
Учетно-оценочные показатели характеризуют состояние изучаемого явления в конкретный момент времени и конкретном месте. На втором этапе статистического исследования в результате сводки и группировки результатов статистических наблюдений рассчитывают прежде всего обобщающие учетно-оценочные показатели.
Аналитические показатели - это итог дополнительной количественной обработки учетно-оценочных показателей. Аналитические показатели характеризуют типичные черты изучаемых явлений, причинно-следственные взаимосвязи между отдельными явлениями, тенденции и закономерности их развития, позволяют выявить возможности сознательного регулирования наблюдаемых явлений. Их расчет выполняется на третьем этапе статистического исследования и служит основой заключительных выводов.
На последующих лекциях мы будем более подробно изучать пять основных групп аналитических показателей:
1) средние величины,
2) показатели вариации,
3) показатели оценки тесноты статистических связей (или показатели корреляции),
4) показатели анализа динамики,
5) статистические индексы, которые можно назвать показателями анализа динамики структуры (структурной динамики).
Мы начнем с изучения средних величин, которые являются основой для расчета многих других аналитических показателей.
Прогнозные показатели - это результат прогнозирования (то есть распространения на будущее) выявленных при анализе тенденций и закономерностей развития изучаемых явлений. До недавнего времени в отечественной статистике расчету прогнозных показателей уделялось мало внимания, так как считалось, что на базе результатов статистических исследований должны прежде всего разрабатываться целевые (плановые) показатели социально-экономического развития. В настоящее время в статистических исследованиях повсеместно используются статистические методы прогнозирования для более углубленного исследования развития явлений во времени. На заключительном этапе статистических исследований очень часто выполняется не только анализ, но и прогноз развития изучаемых явлений.
Абсолютные показатели характеризуют абсолютные размеры изучаемого явления. Они являются именованными числами, которые имеют определенную размерность, конкретные единицы измерения (натуральные или стоимостные).
Относительные показатели - это результат сравнения (сопоставления) двух абсолютных показателей, который рассчитывается как частное от их деления друг на друга. Существуют различные виды относительных показателей, классификация которых рассмотрена ниже.
2. Классификация относительных показателей
Каждый относительный показатель является частным от деления двух абсолютных показателей. В зависимости от того, какие именно абсолютные показатели сравниваются между собой, разделяются различные виды относительных показателей. Классификацию относительных показателей см. на схеме 4.1.
Первая группа относительных показателей - это показатели, которые измеряются в единицах с одинаковым наименованием (т.е. являются одноименными числами). Тогда при делении эти единицы сокращаются, и в результате получаются относительные показатели, не имеющие конкретных единиц измерения («безразмерные» числа: коэффициенты, доли, проценты). Эта группа показателей подразделяется еще на несколько групп, в зависимости от того, в направлении сравниваются между собой различные показатели с одинаковым наименованием.
Вторая группа - это относительные показатели, рассчитываемые в результате сопоставления разноименных величин, то есть друг на друга делятся абсолютные показатели, измеренные в различных единицах, то в результате получаются числа с «двойными» единицами измерения, например, руб./чел. (доход на душу населения) или кг/чел (производство на душу населения). Вторая группа показателей называется показателями интенсивности, так как они характеризуют интенсивность распределения абсолютных размеров каких-то явлений по единицам статистической совокупности, характеризующей абсолютные размеры другого явления.
Схема 4.1
Классификация относительных показателей
Показатели динамики - это результат сравнения во времени, то есть двух показателей, измеренных за различные периоды времени (годы, месяцы, дни недели и т.п.)
Показатели наглядности - это результат сравнения в пространстве (по территориям) показателей, относящихся, например, к разным регионам, городам, странам и т.д. Они получили такое наименование, поскольку их значения часто изображают наглядно на географических картах.
Показатели структуры характеризуют соотношение части и целого, а показатели координации - соотношение отдельных частей целого между собой.
В особую группу выделены показатели выполнения плана, то есть сравнения плановых и отчетных показателей (очерчены пунктиром). Эти показатели сейчас используются в основном только на отдельных предприятиях и не имеют такого определяющего значения, как раньше.
3. Понятие «средняя величина» и основные виды средних величин в статистике
Понятие «средняя величина»
Средняя величина - это обобщающий аналитический показатель, характеризующий типичные черты статистических единиц изучаемой статистической совокупности по какому-либо одному из признаков.
Средние величины можно рассчитывать по-разному, например, путем простого суммирования различных значений признака и их деления на общее число различных значений. Но существуют и более сложные способы расчета средних величин, каждый из которых используется в зависимости от ситуации (условий поставленной задачи, цели исследования).
Различные виды средних величин и способы их расчета
Для расчета средней величины обычно строится вариационный ряд, то есть перечень различных значений данного признака, встречающихся у единиц обследованной статистической совокупности, расположенных в порядке их возрастания.
Каждому отдельному значению соответствует определенная частота его повторяемости, то есть сколько раз одно и то же значение встречается у разных статистических единиц. (Например, если у двух статистических единиц значение данного признака оказалось одинаковым, то соответствующая частота равна 2. Если значения признака совпали у трех статистических единиц, частота равна 3 и т.д.).
Вариационный ряд представляет собой, по существу, два параллельных ряда данных: ряд числовых значений отдельных признаков и ряд частот, соответствующих отдельным значениям, т.е.:
Вариационный ряд:
x: |
x1 |
x2 |
x3 |
x4 |
… |
xn-1 |
xn |
|
m: |
m1 |
m2 |
m3 |
m4 |
… |
mn-1 |
mn |
Если при расчете средней величины не учитывается частота повторяемости одинаковых значений, то такая средняя величина называется простой. Если же каждое из значений признака учитывается столько раз, сколько данное значение повторяется, то такая величина называется взвешенной. Обычно считается, что взвешенные величины лучше характеризуют размер изучаемого явления, поскольку они учитывают с большим «весом» наиболее часто встречающиеся, как бы наиболее вероятные значения. Формулы для расчета различных видов средних приведены в табл. 4.1.
Таблица 4.1
Различные виды средних величин и способы их расчета
№п/п |
Наименование средней величины |
Формулы для расчета средних величин |
||
Степенные средние |
Простые средние |
Взвешенные средние |
||
1. |
Средняя арифметическая |
|||
2. |
Средняя квадратическая |
|||
3. |
Средняя гармоническая |
|||
4. |
Средняя геометрическая |
= |
||
5. |
Обобщеннаястепеннаясредняя |
|||
Структурные средние |
||||
6. |
Мода (Мо) |
Мода - это наиболее часто встречающееся значение признака, то есть такое значение xi*, для которого частота mi максимальна |
||
7. |
Медиана (Ме) |
Медиана - это условная величина, которая делит всю статистическую совокупность обследованных единиц примерно на две равные части (по сумме частот). Значения признака у единиц в первой части совокупности меньше медианы, а во второй части - больше |
В табл. 4.1 приняты следующие обозначения:
xi (i = 1, 2, 3, ..., n ) - различные значения признака x в вариационном ряду;
mi (i = 1, 2, 3,..., n ) - частоты повторяемости одинаковых значений;
Wi = mi xi - условное произведение частоты на значение признака;
Ni = У mi - сумма частот (или общее число единиц обследованной статистической совокупности).
Каждая из приведенных в табл. 4.1 средних величин имеет свои области применения, то есть используется в различных случаях.
Наиболее часто в статистических расчетах используется средняя арифметическая, причем наиболее целесообразен ее «взвешенный» вариант, поскольку он учитывает, насколько часто в данном вариационном ряду встречается данное значение признака.
Средняя квадратическая обычно используется в расчетах одного из показателей вариации (среднего квадратического отклонения) - о котором речь пойдет в следующем разделе главы.
Средняя гармоническая используется в тех случаях, когда нет возможности подсчитать частоты mi отдельных значений признака (отсутствуют соответствующие данные). Достаточно часто такое встречается в статистике торговли - например, имеются данные об общем объеме товарооборота (то есть о продаже товаров в стоимостном выражении), но нет данных о физическом объеме продажи отдельных видов товаров (то есть в натуральном выражении).
Средняя геометрическая используется при расчете средних показателей динамики (темпов роста или прироста), о которых речь пойдет ниже.
Вводя в формулу обобщенной степенной средней различные значения показателя степени, мы можем получить другие, частные виды средних. Расчет различных видов средних величин более подробно изучается на практических занятиях.
Для расчета простой и взвешенной средней арифметической (по признаку x) обычно строится вспомогательная таблица следующего вида (табл. 4.2):
В табл. 4.2 те же обозначения, что и в табл. 4.1.
Таблица 4.2
Вспомогательная таблица для расчета простой и взвешенной средней арифметической
Значения признака |
Частотыповторяемости |
Произведения значений на частоты |
|
Xi |
mi |
mi xi |
|
… |
|||
У |
Расчет средней гармонической удобнее всего рассмотреть на примере решения следующей задачи.
Пример
Предположим, что в течение недели в магазине была продана обувь различных категорий (ассортиментных позиций, артикулов, моделей). Известны данные о примерном диапазоне изменения цен в пределах данной ассортиментной позиции и объем реализации в стоимостном (денежном) выражении. Но нет данных о продаже в натуральном выражении (количестве пар проданной обуви). Требуется определить среднюю цену одной пары проданной обуви. Исходные данные для решения задачи приведены в табл. 4.3.
Таблица 4.3
Исходные данные и вспомогательные расчеты для определения средней гармонической
Ассортиментнаяпозиция |
Диапазон цен (руб.) |
Средняя цена винтервале, |
Объем реализации ( руб.), Wi |
Вспомогательные расчеты, Wi / |
|
Обувь зимняя |
800-2400 |
1600 |
32 000 |
20 |
|
Обувь летняя |
350-1150 |
750 |
30 000 |
40 |
|
Обувь спортивная |
600-2200 |
1400 |
42 000 |
30 |
|
Обувь домашняя |
80-320 |
200 |
20 000 |
100 |
|
Итого (У): |
124 000 |
190 |
Средняя цена одной пары проданной обуви находится по формуле взвешенной средней гармонической:
= = 124000 / 190 = 652,6 руб.
Полученный результат говорит о том, что наибольшим спросом пользуется обувь по относительно невысокой цене.
Более подробно о структурных средних (т.е. о моде и медиане) рассказывается в следующей лекции.
Домашнее задание
В качестве домашнего задания студентам предлагается рассчитать простую и взвешенную среднюю арифметическую величину различных признаков (рост, вес, возраст) отдельно по всей статистической совокупности, а также отдельно для группы женщин и группы мужчин на основе исходных данных, приведенных в домашнем задании к предыдущей лекции.
Пример расчета.
Составляем ранжированный (то есть упорядоченный по возрастанию признака) ряд распределения женщин по росту:
x3 |
m |
|
(Рост) |
(число женщин) |
|
160 |
1 |
|
164 |
3 |
|
165 |
1 |
|
166 |
2 |
|
168 |
1 |
Рассчитываем простую среднюю арифметическую, складывая все различные значения признака x3, без учета частоты их повторения, и делим на число различных значений, т.е. на 5.
Получаем (160+164+165+166+168)/5 = 164,6
Рассчитываем взвешенную среднюю арифметическую, умножая различные значения признака x3 на частоты m их повторяемости, то есть на число женщин с одинаковыми значениями признака, а затем суммируя. Потом делим полученную сумму на число женщин или на сумму частот: У m = 8.
Получаем (160+164Ч3+165+166Ч2 + 168)/8 = 164,625
В данном случае отличие простой средней арифметической от средней взвешенной весьма незначительно.
ЛЕКЦИЯ № 5
ТЕМА «Показатели вариации и структурные характеристики вариационного ряда»
Введение
На прошлой лекции мы изучили основные виды средних величин и способов их расчета.
Средняя величина является одним из важнейших аналитических показателей, однако знание только средних величин не позволяет выполнить углубленное статистическое исследование, характеризующее то или иное явление. Необходимо знать не только среднюю величину того или иного показателя, но и степень различий (дифференциации) значений признака между различными статистическими единицами. Эти различия характеризуются различными показателями вариации.
На данной лекции мы изучим основные виды статистических показателей вариации и способов их расчета.
1. Понятие вариации и основные виды показателей вариации
Понятие «вариация» (от латинского слова variation - изменение) означает изменчивость или способность к изменениям, т.е. изменение (варьирование) свойств отдельных статистических единиц при переходе от одной статистической единицы к другой.
Показатели вариации - обобщающие, аналитические показатели, измеряющие степень отклонений индивидуальных значений признаков от средних значений и отражающих влияние различных факторов, по-разному воздействующих на отдельные единицы изучаемой совокупности.
Формулы для расчета различных показателей вариации приведены в табл. 5.1.
Таблица 5. 1
Различные виды показателей вариации и формулы для их расчета
№п/п |
Наименование показателя вариации |
Формулы для расчетапоказателя вариации: |
||
Абсолютные показатели |
Простые |
Взвешенные |
||
1 |
Среднее линейное отклонение |
|||
2 |
Дисперсия |
|||
3 |
Среднее квадратическое отклонение |
= |
= |
|
4 |
Размах вариации |
R = Xmax - xmin, где Xmax и xmin - соответственно наибольшее и наименьшее значения признака в вариационном ряду |
||
Относительные показатели |
(рассчитываются как отношение абсолютных показателей к средней арифметической) |
|||
5. |
Линейный коэффициент вариации |
|||
6. |
Коэффициент вариации |
|||
7. |
Коэффициент осцилляции |
Как видно из таблицы 5.1. показатели вариации включают как абсолютные, так и относительные показатели, причем каждому абсолютному показателю соответствует особый относительный показатель, который рассчитывается путем деления абсолютного показателя на среднюю величину (среднее значение) изучаемого признака.
Для расчета отдельных показателей вариации обычно строится вспомогательная таблица (5.2).
Таблица 5.2
Вспомогательная таблица для расчета показателей вариации
x |
m |
||||||
У |
На основе исходных данных вначале подсчитываются средние величины, а затем находятся отклонения от средних. Рекомендуется в расчетах показателей вариации пользоваться формулой средней взвешенной.
Однородная статистическая совокупность - это такая совокупность, для которой различия между индивидуальными значениями признака не очень значительны, т.е. мало отличаются от среднего.
Основной количественной характеристикой степени однородности служит коэффициент вариации.
Обычно считается, что этот коэффициент в однородной статистической совокупности не превышает 33%.
Среди различных показателей вариации особое место принадлежит дисперсии, так как этот показатель обладает специальными свойствами, позволяющими упростить порядок его расчета.
2. Свойства средней арифметической и дисперсии
Свойства средней арифметической
Эти свойства используются для упрощения расчета средних величин.
При увеличении или уменьшении всех частот отдельных значений признака в k раз значение средней арифметической не изменяется:
где k - любое натуральное число Это свойство используется для расчета средней арифметической в том случае, если не известны частоты отдельных значений признака, а известны только их удельные веса (доли) в общей численности статистической совокупности..
Если все индивидуальные значения признака умножить или разделить на некоторое число k, то и среднее значение увеличится или уменьшится в k раз:
Средняя суммы или разности двух величин равна сумме или разности их средних:
Если значение признака постоянно (т.е. равно некоторой константе С), то и средняя величина равна этой константе:
Сумма отклонений значений признака от средней арифметической равна нулю.
Свойства дисперсии
Если все значения признака увеличить или уменьшить на постоянную величину, то дисперсия не изменится:
Если все значения признака уменьшить или увеличить в k раз, то дисперсия уменьшится или увеличится в k2 раз:
Если значение признака постоянно (т.е. равно некоторой константе С), то дисперсия равна нулю.
Если рассчитать средний квадрат отклонений от любой величины A, которая отличается от средней арифметической, то этот квадрат будет больше, чем дисперсия:
Если A ? , то
(свойство минимальности).
1) Правило сложения дисперсий:
Общая дисперсия статистической совокупности, разделенной на отдельные группы, равна сумме так называемой межгрупповой дисперсии (или дисперсии внутригрупповых средних) и средней из внутригрупповых дисперсий, или:
где- общая дисперсия;
- межгрупповая дисперсия;
- внутригрупповая дисперсия в j-той группе;
- средняя из внутригрупповых дисперсий.
Межгрупповая дисперсия рассчитывается следующим образом:
1) предположим, что мы выполнили группировку статистической совокупности, т.е. разделили ее на несколько групп;
2) затем в каждой группе мы вычисляем отдельно средние величины признака , которые называются «внутригрупповые средние»;
3) затем мы рассчитываем общую среднюю для всей совокупности.
Тогда межгрупповая дисперсия рассчитывается по формуле:
где - численность j-той группы ( j = 1…k);
- внутригрупповая средняя в j-той группе;
- общая средняя.
Средняя из внутригрупповых дисперсий равна следующей величине:
где - внутригрупповая дисперсия в j-той группе.
Более подробно расчет межгрупповой дисперсии и проверка правила сложения дисперсий изучается на практических занятиях.
3. Изучение структурных характеристик вариационного ряда
При изучении средних величин мы уже отмечали, что мода и медиана являются показателями, характеризующими структуру вариационного ряда, то есть распределение его частот. Как уже отмечалось, мода - это значение признака, наиболее часто встречающееся в данной совокупности. В дискретном ряду модой является просто значение с наибольшей частотой (или частостью).
В интервальном вариационном ряду мода рассчитывается по формуле:
где
- нижняя граница модального интервала
- величина модального интервала
- частоты (или частости) соответственно модального, предшествующего и последующего интервала.
Модальный интервал - это соответственно интервал - имеющий наибольшую частоту (или частость).
Медиана - это условная величина, которая делит всю статистическую совокупность пополам. В дискретном ряду медиана находится как число, расположенное в середине упорядоченного вариационного ряда (если сумма частот является нечетным числом, то медиана совпадает со средним значением в данном ряду, а если - четным, то медиана рассчитывается как полусумма двух средних значений).
В интервальном ряду медиана определяется по формуле:
где
- нижняя граница медианного интервала
- величина медианного интервала
- сумма накопленных частот (частостей) в интервале предшествующем медианному
- сумма частостей.
- порядковый номер медианы в ранжированном ряду.
По соотношению между модой, медианой и средней арифметической можно судить о симметричности ряда распределения.
Симметричным является распределение, в котором частоты двух вариантов, равноотстоящих от центра распределения в обе стороны, равны между собой. В таком распределении частот средняя арифметическая, мода и медиана равны между собой:
= Me =Mo
Если средняя арифметическая превышает значение медианы и моды, то имеет место правосторонняя асимметрия, т.е. большая часть единиц изучаемой совокупности имеет значения, превышающие значение моды.
> Me > Mo
Если, наоборот, средняя арифметическая меньше медианы и моды, то имеет место левосторонняя асимметрия, т.е. большая часть единиц изучаемой совокупности имеет значение признака ниже модального.
< Me < Mo
Моду и медиану называют структурными средними, так как они дают количественную характеристику структуры распределения частот в вариационном ряду. К структурным характеристикам относятся и другие порядковые характеристики вариационного ряда: квартили, делящие ряд на четыре равных части, децили, делящие ряд на 10 равных частей, квинтили, делящие ряд на пять равных частей и другие.
Очевидно, что для деления ряда на четыре части, необходимо рассчитать три квартиля, причем второй квартиль совпадает по своему значению с медианой. Первый и третий квартиль, соответственно, рассчитывают по формулам:
Децили нашли широкое применение в анализе степени дифференциации различных социально-экономических явлений.
Общая схема расчета децилей следующая:
1) Поскольку децили отсекают десятые части совокупности, по накопленным частотам определяем интервалы, куда попадают порядковые номера децилей: для первого дециля - это интервал, куда попадает вариант, отсекающий 10% совокупности с наименьшими значениями признака; для второй - 20% и т.д.;
2) рассчитываем величину децилей по формулам, аналогичным формуле для расчета медианы.
Например, первый и девятый дециль находятся по формулам:
Домашнее задание. Студентам предлагается рассчитать показатели вариации для статистического распределения всех опрошенных по любому из признаков (на основании исходных данных, приведенных в домашнем задании к лекции №3)
Исходные данные для расчета:
x1 |
x2 |
x3 |
x4 |
x1 |
x2 |
x3 |
x4 |
||
(Пол) |
(Возраст) |
(Рост) |
(Вес) |
(Пол) |
(Возраст) |
(Рост) |
(Вес) |
||
ж |
16 |
164 |
55 |
м |
25 |
180 |
70 |
||
ж |
16 |
168 |
60 |
м |
30 |
175 |
66 |
||
ж |
25 |
165 |
64 |
м |
30 |
173 |
64 |
||
ж |
35 |
166 |
70 |
м |
35 |
174 |
68 |
||
ж |
40 |
164 |
65 |
м |
40 |
175 |
70 |
||
ж |
45 |
166 |
68 |
м |
40 |
178 |
76 |
||
ж |
50 |
164 |
60 |
м |
45 |
180 |
70 |
||
ж |
55 |
160 |
75 |
м |
45 |
180 |
75 |
||
м |
16 |
170 |
65 |
м |
50 |
170 |
72 |
||
м |
20 |
178 |
64 |
м |
55 |
168 |
75 |
Затем предлагается рассчитать для этого же признака две внутригрупповые дисперсии (для группы мужчин и группы женщин), найти среднюю внутригрупповую дисперсию, межгрупповую дисперсию и проверить правило сложения дисперсий.
ЛЕКЦИЯ №6 (по теме «Методы структурного анализа, показатели дифференциации и концентрации признака») пропущена, так как в программу по статистике для заочного отделения эта тема не входит
ЛЕКЦИЯ № 7
ТЕМА «Методология и организация выборочных наблюдений»
Введение
На данной лекции мы более подробно остановимся на способах расчета ошибок и численности выборки при проведении выборочных наблюдений. В этих формулах используются ранее изученные показатели вариации.
Основная цель любого несплошного наблюдения заключается в получении характеристик изучаемой статистической совокупности на основе обследования не всей совокупности, а некоторой ее части. Одним из наиболее распространенных видов несплошных наблюдений является выборочное наблюдение.
При выборочном методе наблюдения обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно до 5-10%, реже до 15-25%). При этом изучаемая статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью, или просто выборкой.
Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность.
В отличие от других видов статистических наблюдений, для выборочного наблюдения характерны особые, основанные на законах математической статистики, способы формирования выборочной совокупности.
1. Задачи выборочного наблюдения и различные способы формирования выборки
Задачами выборочного наблюдения являются:
P определение величины возможных отклонений показателей генеральной совокупности (средней или доли) от показателей выборочной совокупности;
P определение объема (численности) выборки, при котором пределы возможной ошибки не превысят некоторой, наперед заданной величины;
P определение вероятности того, что в проведенном выборочном наблюдении ошибка будет иметь заданный предел.
Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.
При некоторых исследованиях выборочный метод является единственно возможным, например, при контроле качества продукции (товара), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов.
При соблюдении правил научной организации обследования выборочный метод дает достаточно точные результаты, поэтому его целесообразно применять для проверки данных сплошного учета. Минимальная численность обследуемых единиц позволяет провести исследования более тщательно и квалифицированно.
Например, при переписях населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.
Особую актуальность приобрел выборочный метод в современных условиях перехода к рыночной экономике в связи с отказом от сплошной статистической отчетности. Изменения в характере экономических отношений повлияли на изменение функций учета и статистики, сокращение и упрощение отчетности. Возросли требования к управлению деятельностью предприятий (которые стали полностью самостоятельными хозяйствующими субъектами), а это в свою очередь усилило потребность в обеспечении надежной информацией, увеличило значение дальнейшего повышения ее оперативности. Все это обуславливает все более широкое применение выборочного метода в статистике.
По сравнению с другими методами сбора информации, основанными на несплошном наблюдении, выборочный метод имеет важную особенность. В основе отбора единиц для обследования положены принципы равных возможностей (вероятностей) попадания в выборку каждой единицы генеральной совокупности. Именно в результате соблюдения этих принципов исключается образование выборочной совокупности только за счет лучших или худших образцов. Это предупреждает появление систематических (тенденциозных) ошибок и делает возможным производить количественную оценку ошибки представительства (репрезентативности) отдельных единиц.
Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими (изменяющимися) признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности представляет собой ошибку выборки. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, метода отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.
Способы определения ошибки выборки при различных приемах формирования выборочных совокупностей и распространения характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.
Проведение исследования социально-экономических явлений выборочным методом складывается из ряда последовательных этапов:
1) обоснование (в соответствии с задачами исследования) целесообразности применения выборочного метода;
2) составление программы проведения статистического исследования выборочным методом;
3) решение организационных вопросов сбора и обработки исходной информации;
4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;
5) обоснование способов формирования выборочной совокупности;
6) осуществление отбора единиц из генеральной совокупности для их обследования;
7) фиксация в отобранных единицах (пробах) изучаемых признаков;
8) статистическая обработка полученной выборочной информации с определением обобщающих характеристик изучаемых признаков;
9) определение количественной оценки ошибки выборки;
10) распространение обобщающих выборочных характеристик на генеральную совокупность.
Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: относительную величину (или долю) альтернативного признака Альтернативный признак - признак, у которого только два значения (условно измеряемые нулем и единицей). Например, пол человека может быть женским (0) или мужским (1). Обычно с помощью понятия «альтернативный признак» измеряется наличие (1) или отсутствие (0) какого-либо качественного признака (например, наличие высшего образования у человека). Любой вопрос в анкете (статистическом формуляре), на который можно дать только два варианта ответа «да» или «нет», также относится к альтернативным признакам опрашиваемых (например, «Жилая площадь Вашей квартиры менее 30 м или нет?»). и среднюю величину количественного признака.
Относительная величина альтернативного признака характеризует долю (удельный вес) единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака. Например, доля нестандартных изделий во всей партии товара, удельный вес продукции собственного производства в товарообороте предприятия общественного питания, удельный вес продавцов в общей численности работников магазина и т.д.
Средняя величина количественного признака - это обобщающая характеристика варьирующего признака, который имеет различные значения у отдельных единиц статистической совокупности. Например, средний образец в товароведении, средняя выработка одного продавца, средняя заработная плата одного работника магазина и т.д.
В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака - генеральной средней (обычно обозначается ч). В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается w), а среднюю величину в выборке - выборочной средней ( обозначается
Основная задача выборочного обследования в статистике состоит в том, чтобы на основе характеристик выборочной совокупности (частоты или средней получить достоверные суждения о показателях доли р или средней х) в генеральной совокупности.
Способы отбора единиц из генеральной совокупности
Практика применения выборочного метода в экономико-статистических исследованиях использует следующие способы отбора единиц из генеральной совокупности:
индивидуальный отбор - в выборку выбираются отдельные единицы;
групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц;
комбинированный отбор как комбинация индивидуального и группового отбора.
Способы отбора определяются правилами формирования выборочной совокупности. При этом выборка может быть:
P собственно случайная;
P механическая;
P типическая, серийная;
P комбинированная.
Собственно случайная выборка состоит в том, что выборочная случайность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
Доля выборки (или выборочная доля) есть отношение числа единиц в выборке n к числу единиц в генеральной совокупности N, т.е. n/N.
Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки. Так, при 2%-ной выборке отбирается каждая 50-я единица (1 : 0,02), при 5%-ной выборке - каждая 20-я единица (1 : 0,05) и т.д.
Таким образом, в соответствии с принятой долей отбора генеральной совокупности как бы механически разбивается на равновеликие группы. Из каждой такой группы в выборку отбирается лишь одна единица.
Для обеспечения репрезентативности (представительности) механической выборки все единицы генеральной совокупности должны располагаться в определенном порядке. При этом по отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признаку. Это важно для установления порядка отбора единиц в выборку.
Величина средней ошибки механической выборки теоретически должна определяться с учетом показателей внутригрупповых дисперсий. Но так как при механической выборке каждая группа представлена лишь одной единицей, то получить значения внутригрупповых дисперсий выборки практически невозможно. Поэтому для определения средней ошибки механической выборки используют формулы собственно случайной выборки.
В статистике довольно часто применяется так называемая типическая выборка.
При типической выборке генеральная совокупность вначале расчленяется на однородные типические группы, а затем с помощью собственно-случайной или механической выборки производится индивидуальный отбор единиц в выборочную совокупность.
Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Репрезентативность типической выборки обеспечивается расчленением генеральной совокупности на качественно однородные группы. Это обусловливает представительство в выборке каждой типической группы.
При определении ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Довольно широко в статистике применяется так называемая серийная, или гнездовая выборка.
При серийной выборке из генеральной совокупности отбираются не отдельные единицы, а целые их серии (гнезда). Внутри же каждой из попавшей в выборку серии обследуются все без исключения единицы, т.е. применяется сплошное наблюдение.
Отбор отдельных серий в выборочную совокупность осуществляется либо посредством собственно случайной выборки, либо механическим отбором. Практически серийная выборка производится, как правило, по схеме бесповторного отбора.
По сравнению с типической выборкой серийная выборка дает более высокую ошибку репрезентативности. Это обусловлено тем, что при серийной выборке, как, правило, обследуется сравнительно небольшое число серий.
Рассмотренные способы выборки на практике обычно применяются не в «чистом» виде, а комбинируются в различных сочетаниях и с различной последовательностью.
При одноступенчатом способе отбора каждая отобранная единица подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной выборке.
При многоступенчатом способе отбора производят отбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц выборочную совокупность.
Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.
2. Понятие «ошибка выборки» и способы ее расчета
Теоретической основой выборочного метода является теорема Чебышева (или «Закон больших чисел»), которая применительно к выборке может быть записана в следующем виде:
P { ч - < t м} > 1,(7.1)
где ч - средняя величина признака для генеральной совокупности;
- средняя величина признака для выборочной совокупности;
P - вероятность того, что разность между выборочной среднейи генеральной средней ч будет меньше, чем t м;
t м = Д - так называемая предельная вероятная ошибка выборки;
м - средняя стандартная ошибка выборки;
t - так называемый коэффициент доверия, связывающий размер ошибки и вероятность ее возникновения. Величина t находится по таблице значений функции Лапласа (такая таблица обычно приводится в качестве приложения к многим учебникам по математической статистике и теории вероятностей).
Наиболее часто используемые в экономике уровни вероятности Р и соответствующие им значения t для выборок достаточно большого объема (n > 30) приведены в табл. 7.1.
Таблица 7.1
Табличные значения функции Лапласа
t |
1,0 |
1,96 |
2,0 |
2,58 |
3,0 |
|
P |
0,683 |
0,950 |
0,954 |
0,99 |
0,997 |
Средняя (стандартная) ошибка выборки (м) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли). Ее значение зависит от определяемой характеристики (средней или доли), способа отбора (повторный или бесповторный) и вида выборочного наблюдения (случайный, механический, типичный, серийный, комбинированный).
Для организации выборочного наблюдения экономических явлений наиболее часто используют формулы, представленные в табл. 7.2.
В табл. 7.2 приняты следующие обозначения:
у2 - дисперсия средней в выборочной совокупности;
щ - доля признака в выборочной совокупности (частость);
n - число единиц в выборочной совокупности;
N - число единиц в генеральной совокупности;
средняя из выборочных дисперсий типических групп;
- средняя из произведений частостей на их дополнение до единицы;
R - число серий в генеральной совокупности;
r - число серий в выборочной совокупности;
- межгрупповая (или межсерийная) дисперсия средних;
- межгрупповая (или межсерийная) дисперсия долей.
Таблица 7.2
Формулы для расчета средней стандартной ошибки выборки
Способ отбора |
Ошибка м для средней |
Ошибка м для доли |
|
Собственно случайный, повторный |
|||
Случайный и механический, бесповторный |
|||
Типический, бесповторный |
|||
Серийный, бесповторный, с равновеликими сериями |
Исходя из формулы (7.1), можно вывести формулу для определения границ изменения генеральной средней ч (если известна выборочная средняя при заданной вероятности P:
- t м ? ч ? + t м,(7.2)
а также формулу для определения границ изменения доли признака d в генеральной совокупности, если (известна выборочная доля щ) при заданной вероятности P:
щ - t м ? d ? щ + t м.(7.3)
В формулах (7.2) и (7.3) вначале для заданного значения вероятности P по таблице определяется значение коэффициента доверия t, затем рассчитываются значения ошибки м и рассчитывается предельная ошибка Д = tм.
3. Расчет оптимальной численности выборки
Определение необходимой численности выборки при заданной величине допустимой (предельной) ошибки выборки основывается на формуле Д = tм и формулах для определения ошибки м, приведенных в табл. 7.2. Так как генеральная дисперсия неизвестна, то используют какие-либо ее оценки. Формулы для определения достаточной (оптимальной) численности выборки представлены в табл. 7.3.
Значение вероятности P достижения заданного предела ошибки выборки Д определяется по таблице значений функции Лапласа, исходя из соотношения:
,
т.е. вначале рассчитывается t, а затем по таблице определяется P.
Таблица 7.3
Формулы расчета численности выборки при случайном (или механическом) отборе
Способ отбора |
Для средней |
Для доли |
Для доли, если даже приблизительно она неизвестна |
|
Повторный |
||||
Бесповторный |
Пример. Рассмотрим пример решения двух задач на определение ошибки и оптимальной численности выборки.
Задача 1. Определить предельную ошибку выборки по следующим данным.
Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 5%-ная механическая выборка, в которую попали 200 счетов. По результатам выборки установлено, что средний срок пользования кредитом составляет 60 дней при среднеквадратическом отклонении 20 дней. В 8 счетах срок пользования кредитом превышал 6 месяцев. Необходимо с вероятностью 0,99 определить пределы, в которых находятся срок пользования краткосрочными кредитами банка и доля краткосрочных кредитов со сроком пользования более полугода.
Решение. Определим среднюю ошибку выборки по формуле для бесповторного отбора.
Доверительной вероятности P=0,99 соответствует t=2,58.
Таким образом, предельная ошибка выборочной средней составит Д=1,4*2,58=3,612?4. Соответственно средний срок пользования краткосрочным кредитом в банке находится в пределах:
? ч ?60+4
То есть с вероятностью 0,99 можно утверждать, что средний срок пользования краткосрочным кредитом составляет от 56 до 64 дней.
Теперь определим по итогам выборки долю кредитов со сроком пользования более полугода:
щ = 8/200 = 0,04 = 4%
Средняя ошибка доли:
Предельная ошибка доли:
Д=0,014*2,58? 0,036=36%
Таким образом, доля кредитов со сроком пользования более полугода в генеральной совокупности находится в пределах:
4%-3,6%? d ?4%+3,6%
То есть с вероятностью 0,99 можно гарантировать, что доля кредитов банка со сроком пользования более полугода в генеральной совокупности находится в пределах от 0,4% до 7,6% от общего числа кредитов.
Задача 2. Определить оптимальную численность выборки по имеющимся данным.
Необходимо произвести выборочную регистрацию цен для определения средней цены за 1 кг овощей. Известно, что цены на овощи колеблются от 40 до 70 руб. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 можно было утверждать, что ошибка выборки при определении средней цены не превысит 2 руб. за 1 кг.
Примечание. Обычно на практике расчет объема выборки производят по формуле для повторного отбора:
Если полученный объем выборки превышает 5% численности генеральной совокупности, то расчеты корректируют на «бесповторность»:
Если доля выборки не превышает 5%, к формуле бесповторного отбора можно не переходить, так как это существенно не скажется на величине n.
Величину дисперсии у2 обычно примерно оценивают по формуле у = 1/6 (xmax - xmin), которая справедлива для нормального закона распределения.
Решая задачу, предполагаем, что распределение цен соответствует нормальному закону распределения. Тогда у = 1/6 (xmax - xmin) = 1/6 (70-40) = 5 (руб.)
Вероятности P=0,954 соответствует t=2. Рассчитаем численность выборки по формуле для повторного отбора:
Поскольку доля выборки не превышает 5% (25/5000=0,005 = 0,5%), то к формуле бесповторного отбора можно не переходить.
ЛЕКЦИЯ № 8
ТЕМА «Методы и показатели оценки тесноты статистических взаимосвязей»
Введение
Изучение статистических взаимосвязей занимает наиболее важное место в любом статистическом исследовании, так как статистика - это, прежде всего, наука о количественных закономерностях и взаимосвязях экономических явлений и процессов. Изучение статистических взаимосвязей позволяет выявить факторы (т.е. причины), влияющие на неблагоприятные события в жизни общества и экономике страны, и своевременно принять те или иные меры по регулированию этих процессов. Прежде, чем изучать разнообразные методы оценки статистических взаимосвязей, необходимо разобраться в том, что такое «статистическая взаимосвязь», и чем статистические связи отличаются от других видов взаимосвязей между явлениями.
1. Понятие «статистическая взаимосвязь»
В статистике принято выделять два вида связи между явлениями:
1) функциональные (или детерминированные);
2) статистические (или стохастические).
Для первого вида связи характерна однозначная строго определенная зависимость между взаимосвязанными показателями или признаками.
Для второго вида связи характерно то, что одному значению независимого признака или показателя может соответствовать несколько значений другого (зависимого) признака или показателя. Простейший пример: люди, имеющие одинаковый рост, не обязательно будут иметь одинаковый вес. Предприятия одинакового размера (то есть с одинаковой численностью работающих или одинаковой стоимостью имущества) совсем не обязательно будут иметь одинаковую прибыль или объем выпускаемой продукции. Но в то же время от размера предприятия зависит и объем продукции, и его прибыль. Статистические связи обычно проявляются в массовом масштабе в виде некоторой усредненной зависимости. Например, средний вес более высоких людей больше, чем средний вес более низких, но отдельный, более высокий человек, может иметь более низкий вес, чем другой человек, рост которого меньше.
Обычно, если между какими-то признаками или показателями имеется статистическая зависимость, то одни из них являются независимыми, то есть изменяются независимо от других, а другие, наоборот, зависимыми, то есть их изменения тесно зависят с изменением других. Условно можно считать, что независимые признаки являются причинами (т.е. факторами), а зависимые - следствиями или результатами.
В статистике независимые признаки принято называть факторными, а зависимые - результативными. Однако не всякая статистическая связь отражает какую-то причинно-следственную зависимость. Иногда статистическая зависимость может носить случайный характер и не отражать реальную причинно-следственную взаимосвязь. Обычно, обнаружив статистическую зависимость между какими-то процессами или явлениями, ученые выдвигают гипотезу о наличии причинно-следственной зависимости, а потом проверяют эту гипотезу на практике или доказывают ее истинность с помощью других методов.
Статистические связи в статистике часто называют корреляционными (от английского слова «correlation» - отношение или соотношение), а показатели, используемые для оценки степени тесноты статистических связей - показателями корреляции.
2. Классификация методов оценки тесноты статистических связей
Для выявления статистических связей и измерения степени их тесноты в статистике используются различные методы, основными из которых являются:
1. Метод параллельных рядов.
2. Метод таблиц сопряженности.
3. Расчет специальных аналитических показателей (или показателей корреляции Слово «корреляция» происходит от английского слова «correlation» (т.е. отношение или соотношение). ), оценивающих степень тесноты связи;
4. Построение уравнений регрессии, количественно выражающих статистическую взаимосвязь между двумя и более признаками, в виде уравнения некоторой математической функции Различные виды и способы построения уравнений регрессии рассматриваются на следующей лекции..
Метод параллельных рядов заключается в том, что параллельно выстраивается два ряда значений количественно измеримых признаков (показателей), причем первый (ряд значений признака x) из них выстраивается в порядке возрастания. Затем проверяется, будет ли соблюдаться тенденция к возрастанию соответствующих значений признака y во втором ряду. Если такая тенденция соблюдается, значит, между двумя признаками имеется статистическая взаимосвязь.
Таблица сопряженности - эта таблица, в которой по вертикали и по горизонтали выстроены различные значения двух признаков (x и y) в порядке возрастания. На пересечении строк и столбцов таблицы стоят числа, выражающие количество статистических единиц, одновременно обладающих соответствующими значениями признаков (x и y). Если ненулевые (т.е. не равные нулю) элементы таблицы сосредоточены вокруг ее главной диагонали, значит, между признаками имеется связь.
Подобные документы
Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.
реферат [33,9 K], добавлен 20.01.2010Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.
курс лекций [68,4 K], добавлен 08.08.2009Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.
методичка [371,4 K], добавлен 15.01.2010Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.
курс лекций [475,4 K], добавлен 11.02.2010Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.
реферат [24,7 K], добавлен 29.03.2013Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.
реферат [192,6 K], добавлен 15.05.2009Предмет и метод статистики как общественной науки. Основные задачи и виды группировок. Точность наблюдения и методы проверки достоверности данных. Понятие о статистическом наблюдении, этапы его проведения. Виды статистических показателей и величин.
курсовая работа [1,5 M], добавлен 09.02.2014Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.
лекция [17,4 K], добавлен 14.03.2010История возникновения и развития статистики. Предмет, основные понятия и категории статистики. Методы сбора, обобщения и анализа статистических данных. Экономическая статистика и ее отрасли. Современная организация статистики в Российской Федерации.
лекция [16,5 K], добавлен 02.05.2012