Введение в статистику: предмет и метод статистики

Количественное выражение закономерностей развития массовых явлений и процессов в конкретных условиях места и времени. Понятие и виды выборочного наблюдения. Классификация рядов динамики. Взаимосвязь между базисными и цепными относительными изменениями.

Рубрика Экономико-математическое моделирование
Вид лекция
Язык русский
Дата добавления 15.08.2014
Размер файла 200,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение в статистику: предмет и метод статистики

Введение

выборочный наблюдение ряд динамика

Слово статистика имеет латинское происхождение: от лат. status -- "состояние", что означало политическое состояние государства. В науку термин статистика ввел в 1746 г. Готфрид Ахенваль, который преподавал курс Государство введение в Германии, изменив его название на "СТАТИСТИКА".

В настоящее время данный термин употребляется в 4 значениях:

Наука, изучающая количественную и качественную сторону массовых общественных явлений и процессов, исследует количественное выражение закономерностей их развития в конкретных условиях места и времени, учебный предмет в ВУЗах;

Цифры, характеризующие массовые общественные явления и процессы;

Деятельность по сбору, обработке, анализу и публикации цифровых данных о самых различных явлениях и процессах общественной жизни;

Параметры рядов случайных величин, рассчитываемые по результатам наблюдений и применяющиеся для проверки различных гипотез преимущественно в математической статистике (например, F-статистика).

Совокупность приемов, пользуясь которыми статистика исследует свой предмет, составляет метод статистики. Можно выделить 3 группы статистических методов (этапов статистического исследования):

Статистическое наблюдение -- это сбор всех существенных фактов об изучаемом явлении и научно организованная их регистрация;

Сводка и группировка -- это систематизация и классификация собранных статистических данных;

Статистический анализ -- это расчет статистических показателей, позволяющий описать изучаемое явление, выявить его динамику, структуру, взаимосвязь с другими явлениями, закономерности, сделать прогнозы на будущее.

Кроме методов статистика использует 5 категорий (ключевых понятий):

Статистическая совокупность -- это массовое общественное явление, которое необходимо исследовать;

Единица статистической совокупности -- это составной элемент статистической совокупности, являющийся носителем изучаемых признаков;

Признак единицы статистической совокупности -- свойства единицы совокупности, которые различаются способами их измерения и другими особенностями;

Статистический показатель - рассчитываемое статистикой значение, характеризующее количественные характеристики изучаемого явления;

Система статистических показателей - набор статистических показателей, отражающий взаимосвязи, существующие между явлениями.

1. Выборочное наблюдение в статистике

1.1 Понятие и виды выборочного наблюдения

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают n, а во всей ГС - N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.

Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.

Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная.

При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.

Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

1.2 Ошибки выборки

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая , а во втором -- выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

Разности -- и W -- р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Величина ошибки выборки может быть разной для разных выборок из одной генеральной совокупности, поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки по формулам:

- повторная;

- бесповторная;

где Дв -- выборочная дисперсия.

Например, на заводе с численностью работников 1000 чел. проведена 5%-ая случайная бесповторная выборка с целью определения среднего стажа работников. Результаты выборочного наблюдения приведены в первых двух столбцах следующей таблицы:

X, лет (стаж работы)

f, чел. (число работников в выборке)

Xиf

до 1

7

0,5

3,5

38,987

1-2

8

1,5

12,0

14,797

2-3

10

2,5

25,0

1,296

3-4

13

3,5

45,5

5,325

4-5

9

4,5

40,5

24,206

более 5

3

5,5

16,5

20,909

Итого

50

143,0

105,520

В 3-м столбце определены середины интервалов X (как полусумма нижней и верхней границ интервала), а в 4-м столбце - произведения XИf для нахождения выборочной средней по формуле средней арифметической взвешенной:

= 143,0/50 = 2,86 (года).

Рассчитаем выборочную дисперсию взвешенную:

= 105,520/50 = 2,110.

Теперь найдем среднюю ошибку бесповторной выборки:

= 0,200 (лет).

Из формул средних ошибок выборки видно, что ошибка меньше при бесповторной выборке, и, как доказано в теории вероятностей, она возникает с вероятностью 0,683 (то есть если провести 1000 выборок из одной генеральной совокупности, то в 683 из них ошибка не превзойдет средней ошибки выборки). Такая вероятность (0,683) является невысокой, поэтому она мало пригодна для практических расчетов, где нужна более высокая вероятность. Чтобы определить ошибку выборки с более высокой, чем 0,683 вероятностью, рассчитывают предельную ошибку выборки:

где t - коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Значения коэффициента доверия t рассчитаны для разных вероятностей и имеются в специальных таблицах (интеграл Лапласа), из которых в статистике широко применяются следующие сочетания:

Вероятность

0,683

0,866

0,950

0,954

0,988

0,990

0,997

0,999

t

1

1,5

1,96

2

2,5

2,58

3

3,5

Задавшись конкретным уровнем вероятности, выбирают из таблицы соответствующую ей величину t и определяют предельную ошибку выборки по формуле.

При этом чаще всего применяют = 0,95 и t= 1,96, то есть считают, что с вероятностью 95% предельная ошибка выборки в 1,96 раза больше средней. Такая вероятность (0,95) считается стандартной и применяется по умолчанию в расчетах.

В нашем примере про средний стаж работников, определим предельную ошибку выборки при стандартной 95%-ой вероятности (из таблицы берем t = 1,96 для 95%-ой вероятности): = 1,96*0,200 = 0,392 (года).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности. Такой интервал для генеральной средней величины имеет вид

а для генеральной доли аналогично:

.

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

В нашем примере про средний стаж работников, определим доверительный интервал генеральной средней - среднего стажа работников:

2,86 - 0,392 2,86 + 0,392 или 2,468 лет 3,252 лет.

То есть средний стаж работников на всем заводе лежит в интервале от 2,468 года до 3,252 года.

1.3 Определение численности выборки

Разрабатывая программу выборочного наблюдения, иногда задаются конкретным значением предельной ошибки с уровнем вероятности. Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность. Ее можно получить из формул средней и предельной ошибок в зависимости от типа выборки. Так, подставляя формулу средней ошибки повторной выборки и формулу средней ошибки бесповторной выборки в формулу предельной ошибки и, решая ее относительно численности выборки, получим следующие формулы:

для повторной выборки n =

для бесповторной выборки n = .

Кроме того, при статистических величинах с количественными признаками надо знать и выборочную дисперсию, но к началу расчетов и она не известна. Поэтому она принимается приближенно одним из следующих способов (в приоритетном порядке):

Берется из предыдущих выборочных наблюдений;

Используется правило, согласно которому в размахе вариации укладывается примерно шесть стандартных отклонений (, а так как , то отсюда );

Используется правило «трех сигм», согласно которому в средней величине укладывается примерно 3 стандартных отклонения (; отсюда ).

При изучении не численных признаков, если даже нет приблизительных сведений о выборочной доле, принимается w = 0,5, что по формуле дисперсии доли соответствует выборочной дисперсии в максимальном размере Дв = 0,5*(1-0,5) = 0,25.

2. Ряды динамики

2.1 Понятие рядов динамики (временных рядов)

Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).

Ряд динамики (или временной ряд) - это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).

Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают буквой y. Первый член ряда y1 называют начальным или базисным уровнем, а последний yn - конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.

Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t, а по оси ординат - шкала уровней ряда y.

Пример ряда динамики

Таблица. Число жителей России в 2004-2009 гг. в млн.чел, на 1 января

Год

2004

2005

2006

2007

2008

2009

Число жителей

144,2

143,5

142,8

142,2

142,0

141,9

График ряда динамики числа жителей России в 2004-2009 гг. в млн. чел, на 1 января

Данные таблицы и графика наглядно иллюстрируют ежегодное снижение числа жителей России в 2004-2009 годах.

2.2 Виды рядов динамики

Ряды динамики классифицируются по следующим основным признакам:

По времени -- ряды моментные и интервальные (периодные), которые показывают уровень явления на конкретный момент времени или на определенный его период. Сумма уровней интервального ряда дает вполне реальную статистическую величину за несколько периодов времени, например, общий выпуск продукции, общее количество проданных акций и т.п. Уровни моментного ряда, хотя и можно суммировать, но эта сумма реального содержания, как правило, не имеет. Так, если сложить величины запасов на начало каждого месяца квартала, то полученная сумма не означает квартальную величину запасов.

По форме представления -- ряды абсолютных, относительных и средних величин.

По интервалам времени -- ряды равномерные и неравномерные (полные и неполные), первые из которых имеют равные интервалы, а у вторых равенство интервалов не соблюдается.

По числу смысловых статистических величин -- ряды изолированные и комплексные (одномерные и многомерные). Первые представляют собой ряд динамики одной статистической величины (например, индекс инфляции), а вторые -- нескольких (например, потребление основных продуктов питания).

В нашем примере про число жителей России ряд динамики: 1) моментный (приведены уровни на 1 января); 2) абсолютных величин (в млн. чел.); 3) равномерный (равные интервали в 1 год); 4) изолированный.

2.3 Показатели изменения уровней ряда динамики

Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений уровней во времени, для рядов динамики рассчитывают показатели изменения уровней ряда динамики:

абсолютное изменение (абсолютный прирост);

относительное изменение (темп роста или индекс динамики);

темп изменения (темп прироста).

Все эти показатели могут определяться базисным способом, когда уровень данного периода сравнивается с первым (базисным) периодом, либо цепным способом - когда сравниваются два уровня соседних периодов.

Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда, определяется по формуле

Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше первого (базисного) уровня, и, следовательно, может иметь знак «+» (при увеличении уровней) или «-» (при уменьшении уровней).

Цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда, определяется по формуле

Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше предыдущего уровня, и может иметь знак «+» или «-».

В следующей расчетной таблице в столбце 3 рассчитаны базисные абсолютные изменения, а в столбце 4 - цепные абсолютные изменения.

Год

y

, %

,%

2004

144,2

2005

143,5

-0,7

-0,7

0,995

0,995

-0,49

-0,49

2006

142,8

-1,4

-0,7

0,990

0,995

-0,97

-0,49

2007

142,2

-2,0

-0,6

0,986

0,996

-1,39

-0,42

2008

142,0

-2,2

-0,2

0,985

0,999

-1,53

-0,14

2009

141,9

-2,3

-0,1

0,984

0,999

-1,60

-0,07

Итого

-2,3

0,984

-1,60

Между базисными и цепными абсолютными изменениями существует взаимосвязь: сумма цепных абсолютных изменений равна последнему базисному изменению, то есть

.

В нашем примере про число жителей России подтверждается правильность расчета абсолютных изменений: = - 2,3 рассчитана в итоговой строке 4-го столбца, а = - 2,3 - в предпоследней строке 3-го столбца расчетной таблицы.

Базисное относительное изменение (базисный темп роста или базисный индекс динамики) представляет собой соотношение конкретного и первого уровней ряда, определяясь по формуле

Цепное относительное изменение (цепной темп роста или цепной индекс динамики) представляет собой соотношение конкретного и предыдущего уровней ряда, определяясь по формуле

.

Относительное изменение показывает во сколько раз уровень данного периода больше уровня какого-либо предшествующего периода (при i>1) или какую его часть составляет (при i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения (если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

В нашем примере про число жителей России в столбце 5 расчетной таблицы найдены базисные относительные изменения, а в столбце 6 - цепные относительные изменения.

Между базисными и цепными относительными изменениями существует взаимосвязь: произведение цепных относительных изменений равно последнему базисному изменению.

В нашем примере про число жителей России подтверждается правильность расчета относительных изменений: = 0,995*0,995*0,996*0,999*0,999 = 0,984 - рассчитано по данным 6-го столбца, а = 0,984 - в предпоследней строке 5-го столбца расчетной таблицы.

Темп изменения (темп прироста) уровней - относительный показатель, показывающий, на сколько процентов данный уровень больше (или меньше) другого, принимаемого за базу сравнения. Он рассчитывается путем вычитания из относительного изменения 100%, то есть по формуле:

,

или как процентное отношение абсолютного изменения к тому уровню, по сравнению с которым рассчитано абсолютное изменение (базисный уровень), то есть по формуле:

.

В нашем примере про число жителей России в столбце 7 расчетной таблицы найдены базисные темпы изменения, а в столбце 8 - цепные. Все расчеты свидетельствуют о ежегодном снижении числа жителей в России за период 2004-2009 гг.

2.4 Средние показатели ряда динамики

Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщать в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении изменений того или иного показателя в разные периоды, в разных странах и т.д.

Обобщенной характеристикой ряда динамики может служить прежде всего средний уровень ряда. Способ расчета среднего уровня зависит от того, моментный ряд или интервальный (периодный).

В случае интервального ряда его средний уровень определяется по формуле простой средней арифметической величины из уровней ряда, т.е.

=

Если имеется моментный ряд, содержащий n уровней (y1, y2, …, yn) с равными промежутками между датами (моментами времени), то такой ряд легко преобразовать в ряд средних величин. При этом показатель (уровень) на начало каждого периода одновременно является показателем на конец предыдущего периода. Тогда средняя величина показателя для каждого периода (промежутка между датами) может быть рассчитана как полусумма значений у на начало и конец периода, т.е. как . Количество таких средних будет . Как указывалось ранее, для рядов средних величин средний уровень рассчитывается по средней арифметической. Следовательно, можно записать

.

После преобразования числителя получаем

,

где Y1 и Yn -- первый и последний уровни ряда; Yi -- промежуточные уровни.

Эта средняя известна в статистике как средняя хронологическая для моментных рядов. Такое название она получила от слова «cronos» (время, лат.), так как рассчитывается из меняющихся во времени показателей.

В случае неравных промежутков между датами среднюю хронологическую для моментного ряда можно рассчитать как среднюю арифметическую из средних значений уровней на каждую пару моментов, взвешенных по величине расстояний (отрезков времени) между датами, т.е.

.

В данном случае предполагается, что в промежутках между датами уровни принимали разные значения, и мы из двух известных (yi и yi+1) определяем средние, из которых затем уже рассчитываем общую среднюю для всего анализируемого периода.

Если же предполагается, что каждое значение yi остается неизменным до следующего (i+1)-го момента, т.е. известна точная дата изменения уровней, то расчет можно осуществлять по формуле средней арифметической взвешенной:

,

где - время, в течение которого уровень оставался неизменным.

Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели - среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.

Базисное среднее абсолютное изменение представляет собой частное от деления последнего базисного абсолютного изменения на количество изменений. То есть

Б =

Цепное среднее абсолютное изменение уровней ряда представляет собой частное от деления суммы всех цепных абсолютных изменений на количество изменений, то есть

Ц =

По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность.

Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными.

Наряду со средними абсолютным изменением рассчитывается и среднее относительное тоже базисным и цепным способами.

Базисное среднее относительное изменение определяется по формуле

Б==

Цепное среднее относительное изменение определяется по формуле

Ц=

Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность.

Вычитанием 1 из базисного или цепного среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики.

3. Средние величины и показатели вариации

3.1 Понятие и виды средних величин

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Существует 2 класса средних величин: степенные и структурные.

К структурным средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.

Степенные средние величины

Степенные средние могут быть простыми и взвешенными.

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

где X - значения отдельных статистических величин или середин группировочных интервалов;

m - показатель степени, от значения которого зависят следующие виды степенных средних величин:

при m = -1 средняя гармоническая;

при m = 0 средняя геометрическая;

при m = 1 средняя арифметическая;

при m = 2 средняя квадратическая;

при m = 3 средняя кубическая.

Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.

Средняя арифметическая

Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4.

Средняя арифметическая взвешенная имеет следующий вид:

где f - количество величин с одинаковым значением X (частота).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X остутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X.

Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет):

(2*10+4*20+6*5)/(10+20+5) = 3,71 года.

Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.

Средняя гармоническая

Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой:

Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно - со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w1=w2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.

Средняя геометрическая

Средняя геометрическая применяется при определении средних относительных изменений, о чем сказано в теме Ряды динамики. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X.

Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году - 1,109; в 2006 - 1,090; в 2007 - 1,119; в 2008 - 1,133. Так как индекс инфляции - это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.

Средняя квадратическая

Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений.

Главной сферой применения квадратической средней является измерение вариации значений X, о чем пойдет речь позднее в этой лекции.

Средняя кубическая

Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.

Структурные средние величины

К наиболее часто используемым структурным средним относятся статистическая мода и статистическая медиана.

Статистическая мода

Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.

Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.

Например, на предприятии работает 16 человек: 4 из них - со стажем 1 год, 3 человека - со стажем 2 года, 5 - со стажем 3 года и 4 человека - со стажем 4 года. Таким образом, модальный стаж Мо=3 года, поскольку частота этого значения максимальна (f=5).

Если X задан равными интервалами, то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:

где Мо - мода;

ХНМо - нижняя граница модального интервала;

hМо - размах модального интервала (разность между его верхней и нижней границей);

fМо - частота модального интервала;

fМо-1 - частота интервала, предшествующего модальному;

fМо+1 - частота интервала, следующего за модальным.

Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Рассчитаем модальный стаж работы в модальном интервале от 3 до 5 лет: Мо = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (года).

Если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.

Статистическая медиана

Статистическая медиана - это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.

Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).

Например, имеются данные о возрасте студентов-заочников в группе из 10 человек - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 лет. Эти данные уже упорядочены по возрастанию, а их количество N=10 - четное, поэтому медиана будет находиться между X с номерами 0,5*10=5 и (0,5*10+1)=6, которым соответствует значения X5=21 и X6=23, тогда медиана: Ме = (21+23)/2 = 22 (года).

Если X задан в виде равных интервалов, то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:

где Ме - медиана;

ХНМе - нижняя граница медианного интервала;

hМе - размах медианного интервала (разность между его верхней и нижней границей);

fМе - частота медианного интервала;

fМе-1 - сумма частот интервалов, предшествующих медианному.

В ранее рассмотренном примере при расчете модального стажа (на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет) рассчитаем медианный стаж. Половина общего числа работников составляет (10+20+5)/2 = 17,5 и находится в интервале от 3 до 5 лет, а в первом интервале до 3 лет - только 10 работников, а в первых двух - (10+20)=30, что больше 17,5, значит интервал от 3 до 5 лет - медианный. Внутри него определяем условное значение медианы: Ме = 3+2*(0,5*30-10)/20 = 3,5 (года).

Также как и в случае с модой, при определении медианы если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.

3.2 Показатели вариации

Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации.

Размах вариации

Размах вариации - это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.

Cреднее линейное отклонение

Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой - получим среднее линейное отклонение простое:

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5.

Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной - получим среднее линейное отклонение взвешенное:

Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4 и среднее линейное отклонение простое = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

Линейный коэффицинт вариации

Линейный коэффицинт вариации - это отношение среднего линейного отклонение к средней арифместической:

С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.

В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%.

Дисперсия

Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую:

В уже знакомом нам примере про студента, который сдал 4 экзамена и получил оценки: 3, 4, 4 и 5, ранее уже была рассчитана средняя арифметическая = 4. Тогда дисперсия простая Д = ((3-4)2+(4-4)2+(4-4)2+(5-4)2)/4 = 0,5.

Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперсию взвешенную:

В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4)2*1+(4-4)2*2+(5-4)2*1)/4 = 0,5.

Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:

В уже знакомом нам примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию методом разности средней квадратов и квадрата средней:

Д = (32*1+42*2+52*1)/4-42 = 16,5-16 = 0,5.

Если значения X - это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:

.

Cреднее квадратическое отклонение

Выше уже было рассказано о формуле средней квадратической, которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:

Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:

В примере про студента, в котором выше рассчитали дисперсию, найдем среднее квадратическое отклонение как корень квадратный из нее: .

Квадратический коэффициент вариации

Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:

Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 - вариация считает слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.

В примере про студента, в котором выше рассчитали среднее квадратическое отклонение, найдем квадратический коэффициент вариации V = 0,707/4 = 0,177, что меньше критериального значения 0,333, значит вариация слабая и равна 17,7%.

4. Абсолютные и относительные статистические величины

4.1 Понятие абсолютных величин

Абсолютные величины -- это результаты статистических наблюдений. В статистике в отличие от математики все абсолютные величины имеют размерность (единицу измерения), а также могут быть положительными и отрицательными.

Единицы измерения абсолютных величин отражают свойства единиц статистической совокупности и могут быть простыми, отражая 1 свойство (например, масса груза измеряется в тоннах) или сложными, отражая несколько взаимосвязанных свойств (например, тонно-километр или киловатт-час).

Единицы измерения абсолютных величин могут быть 3 видов:

Натуральные -- применяются для исчисления величин с однородными свойствами (например, штуки, тонны, метры и т.д.). Их недостаток состоит в том, что они не позволяют суммировать разнородные величины.

Условно-натуральные -- применяются к абсолютным величинам с однородными свойствами, но проявляющим их по-разному. Например, общая масса энергоносителей (дрова, торф, каменный уголь, нефтепродукты, природный газ) измеряется в т.у.т. -- тонны условного топлива, поскольку каждый его вид имеет разную теплотворную способность, а за стандарт принято 29,3 мДж/кг. Аналогично общее количество школьных тетрадей измеряется в у.ш.т. -- условные школьные тетради размером 12 листов. Аналогично продукция консервного производства измеряется в у.к.б. -- условные консервные банки емкостью 1/3 литра. Аналогично продукция моющих средств приводится к условной жирности 40%.

Стоимостные единицы измерения выражаются в рублях или в иной валюте, представляя собой меру стоимости абсолютной величины. Они позволяют суммировать даже разнородные величины, но их недостаток состоит в том, что при этом необходимо учитывать фактор инфляции, поэтому статистика стоимостные величины всегда пересчитывает в сопоставимых ценах.

Абсолютные величины могут быть моментными или интервальными. Моментные абсолютные величины показывают уровень изучаемого явления или процесса на определенный момент времени или дату (например, количество денег в кармане или стоимость основных фондов на первое число месяца). Интервальные абсолютные величины -- это итоговый накопленный результат за определенный период (интервал) времени (например, зарплата за месяц, квартал или год). Интервальные абсолютные величины, в отличие от моментных, допускают последующее суммирование.

Абсолютная статистическая величина обозначается X, а их общее число в статистической совокупности -- N.

Количество величин с одинаковым значением признака обозначается f и называется частота (повторяемость, встречаемость).

Cами по себе абсолютные статистические величины не дают полного представления об изучаемом явлении, так как не показывают его динамику, структуру, соотношение между частями. Для этих целей служат относительные статистические величины.

4.2 Понятие и виды относительных величин

Относительная статистическая величина -- это результат соотношения двух абсолютных статистических величин.

Если соотносятся абсолютные величины с одинаковой размерностью, то получаемая относительная величина будет безразмерной (размерность сократится) и носит название коэффициент.

Часто применяется искусственная размерность коэффициентов. Она получается путем их умножения:

на 100 -- получают проценты (%);

на 1000 -- получают промилле (‰);

на 10000 -- получают продецимилле (‰O>).

Искусственная размерность коэффициентов применяется, как правило, в разговорной речи и при формулировании результатов, а в самих расчетах она не используется. Чаще всего применяются проценты, в которых принято выражать полученные значения относительных величин.

Чаще вместо названия относительная статистическая величина используется более краткий термин-синоним -- индекс (от лат. index -- показатель, коэффициент).

В зависимости от видов соотносимых абсолютных величин при расчете относительных величин, получаются разные виды индексов: динамики, планового задания, выполнения плана, структуры, координации, сравнения, интенсивности.

Индекс динамики

Индекс динамики (коэффициент роста, темп роста) показывает во сколько раз изменилось изучаемое явление или процесс во времени. Рассчитывается как отношение значения абсолютной величины в отчетный (анализируемый) период или момент времени к базисному (предыдущему):

.

Здесь и далее подиндексы означают: 1 -- отчетный (анализируемый) период, 0 -- базисный (прошлый) период.

Критериальным значением индекса динамики служит "1", то есть: если iД>1 - имеет место рост явления во времени; если iД=1 -- стабильность; если iД<1 - наблюдается спад явления.

Если из индекса динамики вычесть его критериальное значение "1" и выразить полученное значение в процентах, то получится темп изменения с критериальным значением "1":

Если T>0, то имеет место рост явления; Т=0 - стабильность, Т<0 -- спад.

В некоторых учебниках индекс динамики называется коэффициентом роста или темпом роста, а темп изменения -- темпом прироста, независимо от получаемого результата, который может показать не только рост, но и стабильность или спад. Поэтому более логичным и чаще используемыми названиями являются именно индекс динамики и темп изменения.

Например, автосалон в январе продал 100 автомобилей, а в феврале -- 110 автомобилей. Тогда индекс динамики составит iД= 110/100 = 1,1, что означает рост продаж автомобилей автосалоном в 1,1 раза или на 10%

Индекс планового задания

Индекс планового задания - это отношение планового значения абсолютной величины к базисному:

Например, автосалон в январе продал 100 автомобилей, а на февраль запланировал продать 120 автомобилей. Тогда индекс планового задания составит iпз= 120/100 = 1,2, что означает планирование роста продаж в 1,2 раза или на 20%

Индекс выполнения плана

Индекс выполнения плана - это отношение фактически полученного значения абсолютной величины в отчетном периоде к запланированному:

Например, автосалон в феврале продал 110 автомобилей, хотя на февраль было запланировано продать 120 автомобилей. Тогда индекс выполнения плана составит iвп= 110/120 = 0,917, что означает выполнение плана на 91,7%, то есть план недовыполнен на (100%-91,7%) = 8,3%.

Перемножая индексы планового задания и выполнения плана, получим индекс динамики:

В рассмотренном ранее примере про автосалон, если перемножим полученные значения индексов планового задания и выполнения плана, то получим значение индекса динамики: 1,2*0,917 = 1,1.

Индекс структуры

Индекс структуры (доля, удельный вес) - это отношение какой-либо части статистической совокупности к сумме всех ее частей:

Индекс структуры показывает, какую долю составляет отдельная часть совокупности от всей совокупности.

Например, если в рассматриваемой группе студентов 20 девушек и 10 молодых людей, тогда индекс структуры (доля) девушек будет равен 20/(20+10) = 0,667, то есть доля девушек в группе составляет 66,7%.

Индекс координации

Индекс координации - это отношение одно части статистической совокупности к другой ее части, принятой за базу сравнения:

Индекс координации показывает, во сколько раз больше или сколько процентов составляет одна часть статистической совокупности по сравнению с другой ее частью, принятой за базу сравнения.

Например, если в группе студентов из 20 девушек и 10 молодых людей, принять за базу сравнения численность девушек, тогда индекс координации численности молодых людей составит 10/20 = 0,5, то есть численность молодых людей составляет 50% от численности девушек в группе.

Индекс сравнения

Индекс сравнения - это отношение значений одной и той же абсолютной величины в одном и том же периоде или моменте времени, но для разных объектов или территорий:

где А, Б -- признаки сравниваемых объектов или территорий.

Например, в январе 2009 года число жителей в Нижнем Новгороде составляло примерно 1280 тыс.чел., а в Москве - 10527 тыс.чел. Примем Москву за объект А (так как принято при расчете индекса сравнения большее число ставить в числителе), а Нижний Новгород - за объект Б, тогда индекс сравнения числа жителей этих городов составит 10527/1280 = 8,22 раза, то есть в Москве число жителей в 8,22 раза больше, чем в Нижнем Новгороде.

Индекс интенсивности

Индекс интенсивности - это отношение значений двух взаимосвязанных абсолютных величин с разной размерностью, относящихся к одному объекту или явлению.

Например, хлебный магазин продал 500 буханок хлеба и заработал на этом 10000 руб., тогда индекс интенсивности составит 10000/500 = 20 [руб./бух. хлеба], то есть цена продажи хлеба составила 20 руб. за буханку.

Большинство величин с дробной размерностью представляют собой индексы интенсивности.

Размещено на Allbest.ru


Подобные документы

  • Предмет, метод, показатели статистики. Понятия и категории статистического наблюдения. Показатели вариации, абсолютные и относительные величины, графический и индексный методы. Взаимосвязь социально-экономических явлений. Сглаживание рядов динамики.

    курс лекций [132,9 K], добавлен 23.02.2009

  • Статистика - количественная сторона массовых экономико-социальных явлений и их связи с качественной стороной конкретных условий места и времени. Математические основы статистики и использование компьютерных технологий в статистическом исследовании.

    учебное пособие [2,7 M], добавлен 13.03.2008

  • Основные понятия статистики. Этапы проведения статистического наблюдения. Свойства средней арифметической. Формы, виды и способы наблюдения. Статистические ряды распределения. Виды дисперсий и правило их сложения. Изучение динамики общественных явлений.

    презентация [938,2 K], добавлен 18.04.2013

  • Построение рядов динамики; определение закономерностей развития общественных явлений во времени. Интерпретация динамических характеристик. Аналитическое выравнивание и прогнозирование, дисперсионный и корреляционно-регрессионный анализ показателей.

    практическая работа [1014,3 K], добавлен 18.04.2014

  • Решение задачи изучения изменения анализируемых показателей во времени при помощи построения и анализа рядов динамики. Элементы ряда динамики: уровни динамического ряда и период времени, за который они представлены. Понятие переменной и постоянной базы.

    методичка [43,0 K], добавлен 15.11.2010

  • Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.

    лабораторная работа [258,1 K], добавлен 13.05.2010

  • Виды статистических методов анализа данных. Применение выборочного наблюдения в правовой статистике. Исследование стажа работы, тарифных разрядов и заработной платы рабочих цеха. Построение рядов распределения и расчет абсолютных показателей вариации.

    курсовая работа [295,5 K], добавлен 14.04.2014

  • Основные понятия, сущность, классификация, уровни и показатели статистических рядов динамики. Общая характеристика деятельности и организационная структура "Салона красоты Goddess", статистический анализ его баланса, доходов и расходов по рядам динамики.

    курсовая работа [401,4 K], добавлен 27.05.2010

  • Количественное выражение общих закономерностей, обусловленных экономической теорией. Механизм функционирования экономической или социально-экономической системы. Связь эконометрики с другими дисциплинами. Сущность эконометрической модели, ее специфика.

    презентация [107,3 K], добавлен 22.08.2015

  • Сущность, цели и задачи выборочного обследования. Описание и особенности использования типического способа отбора выборочной совокупности. Формы статистических показателей выборочного наблюдения. Виды и методика расчета оценок статистических показателей.

    курсовая работа [124,1 K], добавлен 13.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.