Основные понятия статистики
Статистическая сводка, группировка. Ряды распределения. Статистические таблицы. Графическое изображение статистических данных. Абсолютные и относительные статистические величины. Средние величины в статистике. Ряды динамики. Порядок построения индексов.
Рубрика | Экономика и экономическая теория |
Вид | курс лекций |
Язык | русский |
Дата добавления | 12.04.2012 |
Размер файла | 157,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Интерпретация непараметрических коэффициентов связи в некоторых случаях, особенно когда они имеют отрицательное значение, затруднительна. Их абсолютные значения могут изменяться в пределах от 0 до 1. Чем ближе абсолютные значения к единице, тем теснее связь между исследуемыми признаками.
Корреляция и регрессия. Традиционные методы корреляционно-регрессионного анализа позволяют не только оценить тесноту связи, но и выразить эту связь аналитически. Применению корреляционно-регрессионного анализа должен предшествовать качественный, теоретический анализ исследуемого социально-экономического явления или процесса.
Связь между двумя факторами аналитически выражается уравнениями
прямой = a0 + a1x;
гиперболы = a0 + ;
параболы = a0 + a1x + a2x2 (или другой ее степени);
степенной функции .
Параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов. Параметр a1 - коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. На основе этого параметра вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%:
Э = a1•.
Для определения параметров уравнений используется метод наименьших квадратов, на основании которого строится соответствующая система уравнений.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции:
r = ,
а при криволинейной зависимости с помощью корреляционного отношения:
= .
Расчет коэффициентов регрессии несколько осложняется, если ряды по исследуемым факторам сгруппированы, а связь криволинейная.
Если зависимость между двумя факторами выражается уравнением гиперболы
= a0 + ,
то система уравнений для определения параметров a0 и a1 такова:
na0 + a1? = ?y;
a0? + a1? = ?y.
Для определения параметров уравнения регрессии, выраженного степенной функцией , приводят функцию к линейному виду: lg= lga0 + a1lgx, отсюда система уравнений для определения параметров запишется:
n•lga0 + a1?lgx = ?lgy;
lga0?lgx + a1?(lgx)2 = ?lgy•lgx.
Зависимость между тремя и более факторами называется множественной или многофакторной корреляционной зависимостью. Линейная связь между тремя факторами выражается уравнением:
= a0 + a1x + a2z,
а система нормальных уравнений для определения неизвестных параметров a0, a1, a2 будет следующей:
na0 + a1?x + a2?z = ?y;
a0?x + a1?x2 + a2?zx = ?yx;
a0?z + a1?xz + a2?z2 = ?yz.
Теснота связи между тремя факторами измеряется с помощью множественного (совокупного) коэффициента корреляции:
R = ,
где rij - парные коэффициенты корреляции между соответствующими факторами.
Для более углубленного анализа вычисляются частные коэффициенты корреляции.
Дисперсионный анализ связи. При небольшом числе наблюдений исследовать влияние одного или нескольких факторных признаков на результативный можно, используя методы дисперсионного анализа. Дисперсионный анализ проводится расчетом дисперсий: общей, межгрупповой и внутригрупповой. Общую дисперсию называют дисперсией комплекса, межгрупповую - факторной, внутригрупповую - остаточной.
Дисперсионный анализ заключается в сравнении факторной и остаточной дисперсий. Если различие между ними значимо, то факторный признак, т.е. признак, положенный в основание группировки, оказывает существенное влияние на результативный. При исследовании воздействия на результативный признак только одного факторного, т.е. однофакторного комплекса дисперсии вычисляются:
дисперсия комплекса ;
факторная дисперсия ;
остаточная дисперсия ,
где n - 1, r - 1, n - r - соответствующие числа степеней свободы;
r - число уровней (групп).
На основании дисперсий проводится расчет критерия Фишера Fp. Если расчетное значение больше табличного, т.е. Fp F, то существенность влияния факторного признака подтверждается.
Тема 10. Выборочное наблюдение
Главными вопросами теории выборочного наблюдения, требующими практического закрепления на основе решения задач и выполнения упражнений, являются:
- определение предела случайной ошибки репрезентативности для различных типов выборочных характеристик с учетом особенностей отбора;
- определение объема выборки, обеспечивающего необходимую репрезентативность выборочной характеристики, с учетом особенностей отбора.
Ошибка репрезентативности, или разность между выборочной и генеральной характеристикой (средней, долей), возникающая в силу несплошного наблюдения, в основе которого лежит случайный отбор, рассчитывается как предел наивероятной ошибки. В качестве уровня гарантийной вероятности обычно берется 0,954 или 0,997. Тогда предел ошибки определяется величиной удвоенной или утроенной средней ошибки выборки: = 2 при P = 0,954; = 3 при P = 0,997, или в общем виде = t (t - коэффициент, связанный с вероятностью, гарантирующей результат).
Величина средней ошибки выборки различна для отдельных разновидностей случайного отбора. При наиболее простой системе - собственно-случайном повторном отборе - средняя ошибка определяется следующими формулами:
индивидуальный отбор:
= = ,
где у2 - общая дисперсия признака;
n - число отобранных единиц наблюдения;
групповой (гнездовой, серийный) отбор:
= = ,
где д2 - межгрупповая дисперсия;
r - число отобранных групп (гнезд, серий) единиц наблюдения.
При практических расчетах ошибок репрезентативности необходимо учитывать следующее:
1. Вместо генеральной дисперсии используется соответствующая выборочная дисперсия. Так, вместо общей дисперсии доли в генеральной совокупности берется общая дисперсия частости:
= (1 - ) вместо = pq.
2. В случае бесповторного способа отбора (а также механического) следует иметь в виду поправки (K) к ошибке повторной выборки на бесповторность отбора:
K = 1 или K = 1.
Очевидно, что пользоваться этой поправкой целесообразно лишь тогда, когда относительный объем выборки составляет заметную часть генеральной совокупности (не менее 10%, тогда K 0,95).
3. При районированном отборе из типических групп единиц генеральной совокупности используется средняя из частных (групповых) дисперсий. Так, при индивидуальном отборе, пропорциональном размерам типических групп, имеем:
= 2 = = при P = 0,954,
где - частная дисперсия i-й группы;
ni - объем выборки в i-й группе.
Определение ошибок выборочных характеристик позволяет установить наивероятные границы нахождения соответствующих генеральных показателей:
для средней: ,
где - генеральная средняя;
- выборочная средняя;
- ошибка выборочной средней;
для доли: p = ,
где p - генеральная доля;
- выборочная доля (частость);
- ошибка выборочной доли.
Пример. С вероятностью 0,954 нужно определить границы среднего веса пачки чая для всей партии, поступившей в торговую сеть, если контрольная выборочная проверка дала следующие результаты (первые две графы табл. 10.1).
Таблица 10.1 Результаты взвешивания чая
Вес, г (x) |
Количество пачек (m) |
Расчетные графы |
||||
x |
m |
xm |
(x)2m |
|||
48 - 49 |
20 |
-1 |
2 |
-2 |
2 |
|
49 - 50 |
50 |
0 |
5 |
0 |
0 |
|
50 - 51 |
20 |
+1 |
2 |
2 |
2 |
|
51 - 52 |
10 |
+2 |
1 |
2 |
4 |
|
Итого: |
100 |
- |
10 |
2 |
8 |
1. Средний вес пачки чая по выборке:
= K + x0 = 1 + 49,5 = 49,7 г.
2. Выборочная дисперсия веса пачки чая:
у2 = = = 0,76.
3. Средняя ошибка выборочной средней:
= = = 0,087 г.
4. Предел для ошибки с вероятностью 0,954:
= 2 = 0,174 г 0,2 г.
5. Границы генеральной средней:
= = 49,7 0,2 г.
Таким образом, с вероятностью 0,954 можно утверждать, что вес пачки чая в среднем для всей партии не более 49,9 г и не менее 49,5 г.
Определение объема выборки при заданной ее точности является проблемой, обратной рассмотренной нами - определению ошибки выборки при данном ее объеме. Формула объема выборки получается из соответствующей формулы предельной ошибки. Так, получаем для индивидуального бесповторного отбора:
n =;
группового бесповторного отбора:
r =.
При решении задач на определение необходимого объема выборки следует иметь в виду, что вместо генеральной дисперсии определенного вида берется ее оценка - примерное значение, полученное из того или иного источника. Рассмотрим следующий общий пример.
Пример. Нужно определить абсолютный и относительный объемы индивидуального отбора для исследования генеральной доли, чтобы ошибка частости с вероятностью 0,954 не превышала 0,02, если выборка производится из генеральной совокупности объема: а) 1000; б) 100000 единиц.
Используя формулу n =, в которой полагаем t = 2 (гарантийная вероятность равна 0,954), а pq = 0,25, имеем:
а) n = = 714, или 71,4%;
б) n = = 2439, или 2,44%.
Тема 11. Законы распределения
Конечной целью обработки информации методами математической статистика, если речь идет о больших выборках, является получение закона распределения исследуемой случайной величины. Это связано с тем, что закон распределения является фактически, тем аппаратом, который позволяет определить вероятность появления (или, наоборот, непоявления) случайной величины в тот или иной период времени или вероятность того, что случайная величина попадет в тот или иной интервал ее возможных значении. Этот этап статистической обработки является одним из наиболее важных, так как ошибка при выборе того или иного закона распределения приводит к ошибкам при дальнейшем решении практических задач.
Если проанализировать все этапы статистической обработки, то можно сделать вывод, что влекущими за собой наиболее существенные ошибки, а, следовательно, наиболее ответственными, являются этапы, на которых решаются следующие задачи:
1. Возможно ли объединение нескольких малых или средних выборок в одну.
2. Отбрасывать или учитывать резко отличающиеся результаты.
3. Справедливо ли сделанное предположение о законе распределения случайной величины.
Рассмотрим эти этапы более подробно.
1. Так как для установления закона распределения необходимы большие выборки, то на практике часто встает вопрос об объединении нескольких выборок, каждая из которых мала для решения поставленной задачи и получения одной общей выборки, удовлетворяющей предъявленным к ней требованиям. Поэтому, что вообще свойственно для статистической обработки, любое из неправильных решений (как положительное, так и отрицательное) по поводу объединения выборок приводит к нежелательным результатам, или к невозможности установить закон распределения, если выборки не объединяются, или к неправильному выводу о характере закона распределения.
Для решения этой задачи используют критерии, с помощью которых с разной формулировкой фактически дается ответ на один и тот же вопрос: принадлежат или не принадлежат исследуемые выборки одной генеральной совокупности, то есть автоматически решается задача о возможности или невозможности их объединения. Как правило, все эти критерии основаны на сравнении выборочных характеристик (выборочных дисперсий или средних величин) между собой или с соответствующими генеральными характеристиками. В большинстве случаев использование этих критериев предполагает нормальный или логарифмически-нормальный закон распределения для каждой выборки. При других же законах распределения эти критерии некорректны и их использование может привести к ошибочным результатам.
Наиболее используемыми являются следующие критерии:
а) критерии, основанные на сравнении дисперсий: критерий , критерий Фишера (F = ), критерий Хартлея (Fmax = ), критерий Кочрена (Gmax = ), критерий Бартлета (ч2);
б) критерии, основанные на сравнениях средних величин: критерий Стьюдента (t), критерий Z и другие.
Для всех критериев в качестве нулевой гипотезы (H0) выдвигается предположение о принадлежности выборки генеральной совокупности или об однородности выборок между собой.
2. При наличии выборки, удовлетворяющей требованиям относительно ее пригодности для установления закона распределения перед тем, как приступить к определению статистических характеристик, необходимо проверить, принадлежат ли к данной выборке ее члены, резко отличающиеся от большинства данных, если таковые имеются. Такая проверка строго обязательна, так как любое неверное решение в отношении резко отличающихся результатов приводит к искажению вида кривой закона распределения и к последующим ошибкам, о которых уже говорилось выше. Описанная проверка также осуществляется с помощью соответствующих критериев: критерия Груббса (для малых выборок), критерия Ирвина и некоторых других. В качестве нулевой гипотезы во всех случаях принимается предположение о том, что резко выделяющиеся результаты принадлежат данной выборке.
3. Заключительной и самой трудоемкой проверкой является проверка гипотез о виде функции распределения или, что то же, о соответствии предполагаемого закона теоретического распределения эмпирическому. Эта проверка осуществляется с помощью так называемых критериев согласия. Существуют критерии для проверки соответствия как предполагаемому нормальному или логарифмически-нормальному закону распределения, так и любому другому закону распределения.
Наиболее используемыми при практических расчетах являются следующие критерии:
а) критерий Пирсона (ч2); он справедлив при больших объемах выборок и для любых законов распределения;
б) критерий Колмогорова-Смирнова (Du); этот критерий используется для проверки гипотезы о соответствии эмпирического распределения любому теоретическому закону распределения с заранее известными параметрами, что накладывает ограничения на его использование. В то же время Du является более мощным, чем критерий ч2;
в) критерий Крамера-Мизеса (2); данный критерий используется для объемов выборок 50 n 200 и является более мощным, чем ч2, однако, при его применении требуется больший объем вычислений. Поэтому при n > 200 этот критерий целесообразно использовать только в тех случаях, когда проверки гипотезы по другим критериям не приводят к безусловным результатам;
г) критерий Шапиро-Уилкса (W); он предназначен для проверки гипотезы о нормальном или логарифмически нормальном законе распределения при ограниченном объеме выборки (n 50) и является более мощным, чем другие критерии.
Укрупненно порядок проведения статистической обработки информации можно представить следующим образом: после решения вопроса об объеме выборки и принадлежности к ней резко отличающихся результатов, строится гистограмма, рассчитываются статистические характеристики исследуемой случайной величины, и устанавливается закон ее распределения.
При решении технических и экономических задач существует достаточно широкий круг законов распределения, которым подчиняются те или иные процессы. К ним относятся законы Вейбулла, Релея, экспоненциальный, гамма-распределения, однако, самыми распространенными являются нормальный (Гаусса) и логарифмически-нормальный законы распределения. Получив математическое выражение закона распределения, то есть соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, можно утверждать, что с вероятностной точки зрения, случайная величина описана полностью.
статистическая сводка распределение индекс
Размещено на Allbest
Подобные документы
Статистическое наблюдение; классификация признаков явлений; сводка и группировка. Ряды распределения и их графическое изображение; уровневые и интегральные графики. Динамические ряды, статистические таблицы, абсолютные, относительные и средние величины.
учебное пособие [217,1 K], добавлен 23.12.2009Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.
реферат [24,7 K], добавлен 29.03.2013Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.
методичка [2,2 M], добавлен 16.02.2011Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013Рассмотрение процесса ревизии в бухгалтерии предприятия налоговыми органами с точки зрения статистического наблюдения. Выбор из исходных данных абсолютной статистической величины. Представление статистических данных. Средние величины. Показатели вариации.
контрольная работа [139,5 K], добавлен 28.05.2015Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.
курсовая работа [498,5 K], добавлен 09.01.2011Понятие статистики, история ее развития. Организация статистики в Российской Федерации. Понятие о статистическом наблюдении. Виды экономических индексов. Виды статистических показателей. Абсолютные и относительные величины. Этапы построения группировки.
лекция [92,0 K], добавлен 20.10.2010Сущность понятия "статистика". Абсолютные и относительные величины, характеризующие рождаемость, динамику численности населения города за отчетный год. Исчисление абсолютных и относительных показателей ряда динамики по цепной и базисной системе.
контрольная работа [776,1 K], добавлен 28.09.2011