Теоретические основы формирования рядов распределения
Понятие о рядах распределения, их типы и составляющие. Дискретные и непрерывные виды законов разделения. Основные аспекты применения концепции Гаусса. Разработка критерия согласованности Пирсоном. Исследование отношений двух выборочных дисперсий Фишером.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 12.05.2015 |
Размер файла | 154,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ФОРМИРОВАНИЯ РЯДОВ РАСПРЕДЕЛЕНИЯ
1. Понятие о рядах распределения, их виды и составляющие
Единицы статистической совокупности характеризуются многими признаками, значения которых изменяются от одной единицы к другой. Чтобы изучить характер распределения единиц изучаемой совокупности по варьирующим признакам, получить полную характеристику ее состава, выявить закономерности распределения ее единиц по тому или иному признаку, строят ряды распределения. Построение и анализ рядов распределения дает возможность выявить и отразить характерные свойства, особенности социально-экономических явлений. Поэтому изучение рядов распределения - одна из центральных проблем статистической науки.
Ряд распределения - это такое распределение единиц статистической совокупности по значению какого-либо признака, когда каждому значению или группе значений этого признака соответствует некоторое число единиц совокупности [1, с. 171]
Построение рядов распределения является первым шагом в обработке статистической информации, полученной в результате проведения статистического наблюдения. Одновременно эти ряды являются основой дальнейшей детальной и основательной всесторонней разработки этой информации, а также ее анализа. Их строят в результате группировки единиц изучаемой статистической совокупности по значению или разновидностями любого признака и подсчетом количества единиц в каждой группе.
В общем виде любой ряд распределения является таблицей, состоящей из двух столбцов (строк): один столбик (строка) содержит отдельные значения или разновидности любого признака, которые называются вариантами и обычно обозначаются ; второй столбец (строка) содержит абсолютные числа, которые показывают сколько раз повторяются отдельные значения вариантов. Эти абсолютные числа называются частотами и обозначаются [6, с.54]. Сумма всех частот ряда распределения равна общей численности единиц изучаемой совокупности и называется объемом ряда распределения, или объемом совокупности, который обозначается n, то есть:
.
Варианты и частоты являются основными структурными элементами ряда распределения, его главными определяющими составляющими. Их наличие позволяет выделить ряд распределения как самостоятельное средство описания и анализа статистической совокупности.
Ряд распределения перестает быть самостоятельным средством статистического анализа, если он, кроме своих основных составляющих, то есть вариант, частот и других производных от них, так называемых частотных характеристик (частости, кумулятивные частоты и частости), имеет другие статистические характеристики, в частности средние показатели.
На основе частот ряда распределения определяются частотные характеристики ряда распределения, которые дают возможность всесторонне и детально изучить любую статистическую совокупность [4, с. 142].
Роль и значение каждой характеристики ряда распределения в изучении статистической совокупности:
1. Частоты () характеризуют степень распространенности этой варианты или группы вариант среди единиц совокупности.
2. Частости (), то есть модифицированные частоты, определяются делением частот отдельных вариант на общее число единиц совокупности по формуле:
= .
Сумма всех частостей, рассчитанных по этой формуле, равна единице. Так,
,
Итак, если частости выражены в коэффициентах, то сумма частостей всех вариант ряда распределения равна единице, то есть [14, с.64].
Однако частости, выраженные в коэффициентах, то есть в виде десятичных дробей, довольно трудно воспринимаются в практической работе. Поэтому их подают в удобном для восприятия и анализа виде, умножив на 100, 1000, 10000 или 100000 и получив характеристики, которые называются процентами (%), промилле (‰), продецимилле (о/ооо), просантимилле (о/оооо).
3. Кумулятивные частоты и частости вычисляются суммированием частоты или частости такой варианты или группы вариант ряда распределения частот или частостей всех предыдущих вариантов, т.е. кумуляцией частот или частостей сверху вниз, начиная с частоты или частости этой варианты или группы вариант.
Кумулятивная частота первой варианты или группы вариант ряда распределения равна ее собственной частоте, а последней варианты или группы вариант - объема совокупности, т.е.
Кумулятивные частоты показывают, сколько единиц совокупности не превышает такого значения признака, т. е. количество единиц совокупности имеют варианты, меньше или ниже определенной варианты.
Кумулятивные частости показывают, какая доля (процент) единиц совокупности превышает такую варианту, то есть имеет варианту, меньшую или большую этой варианты.
Кумулятивные частоты и частости используются для построения так называемых кумулятивных рядов, с помощью которых можно не только получать важные показатели для характеристики структуры изучаемой статистической совокупности, но и значительно расширять возможности ее анализа, в частности изучать процесс концентрации исследуемого явления, степень его дифференциации, определять важные статистические характеристики ряда распределения - так называемые порядковые статистики - квантили, разбивающие совокупность на ряд равных по численности частей [1, с. 175-176].
Как уже отмечалось, построение рядов распределения основывается на группировке единиц совокупности по варьирующим признакам.
Ряды распределения могут быть построены по любому варьирующему признаку, который присуща единицам этой статистической совокупности. Выбор того или иного признака, по которому выполняется построение ряда распределения, т.е. группировочного признака, определяется прежде всего задачами и целями такого исследования. Построение рядов распределения должно осуществляться на основе существенных, вполне объективных и легко опознавательных группировочных признаков, которые наиболее полно и точно характеризуют исследуемую статистическую совокупность, позволяют выявить ее типичные черты и характерные особенности.
В зависимости от того, какой признак положен в основу построения рядов распределения - атрибутивный или количественный, выделяют соответственно два их вида: атрибутивные и количественные.
Атрибутивными рядами распределения называют такие, которые построены по качественным признакам. При построении атрибутивных рядов распределения число групп соответствует числу разновидностей атрибутивного признака, который положен в основу построения такого атрибутивного ряда распределения [2, с.246].
Атрибутивные ряды распределения позволяют изучить состав изучаемой совокупности по тем или иным существенным признакам. Построение атрибутивных рядов по нескольким периодам дает возможность исследовать изменение структуры, т.е. структурные сдвиги, и на основе этого выявить важнейшие закономерности изменения исследуемого явления.
Разновидностью атрибутивных рядов распределения являются альтернативные ряды, которые образуются на основе альтернативных признаков, например, распределение рабочих по наличию прогулов [14, с.51].
Количественные ряды распределения - это такие, которые образованы по количественным признакам. В современной статистической литературе ряды распределения, построенные по количественным признакам, обычно называют вариационными. Количественные ряды распределения в зависимости от способа их построения бывают двух видов: дискретные и интервальные [2, с.247].
Дискретные ряды распределения - это ряды, построенные на основе отдельных значений количественных признаков как прерывных, так и непрерывных. Дискретные ряды образуются тогда, когда количественный признак, прерывный или непрерывный, приобретает малое число значений, то есть их количество весьма ограничено, практически оно не превышает 10-15 значений. В этом случае, как и при построении атрибутивных рядов распределения, вопрос о количестве групп не ставится, потому что их столько, сколько значений приобретает признак, который положен в основу построения такого дискретного ряда [5,с. 108].
Характерной особенностью дискретных рядов распределения является то, что частоты или частости в них относятся к конкретным значениям количественных признаков, которые положены в основу их построения, то есть они показывают, сколько раз встречается такая варианта в совокупности.
Интервальный ряд распределения - это упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины. Интервальные ряды предназначены для анализа распределения непрерывно изменяющегося признака, значение которого чаще всего регистрируется путем измерения или взвешивания. Интервалы могут быть равные и неравные.
При построении интервальных рядов распределения, как и структурных и аналитических группировок, могут быть применены следующие методы: равных интервалов, кратности интервалов, равных частот. Применение этих методов основывается на анализе характера и степени вариации группировочного признака. Для изучения вариации группировочного признака целесообразным является построение так называемого ранжированного ряда [2, с. 250-251].
В интервальных рядах распределения с равными интервалами частоты и доли дают представление о степени их заполнения единицами совокупности, возможность непосредственного сравнения, а следовательно, и сделать выводы относительно значимости того или иного интервала в этом ряду распределения. В интервальных рядах распределения с неравными интервалами непосредственно сравнивать частоты или частости нельзя, поскольку их величины зависят не только от значений признака, которые определяют границы интервалов, но и от величины интервалов. Чем шире интервал, тем больше он будет иметь единиц совокупности.
Для обеспечения сравнимости частот или частости рядов распределения с неравными интервалами, определяют особый показатель, который называется плотностью интервалов распределения. Плотность распределения показывает, сколько единиц совокупности или какой их процент приходится в среднем на единицу величины интервала. Она определяется делением частоты или частости ( или ) соответствующего интервала на его величину (). В первом случае получим абсолютную плотность распределения: , а в другом - относительную: [3, с. 106].
В интервальных рядах распределения частоты или частости принадлежат не к отдельным значениям изучаемого признака, а ко всему интервалу в целом и показывают число или частость единиц совокупности, в которых этот признак приобретает значение в рамках такого интервала. Конкретные значения признака этих единиц совокупности остаются неизвестными. Одновременно при анализе интервальных рядов распределения возникает необходимость сопоставлять частоты и частости с определенным значением признака, то есть присваивать всем единицам совокупности, попавшим в данный интервал, одно и то же значение. Как правило, в таком случае для каждого интервала условно принимают его среднее значение, которое определяется как полусумма двух его границ, то есть по формуле:
,
где - нижняя граница
- верхняя граница
Поскольку , получаем еще и такую ??формулу для вычисления середины интервала:
,
Эту формулу целесообразно применять в случае, когда нижняя граница интервала не совпадает с верхней границей предыдущего интервала [5, с.87].
Использование середины интервала основывается на предположении, что в пределах интервала отдельные значения признака распределяются равномерно и определенная в таком случае середина интервала является средней величиной этих значений. На самом деле распределение отдельных значений признака в пределах интервалов может быть неравномерным, и тогда середина интервала несколько отклоняется от настоящей средней величины интервала.
Ряды распределения могут быть построены как по какому-то одному признаку, так и по двум и более. Ряды распределения, построенные по одному признаку, называются простыми, или одномерными, по двум и более - комбинационными, или многомерными. Многомерные ряды распределения, в частности, построенные по двум признакам, один из которых является факторным, а другой - результативным, находят применение при изучении связи между явлениями [15, с.97].
Описанные выше основные статистические характеристики рядов распределения имеют важное значение не только для построения рядов распределения, но и для их анализа.
2. Основные виды законов распределения
Закон распределения характеризует случайную величину с точки зрения теории вероятностей. Распределение вероятностей тесно связан с рядами распределения частот. Если рассматривать ряды распределения как перечень возможных результатов или групп измерений и соответствующих им частот каждого результата, то аналогичное определение можно дать и распределению вероятностей.
В практических и научных расчетах иногда приходится анализировать признак, который является случайной величиной с неизвестным характером статистического распределения, то есть его законом. Чтобы найти этот закон распределения, проводят статистическое наблюдение по случайным изменениям в определенных условиях и получают вариационный ряд, который дает представление о его эмпирическом распределение. По этому распределению случайной величины необходимо найти неизвестный ее закон как общий закон распределения исследуемого признака [4, с.134].
Законов, по которым распределяется случайная величина, достаточно много. распределение дискретный согласованность выборочный
Классическими принято считать три теоретических распределения, которые по своей научной значимости занимают видное место среди других. Если рассматривать в хронологическом порядке их открытия, то названия этих теоретических распределений разместятся в такой последовательности: биномиальное (открытый Я.Бернулли, 1700), нормальный закон распределение (Демуавр, 1773; Гаусс, 1809; Лаплас, 1812) и закон распределения Пуассона (С.Пуассон, 1837). Среди названных важным законом, на котором основывается большинство статистических методов исследования, есть закон нормального распределения [6, с. 278].
Размещено на http://www.allbest.ru/
Рис.1.1 Виды законов распределения
Закон нормального распределения, или закон Гаусса - один из самых распространенных законов. Это фундаментальный закон в теории вероятностей и в ее применении. Нормальное распределение чаще всего встречается в изучении природных и социально-экономических явлений. Иначе говоря, большинство статистических совокупностей в природе и обществе подчиняется закону нормального распределения.
Нормальным называют распределение вероятностей непрерывной случайной величины, имеющей плотность:
,
где - математическое ожидание или средняя величина.
Нормальное распределение определяется двумя параметрами: і . Чтобы задать нормальное распределение, достаточно знать математическое ожидание или среднее и среднее квадратическое отклонение [4, с.145]. Эти две величины определяют центр группировки и форму кривой на графике (рис.1.2).
Рис.1.2 Кривая нормального распределения (кривая Гаусса)
Основные аспекты применения нормального распределения в статистико-математическом анализе:
1. Для определения вероятности конкретного значения признака. Это необходимо при проверке гипотез о соответствии того или иного эмпирического распределения нормальному.
2. При оценке ряда параметров, например, средних, методом максимального правдоподобия. Суть его заключается в определении такого закона, которому подчиняется совокупность.
3. Для определения вероятности выборочных средних относительно генеральных средних.
4. При определении доверительного интервала, в котором находится приближенное значение характеристик генеральной совокупности.
Распределение Стьюдента. При рассмотрении вопроса средней арифметической в выборках, которые взяты из генеральной совокупности и подчиняются закону нормального распределения, становится очевидным, что это распределение зависит от среднего квадратического отклонения () [7, с.43].
В практических расчетах значение среднего квадратического отклонения, как правило, неизвестно, что вызывает определенные расчетные осложнения. Это обстоятельство побудило английского статистика В.С. Госсета (он печатался под псевдонимом Стьюдент) заняться поиском такого распределения средней арифметической, который не зависел бы от среднего квадратического отклонения.
Поставленная задача Стьюдента была решена в 1908 г. Открытый закон распределения поднял на новую ступень теорию статистического оценивания и теорию проверки статистических гипотез. Он установил, что вероятность нормированного отклонения выражается уравнением:
,
где - вероятность того, что стандартизованная разница между имеет величину ;
- среднее значение первой совокупности
- среднее значение второй совокупности
С - некоторый коэффициент, который зависит от объема выборки.
Размер его составляет:
,
где и - гамма-функции.
Закону распределения t-Стьюдента подчиняются малые выборки, полученные из нормального распределения совокупностей. Характерной особенностью этого распределения является то, что вероятность значения t зависит от двух величин: объема выборки (n) и нормированного отклонения (t) [7, с.48].
При увеличении численности выборочной совокупности распределение Стьюдента приближается к нормальному:
,
Распределение . При проверке статистических гипотез рассматриваются вопросы о критериях согласованности. Последние позволяют решить задачу о соответствии или несоответствии определенного закона распределения, выбранного для отображения исследуемого эмпирического ряда распределения. Рассчитанные критерии согласия предопределяют возможность (или невозможность) принятия для исследуемого ряда распределения модели, которая выражается некоторым теоретическим законом распределения [9, с.116].
Для характеристики (оценки) различия эмпирических и теоретических частот английский статистик Карл Пирсон разработал критерий согласованности - . Этот критерий применяют в тех случаях, когда необходимо определить степень отличия фактического распределения частот от теоретического.
Если в выборку из генеральной совокупности, распределенной по нормальному закону (, ввести центрированные и нормированные величины и суммировать их квадраты, получим значение величины :
,
Если принять ряд эмпирических и теоретических частот соответственно по , вычисление - критерия выразится формулой:
,
Чем меньше эмпирические и теоретические частоты в отдельных группах отличаются друг от друга, тем меньше эмпирическое распределение отличается от теоретического, то есть тем в большей степени эмпирическое и теоретическое распределения согласуются между собой [9, с.118].
Для оценки существенности расчетной величины -критерия оно сравнивается с табличным (критическим) значением , определяемым по статистическим таблицам значений -критерия. определяют в зависимости от уровня значимости б (вероятность ошибки) и числа степеней свободы m (m=k - 3, где k - число групп). Уровень значимости выбирается таким образом, что = б. Обычно б принимается равным 0,05 или 0,01, что соответствует вероятности 95% или 99%. Если , то считают, что распределения близки друг другу, различия между ними несущественны.
Распределение Фишера-Снедекора. В целом ряде задач, которые решает математическая статистика, в частности в дисперсионном и корреляционно-регрессионном анализе, используется «распределение F», названный так по первой букве фамилии английского статистика-математика Р.Фишера. Если независимые случайные величины с распределениями , и степенями свободы соответственно, то случайная переменная F составит:
,
Полученная величина называется случайной переменной с распределением Фишера-Снедекора с степенями свободы. Принимая, что величина F будет иметь только значение, не меньше чем 1 [10, с.193].
Плотность вероятности случайной переменной F, которая имеет распределение Фишера-Снедекора с степенями свободы, имеет вид:
,
Распределение F обусловлено и определяется двумя параметрами, то есть числами степеней свободы . Распределение случайной переменной F представлено в виде специальных математических таблиц. Последние построены так, чтобы для разных уровней доверительной вероятности (в основном для ; ; ) и для различных сочетаний числа степеней свободы даются значения F. Если принять обозначения расчетной и табличной величины F соответственно как , то для них справедливо будет равенство = a [22, с.206].
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух независимых выборок. Для вычисления нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая - в знаменателе. Формула вычисления критерия Фишера такова:
.,
Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fрасч всегда будет больше или равно единице. Число степеней свободы определяется также просто: k1=n1 - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k2=n2 - 1 для второй выборки. По таблицам F-распределения критические значения критерия Фишера находятся по величинам k1 и k2. Если <, нулевая гипотеза принимается, в противном случае принимается альтернативная [9, с.87].
Р.Фишер первым исследовал распределение отношений двух выборочных дисперсий, но предметом его изучения было распределение не отношений дисперсий, а логарифмической величины ln). Несколько позже американский статистик Дж. Снедекор рассчитал таблицы распределения переменной ), что оказалось значительно удобнее для практического использования в расчетах. Это распределение он назвал в честь Фишера «Распределением F». Позже данный вид распределения стали называть «Распределением Фишера-Снедекора» [10, с.196].
Таким образом, знание законов распределения позволяет оценивать параметры генеральной совокупности, проверять статистические гипотезы, осуществлять прогнозные вычисления.
Размещено на Allbest.ru
Подобные документы
Статистические ряды распределения, их значение в статистике. Подразделение вариационных рядов на дискретные и интервальные, особенности их применения. Практическое задание: использование статистических рядов для оценки состояния предприятия и отрасли.
контрольная работа [134,2 K], добавлен 17.11.2009Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.
курсовая работа [1,4 M], добавлен 22.11.2013Понятие дохода и источники его формирования, виды доходов. Неравенство доходов, причины, способы распределения дохода. Важнейшие показатели неравенства. Качество жизни в РФ на современном этапе развития. Регулирование распределения национального дохода.
курсовая работа [1,3 M], добавлен 14.01.2015Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Анализ понятий о диаграммах динамики и диаграммах рядов распределения, линейные диаграммы с равномерными шкалами и на полулогарифмической сетке, радиальные диаграммы. Диаграммы рядов распределения: полигон, гистограмма, кумулята, огива, график Лоренца.
контрольная работа [4,6 M], добавлен 07.08.2010Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.
контрольная работа [226,8 K], добавлен 31.07.2011Понятие, сущность, субъекты и объекты собственности. Влияние на ее зарождение, развитие ее форм и отношений труда и его разделения между людьми. Содержание теоремы Коуза. Пример ее использования при решении проблем распределения прав собственности.
реферат [209,6 K], добавлен 30.01.2015Средняя величина в статистике, ее виды и формы. Средняя арифметическая, средняя гармоническая и условия их применения. Понятие, виды и показатели вариации. Правило сложения дисперсий. Изучение формы распределения признака, ее основные характеристики.
курсовая работа [148,5 K], добавлен 22.12.2010Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014Построение рядов распределения и секторной диаграммы. Графическое изображение дискретного ряда. Показатели центра распределения, к которым относятся мода, медиана, средняя арифметическая. Вычисление основных показателей вариации и формы распределения.
контрольная работа [355,3 K], добавлен 22.12.2013