Группировка данных
Виды статистических группировок. Группировка предприятий города по формам собственности. Формула Стэрджесса. Ряды распределения и группировки. Формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 02.11.2012 |
Размер файла | 48,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
В данном реферате рассмотрим такой важный раздел статистики, как «группировки». Для того чтобы сделать это, необходимо выполнить ряд задач:
- узнать, какие существуют виды группировок, по какому принципу происходит разделение;
- выяснить значение двух понятий - «ряд распределения» и «группировка»;
- узнать, какие показатели используются для тех или иных оценок группировок;
- понять, что такое многомерные группировки.
После выполнения вышеизложенных задач, тема «группировка» будет раскрыта.
1. Виды статистических группировок
Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка. Группировка - объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака [3].
Понятие статистической группировки в широком смысле слова охватывает целый комплекс статистических операций. Прежде всего, к ним относится объединение зарегистрированных при наблюдении единичных случаев в группы, сходные в том или ином отношении, поскольку целостную характеристику совокупности необходимо сочетать с характеристикой основных ее частей, классов и т.д. Затем проводится подсчет итогов по выделенным группам и всей совокупности в целом и, наконец, результаты группировки оформляются в виде статистических таблиц. При составлении плана статистического наблюдения определяется очередность обработки материалов, разрабатываются макеты сводных таблиц, указывается также, кто и в какие сроки осуществляет сводку, каким способом, куда поступают сводные данные и кто проводит их дальнейшую обработку.
Значение группировок состоит в том, что этот метод, во-первых, обеспечивает систематизацию и обобщение результатов наблюдения, а во-вторых, метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений.
В процессе группировки происходит распределение единиц статистической совокупности по группам, однородным в каком-либо существенном отношении, и дается характеристика таких групп с помощью системы показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей [5]. Метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношения различных факторов и определить силу их влияния на результативные показатели.
Огромное значение и роль группировок в статистическом исследовании вытекает из характера объекта статистики, его специфики. Явления общественной жизни, изучаемые статистикой, отличаются многообразием форм и стадий развития, они состоят из существенно различающихся частей, обладающих многими специфическими свойствами.
Изучая количественную сторону массовых общественных явлений в неразрывной связи с их количественными особенностями, статистика стремится показать совокупность явлений дифференциации в многообразии их типов, рассмотреть взаимосвязи и соотношения между последними. С помощью метода группировок решаются сложные задачи статистического анализа.
Необходимость группировки обусловливается, прежде всего, наличием качественных различий между изучаемыми явлениями, и первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов [2].Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в виде, доступном для восприятия.
Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой.
Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.
Основа группировочной таблицы
Название таблицы (общий заголовок)
Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Содержание строк |
Наименования граф (верхние заголовки) |
||||||
А |
1 |
2 |
3 |
4 |
5 |
… |
|
Наименования строк (боковые заголовки) |
|||||||
Итоговая строка |
Итоговая графа |
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком.
Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк.
Подлежащее статистической таблицы - объект, характеризующийся цифрами.
Сказуемое - система показателей, которыми характеризуется объект изучения, т.е. подлежащее.
Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки (…;-; НС) [5].
Группировочная таблица
Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 1999 года).
Поддерживаю |
Не поддерживаю |
Безразлично |
||
Студенты 1 курса |
2 |
20 |
3 |
|
Студенты 2 курса |
2 |
25 |
3 |
|
Студенты 3 курса |
1 |
30 |
2 |
|
Студенты 4 курса |
- |
35 |
- |
|
Студенты 5 курса |
- |
25 |
- |
|
Итого |
5 |
105 |
8 |
Таким образом, группировка - это разделение единиц совокупности на группы по выбранным варьирующим признакам.
Группировки различают:
по задачам систематизации данных;
по числу группировочных признаков;
по используемой информации.
По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам - комбинированные и многомерные).
Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.
Многомерные - строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в N-мерном пространстве, где каждый объект - точка, т.е. построить многомерную группировку - найти скопление точек.
По задачам систематизации данных различают: типологические, структурные и аналитические.
Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.
Структурные группировки - это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации [1].
Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется.
По используемой информации различают первичные и вторичные группировки.
Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
Вторичные - результат объединения или расщепления первичной группировки [6].
При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки, от объема совокупности, степени вариации признака.
При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможны два подхода: группировка с равными и неравными интервалами.
Для определения этих параметров в первом случае рекомендуется формула Стэрджесса:
т = 1 + 3,21 - lgN,
где N - количество наблюдений.
В этом случае величина интервала:
D=,
а границы интервалов:
х =x+(i-1)D
х = x+iD
где х - нижняя, а х - соответственно, верхняя граница.
Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует по мере возможности избегать таких группировок.
2. Ряды распределения и группировки
Ряд распределение - это группировка, в которой для характеристики групп применяется один показатель - численность группы, т.е. это ряд чисел, показывающий, как распределяются единицы совокупности по изучаемому признаку.
Ряды, построенные по атрибутивному признаку, называют атрибутивными рядами. Атрибутивный ряд распределения содержит три элемента: разновидности атрибутивного признака; численности единиц в каждой группе - частоты ряда распределения; численности групп, выраженные в долях (процентах) от общей численности единиц - частости. Сумма частостей равна 1, если они выражены в долях единицы, и 100%, если они выражены в процентах.
Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Числовые значения количественного признака в вариационном ряду распределения называется вариантами, и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.
Дискретные вариационные ряды характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т.е. принимающему целые значения. Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.
В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале. Варианты могут быть целыми и дробными, как угодно мало отличаться друг от друга. Построение непрерывного (интервального) вариационного ряда основано на принципах статистической группировки [4].
Если построен ряд с равными интервалами, частоты дают представление о степени заполнения интервала единицами совокупности. При неравных интервалах сравнивать частоты и судить о степени заполнения разных интервалов нельзя. В целях сравнения заполненности интервалов рассчитывается плотность распределения - число единиц совокупности, приходящееся в среднем на одну единицу ширины интервала. Если плотность распределения определяется отношением частоты на ширину интервала, она будет абсолютной, если отношением частости к ширине интервала - относительной.
Ряды распределения могут строиться по накопленным частотам, которые показывают, какое число единиц имеет величину варианта, не большую данной. Если вместо абсолютных частот взять частости, то аналогично получают накопленные частости.
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Число групп устанавливается по формуле:
K= 1 + 3,32lgN = 1,44 lnN + 1
где k - число групп; N - численность совокупности. Длину интервала рассчитывают по формуле:
Если полученная группировка не удовлетворяет требованиям анализа, то производят перегруппировку. Ряды распределения используются 8 статистике как средство систематизации и упорядочивания материалов наблюдения, для изучения структуры явлений, анализа самих распределений и колеблемости группировочного признака [3].
3. Многомерные группировки
Использование в статистических исследованиях ЭВМ и статистической теории распознавания образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.
Многомерная группировка или многомерная классификация основана на измерении сходства или различия между объектами (единицами): единицы, отнесенные к одной группе (классу), различаются между собой меньше, чем единицы, отнесенные к различным группам (классам). Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектам, представленными точками в n-мерном пространстве. Чем меньше это расстояние, тем больше близость.
Задача многомерной группировки сводится к выделению сгущений точек (объектов) в n-мерном пространстве. Группы (кластеры) формируются на основании близости объектов одновременно по всему комплексу признаков, описывающих объект. Нахождение этих групп осуществляется методами кластерного анализа на ЭВМ.
Многомерные группировки позволяют решать целый ряд таких важных задач экономико-статистического исследования, как формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов и др. в зависимости от вида группировочных признаков различают группировки по атрибутивным и количественным признакам. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Таковы, например, группировки населения по полу, семейному положению, образованию; распределение числа групп при группировке по варьирующему количественному признаку (например, распределение населения по уровню доходов, потреблению отдельных продуктов питания и др.) требует специальных расчетов. [2]
Цель многомерных группировок - классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно. В процессе такой группировки решаются, например, задачи типизации - выделяются самостоятельные экономические или социальные типы явлений. Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно - производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д.
Можно выделить типы предприятий по финансовому положению на основе таких показателей как размер прибыли, уровень рентабельности производства, уровень капитализации, уровень ликвидности ценных бумаг и т.д.
В психологии многомерные группировки используются для выделения типов людей по степени их профессиональной пригодности, в медицине - для диагностики болезней на основе множества симптомов.
При выполнении многомерных группировок могут быть использованы два основных подхода:
* Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.
* Второй подход состоит в использовании методом кластерного анализа.
Представителем первого подхода является метод многомерной средней, алгоритм которого заключается в следующем:
1. Составляется матрица абсолютных значений признаков по всем статистическим единицам - xij,
i=1, n - статистические единицы,
j=1, k - признаки.
2. Абсолютные значения признаков заменяются их нормированными по среднему значению уровнями:
где Pij - нормированное значение j-ого признака у i-ой статистической единицы;
x - среднее значение j-того признака,
3. Для каждой статистической единицы рассчитывается многомерная средняя:
,
k - число оснований группировки;
4. В соответствии со значениями многомерной средней совокупность разделяется на однородные группы, то есть выполняется простая группировка по многомерной средней [7].
При втором подходе к выполнению многомерных группировок каждая единица совокупности, обладающая набором из k признаков рассматривается как точка в k-мерном пространстве - пространстве признаков, а каждому признаку придается смысл координаты. Задача классификации в этом случае сводится к выделению сгущений объектов в этом пространстве. Для этого используются различные алгоритмы, но всегда однородные группы выделяются на основании близости объектов по совокупности признаков.
Мерой близости объектов, то есть мерой сходства единиц совокупности, могут служить различные критерии.
Выделяют три типа мер сходства:
* Коэффициенты подобия;
* коэффициенты связи;
* показатели расстояния.
Коэффициенты подобия используются для измерения степени близости между парой объектов, каждый из признаков которых принимает значения 0 или 1.
Наиболее простой коэффициент подобия рассчитывается по формуле:
где Pij - число совпадений признаков у объектов i и j;
m - общее число признаков, по которым осуществляется сравнение.
0?Sij ?1.
Коэффициенты корреляции используются как измерители силы связи между статистическими единицами или между признаками. Для измерения тесноты связи количественных признаков применяют коэффициенты линейной корреляции.
В кластерном анализе мерой сходства является мера расстояния между двумя объектами I и j. Для количественных признаков используется Евклидово расстояние:
где Pi1 Pj, 1 - стандартизованные значения 1-го признака i-ого и j-ого объекта наблюдения. [5]
Заключение
Поставленные задачи были успешно выполнены, мы выяснили значение статистической группировки, узнали, какие бывают классификации.
Понятие «ряды распределения» также было охвачено в данном реферате. Мы привели примеры различных группировок и методов качественной и количественной оценки их.
Так же были показаны графические способы отображения.
Мы также познакомились с понятием «многомерные группировки», узнали о двух основных подходах, применяемых при формировании многомерных группировок.
Итогом данной работы является наиболее полное и подробное отражение темы «группировки» в рамках поставленных учебным планом задач в виде параграфов данной работы.
группировка стэрджесс совокупность статистический
Список литературы
1. Елисеева И.И., Юзбашев М.М. Общая теория статистики. - М.: Финансы и статистика, 2004. - 656 с.
2. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ-ДАНА, 2003. - 463 с.
3. Кошевой О.С. Основы статистики. Пенз. гос. ун-т, 2005 г., 168 с.
4. Лосева О.В. Буданов К.М., Практикум по общей теории статистики. Издательство: «ПГПУ им. В.Г. Белинского» Год: 2009.
5. Переяслова И.Г., Колбачев Е.Б., Основы статистики. Серия «Учебники, учебные пособия». - Ростов н/Д.: Феникс, 1999. - 320 с.
6. Сизова Т.М. Статистика: Учебное пособие. - СПб.: СПбГУ ИТМО, 2005.
7. Статистика. Рудакова Р.П., Букин Л.Л., Гаврилов В.И., «Питер» - 2007,288 с.
Размещено на Allbest.ru
Подобные документы
Основные виды статистических группировок. Значения группировочного признака. Интервальный ряд распределения. Проведение статистического исследования и формула Стерджесса. Основные ряды распределения и группировки. Графические способы отображения.
реферат [2,3 M], добавлен 19.12.2010Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Понятие сводки и группировки статистических данных, их содержание, виды и основные элементы. Цели и задачи сводки и группировки данных, решаемые задачи и правила проведения. Этапы составления и назначение, виды и характеристика статистических таблиц.
контрольная работа [22,6 K], добавлен 20.04.2009Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".
дипломная работа [1,6 M], добавлен 14.02.2016Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Построение группировки коммерческих банков по величине балансовой прибыли, выделение групп банков с открытыми интервалами для характеристики структуры совокупности коммерческих банков. Построение огивы распределения банков по величине балансовой прибыли.
контрольная работа [61,1 K], добавлен 01.03.2010Метод статистических группировок: сущность, этапы построения и основные классификации. Определение числа групп, расчет ширины интервала группировки. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.
курсовая работа [538,2 K], добавлен 26.10.2009Метод типологической и аналитической группировки. Простые, групповые и комбинационные статистические таблицы. Основные приемы построения и выполнения группировок. Процедура определения оптимального числа групп. Неравные и специализированные интервалы.
реферат [27,7 K], добавлен 05.05.2010Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.
реферат [24,7 K], добавлен 29.03.2013Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.
контрольная работа [23,3 K], добавлен 17.03.2015