Сводка, группировка статистических данных
Общее понятие статистической сводки. Метод группировки как основа статистической методологии. Особенности рядов распределения. Понятие полигона, гистограммы распределения и их применение в статистике. Основные элементы статистических показателей.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 14.08.2010 |
Размер файла | 44,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
17
Сводка, группировка статистических данных
Общее понятие статистической сводки
На основе информации, собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Полученные данные не являются обобщающими показателями, с их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных. Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей. Статистическая сводка - научная обработка первичных материалов статистического наблюдения, представляющая собой совокупность приемов, включающих следующие операции:
группировку данных статистического наблюдения;
суммирование показателей по отдельным группам, т. е. подсчет групповых и общих итогов, что получило название «сводка в узком смысле слова»;
разработку и подсчет системы статистических показателей;
табличное (или графическое) оформление результатов сводки и их анализ.
Сводка, включающая все названные операции, называется «сводкой в широком смысле слова». Статистическая сводка проводится по программе, в которой предусматриваются территориальные границы, группировочные признаки, система статистических показателей, - все это можно отразить в системе макетов разработанных таблиц. План статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителей и порядок изложения результатов. Сводка статистических данных может производиться в централизованном (первичные данные сосредотачиваются в одном централизованном органе, например, Госкомстате РФ, и обрабатываются только в нем), децентрализованном (документы первичного учета обобщаются на местах и в вышестоящий орган направляются уже в итоговом виде) и в смешанном (обработка первичного материала происходит частично на местах и завершается полностью в вышестоящем государственном органе) порядках.
В зависимости от объема данных обработка первичной статистической информации может производиться вручную (при сравнительно небольшом объеме материала) или с помощью машин (ЭВМ и др.).
Метод группировки
Основой статистической методологии является метод группировок. Задачи, решаемые с помощью группировок, настолько широки, что без них практически не обходится ни одно сколько-нибудь научное исследование. Многие методы статистики, сохраняя свои характерные черты и специфические задачи, в той или иной степени опираются на метод группировок (средние, относительные, корреляции). Использование метода статистических группировок повышает эффективность применения других статистических методов.
Группировкой в статистике называется выделение в совокупности общественных явлений важнейших типов, характерных групп и подгрупп по существенным для них признакам.
Группировка - сложная работа и проводится она в следующей последовательности:
намечается перечень типов, групп, которые надо выделить;
выбираются группировочные признаки;
определяются интервалы и число групп;
разрабатывается система показателей и характеризуются выделенные группы;
определяется характер взаимодействия между отдельными признаками в совокупности в целом и по выделенным группам;
оценивается влияние фактора на изменение результативного признака.
Установление типов, подлежащих выделению при группировке, требует глубоких теоретических познаний и знания конкретной действительности. Но часто приходится сталкиваться с конкретными различиями в формах исследуемого процесса, поскольку там, где имеет место развитие, всегда следует ожидать многообразия конкретных форм, поэтому теоретически трудно установить типы. Обоснованность полученных результатов группировки в основном определяется группировочным признаком. Группировочный признак должен выражать сущность исследуемого процесса, отражать состоятельность явлений в соответствии с конкретными условиями и особенностями их развития. Необходима комбинация группировочных признаков для достаточно полного проявления существующих типов. В основу группировки могут быть положены как количественные, так и качественные группировочные признаки.
Качественные (атрибутивные) группировочные признаки - это признаки, которые не могут быть выражены количественно (пол, национальность и т. д.). При группировке большое значение имеет число групп. Если признак атрибутивный, то количество групп определяется числом качественных градаций. Группировки по атрибутивным признакам часто называют классификациями.
Под классификацией следует понимать более устойчивое разграничение объектов, которое обычно содержит подробную номенклатуру. Классификация отличается научной обоснованностью, народнохозяйственными принципами построения, которые позволяют сопоставлять статистические материалы различных отраслей. Классификация отличается многоступенчатостью. В группировках тоже применяются комбинационные признаки, но в группировках группировочный признак для всех групп единый и подгруппы также выделяются по общему для них признаку, а в классификациях распределение ведется по специализированным признакам в разрезе выделенных отраслей, подотраслей. При установлении количества групп, когда признак количественный, их число будет зависеть от характера изменения группировочного признака (при большой его вариации число групп будет большим); от конечной цели исследования; от объема исследуемой совокупности. При этом, если совокупность небольшая, число групп можно устанавливать по графику ранжированного ряда группировочного признака при условии четко выраженного характера его изменения.
При плавном изменении группировочного признака и при большой численности единиц исследования число групп можно определить по формуле Стерджесса:
(1)
Где n - число групп;
N - численность единиц исследования.
Способы проведения статистических группировок разнообразны.
Разбивку единиц исследуемой совокупности проводят по интервалу.
Интервалом в статистике называют количественные значения признака, на основе которых исследуемая совокупность разбивается на группы. Каждый интервал имеет свою величину, верхнюю и нижнюю границы. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала. Применяют открытые и закрытые интервалы. Открытые - это те интервалы, у которых указана только одна граница: верхняя - у первого интервала или нижняя - у последнего. У закрытых интервалов указываются верхняя и нижняя границы. Существенное значение имеет определение границ интервала. Закрытые интервалы, если группировочный признак имеет плавный характер изменения, могут быть равными и неравными. Величина равного интервала определяется по формуле
(3.2)
где h - величина интервала;
- максимальное и минимальное значения группировочного признака;
n - число групп.
При установлении числа групп и границ интервалов важно увидеть за количественными изменениями качественные переходы и не смешать существенно различные единицы наблюдения в одной группе. В экономической практике в основном применяются неравные интервалы.
Неравные интервалы могут быть прогрессивно возрастающими или убывающими в арифметической или геометрической прогрессии и определяются следующим образом:
(3.3)
Где а - константа-число, которое будет положительным при возрастающих интервалах, и отрицательным при убывающих интервалах;
q - константа - число, которое при возрастающих интервалах больше 1, а при убывающих - меньше 1.
При определении границ интервалов статистических группировок исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.
Один из способов определения числа групп основан на применении показателя среднего квадратического отклонения . Мера вариации (колеблемости) называется дисперсией (), а корень квадратный из дисперсии - средним квадратическим отклонением (). В зарубежной литературе этот показатель называется стандартным отклонением
, (3.4)
где - среднее значение признака по совокупности, которое определяется по формуле
, (3.5)
где - i-е значение варьирующего признака.
Если величина интервала 0,5 , то совокупность разбивается на 12 групп, когда величина интервала 2/3, то совокупность делится на 9 и 6 групп. Этот метод не дает гарантии, что не будут сформированы малочисленные группы или “пустые”. “Пустыми” считаются группы, в которые не попала ни одна единица совокупности, группировка построена неправильно. При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными. Группировка с произвольными интервалами может быть построена с помощью коэффициента вариации
(3.6)
Построение начинается с упорядочения единиц совокупности по возрастанию или убыванию группировочного признака. В ряду значения объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не достигнет 33 %, что свидетельствует об образовании первой группы, и т. д., пока все единицы совокупности не будут объединены в группы.
В основе определения величины интервала должно учитываться экономическое содержание исследуемого явления. Для характеристики существенных типов применяются и специализированные интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Основными требованиями при установлении числа групп и границ интервалов являются:
однородность значения признака в каждом интервале;
достаточная численность единиц для того, чтобы интервал решил свою задачу.
Виды статистических группировок
При помощи группировок в основном решаются следующие задачи:
выделяются существующие социально-экономические типы, однородные группы и подгруппы;
изучается состав социально-экономических явлений и структурные сдвиги, их влияние на развитие исследуемого явления;
исследуются взаимосвязи между признаками.
Статистические группировки по целям исследования разделяются на типологические, структурные и аналитические.
Типологическая группировка - это разделение исследуемой качественно разнородной совокупности на классы, социально- экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером типологической группировки является группировка промышленных предприятий по формам собственности. Особая роль принадлежит выбору группировочных признаков. За основание группировки должны быть взяты наиболее существенные признаки, которые непосредственно характеризуют сущность явлений. Группировки должны быть обоснованы экономически.
Структурными называются группировки, в которых происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. Они имеют большое практическое значение для изучения структуры однотипных явлений. Примерами могут служить группировки предприятий по числу рабочих, группировки по неиспользованным резервам основных фондов производства, группировки по факторам повышения производительности труда, улучшения качества продукции и т. д.
Группировки, которые применяются для исследования взаимосвязи между явлениями, называются аналитическими. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки. Результативные - признаки, которые изменяются под влиянием факторных. Чтобы исследовать взаимосвязь между отобранными признаками с помощью метода аналитических группировок, необходимо произвести группировку единиц совокупности по факторному признаку и по каждой группе исчислить средние значения результативного признака, вариация которого от группы к группе под влиянием группировочного признака будет указывать на наличие или отсутствие взаимосвязи.
По числу группировочных признаков, взятых в основу группировки, различают группировки простые (по одному признаку) и комбинационные (по двум и более признакам). При комбинационной группировке группы, выделенные по одному признаку, разбиваются на подгруппы по другому признаку, последние в свою очередь могут разбиваться по третьему. Т. е. создается возможность исследования влияния нескольких признаков в отдельности и совокупности на результат. Но увеличение числа групп может привести к недостаточной численности единиц в группах. Отсюда возникает опасность на основании небольшого числа наблюдения делать малообоснованные, случайные (ненадежные) выводы.
Ряды распределения
Ряды распределения характеризуют распределение единиц совокупности по группировочному признаку и позволяют судить об однородности исследуемого явления, закономерностях развития. Ряд распределения по качественному признаку называют атрибутивным статистическим рядом (осуществляется по полу, образованию и др.).
Ряд распределения по количественному признаку называют вариационным. Вариационные ряды состоят из вариант (индивидуальные значения анализируемого признака), частот (численность вариантов или каждой группы вариационного ряда), частостей (частоты, выраженные в долях единицы или в процентах к итогу). Сумму всех частот ряда называют объемом ряда распределения.
По характеру изменения признака различают дискретные (прерывные) и интервальные (непрерывные) вариационные ряды.
Дискретные количественные признаки могут принимать только определенные значения, между которыми не могут иметь места промежуточные. Варианты дискретных признаков выражаются обычно в виде целых чисел (число детей в семье, тарифные разряды и т. п.).
Количественные признаки, которые могут в определенных пределах иметь как целые, так и дробные значения, называются непрерывными (стаж, возраст). В случае непрерывного распределения величина признака выражается в виде интервалов (интервальный ряд распределения).
Ряд единиц статистической совокупности, расположенный в порядке возрастания или убывания вариант, называют ранжированным рядом. Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сопоставимости их во времени и пространстве. Вариационные ряды с равными интервалами обеспечивают это требование. В рядах с неравными интервалами частоты непосредственно несопоставимы, что не позволяет правильно оценить характер распределения изучаемого явления по этому признаку. Для обеспечения сопоставимости в таких случаях исчисляют плотность распределения (т. е. сколько единиц в каждой группе приходится на единицу величины интервала). И анализ проводится не по частотам, а по плотности распределения.
Удобнее ряды распределения анализировать при помощи графического изображения - полигона и гистограммы, приведенных на рис. 1.
Полигон используется при изображении дискретных вариационных рядов. Для его построения в системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала величины частот. Полученные на пересечении абсцисс и ординат точки соединяются прямыми линиями, в результате получают ломаную линию, называемую полигоном частот.
Гистограмма применяется для изображения интервального вариационного ряда. При ее построении на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах.
Рис. 1. Полигон и гистограмма распределения
Для графического изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не превышающие рассматриваемое значение.
При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат - накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Эти перпендикуляры соединяют и получают ломаную линию, т. е. кумуляту.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву.
Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется одним показателем - численностью единиц объекта, попавших в каждую группу. Для получения обобщенной комплексной характеристики социально-экономического явления используют не отдельные показатели, а систему статистических показателей, которая предусматривает исчисление абсолютных, относительных и средних величин.
Статистические таблицы
Табличный метод является основным приемом обобщения данных статистического наблюдения и широко применяется в научной и практической работе. Статистические таблицы были разработаны русским географом и статистиком И. К. Кирилловым. Статистические таблицы, как правило, получаются в результате сводки. Многие считают таблицы самой рациональной формой изложения, но суть таблицы не в ее форме, а в содержании.
Статистической таблицей называется комплекс статистических показателей, изображенных особым способом, при котором общее содержание показателей указывается в наименовании столбцов и строк, а величины показателей приводятся цифрами на пересечении столбцов и строк. Основными элементами статистических таблиц являются макет, примечания, числовые данные.
Макетом статистической таблицы называется ее форма, имеющая общий заголовок, заголовки горизонтальных строк и вертикальных граф (столбцов). Правильность составления макета зависит от того, как скомпонованы ее основные части, из которых складывается ее логическое содержание: подлежащее и сказуемое.
Подлежащим статистической таблицы называется объект или группы, которые характеризуются в таблице. Подлежащее статистической таблицы показывает, о чем идет речь в таблице.
Сказуемым статистической таблицы называется комплекс статистических показателей, которыми характеризуется подлежащее таблицы. Глубина анализа будет зависеть от подлежащего и системы статистических показателей - сказуемых таблицы.
В зависимости от характера подлежащего различают следующие виды статистических таблиц: простые, групповые, комбинационные. Самым распространенным видом являются простые таблицы, они необходимы и в то же время достаточны для разнообразных практических и справочных целей. В простой статистической таблице в подлежащем нет группировки, а дается перечень, единицы времени, территориальные единицы. К простым таблицам относят и ряды распределения.
В подлежащем групповой статистической таблицы объект исследования представлен рядом групп по одному существенному признаку, а сказуемое построено так, что ясно прослеживается изменение сказуемого с изменением подлежащего.
Таблицы, в которых подлежащее разбивается на группы по двум или более признакам, называются комбинационными. По такой таблице возможен не только анализ по признакам подлежащего отдельно, но и возможно установить их совместное влияние на изменение признаков сказуемого статистической таблицы.
По назначению статистические таблицы можно подразделить на описательно-информационные, хронологические, вариационно- динамические (система вариационных и динамических рядов).
Основная задача сказуемого статистической таблицы - дать характеристику подлежащего системой статистических показателей, число которых должно быть достаточно полным для решения поставленной задачи. Различают статистические таблицы с простой разработкой сказуемого (его характеристика ограничена подсчетом по одному или нескольким изолированно взятым признакам) и сложной (выделенные признаки распределяются еще на подгруппы).
При построении таблиц необходимо учитывать следующее:
таблицы должны быть небольшими;
общий заголовок должен быть точным, кратким, выразительным, отражающим основное содержание таблицы;
названия подлежащего и сказуемого должны быть точными и краткими, без сокращения слов, с указанием единиц измерения, с учетом стандартов;
величину анализируемых показателей для большей наглядности и облегчения чтения таблиц лучше записывать с небольшим числом значащих цифр, многозначные абсолютные показатели округляются. Если нет сведений, ставится многоточие (…), если данное явление отсутствует, ставят тире (-), если сведения имеются, но числовые значения меньше принятой в таблице точности, то ставят 0,0. Если пересечение строки и графы не имеет осмысленного содержания, то клетка перечеркивается (х);
порядок расположения показателей: вначале ставится численность совокупности, затем абсолютные величины, затем средние и относительные .
Графики
Графический метод является важным орудием науки, особенно в статистических и экономических исследованиях.
Основными элементами графика являются:
графический образ (основа графика) - совокупность геометрических знаков: линий, фигур и точек, которыми изображаются статистические показатели;
поле графика - место, где расположены графические образы;
пространственные ориентиры, определяющие размещение геометрических знаков на поле;
масштабные ориентиры, дающие этим знакам количественную определенность;
экспликация графика - словесное объяснение содержания графика, каждого его геометрического знака.
Наиболее распространенными в аналитической работе являются следующие виды графиков: диаграммы, картограммы и картодиаграммы.
Диаграмма представляет собой чертеж, показывающий соотношение статистических величин при помощи разнообразных геометрических и изобразительных средств.
Для изображения структуры или динамики изучаемого явления применяются столбиковые диаграммы. Они представляют собой график, в котором различные величины показаны в виде прямоугольников одинаковой и разной высоты, расположенных вертикально. Построение столбиковой диаграммы требует только одной масштабной шкалы, которая определяет высоту каждого столбика.
Ленточные (полосные) графики - в которых различные величины представлены прямоугольниками, расположенными по горизонтали, что значительно удобнее для расположения соответствующих надписей.
Квадратные и круговые - это графики, в которых статистические показатели изображены для сравнения в виде кругов и квадратов.
Фигурные - это несколько измененные полосовые диаграммы. В них полосу делят на равные прямоугольники, в пределах которых изображают одинаковой величины фигуры, соответствующие цифрам. На фигурных диаграммах сравнивают не только количество фигур, но и длину полос.
Секторные представляют собой круг, разделенный радиусами на отдельные секторы. Каждый сектор, по-разному заштрихованный, характеризует какую-то часть целого и занимает площадь круга пропорционально удельному весу этой части. Лучше всего структуру отображать в процентах. Тогда весь круг 360 равен 100 %, а сектор в 3,6 приходится на 1 %. Наглядность достигается тем, что в кругу глаз улавливает удельный вес отдельных частей в целом.
Картограмма представляет собой географическую карту или схему, на которой при помощи некоторых условных знаков (штриховкой, окраской или точками) показаны степень распространения того или иного явления в пространстве (например: уровень преступности, плотность населения и т. д.).
Картодиаграмма - это сочетание географической карты или ее схемы (с четким административным делением и с удалением географического содержания) с диаграммой. Различные фигуры ставятся при этом не в ряд, как на обычной диаграмме, а разносятся в определенном масштабе по всей карте в соответствии с теми районами, которые они представляют.
Литература
1. Теория статистики: Учебник / Под ред. проф. Р.А. Шмойловой. - М.: Финансы и статистика, 2007. - 560 с.
2. Практикум по теории статистики: Учеб. Пособие/ Под ред. Р.А. Шмойловой. - М.: Финансы и статистика, 2004. - 416 с.
3. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: ИНФРА-М.2002. - 387 с.
4. Ефимова М.Р., Петрова Е.В., румянцев В.Н. Общая теория статистики: Учебник. - М.:ИНФРА-М,2001. - 346 с.
5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности /Под ред. О.Э. Башиной, А.А Спирина. - М.: Финансы и статистика, 2003. - 298 с.
6. Экономическая статистика: Учебник/ Под ред. Ю.Н. Иванова. - М.: ИНФРА-М, 2007. - 480 с.
7. Гусаров В.М. Статистика: Учеб. Пособие для вузов. - М.: ЮНИТИ-ДАНА, 2003. - 463 с.
Подобные документы
Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Виды статистических методов анализа данных. Применение выборочного наблюдения в правовой статистике. Исследование стажа работы, тарифных разрядов и заработной платы рабочих цеха. Построение рядов распределения и расчет абсолютных показателей вариации.
курсовая работа [295,5 K], добавлен 14.04.2014Теоретические основы первичной обработки статистической информации. Особенности определения минимального числа объектов наблюдения при оценке показателей надежности. Анализ вероятностной бумаги законов нормального распределения и распределения Вейбулла.
курсовая работа [163,5 K], добавлен 22.03.2010Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.
методичка [411,0 K], добавлен 15.12.2008Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Основные задачи статистики предприятия, населения, инвестиций. Способы, формы и виды статистического наблюдения. Сводка и группировка статистических данных. Структурная и аналитическая группировка данных. Абсолютные, относительные и средние величины.
контрольная работа [262,6 K], добавлен 07.03.2011Построение рядов распределения с произвольными интервалами и с помощью формулы Стерджесса. Построение статистических графиков. Расчет и построение структурных характеристик вариационного ряда. Общая характеристика исследуемых статистических совокупностей.
курсовая работа [654,9 K], добавлен 12.04.2009Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.
методичка [741,9 K], добавлен 28.12.2008Типологическая, структурная, аналитическая группировка данных. Определение моды и медианы распределения. Зависимость прибыли от развития компании. График, отражающий изменение прибыли фирмы. Особенности группировки данных по системе варьирующих признаков.
контрольная работа [959,9 K], добавлен 12.02.2012Расчет коэффициентов регрессии. Теоретическая и экспериментальная зависимость параметров а и b. Определение значений статистической дисперсии и среднеквадратического отклонения. Составление графика гистограммы распределения признака и кумулятивной прямой.
контрольная работа [679,1 K], добавлен 12.05.2014