Статистические методы обработки данных
Теоретические основы и методология статистики. Формы, виды и способы статистического наблюдения. Понятие статистической сводки и группировки, их виды. Обобщающие статистические показатели. Статистическое изучение динамики и взаимосвязей между явлениями.
Рубрика | Экономика и экономическая теория |
Вид | курс лекций |
Язык | русский |
Дата добавления | 12.11.2017 |
Размер файла | 221,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Министерство образования и науки Российской Федерации
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«Тюменский индустриальный университет»
Кафедра «Экономика и организация производства»
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ:
КОНСПЕКТ ЛЕКЦИЙ
И ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
для обучающихся
по направлению подготовки магистров
210401 «Нефтегазовое дело»
Составитель: к. с. н., доцент Дружинина И.В.
2017 г.
ТЕМА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ И МЕТОДОЛОГИЯ СТАТИСТИКИ
Термин «статистика» (от латинского слова «status» - состояние, определенное положение вещей) в настоящее время употребляется в основном в трех значениях:
1) ОТРАСЛЬ ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ, направленная на сбор, обработку и анализ данных, характеризующих социально-экономическое развитие страны, ее регионов, отраслей экономики, отдельных предприятий;
2) ОТРАСЛЬ ОБЩЕСТВЕННЫХ НАУК, занимающаяся разработкой теоретических положений и методов, которые используются статистической практикой; статистика наблюдение сводка группировка показатель
как наука, статистика - это еще и УЧЕНИЕ О СИСТЕМЕ ПОКАЗАТЕЛЕЙ, дающих всестороннее представление об общественных явлениях, о народном хозяйстве в целом и отдельных его отраслях; - это ИНСТРУМЕНТ ПОЗНАНИЯ, используемый в различных науках для установления специфических закономерностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой;
3) СИНОНИМ СЛОВА "ДАННЫЕ", т.е. числовые (или цифровые) данные, характеризующие различные стороны жизни государства: политические отношения, культуру, население, производство, торговлю и т.д.
Как наука статистика имеет свой предмет и специфические методы исследования.
ПРЕДМЕТ СТАТИСТИКИ - количественная сторона качественно определённых массовых социально-экономических явлений и процессов, их структура и распределение, размещение в пространстве, движение во времени. Статистика также выявляет действующие количественные зависимости, тенденции и закономерности развития явлений, причём в конкретных условиях места и времени.
Теоретическую основу статистики составляют следующие важнейшие категории: совокупность; вариация; признак; закономерность.
СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ - объект статистического исследования (в каждом конкретном случае), т.е. множество единиц, обладающих массовостью, качественной однородностью и наличием вариации. Например, множества промышленных предприятий, семей, студентов, граждан какой-либо страны.
Каждый отдельно взятый элемент данного множества называется ЕДИНИЦЕЙ СОВОКУПНОСТИ.
Единицы совокупности обладают определёнными свойствами, качествами.
Свойство, качество единицы совокупности, отличающее её от других единиц, называется ПРИЗНАКОМ.
Признаки различаются способами их измерения, характером выражения, вариации и другими особенностями, влияющими на приёмы статистического изучения (табл. 1).
Под КАЧЕСТВЕННОЙ ОДНОРОДНОСТЬЮ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ понимается сходство единиц по каким-либо существенным признакам (т.е. определяющим главное содержание изучаемого явления), но различие по каким-либо другим.
Например, качественная однородность множества студентов заключается в принадлежности этих лиц к определённой социальной группе.
Таблица 1 - КЛАССИФИКАЦИЯ ПРИЗНАКОВ В СТАТИСТИКЕ
Основание классификации |
Виды признаков |
|
1. По характеру выражения признаков |
1. Описательные (атрибутивные): а) номинальные; б) порядковые 2. Количественные |
|
2. По способу измерения (учёта) |
1. Первичные (учитываемые) 2. Вторичные (расчётные) |
|
3. По отношению ко времени |
1. Моментные 2. Интервальные |
|
4. По характеру вариации |
1. Альтернативные 2. Дискретные 3. Непрерывные |
|
5. По содержательности |
1. Существенные 2. Несущественные |
|
6. По причинности |
1. Факторные 2. Результативные |
ВАРИАЦИЯ ПРИЗНАКОВ - различие величины того или иного признака у разных единиц совокупности - обусловлена различным сочетанием условий, в которых развиваются или существуют единицы совокупности. Именно наличие вариации предопределяет необходимость статистики.
Вариация признаков отражается статистическим распределением, которое имеет большое практическое и научное значение.
Важнейшей категорией статистики является статистическая закономерность.
СТАТИСТИЧЕСКАЯ ЗАКОНОМЕРНОСТЬ - это количественная закономерность изменения в пространстве и во времени массовых явлений и процессов общественной жизни, состоящих из множества элементов (единиц совокупности).
Важнейшая особенность статистической закономерности (главное ее отличие от других видов закономерностей) заключается в том, что она свойственна не отдельным единицам совокупности, а всей их массе (совокупности в целом) и проявляется только при достаточно большом числе наблюдений и только в среднем.
Это обусловливает её взаимосвязь с ЗАКОНОМ БОЛЬШИХ ЧИСЕЛ, основное содержание которого заключается в том, что в сводных статистических характеристиках действия элементов случайности взаимопогашаются, хотя они и могут проявляться в индивидуальных признаках единиц статистической совокупности.
Предмет статистики имеет ряд особенностей:
1) исследуются не отдельные факты, а массовые социально-экономические явления и процессы (т.е. множества отдельных фактов, обладающих как индивидуальными, так и общими признаками);
2) статистика изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени; количественную характеристику статистика выражает через определённого рода числа - СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ;
3) статистика характеризует структуру общественных явлений, т.е. их внутреннее строение, при этом выявляются составные части социально-экономических явлений, эти составные части сопоставляются с явлением в целом и между собой, данная структура сравнивается с другими однотипными структурами, а также с заданной (нормативной или плановой) и выявляются причины отклонений;
4) изменения уровня явления и его структуры исследуются во времени, при этом анализ динамики включает: установление уровня явления на определённые моменты или промежутки времени и среднего уровня, выявление характера изменений за каждый промежуток времени и в целом, определение величины и темпов изменения, установление основной тенденции изменений, их закономерности и составление статистического прогноза.
5) выявление связей; явления общественной жизни взаимосвязаны и взаимообусловлены: изменение одних явлений предопределяет другие; наибольшее значение имеет выявление причинно-следственных связей для того, чтобы воздействовать на общественные явления с целью их изменения в интересах общества; с помощью специальной методологии статистика определяет количественные связи между общественными явлениями.
Для изучения своего предмета статистика разрабатывает и применяет разнообразные МЕТОДЫ, совокупность которых образует СТАТИСТИЧЕСКУЮ МЕТОДОЛОГИЮ. Применение в статистическом исследовании конкретных методов обусловлено поставленными при этом задачами и зависит от характера исходной информации.
Всё многообразие статистических методов систематизируется по их целевому применению в трёх стадиях экономико-статистического исследования, выполняемых последовательно: 1) сбор первичной информации; 2) статистическая сводка и обработка первичной информации; 3) анализ статистической информации.
На начальной стадии статистического исследования применяется МЕТОД МАССОВОГО СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ.
Важнейшим методом второй стадии является МЕТОД СТАТИСТИЧЕСКОЙ СВОДКИ И ГРУППИРОВКИ. Одним из этапов процесса группировки является построение РЯДОВ РАСПРЕДЕЛЕНИЯ, т.е. распределение единиц наблюдения по величине или значению признака. Результаты статистической сводки и группировки оформляются в виде СТАТИСТИЧЕСКИХ ТАБЛИЦ.
Для третьей стадии статистического исследования характерны:
- МЕТОД ОБОБЩАЮЩИХ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ (включает применение абсолютных, относительных и средних величин);
- ИНДЕКСНЫЙ МЕТОД;
- ДИНАМИЧЕСКИЕ РЯДЫ;
- КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ;
- МЕТОДЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА;
- МЕТОД СТАТИСТИЧЕСКИХ ГРАФИКОВ;
- БАЛАНСОВЫЙ МЕТОД.
Познавательные задачи статистики, как науки:
изучение уровня, структуры, динамики и взаимосвязей массовых социально-экономических явлений;
разработка и совершенствование системы статистических показателей, приёмов и методов сбора, обработки, анализа и хранения статистической информации.
ТЕМА 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
2.1 Понятие и план подготовки статистического наблюдения
СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - массовое, планомерное научно организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности. Может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими и социальными службами фирм, банков, бирж.
Статистическое наблюдение должно удовлетворять ряду требований: 1) наблюдаемые явления должны иметь научную (практическую) ценность; 2) непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к рассматриваемому явлению; 3) результаты статистического наблюдения должны быть достоверны и сопоставимы.
Процесс подготовки статистического наблюдения включает решение программно-методологических и организационных вопросов (таблица 2).
Таблица 2 - Содержание подготовки статистического наблюдения
Программно-методологические вопросы |
1. Формулировка задачи статистического наблюдения. |
|
2. Определение объекта и единицы наблюдения. |
||
3. Составление программы статистического наблюдения. |
||
4. Выбор места и времени наблюдения. Выбор времени наблюдения заключается в решении двух вопросов: - установление критического момента (даты) или интервала времени - определение срока (периода) наблюдения |
||
Организационные вопросы |
1. Выбор формы, вида и способа наблюдения (табл. 3). |
|
2. Установление субъекта наблюдения (состав организаций и лиц, осуществляющих наблюдение). |
||
3. Подбор, обучение и инструктаж кадров. |
||
4. Подготовка формуляров и разработка инструментария |
||
5. Подготовительные мероприятия: составление списка единиц, предоставляющих сведения; разбивка территории на участки; разъяснительная работа и пропаганда; проведение пробных наблюдений. |
Таблица 3 - Формы, виды и способы статистического наблюдения
Организационные формы наблюдения |
Виды статистического наблюдения |
Способы наблюдения |
||
по времени регистрации фактов |
по степени охвата единиц совокупности |
|||
1. Статистическая отчётность 2. Специально организованное наблюдение 3. Регистры |
1. Текущее (непрерывное) 2. Прерывное: - периодическое; - единовременное |
1. Сплошное 2. Несплошное: - выборочное; - основного массива; - монографическое |
1. Непосредственное 2. Документированное 3. Опрос: экспедиционный; саморегистрации; корреспондентский; анкетный; явочный |
2.2 Ошибки статистического наблюдения
Как показывает практика, даже при чётко организованном и спланированном статистическом наблюдении встречаются погрешности и ошибки, требующие исправления.
Расхождение между расчетным и действительным значением изучаемых величин называется ОШИБКОЙ НАБЛЮДЕНИЯ.
В зависимости от причин возникновения различают:
1) ошибки регистрации (случайные и систематические);
2) ОШИБКИ РЕПРЕЗЕНТАТИВНОСТИ (случайные и систематические) ПРИСУЩИ ТОЛЬКО НЕСПЛОШНОМУ НАБЛЮДЕНИЮ.
После получения статистических формуляров, прежде всего, проводится проверка полноты собранных в процессе статистического наблюдения данных, а затем осуществляется их логический и арифметический контроль.
2.3 Понятие выборочного метода. Ошибка выборки
Статистическое исследование может осуществляться по данным несплошного наблюдения. Основная цель несплошного наблюдения - получение характеристик изучаемой совокупности по обследованной её части. Один из наиболее распространённых в статистике методов, применяющий несплошное наблюдение - выборочный метод.
Под ВЫБОРОЧНЫМ понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой её части (обычно 5 - 10 %, реже 15 - 25 % изучаемой совокупности)на основе случайного отбора.
Подлежащая изучению статистическая совокупность, из которой часть единиц отбирается для обследования, называется ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ.
Некоторая часть единиц, отобранная из генеральной совокупности и подвергающаяся обследованию, называется ВЫБОРОЧНОЙ СОВОКУПНОСТЬЮ (ВЫБОРКОЙ).
Значение выборочного метода состоит в следующем:
при минимальной численности обследуемых единиц исследование проводится в более короткие сроки и с минимальными затратами труда и денежных средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации;
при проведении ряда исследований выборочный метод является единственно возможным;
применяется для проверки данных сплошного учёта.
Выборочный метод имеет важную особенность по сравнению с другими методами несплошного наблюдения: в основу отбора единиц для обследования положен принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности. В результате соблюдения этого принципа исключается возможность образования выборки только за счёт лучших или худших образцов. Это предупреждает возникновение систематических ошибок.
Поскольку любая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ОШИБКУ ВЫБОРКИ.
Величина ошибки выборки зависит от ряда факторов:
степени вариации изучаемого признака;
численности выборки;
методов отбора единиц в выборочную совокупность;
принятого уровня достоверности результата исследования.
ОБЩАЯ ВЕЛИЧИНА ВОЗМОЖНОЙ ОШИБКИ ВЫБОРКИ слагается из ошибок двух видов: ошибки регистрации и ошибки репрезентативности. Первый вид ошибок при выборочном наблюдении практически исключён. Второй вид ошибок присущ только несплошному наблюдению.
Ошибки репрезентативности бывают систематические и случайные.
СИСТЕМАТИЧЕСКИЕ ОШИБКИ могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдения, или в связи с нарушениями установленных правил отбора единиц для обследования.
Возникновение СЛУЧАЙНЫХ ОШИБОК РЕПРЕЗЕНТАТИВНОСТИ объясняется неравномерным распределением единиц в генеральной совокупности. Поэтому распределение отобранной для обследования совокупности единиц (выборки) не вполне точно воспроизводит распределение единиц генеральной совокупности.
Величина ошибки выборки характеризует степень надёжности результатов обследования выборочной совокупности и необходима для оценки параметров генеральной совокупности. Для каждого конкретного выборочного наблюдения величина ошибки выборки может быть определена по соответствующим формулам.
2.4 Основные способы формирования выборочной совокупности
Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности и зависит от степени вариации изучаемого признака в исследуемой совокупности.
В практике выборочных обследований наибольшее распространение получили следующие СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ.
СОБСТВЕННО-СЛУЧАЙНАЯ ВЫБОРКА заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Применяется в случае незначительной вариации изучаемого признака в пределах исследуемой совокупности.
При проведении отбора этим способом следует принять во внимание, что все единицы генеральной совокупности имеют равные шансы попадания в выборку. Следует также установить чёткие границы генеральной совокупности таким образом, чтобы включение или невключение в неё отдельных единиц не вызывало сомнений.
Технически собственно-случайный отбор проводится путём жеребьёвки или с помощью таблиц случайных чисел.
Собственно-случайный отбор может быть повторным и бесповторным (выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют).
Условия применения различных способов формирования выборочной совокупности (виды выборки) приведены в таблице.
Вид выборки |
Условия применения |
|
Механическая |
Генеральная совокупность каким-либо образом упорядочена, т.е. имеется определённая последовательность в расположении единиц (телефонные номера респондентов, списки избирателей, номера домов, квартир). Для проведения механической выборки устанавливается пропорция отбора, которая устанавливается соотнесением объёмов выборочной и генеральной совокупности. Напр., при пропорции 1:50 (2%-ная выборка) отбирается каждая 50-я единица; при пропорции 1:20 (5%-ная выборка) - каждая 20 единица и т.д. |
|
Типическая |
Все единицы генеральной совокупности можно разбить на типические группы; вариация исследуемого признака от группы к группе - значительная. При обследованиях населения такими группами могу быть районы, социальные, возрастные или образовательные группы; при обследовании предприятий - вид экономической деятельности, форма собственности и т.д. Выборка формируется из единиц из каждой типической группы собственно-случайным или механическим способом пропорционально объёму типических групп, либо пропорционально внутригрупповой дифференциации признака. При выборке, пропорциональной объёму типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом: ni = n · Ni/N, где ni - объём выборки из i-й группы; Ni - объём i-й группы, n - численность выборочной совокупности. Отбор, пропорциональный внутригрупповой дифференциации признака, осуществляется на основе использования внутригрупповых дисперсий по каждой типической группе. |
|
Серийная |
Единицы генеральной совокупности объединены в небольшие группы или серии (упаковки с определённым количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения). Отбор заключается в собственно-случайном, либо механическом отборе серий, внутри которых производится сплошное обследование единиц; удобен в тех случаях, когда. |
|
Комбинированная |
Различные способы формирования выборки используются в комбинации. Возможно комбинировать: - типическую выборку и серийную (серии отбираются в установленном порядке из нескольких типических групп); - серийный и собственно-случайный отбор (отдельные единицы отбираются внутри серии в собственно-случайном порядке). |
2.5 Средняя и предельная ошибки выборки
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
СРЕДНЯЯ ОШИБКА ВЫБОРКИ показывает величину возможных отклонений характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.
Ошибки выборки могут быть рассчитаны для среднего значения признака и для доли альтернативного признака (табл.). В математической статистике доказывается, что генеральная средняя будет отличаться от выборочной средней на величину средней ошибки выборки () только в 68,3% случаев. В 95% случаев ошибка выборки не выйдет за пределы 2. В 99,7% случаев разность между генеральной и выборочной средней на превзойдёт трёхкратной средней ошибки выборки (3) и т.д.
Метод отбора |
Формула для определения средней ошибки выборки |
||
Для средней |
Для доли |
||
Собственно-случайный и механический отбор |
|||
Повторный |
|||
Бесповторный |
|||
Типический отбор |
|||
Повторный |
|||
Бесповторный |
|||
Серийная выборка |
|||
Повторный |
, где r - число отобранных серий; R - число серий в генеральной совокупности; - межсерийная дисперсия средних |
, где - межсерийная дисперсия доли |
|
Бесповторный |
Таким образом, о величине ошибки выборки можно судить с определённой вероятностью, от которой зависит множитель t, называемый коэффициентом доверия.
Логически связь выглядит так: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о её величине.
При заданной вероятности коэффициент доверия t определяют по таблице значений интегральной функции Лапласа (t).
Величина = t называется предельной ошибкой выборки.
Зная выборочную среднюю величину признака (долю альтернативного признака в выборочной совокупности) и предельную ошибку выборки (для средней или для доли), можно определить ГРАНИЦЫ, В КОТОРЫХ ЗАКЛЮЧЕНА ГЕНЕРАЛЬНАЯ СРЕДНЯЯ (ГЕНЕРАЛЬНАЯ ДОЛЯ):
для средней или .
для доли или .
2.6 Определение необходимого объёма выборки
При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении исходя из вероятности, с которой гарантируется величина устанавливаемой ошибки, и наконец, на базе способа отбора.
Для определения необходимой численности выборки исследователь должен задать уровень точности характеристики выборочной совокупности с определённой вероятностью.
Необходимый объём выборки для различных способов формирования выборочной совокупности определяется исходя из формул для расчёта предельной ошибки выборки (табл.).
Метод отбора |
Формула для определения необходимой численности выборки |
||
При определении среднего размера признака |
При определении доли признака |
||
Собственно-случайный и механический отбор |
|||
Повторный |
|||
Бесповторный |
|||
Типический отбор |
|||
Повторный |
|||
Бесповторный |
|||
Серийная выборка |
|||
Повторный |
|||
Бесповторный |
Упражнения
Задача 2.1. На участке месторождения 1000 скважин. Определите минимальный объем случайной бесповторной выборки, которая позволит с вероятностью 0,95 (t=1,96) оценить среднесуточный дебит с предельной ошибкой выборки 1 т/сут. Дисперсия среднесуточного дебита по данным предварительного обследования 34.
Задача 2.2. На предприятии 5000 рабочих, из них 1000 - в цехе №1, 1500 - в цехе №2, 2500 - в цехе №3. С целью определения средней выработки предполагается провести типическую выборку с пропорциональным механическим отбором рабочих внутри каждого цеха.
Какое количество рабочих следует отобрать, чтобы с вероятностью 0,997 (t=2,97) ошибка выборки не превышала 5 тыс.руб./чел.? Дисперсия выработки для типической выборки по данным предыдущих обследований 1600.
Сколько рабочих необходимо отобрать из каждого цеха?
Задача 2.3. На склад сырья и материалов предприятия поступила партия заготовок из 100 ящиков по 80 шт. в каждом. Для установления среднего веса заготовки следует провести серийную выборку методом механического отбора так, чтобы с вероятностью 0,954 (коэффициент доверия t=1,99) ошибка выборки не превысила 2 кг. На основе ранее проводимого контроля качества заготовок известно, что дисперсия серийной выборки равна 5.
Определите необходимый объем выборки (ящиков).
Задача 2.4. Для изучения уровня качества насосов проведено 10%-е выборочное обследование партии методом случайного бесповторного отбора. В результате обследования получены данные о распределении насосов по величине наработки на отказ.
Наработка на отказ, час. |
До 900 |
900 - 950 |
950 - 1000 |
1000 - 1050 |
1050 - 1100 |
1100 и более |
Итого |
|
Число насосов, шт. (f) |
8 |
10 |
26 |
36 |
14 |
6 |
||
Центр интервала (х) |
- |
|||||||
Взвешенный центр интервала (xf) |
||||||||
Квадрат центра интервала (х2) |
||||||||
Взвешенный квадрат центра интервала (х2f) |
С вероятностью 0,990 определите пределы, в которых находится среднее значение наработки на отказ во всей партии насосов. Коэффициент доверия t=2,58.
Задача 2.5. Для изучения содержания серы были взяты пробы на участке нефтяного месторождения методом 5%-ного собственно-случайного бесповторного отбора. В результате обследования проб получены следующие данные:
Содержание серы, % |
Менее 0,2 |
0,2 - 0,4 |
0,4 - 0,6 |
0,6 - 0,8 |
0,8 - 1,0 |
Более 1,0 |
Итого |
|
Число обследованных скважин, шт. (f) |
8 |
16 |
45 |
27 |
3 |
1 |
||
Центр интервала (х) |
||||||||
Взвешенный центр интервала (xf) |
||||||||
Квадрат центра интервала (х2) |
||||||||
Взвешенный квадрат центра интервала (х2f) |
С вероятностью 0,997 определите пределы, в которых находится средний уровень содержания серы по всему участку месторождения. Коэффициент доверия t=2,97.
Задача 2.6. Для планирования потребности буровой кампании в долотах проведено 10%-е выборочное обследование 100 буровых бригад методом случайного бесповторного отбора. В результате обследования получены данные о количестве израсходованных долот на одну скважину.
Число долот, шт. |
Менее 20 |
20 - 22 |
22 - 24 |
24 - 26 |
26 - 28 |
28 - 30 |
30 и более |
|
Число бригад |
2 |
3 |
9 |
23 |
5 |
5 |
3 |
С вероятностью 0,954 определите пределы, в которых находится среднее число долот, израсходованных при бурении одной скважины. Коэффициент доверия t=1,99.
Задача 2.7. По действующему фонду скважин проведено 5%-ное обследование с целью измерения обводненности продукции методом случайного бесповторного отбора. В результате обследования получены следующие данные.
Обводненность, % |
До 80 |
80 - 82 |
82 - 84 |
84 - 86 |
86 - 88 |
Более 88 |
|
Число скважин |
4 |
16 |
20 |
32 |
26 |
2 |
С вероятностью 0,990 определите пределы, в которых находится средний уровень обводненности действующего фонда скважин. Коэффициент доверия t=2,58.
Задача 2.8. Для изучения степени износа оборудования на участке магистрального трубопровода проведено 10%-е выборочное обследование однотипных компрессоров методом случайного бесповторного отбора. В результате обследования получены данные о распределении оборудования по сроку эксплуатации.
Срок эксплуатации, лет |
Менее 5 |
5 - 8 |
8 - 11 |
11 - 14 |
14 - 17 |
Более 17 |
|
Число компрессоров, шт. |
7 |
5 |
6 |
8 |
3 |
2 |
С вероятностью 0,990 определите пределы, в которых находится средний срок эксплуатации компрессоров на всем участке трубопровода. Коэффициент доверия t=2,58.
Задача 2.9. Для изучения качества нефти по резервуарному парку проведен отбор проб. В результате получены данные о распределении проб по величине содержания хлористых солей.
Содержание солей, % |
Менее 0,1 |
0,1 - 0,2 |
0,2 - 0,3 |
0,3 - 0,4 |
0,4 - 0,5 |
Более 0,5 |
Итого |
|
Число проб (f) |
10 |
14 |
18 |
30 |
16 |
12 |
||
Центр интервала (х) |
||||||||
Взвешенный центр интервала (xf) |
||||||||
Квадрат центра интервала (х2) |
||||||||
Взвешенный квадрат центра интервала (х2f) |
С вероятностью 0,990 определите пределы, в которых находится средний срок эксплуатации компрессоров на всем участке трубопровода. Коэффициент доверия t=2,58.
ТЕМА 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА
3.1 Понятие сводки и группировки, их виды
Процесс упорядочения, систематизации и обобщения данных статистического наблюдения называется СТАТИСТИЧЕСКОЙ СВОДКОЙ.
Сводка включает комплекс операций: 1) группировка единиц наблюдения; 2) разработка системы статистических показателей для характеристики групп и объекта в целом; 3) подсчёт итогов по каждой выделенной группе и по всему объекту; 4) представление результатов группировки и сводки в виде статистических таблиц.
Отдельные единицы статистической совокупности объединяются в группы при помощи метода группировки.
ГРУППИРОВКОЙ называется расчленение множества единиц изучаемой совокупности на группы (подсистемы, классы, подгруппы) по определённым существенным для них признакам.
Признак, по которому производится разбивка единиц совокупности на отдельные группы, называется ГРУППИРОВОЧНЫМ ПРИЗНАКОМ (или, основанием группировки).
В зависимости от целевого назначения выделяют следующие виды статистических группировок.
1. ТИПОЛОГИЧЕСКАЯ группировка служит для выделения социально-экономических типов в разнородной совокупности (группировка государств по уровню экономического развития; населения по принадлежности к общественным группам)
2. СТРУКТУРНАЯ группировка используется для разделения однородной совокупности на группы, характеризующие её структуру, по величине (значению) варьирующего признака.
3. АНАЛИТИЧЕСКАЯ группировка служит для исследования взаимосвязи между явлениями и их признаками. Взаимосвязь проявляется в том, что с возрастанием значений факторного признака систематически возрастает или убывает среднее значение результативного признака. Особенности аналитической группировки: в основу группировки положен факторный признак; каждая выделенная группа характеризуется средним значением результативного признака.
В зависимости от количества группировочных признаков группировки бывают простые и сложные (комбинационные) группировки.
По очерёдности обработки информации выделяют первичные и вторичные группировки.
3.2 Принципы определения числа групп (интервалов) группировки
Число групп в группировке зависит от вида группировочного признака (атрибутивный или количественный), характера его вариации, а также от задач исследования.
Если в качестве группировочного выбран атрибутивный признак, то число групп в группировке будет таким, каково число разновидностей (видов, градаций) этого признака. В случаях, когда атрибутивный признак имеет большое число разновидностей (профессия, наименование выпускаемой продукции, наименование товара) и перечислить их все невозможно или нецелесообразно, то используют классификации.
Если группировка проводится по количественному признаку, то число групп определяется исходя из объема совокупности (числа единиц исследуемого объекта) и степень вариации группировочного признака:
а) при группировке по дискретному признаку, принимающему небольшое число значений, число групп будет равно числу этих значений (напр., разряд рабочего);
б) если дискретный признак принимает много значений, и выделение такого числа групп невозможно, или группировочный признак - непрерывный, в этом случае для определения числа групп (n) можно использовать формулу Стерджесса:
n = 1 + 3,322 lgN, где N - число единиц совокупности.
После определения числа групп определяют интервалы группировки.
ИНТЕРВАЛ - промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают: равные и неравные (в свою очередь, могут быть произвольными, прогрессивно возрастающими или убывающими, специализированными); открытые и закрытые.
Если строится группировка с равными интервалами (т.е. разность между максимальным и минимальным значением признака для каждой группы одинакова), то величина интервала (h) определяется по формуле:
,
где xmax и xmin - соответственно, максимальное и минимальное значение группировочного признака в совокупности.
3.3 Статистические ряды распределения
После определения группировочного признака и границ групп строится ряд распределения (табл. 3).
ВАРИАНТА (ВАРИАНТ) - это отдельные значения признака, которые он принимает в ряду распределения.
ЧАСТОТА - число единиц совокупности, принимающих данное значение признака, численность каждой группы вариационного ряда. Сумма всех частот определяет численность всей совокупности, её объём.
Частоты, выраженные в долях единицы или в процентах к итогу, называют ЧАСТОСТЯМИ (относительными частотами).
Таблица 3 - Понятие и виды статистических рядов распределения
СТАТИСТИЧЕСКИЙ РЯД РАСПРЕДЕЛЕНИЯ - это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку. Ряд распределения представляет собой простейшую группировку, в которой каждая выделенная группа характеризуется только одним показателем - числом единиц объекта (статистической совокупности), попавших в каждую группу. Ряды распределения принято оформлять в виде таблиц. В зависимости от того, по какому признаку построен ряд распределения, различают следующие их виды. |
|||
АТРИБУТИВНЫЙ ряд распределения - ряд, построенный по атрибутивному (качественному) признаку. Его элементы - значения атрибутивного признака и число единиц, принимающих данное значение |
ВАРИАЦИОННЫЙ ряд распределения - ряд, построенный по количественному признаку. Вариационные ряды, в свою очередь, в зависимости от характера вариации группировочного признака могут быть дискретными и интервальными. |
||
ДИСКРЕТНЫЙ ряд построен по дискретному признаку, его элементы - варианты и частоты. |
ИНТЕРВАЛЬНЫЙ ряд построен по непрерывному признаку, его элементы интервалы признака и частоты. |
Для анализа рядов распределения используется их графическое изображение, позволяющее судить о форме распределения. Для изображения дискретного ряда применяется ПОЛИГОН ЧАСТОТ (ЧАСТОСТЕЙ), а интервального - ГИСТОГРАММА.
3.4 Анализ частотных распределений
В вариационных рядах распределения можно заметить определённую зависимость между изменением значений варьирующего признака и частот: частоты в этих рядах с увеличением значения варьирующего признака сначала увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются. Это свидетельствует о том, что частоты в вариационных рядах изменяются ЗАКОНОМЕРНО в связи с изменением варьирующего признака. Такие закономерности называются ЗАКОНОМЕРНОСТЯМИ РАСПРЕДЕЛЕНИЯ.
Цель статистического изучения вариационных рядов - выявление закономерности распределения и оценка ее характера. Закономерности распределения наиболее отчётливо проявляются только при массовом наблюдении. Поэтому основной путь выявления таких закономерностей состоит в правильном построении вариационных рядов распределения для достаточно большой численности статистической совокупности, оптимальных числе групп и величине интервала, при которых закономерность распределения видна более отчётливо.
Из математической статистики известно, что если увеличить объём совокупности и уменьшить интервал группировки, то полигон (гистограмма) распределения всё более и более будет приближаться к некоторой плавной линии - кривой распределения.
КРИВАЯ РАСПРЕДЕЛЕНИЯ - графическое изображение вариационного ряда в виде непрерывной линии изменения частот, функционально связанного с изменением вариант.
Получение кривой распределения на основе полигона (гистограммы) можно представить лишь для гипотетического случая (бесконечно большое число единиц совокупности и бесконечно малая ширина интервала ряда). Только при этих идеализированных условиях кривая распределения будет отражать функциональную связь между значениями признака и соответствующими им частотами и представлять так называемое теоретическое распределение.
ТЕОРЕТИЧЕСКОЙ КРИВОЙ РАСПРЕДЕЛЕНИЯ называется кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающая влияние случайных для него факторов. При проведении анализа вариационных рядов целесообразно свести эмпирическое распределение к одному из хорошо известных видов теоретического (рассматриваются математической статистикой). При этом теоретическое распределение играет роль некоторой идеализированной модели эмпирического распределения, а сам анализ вариационных рядов сводится к сопоставлению эмпирического и теоретического распределений и определению степени различия между ними.
В статистической практике встречаются следующие разновидности кривых распределения:
а) ОДНОВЕРШИННЫЕ КРИВЫЕ - характерны для однородных совокупностей: симметричные (в симметричных распределениях частоты любых двух вариант, равноотстоящих в обе стороны от центра распределения, равны между собой, значения средней, моды и медианы совпадают), умеренно асимметричные, крайне асимметричные;
б) МНОГОВЕРШИННЫЕ КРИВЫЕ (многовершинность свидетельствует о неоднородности изучаемой совокупности; появление двух и более вершин требует перегруппировки данных с целью выделения более однородных групп).
ВЫЯСНЕНИЕ ОБЩЕГО ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ предполагает:
- оценку его однородности с использованием структурных средних (мода, мендиана, перцентили (квартили, децили)) и показателей вариации (см. тема 5);
- вычисление показателей асимметрии и эксцесса.
Наиболее распространённый способ определения показателя (коэффициента) асимметрии (): или , где - среднее значение признака; - мода, модальное значение признака (варианта, расположенная в центре упорядоченного ряда); - среднее квадартическое отклонение; Р - удельный вес (в %) количества тех вариант, которые превосходят среднюю арифметическую в общем количестве вариант данного ряда; 50 - удельный вес (в %) вариант, превосходящих среднюю арифметическую ряда нормального распределения.
Если As = 0, то распределение считается симметричным.
При As меньше нуля - левосторонняя асимметрия (правая ветвь кривой короче, мода больше медианы и больше средней).
При As больше нуля - правосторонняя асимметрия (левая ветвь короче, средняя больше медианы и больше моды).
As более 0,5 (независимо от знака) считается значительной; если она меньше 0,25 - незначительной.
Для симметричных распределений может быть рассчитан показатель эксцесса (Ex ).
Наиболее точно Ех определяется по формуле с использованием центрального момента четвёртого порядка:
,
где - - условный центральный момент четвертого порядка.
Можно воспользоваться упрощенной формулой: , где Р - удельный вес (в %) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту или другую сторону от величины средней в общем количестве вариант данного ряда); 38,29 - удельный вес (в %) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту или другую сторону от величины средней в общем количестве вариант ряда нормального распределения).
В нормальном распределении Ex = 0, в плосковершинном распределении Ex отрицательный, и в островершинном Ех положительный.
Если на практике часто встречается один и тот же тип распределения частот (например, распределение населения по уровню доходов в различных странах), его целесообразно описать с помощью математической формулы, которая может служить для сравнения и обобщения различных совокупностей аналогичных данных.
В статистике широко используются следующие ВИДЫ ТЕОРЕТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ: нормальное, биномиальное, распределение Пуассона и др. Каждое из теоретических распределений имеет свою специфику и область применения в различных отраслях знания.
Чаще всего обращаются к НОРМАЛЬНОМУ РАСПРЕДЕЛЕНИЮ, так как оно отражает распределение частот в совокупности под действием большого числа независимых факторов и причин, из которых ни одна не является преобладающей. Такая закономерность проявляется, например, в распределении отклонений в производственном процессе при нормальном уровне организации производства и технологии; в разбросе отклонений параметров качества от среднего значения; в распределении населения определённого возраста по размерам.
Нормальное распределение полностью определяется двумя параметрами (средней арифметической и СКО) и описывается формулой , где - ордината кривой нормального распределения; - стандартизованная (нормированная) величина; - математические постоянные; - варианты вариационного ряда и их средняя величина; - среднее квадратическое отклонение.
Часто возникают распределения, хотя и не отвечающие строго нормальному закону (нормальному распределению), но имеющие с ним сходство.
СВОЙСТВА НОРМАЛЬНОЙ КРИВОЙ РАСПРЕДЕЛЕНИЯ:
1) функция нормального распределения - ЧЁТНАЯ, т. е. f(-t) = f(+t). Следовательно, изображающая её кривая расположена симметрично относительно оси ординат, т. е. = Мо = Ме;
2) функция имеет бесконечно малые значения при t = ±, т.е. ветви кривой удалены в бесконечность и асимптотически приближаются к оси абсцисс; чем больше значения признака отклоняются от средней, тем реже встречаются;
3) функция имеет максимум при t = 0, т.е. кривая распределения модального значения достигает при t = 0 или при ; величина максимума составляет .
4) при t = ± 1 функция даёт точки перегиба, следовательно, при отклонении значений признака от средней в положительном и отрицательном направлениях на одно стандартное (нормированное) отклонение (± от х) кривая даёт переход от выпуклости к вогнутости;
5) если случайная величина представляет сумму двух независимых случайных величин, следующих каждая нормальному закону, то она тоже следует нормальному закону.
Объективную оценку соответствия эмпирического распределения нормальному можно получить с использованием особых статистических показателей - КРИТЕРИЕВ СОГЛАСИЯ (К.Пирсона (хи - квадрат), В.И. Романовского, А.Н. Колмогорова и Б.С. Ястремского).
3.5 Структурные характеристики вариационного ряда
В качестве характеристик вариационных рядов рассчитываются так называемые структурные средние - мода и медиана.
МОДА (модальное значение признака) отражает типичное, наиболее распространённое значение признака в изучаемой совокупности.
МОДА (Мо) - это варианта, наиболее часто повторяющаяся в изучаемой совокупности.
Пример определения моды по несгруппированным данным:
рабочие бригады, состоящей из 9 человек, имеют следующие тарифные разряды: 4 3 4 5 3 3 6 2 6;
в данной бригаде больше всего рабочих имеют 3-й разряд, он и будет модальным.
В дискретных рядах распределения модой является варианта с наибольшей частотой.
Если в ряду распределения два или несколько значений признака встречаются чаще других и одинаково часто, ряд называют мультимодальным или бимодальным. Наличие двух и более модальных значений признака говорит о неоднородности совокупности, возможно представляющей собой агрегат нескольких совокупностей с разными модами. Но всё-таки чаще встречаются ряды распределения с одной модой.
В интервальном вариационном ряду при непрерывной вариации признака, каждое значение признака встречается только один раз. В этом случае модой является условное значение признака, вблизи которого ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ достигает максимума.
Для расчёта моды в интервальном вариационном ряду сначала определяют модальный интервал (интервал, которому соответствует наибольшая плотность распределения), а затем рассчитывают моду по формуле:
,
где - нижняя граница модального интервала; - величина модального интервала; - частота модального интервала; - частота предмодального и постмодального интервала.
МЕДИАНОЙ (Ме) в статистике называется значение признака, расположенное в середине упорядоченного (ранжированного) ряда. Медиана выполняет функции средней величины для неоднородной (не подчиняющейся нормальному закону распределения) совокупности.
Для определения медианы по несгруппированым данным необходимо сначала произвести ранжирование этих данных: ранжированный ряд разрядов рабочих бригады: 2 3 3 3 4 4 5 6 6, центральным в этом ряду является 4-й разряд, следовательно, данный разряд и будет медианным.
Если ранжированный ряд имеет чётное число единиц, то медиана определяется как средняя арифметическая из двух центральных значений.
В дискретном вариационном ряду медианой является не требующее расчёта значение признака в той группе, в которой накопленная частота превышает половину численности совокупности.
Пример: имеется распределение рабочих участка по уровню квалификации:
Тарифный разряд 2 3 4 5 6 Итого
Число рабочих 1 5 8 4 2 20
Накопленная частота 1 6 14 18 20
В третьей группе рабочих с 4-м разрядом накопленная частота превышает половину численности совокупности, следовательно, Ме = 4.
В интервальном вариационном ряду медиана определяется по формуле:
,
где - нижняя граница интервала, содержащего медиану; - величина медианного интервала; - сумма частот, численность совокупности; - сумма накопленных частот, предшествующих медианному интервалу; - частота медианного интервала.
Медианным считается интервал, для которого накопленная частота превышает половину суммы всех частот ряда.
КВАРТИЛИ, ДЕЦИЛИ, ПЕРСЕНТИЛИ (перцентили, процентили) - это значения вариант, отделяющие соответственно 1/4, 2/4, 3/4 (квартили), 1/10, 2/10, …, 9/10 (децили), 1/100, 2/100, …, 99/100 (персентили) упорядоченной совокупности.
Порядок расчета этих характеристик аналогичен расчету медианы.
Упражнения
Задача 3.1. Имеются данные о пластовом давлении (в атм.) при насосном способе эксплуатации 90 скважин:
95 |
57 |
15 |
26 |
35 |
46 |
52 |
55 |
59 |
47 |
42 |
48 |
58 |
|
55 |
102 |
96 |
45 |
54 |
56 |
60 |
10 |
16 |
20 |
49 |
48 |
43 |
|
12 |
19 |
51 |
103 |
62 |
61 |
38 |
29 |
10 |
39 |
40 |
18 |
14 |
|
41 |
58 |
63 |
59 |
60 |
63 |
68 |
70 |
71 |
75 |
82 |
87 |
92 |
|
99 |
65 |
68 |
78 |
91 |
94 |
77 |
65 |
79 |
67 |
74 |
80 |
89 |
|
69 |
81 |
83 |
100 |
90 |
36 |
64 |
97 |
50 |
76 |
72 |
31 |
55 |
|
28 |
57 |
85 |
69 |
13 |
53 |
11 |
61 |
90 |
76 |
17 |
37 |
Произведите разведочный анализ выборки: 1) постройте статистический ряд распределения, определив число групп как квадратный корень из объема выборки (); 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы, полигона и кумуляты, оцените характер распределения; 3) вычислите характеристики вариационного ряда (размах, среднее значение, моду, медиану, дисперсию, среднее квадратическое отклонение (СКО), коэффициент, вариации, структурные характеристики вариационного ряда (децили и квартили), асимметрию (скос), эксцесс), перечисленные характеристики можно вычислить с помощью встроенных статистических функций в пакете MS Excel.
Сформулируйте выводы.
Результаты построения статистического ряда распределения
Интервалы распределения скважин по уровню пластового давления, атм. |
Число скважин (частота) |
Относительная частота, доли ед. |
Накопленная относительная частота |
Центр интервала |
Взвешенный центр интервала |
|
от 10 до 20 |
||||||
от 20 до 30 |
||||||
от 30 до 40 |
||||||
от 40 до 50 |
||||||
от 50 до 60 |
||||||
от 60 до 70 |
||||||
от 70 до 80 |
||||||
от 80 до 90 |
||||||
90 и более |
||||||
Итого |
- |
Результаты расчета описательных статистик распределения
Средняя |
Квартиль-1 |
|||
Мода |
Квартиль-2 |
|||
Медиана |
Квартиль-3 |
|||
Дисперсия |
Дециль-1 |
|||
СКО (Стандартное отклонение) |
Дециль-9 |
|||
Коэффициент вариации |
Асимметрия |
|||
Размах |
Эксцесс |
Задача 3.2. По данным о количестве израсходованных долот при механической скорости проходки 18 м/ч. на 100 скважинах
28 |
30 |
28 |
27 |
28 |
29 |
29 |
29 |
31 |
28 |
26 |
25 |
33 |
|
35 |
27 |
31 |
31 |
30 |
28 |
33 |
23 |
30 |
31 |
33 |
31 |
27 |
|
30 |
28 |
30 |
29 |
30 |
26 |
25 |
31 |
33 |
26 |
27 |
33 |
29 |
|
30 |
30 |
36 |
26 |
25 |
28 |
30 |
29 |
27 |
32 |
29 |
31 |
30 |
|
31 |
26 |
25 |
29 |
31 |
33 |
27 |
32 |
30 |
31 |
34 |
28 |
26 |
|
38 |
29 |
31 |
29 |
27 |
31 |
30 |
28 |
34 |
30 |
26 |
30 |
32 |
|
30 |
29 |
30 |
28 |
32 |
30 |
29 |
34 |
32 |
35 |
29 |
27 |
28 |
|
30 |
30 |
29 |
32 |
29 |
34 |
30 |
32 |
24 |
произведите разведочный анализ выборки: 1) постройте статистический ряд распределения, определив число групп как квадратный корень из объема выборки (); 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы, полигона и кумуляты, оцените характер распределения; 3) вычислите характеристики вариационного ряда (размах, среднее значение, моду, медиану, дисперсию, среднее квадратическое отклонение (СКО), коэффициент, вариации, структурные характеристики вариационного ряда (децили и квартили), асимметрию (скос), эксцесс), перечисленные характеристики можно вычислить с помощью встроенных статистических функций в пакете MS Excel. Сформулируйте выводы.
Результаты построения статистического ряда распределения
Число долот, шт. |
Число скважин (частота) |
Относительная частота, доли ед. |
Накопленная относительная частота |
Центр интервала |
Взвешенный центр интервала |
|
от 23 до 25 |
||||||
от 25 до 27 |
||||||
от 27 до 29 |
||||||
от 29 до 31 |
||||||
от 31 до 33 |
||||||
от 33 до 35 |
||||||
от 35 до 37 |
||||||
37 и более |
||||||
Итого |
- |
Результаты расчета описательных статистик распределения
Средняя |
Квартиль-1 |
|||
Мода |
Квартиль-2 |
|||
Медиана |
Квартиль-3 |
|||
Дисперсия |
Дециль-1 |
|||
СКО (Стандартное отклонение) |
Дециль-9 |
|||
Коэффициент вариации |
Асимметрия |
|||
Размах |
Эксцесс |
Задача 3.3. На основе графического изображения и характеристик распределения статистического ряда проанализируйте стабильность технологического процесса первичной переработки нефти по результатам измерения температуры раздела фракции бензин-авиакеросин на установке первичной переработки нефти (в °С):
133 |
133 |
142 |
135 |
145 |
144 |
145 |
147 |
146 |
134 |
130 |
134 |
138 |
|
144 |
141 |
141 |
134 |
141 |
136 |
140 |
143 |
139 |
141 |
137 |
140 |
145 |
|
145 |
141 |
144 |
138 |
139 |
143 |
141 |
141 |
146 |
143 |
140 |
139 |
143 |
|
143 |
139 |
140 |
139 |
138 |
138 |
135 |
141 |
141 |
140 |
138 |
145 |
135 |
|
148 |
136 |
139 |
142 |
143 |
143 |
137 |
138 |
138 |
139 |
138 |
144 |
143 |
|
138 |
142 |
138 |
140 |
140 |
137 |
139 |
140 |
139 |
137 |
136 |
136 |
135 |
|
135 |
141 |
142 |
136 |
140 |
136 |
137 |
138 |
138 |
137 |
139 |
139 |
140 |
|
139 |
140 |
140 |
139 |
139 |
139 |
140 |
140 |
146 |
Для анализа стабильности процесса: 1) постройте статистический ряд распределения, определив число групп как квадратный корень из объема выборки ();2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы, полигона и кумуляты, оцените характер распределения; 3) вычислите характеристики вариационного ряда (размах, среднее значение, моду, медиану, дисперсию, среднее квадратическое отклонение (СКО), коэффициент, вариации, структурные характеристики вариационного ряда (децили и квартили), асимметрию (скос), эксцесс) и верхнюю и нижнюю границу допусков по правилу «трех сигм», перечисленные характеристики можно вычислить с помощью встроенных статистических функций в пакете MS Excel.
Сформулируйте выводы.
ТЕМА 4. ОБОБЩАЮЩИЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ
Обобщающие статистические показатели получают в результате сводки и обобщения данных статистического наблюдения. Последние могут быть представлены абсолютными, относительными и средними величинами.
1. АБСОЛЮТНЫЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ характеризуют абсолютные размеры изучаемых статистикой явлений и процессов в конкретных условиях места и времени: их массу, площадь, объём, протяжённость; а также могут представлять объём совокупности (т.е. число составляющих её единиц). Такие показатели всегда являются именованными числами, т.е. имеют определённую единицу измерения, они выражаются в натуральных (тонны, килограммы, мили, километры, штуки, литры и т. д.), стоимостных (рубли, доллары и др.) и трудовых единицах измерения (человеко-дни, человеко-часы, нормо-часы).
2. ОТНОСИТЕЛЬНЫЙ СТАТИСТИЧЕСКИЙ ПОКАЗАТЕЛЬ - это показатель, полученный путём сравнения статистических показателей в пространстве (между объектами), во времени (по одному и тому же объекту за разные отрезки времени) или путём сопоставления показателей разных свойств изучаемого объекта. Другими словами, - это частное от деления двух статистических показателей.
Относительные показатели могут выражаться в коэффициентах, процентах, промилле, продецимилле. Относительный показатель, полученный путём сопоставления разноимённых величин, должен быть именованным.
Все используемые на практике относительные статистические показатели можно подразделить на следующие виды: 1) планового задания, выполнения плана (договорных обязательств); 2) структуры; 3) динамики; 4) координации; 5) сравнения; 6) интенсивности и уровня развития и др.
Относительные показатели планового задания (ОППЗ) и выполнения плана (ОПВП) (договорных обязательств - ОПДО) используются для перспективного планирования деятельности предприятий и сравнения реально достигнутых результатов с намеченными ранее.
,
.
Относительный показатель структуры (ОПС) - соотношение структурных частей изучаемого объекта и их целого, характеризует состав совокупности:
Подобные документы
Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.
реферат [33,9 K], добавлен 20.01.2010Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.
курс лекций [475,4 K], добавлен 11.02.2010Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Статистические показатели производительности труда и заработной платы, характеристика ее динамики. Виды взаимосвязей между явлениями. Статистический анализ использования трудовых ресурсов, производительности и оплаты труда и факторов, на них влияющих.
курсовая работа [181,7 K], добавлен 18.03.2015Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Статистическое наблюдение как первый этап статистического исследования. Формы организации статистического наблюдения. Виды и способы статистического наблюдения. Организация сбора данных, план статистического наблюдения, ошибки и меры борьбы с ними.
реферат [19,6 K], добавлен 04.06.2010Статистическое наблюдение, формы, виды статистического наблюдения и отчетности. Статистические показатели, характеризующие экономическую деятельность организаций. Классификация, группировка и номенклатура - их роль в статистическом исследовании.
шпаргалка [1,3 M], добавлен 31.05.2008Виды и формы связей между явлениями. Методы изучения взаимосвязи экономических явлений. Статистические методы изучения взаимосвязи. Метод аналитических группировок. Дисперсионный и корреляционно-регрессионный анализ. Непараметрические методы оценки связи.
курсовая работа [235,9 K], добавлен 10.12.2008Рассмотрение процесса ревизии в бухгалтерии предприятия налоговыми органами с точки зрения статистического наблюдения. Выбор из исходных данных абсолютной статистической величины. Представление статистических данных. Средние величины. Показатели вариации.
контрольная работа [139,5 K], добавлен 28.05.2015