Теория статистики
Количественная оценка свойств изучаемого явления. Стадии статистической работы. Массовое наблюдение фактов. Принципы и методы статистического исследования, наиболее общие категории. Анализ синтетических показателей, отражающих состояние экономики.
Рубрика | Экономика и экономическая теория |
Вид | курс лекций |
Язык | русский |
Дата добавления | 25.09.2017 |
Размер файла | 139,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
3
Размещено на http://www.allbest.ru/
1. Введение в теорию статистики
статистический экономика количественный
1. Термин «статистика» происходит от латинского слова «статус» (status), что означает «определенное положение вещей». Первоначально он употреблялся в значении слова «государствоведение» и был введен в обиход в 1749 году немецким ученым Г. Ахенвалем, выпустившим книгу о государствоведении.
Статистика имеет многовековую историю и своими корнями уходит в глубокую древность. С образованием государств появилась необходимость в статистической практике, т.е. в сборе сведений о наличии земель, численности населения, о его имущественном положении. Несколько тысячелетий назад такой учет проводился в Китае, Древнем Риме и в Египте.
С развитием общественных отношений, возникновением системы налогообложения необходимость статистических данных становится очевидной, таких, к примеру, как:
Цены на хлеб;
Количество городов;
Численность городского населения;
Объемы внешней торговли;
Регистрация новых заводов и фабрик;
Регистрация браков, рождений, смертей.
По мере усложнения общественной жизни все более расширялся круг учитываемых явлений.
Рост общественного производства в период становления капитализма, расширение торговых и международных отношений послужили стимулом развития учета и статистики.
В Италии в начале XIV века появилась система двойной бухгалтерии, при которой операция фиксируется дважды - в дебете и кредите. Следовательно, значительно возрастает потребность в анализе экономической конъюнктуры. Объем статистической информации особенно резко увеличивается - требуются сведения, характеризующие:
Размеры и размещение промышленного и сельскохозяйственного производства;
Рынки сбыта товаров;
Рынки труда;
Сырьевые ресурсы и т.д.
В настоящее время термин «статистика» имеет три значения:
Во-первых это особая отрасль практической деятельности, направленная на сбор, обработку, анализ данных, характеризующих социально-экономическое положение страны, ее регионов, отраслей экономики, отдельных предприятий.
Во-вторых, статистикой называют науку, занимающуюся разработкой технических положений и методов, используемых статистической практикой.
Наука и практика очень тесно связаны, взаимно опираясь, друг на друга.
В-третьих, статистикой называют сами статистические данные, представленные в отчетности предприятий, учреждений, компаний, фирм, отраслей экономики или же данные, публикуемые в сборниках, справочниках, СМИ в виде результатов статистической работы.
Статистика как наука стала развиваться с середины 17-го века по двум направлениям:
Описательному;
Математическому
Важнейшими представителями описательной школы государствоведения были немецкие учены Г. Конринг (1606-1681) и Г. Ахенваль (1719-1772).
Первая отличительная черта описательного направления заключается в том, что её задачей считалось описание «государственных достопримечательностей», как:
Территория государства;
Государственное устройство;
Население;
Религия;
Внешняя политика и т.п.
То есть предмет статистики не имел числовой характеристики до середины 18-го века.
Вторая особенность в том, что она не проводила анализ закономерностей и взаимосвязей общественных процессов.
Математическое направление зародилось в Англии. «Политическая арифметика» ставила задачей выявление закономерностей и взаимосвязей общественных процессов с помощью расчетов
Важнейшим представителем этого направления был У. Петти (1623-1687), которого К. Маркс назвал «в некотором роде изобретателем статистики». В дальнейшем его развили Ф. Гальтон (1822-1911), К. Пирсон (1857-1936), В. Госсет (1876-1936), Р. Фишер (1890-1962) и др.
2. Каждая наука обладает существенными специфическими особенностями, которые отличают ее от других наук и дают ей право на самостоятельное существование. Главная особенность любой науки заключается в:
предмете познания;
принципах и методах его изучения, которые в совокупности образуют ее методологию.
Предметом исследования статистики являются:
массовые явления социально-экономической жизни;
количественная сторона этих явлений в конкретных условиях места и времени.
Социально-экономическая жизнь общества проявляется в различного рода массовых явлениях, таких как, например:
производство разнообразных видов продукции;
потребление этой продукции;
перевозка грузов и пассажиров;
другие явления экономической, культурной и политической жизни;
природные ресурсы и природные условия.
3. Статистический показатель - это количественная оценка свойств изучаемого явления. В нем проявляется единство качественной и количественной сторон.
Статистика при помощи статистических показателей характеризует:
размеры изучаемых явлений;
их особенности;
закономерности развития;
их взаимосвязи.
Статистические показатели бывают учетно-оценочными и аналитическими. Первые отражают объем или уровень. А вторые используются для характеристики особенностей развития, распространенности, взаимосвязей, соотношений его частей. К ним относятся:
средние величины;
показатели структуры;
вариации, динамики, степени тесноты связи и др.
Специфический метод статистики основан на соединении анализа и синтеза. Сначала:
Выделяются и отдельно изучаются части явления (группы);
Оцениваются различия в величине признака;
Выявляются причины различий;
Дается характеристика явления в целом и тенденции его развития.
Все стадии статистической работы тесно связаны друг с другом. Ошибка допущенная на одной из стадий скажется на всем исследовании.
Статистика тесно связана с математикой различных уровней сложности, особенно с теорией вероятности и матем. статистикой.
Статистика опирается на закон больших чисел.
Поэтому в основе статистического исследования всегда лежит массовое наблюдение фактов. Чем больше объем наблюдаемых единиц, тем ближе наблюдаемые средние величины показывают закономерности изучаемого явления.
В современной статистике выделяются три основные части:
Общая теория статистики;
Экономическая статистика и ее отрасли;
Социальная статистика и ее отрасли.
Общая теория статистики разрабатывает общие принципы и методы статистического исследования, наиболее общие категории (показатели статистики).
Задачей экономической статистики является разработка и анализ синтетических показателей, отражающих состояние национальной экономики, взаимосвязи отраслей, особенности размещения производительных сил, наличие материальных, трудовых и финансовых ресурсов, достигнутый уровень их использования.
Социальная статистика формирует систему показателей для характеристики образа жизни и различных аспектов социальных отношений.
6. С развитием рыночных отношений роль информационной базы возрастает. Это связано с тем, что:
Усложняются связи субъектов рынка;
Появляется потребность в изучении влияния различных факторов на результаты экономической деятельности, социальные последствия;
Требуется обобщение на макро- и на микроуровне, а также подробная информация для составления самых разнообразных прогнозов.
Для того чтобы выполнить статистическое исследование, необходима научно обоснованная информационная база. Которая должна:
Обеспечить поддержку формирующегося рынка;
Дать всестороннюю и объективную информацию для разработки вариантов, обоснования и принятия управленческих решений.
Для этих целей специальный статистический аппарат занимается систематическим сбором данных, их обработкой и представлением результатов в виде статистической информации государственным и другим органам, коммерческим пользователям.
Владея информацией, предприятия могут эффективнее реализовывать поставленные задачи. И наоборот, важной причиной банкротств в Казахстане являются некомпетентные действия руководства предприятий, чему способствовало отсутствие в распоряжении руководителей информации о конъюктуре рынка и многих других жизненно важных для данного предприятия явлениях и процессах.
Статистическое наблюдение помогает предприятию:
Реализовать маркетинговую стратегию;
Гибко реагировать на изменения рынка;
Сделать обоснованный выбор.
2. Теория статистического наблюдения
Статистическое наблюдение - это процесс сбора первичных данных. Оно базируется на собственном наблюдении человека на основе опроса или измерения конкретных параметров изучаемого объекта.
Основные требования к первичным данным:
Достоверность данных, т.е. соответствие данных реальной действительности, техническая точность измерения;
Полнота данных;
Своевременность данных;
Сопоставимость данных во времени и пространстве;
Обоснованность отбора выборочной совокупности, т.е. отобранная часть единиц должна максимально обладать основными свойствами всей изучаемой совокупности.
I. Программно-методологические вопросы определяют:
цель наблюдения;
единицы наблюдения;
объект наблюдения
программу наблюдения, т.е. перечень вопросов подлежащих изучению;
статистические формуляры, т.е. бланки форм учета и отчетности;
инструкции, т.е. совокупность разъяснений, указаний по программе статистического наблюдения.
II. Организационные вопросы включаются в организационный план, где разработаны вопросы организации и проведения статистического наблюдения, в том числе указаны:
место наблюдения;
время наблюдения;
период наблюдения;
критический момент наблюдения, т.е. момент по состоянию на который собираются сведения. Например, критический момент переписи населения в Казахстане в 1999 г. - 12 часов ночи с 24 на 25 февраля.
3. I. Статистическая отчетность - это официальный документ, содержащий необходимые цифровые данные.
Статистическая отчетность классифицируется по ряду признаков:
По централизации:
государственная;
ведомственная;
по содержанию:
типовая,
специализированная;
по периодичности:
годовая;
текущая, т.е. квартальная, месячная, недельная;
по способу представления:
срочная;
почтовая.
Обследование имеет более расширенную программу, чем статистическая отчетность. Оно требует значительных затрат финансовых, материальных, трудовых ресурсов (н/р перепись).
Регистр - это непрерывное статистическое наблюдение за долговременными процессами, имеющими фиксированное начало, стадию развития и фиксированный конец (н/р регистр населения, предприятий и т.п.).
Виды статистического наблюдения
Статистические наблюдения классифицируются:
по полноте охвата единиц совокупности:
сплошное;
несплошное:
* основного массива. Т.е. изучается часть наиболее крупных единиц совокупности;
* выборочное;
* монографическое, т.е. проводится подробное описание отдельных, наиболее типичных единиц совокупности.
По непрерывности учета фактов во времени:
текущее, т.е. регистрация фактов производится по мере их возникновения;
периодическое;
единовременное.
Способы сбора сведений:
отчетный т.е. сведения поступают в статистические органы в порядке обязательного и регулярного их представления;
экспедиционный, т.е. сведения доводятся через регистраторов, которые сами заполняют формуляры, а регистраторы проверяют сведения и доставляют собранный материал в организацию, проводящую обследование;
явочный, т.е. респонденты сами являются по месту регистрации и сообщают необходимые сведения;
корреспондентский, т.е. сведения собирают добровольные корреспонденты, например, собирается информация для самостоятельной научной работы;
анкетный.
Основные источники сведений:
непосредственный учет, т.е. учет фактов путем подсчета, обмера, взвешивания;
документальный учет;
опрос;
мониторинг, т.е. систематическое непрерывное наблюдение за состоянием явления.
4. Ошибки статистического наблюдения
Ошибки регистрации возникают в результате неправильного установления фактов или неправильной записи результатов:
Случайные ошибки регистрации допускаются и респондентами, и регистраторами в результате их невнимательности, небрежности, а также неточности измерительных приборов;
Систематические ошибки регистрации:
* преднамеренные;
* непреднамеренные.
Ошибки репрезентативности (представительности) возникают при несплошном наблюдении:
Случайные ошибки репрезентативности допускаются, когда выборочная совокупность неполно отображает всю совокупность;
Систематические ошибки репрезентативности возникают в результате нарушения принципов случайного отбора единиц совокупности.
3. Методы представления статинформации
1. Первичные данные статистического исследования требуют предварительной обработки. Для этого используется метод статистической сводки. Это систематизация первичных данных и подсчет обобщающих статистических показателей, относящихся ко всей совокупности.
Статистическая сводка классифицируется по ряду признаков:
по глубине обработки данных:
простая;
сложная:
* комбинированная;
* многомерная;
по форме обработки материала:
децентрализованная;
централизованная;
по технике выполнения:
механизированная;
ручная.
Одним из основных и наиболее распространенных методов обработки и анализа статистической информации является группировка.
Группировкой называется расчленение множества единиц изучаемой совокупности на однородные типичные группы по определенным существенным количественным или качественным признакам.
Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений.
Группировочным признаком (основанием группировки) называется признак, по которому проводится разделение единиц совокупности на отдельные группы.
Вторичная группировка - это образование новых групп на основе ранее проведенной группировки.
Два способа вторичной группировки:
способ укрупнения интервалов;
способ долевой перегруппировки.
Метод группировок решает следующие задачи статистического анализа:
Выделение социально-экономических типов явлений.
Изучение структуры явления и структурных сдвигов, происходящих в нем.
Обнаружение связи и зависимости между явлениями.
Результаты группировок представляются в статистических таблицах.
Статистические таблицы - это форма рационального и наглядного изложения цифровых характеристик исследуемых явлений и их составных частей. Представление информации в виде статистических таблиц дает возможность характеризовать:
размеры;
структуру:
динамику изучаемых явлений.
Основные элементы статистической таблицы - подлежащее и сказуемое. Подлежащее таблицы единицы статистической совокупности или их группы. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных.
Виды статистических таблиц:
I. По характеру подлежащего:
простые:
* перечневые;
* хронологические;
* территориальные;
сложные:
* групповые;
* комбинационные.
II. По разработке сказуемого:
простые;
сложные;
* некомбинированные;
* комбинированные.
При заполнении статистических таблиц используются следующие условные обозначения:
если явление не имеет места, то ставят тире «-»;
если нет сведений о явлении, то ставят многоточие «…» или пишут «нет сведений»;
если данные очень малы, то ставят 0,0.
Графический метод представления статистических данных связан с развитием семиотики.
Семиотика - это наука о знаках и знаковых системах. Знаковые системы семиотики делятся на:
неязыковые;
языковые.
Неязыковые знаковые системы дают представление о явлениях окружающего нас мира (например, шкала измерительного прибора, высота столбика ртути в термометре и т.д.)
Языковые знаковые системы, кроме сигнальных функций, выполняют задачи сопоставления совокупности явлений для их анализа. В этих системах сочетание знаков приобретает смысл только тогда, когда их объединение производится по определенным правилам.
В языковых знаковых системах различают:
естественные системы знаков;
искусственные системы знаков.
С т. зр. семиотики, человеческая речь, выраженная в буквах - естественный язык.
Искусственные языковые системы используются в различных областях жизни. Например: математические, химические знаки, алгоритмические языки, графики, логотипы и т.д.
Статистический график - чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков.
Данные в виде графика позволяют:
производить более сильное впечатление, чем цифры;
лучше осмыслить результаты статистического наблюдения;
правильно истолковать результаты статистического анализа;
значительно облегчает понимание статистического материала;
делает его наглядным и доступным.
График состоит из графического образа и вспомогательных элементов.
Графический образ - это совокупность линий, фигур, точек, которыми изображены статистические данные.
Эти знаки применяются для сравнения статистических величин, изображающих абсолютные и относительные размеры сравниваемых совокупностей. Сравнение на графике производится по некоторым измерениям:
площади или длине одной из сторон фигуры;
местонахождению точек;
их густоте;
густоте штриховки;
интенсивности или цвету окраски.
Вспомогательные элементы графика включают:
общий заголовок;
условные обозначения;
оси координат;
шкалы с масштабами и числовую сетку.
Статистические графики по форме графического образа делятся на:
Линейные |
Плоскостные |
Объемные |
|
Статистические кривые |
столбиковые полосовые квадратные круговые секторные фигурные точечные фоновые |
Поверхности распределения |
Статистические графики по способу построения и задачам изображения делятся на:
Диаграммы:
диаграммы сравнения;
диаграммы динамики;
структурные диаграммы.
Статистические карты:
картограммы;
картодиаграммы.
4. Обобщающие показатели
Статистический показатель - количественная характеристика социально-экономических явлений и процессов в условиях качественной определенности.
Статистические показатели классифицируются по ряду признаков:
по охвату единиц совокупности:
индивидуальные;
сводные:
* объемные;
* расчетные;
по временной определенности:
моментные, т. е. по состоянию на определенный момент времени;
интервальные, т.е. за определенный период времени;
по пространственной определенности:
обще территориальные;
региональные;
локальные.
2. Абсолютные величины характеризует массу, площадь, объем, протяженность, численность и т.п. изучаемых явлений и процессов. Абсолютные величины выражаются в натуральных, условно-натуральных, трудовых и стоимостных единицах измерения.
Абсолютные величины могут быть:
индивидуальные;
сводные.
Относительные величины представляют собой отношение одной абсолютной величины к другой. Абсолютный показатель, находящийся в числителе, называется текущим, а показатель, находящийся в знаменателе, - основанием или базой сравнения. Относительные величины выражаются в коэффициентах, процентах (%), промилле (%0), продецимилле (%00), просантимилле (%000), а также могут быть именованными. Именованная относительная величина получается в результате деления разноименных абсолютных величин. Ее наименование представляет собой сочетание наименований текущего и базисного показателей.
Относительные величины могут быть:
динамики - отношение текущего показателя к базисному или предшествующему показателю;
плана - отношение показателя, планируемого на текущий период, к показателю, запланированному на текущий период;
реализации плана - отношение показателя, достигнутого в текущем периоде, к показателю, запланированному на текущий период;
структуры - отношение показателя, характеризующего часть совокупности, к показателю, отражающему всю совокупность;
координации - отношение отдельных частей целого между собой;
интенсивности и уровня экономического развития - отношение показателя, характеризующего явление, к показателю, характеризующему среду распространения этого явления;
сравнения - отношение одноименных абсолютных величин, характеризующих разные объекты.
3. Средняя величина является обобщающим показателем, с помощью которого характеризуют изучаемую совокупность по количественно варьирующему признаку в конкретных условиях места и времени. Она отражает его типичный уровень в расчете на единицу совокупности в конкретных условиях места и времени.
Средняя, рассчитанная по совокупности в целом, называется общей средней. Она отражает общие черты изучаемые явления. Средняя, исчисленная для каждой группы, - групповой средней, которая дает характеристику размера явления, складывающуюся в конкретных условиях данной группы.
Существуют две категории средних величин:
степенные средние (к ним относятся средняя арифметическая, средняя гармоническая, средняя геометрическая);
структурные средние (мода и медиана).
В зависимости от характера исходных данных, цели исследования или сущности усредняемого показателя определяется тип средней.
НАПРИМЕР:
По данным о размере месячной заплаты рабочих бригад за январь нужно определить среднюю месячную заплату.
Табельный номер рабочего |
12 |
14 |
32 |
24 |
18 |
26 |
34 |
41 |
19 |
37 |
всего |
|
Месячная зарплата, тыс. тг. |
32 |
34 |
37 |
38 |
39 |
51 |
54 |
57 |
59 |
55 |
416 |
Общая сумма заработной платы всех работников хi=416 тыс. тг, где i=от 1 до n. Это определяющий показатель, исчисленных значений заработной платы хi каждого рабочего. Другими словами, это фонд оплаты их труда, который может быть записан алгебраически:
x1 + х2 +х.3 +…+хn= хi,
где i - от 1 до n.
Определяющий показатель, выраженный математически, называется определяющей функцией.
Средняя месячная зарплата рассчитывается по формуле простой средней. Эта формула используется в двух случаях:
когда каждая варианта встречается только один раз;
когда все частоты равны между собой.
Х - варианта (x1, х2, х.3, хn);
Хсред. - средняя величина из вариант;
n - число вариант;
f - частоты (как часто встречается варианта);
Хсред.(простая) = х/n.
Итак, средняя месячная зарплата равна 416/10 = 41,6 тыс. тг
Если бы все единицы изучаемой совокупности развивались под действием одних общих условий и на них не действовали никакие «случайные» факторы, то величина признака у каждой единицы - индивидуальное значение - была бы одинаковой. Она была бы равна 21600 тг.
Средняя арифметическая взвешенная рассчитывается, когда частоты не равны между собой:
Х сред. (взвешенная) = хf / f
Например, имеются следующие данные о количестве человек разного возраста в определенном коллективе:
Возраст |
Х |
25 |
27 |
21 |
23 |
|
Кол-во человек |
f |
3 |
2 |
2 |
6 |
Х сред. = (25*3+27*2+21*2+23*6) / (3+2+2+6);
Х сред. = 23,769
Средняя арифметическая величина обладает следующими свойствами:
сумма отклонений отдельных значений признака от средней арифметической равна 0;
если от каждой варианты вычесть или к каждой варианте прибавить какое-либо произвольное постоянное число, то средняя уменьшится (увеличится) на это же число;
если каждую варианту разделить (умножить) на какое-либо произвольное число, то средняя уменьшится (увеличится) во столько же раз;
если все частоты разделить на какое-либо число, то средняя величина не изменится. Это свойство дает возможность абсолютные значения частот заменять их удельными весами.
Средняя гармоническая является преобразованной средней арифметической. Применяется тогда, когда необходимые веса в исходных данных не заданы непосредственно. Они могут входить множителем в один из имеющихся показателей.
Как и средняя арифметическая, средняя гармоническая может быть простой и взвешенной.
Если веса у каждого значения признака равны, то можно использовать среднюю гармоническую простую:
Х сред.гармон. = N/ хi
Однако в статистической практике чаще применяется средняя гармоническая взвешенная. Она используется, как правило, при расчете общей средней из средних групповых.
Например, имеются следующие данные по цехам:
Номер цеха |
Х Средняя зарплата за месяц |
F число работников |
х средняя зарплата за месяц |
М фонд зарплаты |
|
1 2 3 итого |
42 42 51,5 135,5 |
150 120 83 353 |
40,8 42 54 136,8 |
5304 5124 4590 15018 |
Хсред.(за август) = хf / f = (42*150+42*120+51,5*83) / (150+120+83)
Хсред = 44,23 тыс. тг
Средняя гармоническая:
Хсред..гармон.= М / М / х; М= хf;
Хсред.= (5304+5124+4590) / (5304/408 + 5124/420 + 4590/540) = 44,56 тыс. тг
Логическая формула данного примера
Средняя зарплата 1 работника = общий фонд зарплаты / число работников
5. Ряды распределения
Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному группировочному признаку, который изменяется количественно и качественно от одной единицы к другой или от одного периода времени к другому.
Ряды распределения могут быть:
атрибутивные, т.е. ряды распределения, построенные по качественным признакам.
вариационные, т.е. ряды распределения, построенные по количественным признакам:
дискретные признаки, отличаются друг от друга на некоторую конечную величину, т.е. даны в виде прерывных чисел; (н/р число детей в семье, число работников)
непрерывные признаки, могут отличаться друг от друга на сколь угодно малую величину; (н/р зарплата рабочих, размер среднедушевого денежного дохода)
Способы построения вариационного ряда для этих видов признаков различны.
Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака, обозначаемые через Хi, а затем подсчитать частоту повторений каждого варианта Fi (например, распределение рабочих по разрядам, студентов по успеваемости и так далее).
Ряд распределения принято оформлять в виде таблиц, например:
Тарифный разряд рабочего, хi |
Число рабочих, имеющих этот разряд, fi |
Частота, Wi |
Накопленная частота, Si |
|
2 3 4 5 6 итого |
1 5 8 4 2 20 |
0,05 0,25 0,40 0,20 0,10 1,00 |
1 6 14 18 20 |
Т.о., ряд первичных данных, характеризующих квалификацию 20 рабочих, заменен коротким рядом, состоящим из 5 групп. Вместо абсолютного числа рабочих, имеющих определенный разряд можно установить долю рабочих этого разряда.
Вариационные ряды состоят из вариантов и частот (частостей).
Варианты - отдельные значения признака, которые он принимает в вариационном ряду распределения.
Частоты - числа, показывающие, как часто встречаются те или иные варианты в вариационном ряду распределения.
Частости - частоты, выраженные в долях единицы или в процентах к итогу.
2. В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значение признака у отдельных единиц может вообще не повторяться, строятся интервальные ряды распределения.
Интервал указывает определенные пределы значений варьирующегося признака и обозначается верхней и нижней границами интервала.
При построении интервальных рядов распределения необходимо прежде всего установить число групп (интервалов), на которые будут разбиты все единицы изучаемой совокупности.
Определение величины интервала (h) для построения вариационного ряда с равными интервалами производится следующим образом:
вычисляется разность между максимальным и минимальным значением признака первичного ряда (определяется размах вариации R):
R =X max - Xmin;
размах вариации делится на число групп k, то есть
h = R / k.
Число групп приближенно определяется по формуле Стэрджесса:
K = 1+ 3,322 lg n,
где n - общее число изучаемых единиц совокупности, оно обычно дробное и его следует округлить.
3. Для характеристики среднего значения признака в вариационном ряду используются: средняя арифметическая, мода и медиана.
Средняя арифметическая для дискретного ряда распределения рассчитывается по формуле:
Хсред. = хi fi / fi;
где хi - варианта значений признака;
fi - частота повторения данного варианта.
В вариационном интервальном ряду средняя арифметическая определяется по формуле:
Хсред. = хki fi / fi;
где хki - середина соответствующего интервала.
В отличии от средней арифметической, рассчитываемой на основе использования всех вариантов значений признака, мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.
Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером NMe =(n + 1) / 2, где n - число единиц в совокупности.
Например:
№ группы |
Заработная плата, тыс. тенге |
Число работников, чел. |
Сумма накопленных частот |
|
I II III IV V VI |
50-60 60-70 70-80 80-90 90-100 Свыше 100 |
10 30 70 60 25 5 |
10 40 110 - - - |
Мода - наиболее часто встречающееся значение признака совокупности. Для указанного в примере ряда распределения она также ….. (максимальная частота).
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода и медиана.
Для определения медианы в интервальном ряду используют следующую формулу:
М= x+ h=
где Х Ме - нижняя граница медианного интервала;
h - величина интервала;
S(-1) - накопленная частота интервала, предшествовавшего медианному;
fMe - частота медианного интервала.
Например:
Размер прибыли, млн. тг |
Число банков |
Накопленная частота |
|
3,7-4,6 |
2 |
2 |
|
4,6-5,5 |
4 |
6 |
|
5,5-6,4 |
6 |
12 |
|
6,4-7,3 |
5 |
17 |
|
7,3-8,1 |
3 |
20 |
|
Итого |
20 |
В нашем примере рассчитаем медиану. По накопленным частотам определяем, что медиана находится в интервале 5,5-6,4.
Тогда:
Ме = 5,5+0,9* (0,5*20 - 6)/6 = 6,175млн. тг
Т.о. 50% банков имеют прибыль менее 6,175 млн. тг, а 50% банков - более 6,175 млн. тг.
Теперь определим моду. Наибольшая частота также соответствует интервалу 5,5-6,4, то есть мода должна находиться в этом интервале. Ее величину определяем по формуле:
М= xh;
где:
Хмо - начало модального интервала;
fMo - частота, соответствующая модальному интервалу;
f(-1) - предмодальная частота;
f(+1) -послемодальная частота.
Приведенная формула может быть использована в вариационных рядах с равными интервалами:
Мо = 5,5 + 0,9 (6 - 4) / ((6 - 4) + (6 - 5)) = 6,10 млн. тг
Т.о., в данной совокупности наиболее часто встречается размер прибыли 6,10 млн. тг
4. Для измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Дисперсия (2) - это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.
В зависимости от исходных данных дисперсия вычисляется по формуле средней арифметической простой или взвешенной:
2 = (х - х)2 / n - простая
2 = (х - х)2 f / f - взвешенная
Среднее квадратическое отклонение () представляет собой корень квадратный из дисперсии и равно
= (х - х)2 / n - невзвешенное
= (х - х)2 f / f -взвешенное.
В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (тенге, тоннах, процентах и т.д.).
Для сравнения размеров вариации различных признаков, а также для сравнения степени вариации одноименных признаков в нескольких совокупностях исчисляется относительный показатель вариации - коэффициент вариации (V), который представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:
V = *100/ xсред
По величине коэффициента можно судить о степени вариации признаков, а следовательно, об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.
Например:
Стаж, лет |
Среднесписочная численность работников, чел., f |
Середина интервала, хi |
xi f |
xi - xcp |
(xi -xcp)2 |
(xi -xcp)2 f |
|
До 3 3-5 5-7 7-9 свыше 9 |
10 48 28 10 4 |
2 4 6 8 10 |
20 192 168 80 40 |
-3 -1 1 3 5 |
9 1 1 9 25 |
90 48 28 90 100 |
|
Итого |
1000 |
- |
500 |
- |
- |
356 |
Определить:
средний стаж работников;
дисперсию;
среднее квадратическое отклонение;
коэффициент вариации.
Решение: 1. Хсред. = 500/100=5 лет
дисперсия
2= 356/100=3,56=3,6
среднее квадратическое отклонение
= 356/100 = 3,6 = 1,8867
коэффициент вариации
V = 1,8867/5 * 100 =37,7 %
Правило сложения дисперсий (вариаций). Для статистической совокупности, сгруппированной по изучаемому признаку, возможно вычисление трех видов дисперсий: общей (2), частных (внутригрупповых) - (i2) и межгрупповой (2). Общая дисперсия характеризует вариацию всех единиц совокупности от общей средней, частные - вариацию признака в группах от групповой средней и межгрупповая - вариацию групповых средних от общей средней. Между указанными видами дисперсий существует соотношение, которое называют правилом сложения дисперсий: общая дисперсия равна сумме средней из частных дисперсий и межгрупповой:
2 =i2 + 2
Если основанием группировки является факторный признак, то с помощью правила сложения дисперсий можно измерить силу его влияния на результативный признак. Вычислив коэффициент детерминации и эмпирическое корреляционное отношение.
Коэффициент детерминации равен отношению межгрупповой дисперсии к общей:
2 = 2х / 2
Показывает долю общей вариации результативного признака, обусловленную вариацией группировочного признака.
Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением:
= 2х / 2
По абсолютной величине он может изменяться от 0 до 1. Если = 0, группировочный признак не оказывает влияния на результативный. Если = 1, изменение результативного признака полностью обусловлено группировочным признаком, т. е. между ними существует функциональная связь.
6. Выборочное наблюдение
1. Выборочное наблюдение - это несплошное наблюдение, при котором статистическому обследованию подвергается не вся изучаемая совокупность. А лишь ее часть, отобранная специальным образом.
Задача выборочного наблюдения - по обследуемой части изучаемой совокупности дать характеристику всей совокупности.
Цель выборочного наблюдения - по среднему значению признака у отобранной части единиц с достаточной точностью дать вывод о величине этих показателей у всех единиц того же рода.
Выборочное наблюдение проводится в следующих случаях:
когда вся совокупность единиц (генеральная совокупность) бесконечно велика и мы практически не можем исследовать каждую единицу;
когда изучение свойств совокупности связано с ее уничтожением;
с целью экономии средств и времени.
Например: нам нужно выяснить среднюю продолжительность горения лампочек. Чтобы установить их качество.
Вся совокупность (общее кол-во лампочек) N = 10000. Выборка n = 100 штук. Для установления средней продолжительности горения отобранных 100 лампочек. Мы наблюдаем их на протяжении всей продолжительности горения. Затем разбиваем всю выборочную совокупность на интервалы, указывающие среднюю продолжительность горения лампочек:
Продолжительность горения лампочек (час) |
Число лампочек (штук) |
Середина интервала |
|
170-190 190-210 210-230 230-250 250-270 |
5 15 40 30 10 |
180 200 220 240 260 |
|
Итого |
100 |
- |
Средняя продолжительность горения лампочки из выбранной совокупности равна:
Хсред = xf / f = (5 * 180 + 15 * 200 +40 * 220 + 30 * 240 + 10 * 260) / 100=225 часов
2. Средняя ошибка выборки - это расхождение между генеральными и выборочными характеристиками.
По способу проведения отбор может быть повторным и бесповторным. При повторном отборе каждая единица совокупности после исследования ее признака возвращается обратно в генеральную совокупность и может быть отобрана еще раз. При бесповторном отборе каждая единица совокупности может быть отобрана только один раз, так как после изучения ее признака она не возвращается в генеральную совокупность.
Средняя ошибка при повторном отборе:
,
где n - численность выборки
При бесповторном отборе средняя ошибка выборки равна:
;
величина (1 - n) / N всегда меньше единицы, поэтому величина средней ошибки выборки при бесповторном отборе оказывается меньше, чем при повторном
(дисперсия)
Вероятность всегда равна 0,683. Это означает, что если мы из нашей генеральной совокупности сделаем 1000 аналогичных выборок, то в 683 выборках интересующая нас средняя будет лежать в указанных пределах, а в остальных 317 выборках результат будет находиться за данными пределами.
Если мы хотим увеличить вероятность наших утверждений, то мы переходим от средней ошибки выборки к предельной
t |
P (вероятность) |
|
1 2 3 3,5 |
0,683 0,954 0,997 0,999 |
Рассчитаем среднюю ошибку выборки для примера, рассмотренного в предыдущем вопросе
2 =395 = 395 /100 * (1-100) / 10000 = 1,98 часа;
Хв/с - Хген/с Хв/с + ;
225 - 2 Хген/с 225 + 2
Увеличим вероятность нашего утверждения до 0,997. Для этого перейдем к предельной ошибке выборки t:
t = 3 * 1,98 = 5,94;
Хв/с - t Хген/с Хв/с ++ t; 225 -6 Хген/с 225+6
219 часов Хген/с 231 час; при р = 0, 997
3. Формула расчета ошибки выборки для доли при повторном отборе:
= W(1 - W)/ n
где W - доля единиц, обладающих данным признаком;
1 - W - доля единиц, не обладающих этим признаком;
расчет средней ошибки выборки при бесповторном отборе:
= ( W(1 - W))/ n * (1 - n)/ N;
W - Р W +
Если мы хотим увеличить вероятность наших утверждений, то мы переходим от средней ошибки выборки к предельной.
t = t *; W - t P W + t;
Определим для нашего примера удельный вес ламп, продолжительность горения которых равна более 230 часов: W = 40 / 100 = 0,4 или 40%;
= (0,4* 0,6)/100 * (1 - 100)/100 = 0,05
0,4 - 0,05 Р 0,4 + 0,05; 0,35 Р 0,45;
35% Р 45% при р = 0,683
Для увеличения вероятности наших расчетов, переходим к предельной ошибке выборки: t = 2*0,05 = 0,1 при р = 0,954.
0,4 - 0,1 Р 0,4 +0,1; 30% Р 50% при Р = 0,954
Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле
2 (Х) = 2 / n,
где n - объем выборки; 2 - дисперсия признака, рассчитанная по данным выборки.
Формулы:
Х = ni / n = W;
2w = W (1 - W);
= (W(1 - W))/ n
Используются для оценки точности выборочного значения доли (удельного веса) как средней величины альтернативного признака.
Под альтернативным понимается такой статистический показатель, который принимает одно из взаимоисключающих значений (пол - мужской или женский; изделие - годное или негодное; план по выпуску продукции - выполнен или не выполнен; заказ - выполнен менее, чем на 90% или более, чем на 90 % и т.д.). То есть, конкретное содержание альтернативного признака устанавливается самим исследователем. Обычно считают, что если признак Х принял интересующее нас значение, то его величина равна 1, в противном случае Х = 0. В результате в n1 наблюдениях имеем интересующее нас явление (когда Х = 1), а в n2 случаях оно отсутствует (когад Х = 0). Таким образом,
Хw = (1 * n1 + 0 * n2) / (n1 + n2) = n1 / (n1 = n2) = n1 / n = W,
т.е. среднее значение альтернативного показателя равно частоте его появления (W = n1 / n). Аналогично
2w = ((1-W)2 * n1 + (0 - W)2 * n2)/ (n1 + n2) = (1-W)2 * W + W2 * (1 - W) = W (1-W)
т.е. дисперсия альтернативного показателя равна произведению частоты его появления на частоту его отсутствия.
4. В практике проектирования выборочного наблюдения возникает потребность в нахождении численности выборки, которая необходима для обеспечения определенной точности расчета генеральных характеристик - средней и доли.
Предельная ошибка выборки, вероятность ее появления и вариация признака предварительно известны.
При случайном повторном отборе численность выборки определяется по формуле
n = (t2 2)/ 2 ;(1)
При случайном бесповторном и механическом отборе численность вычисляется по формуле
n = (t2 2 N)/( N 2 +t22 ) (2)
Для типической выборки n = (t2 ср2 N ) /( N 2 +t2 ср 2 ) ; (3)
Для серийной выборки n = (t2 2 R)/( R 2 +t2 2 ) ; (4)
Например: в районе проживает 2000 семей. Предполагается провести их выборочное обследование методом случайного бесповторного отбора для нахождения среднего размера семьи. Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит одного человека при среднем квадратическом отклонении три человека.
РЕШЕНИЕ: при бесповторном случайном отборе численность выборки по формуле (2) составит: n = (4 * 9 * 2000)/(2000 * 1 + 4 * 9) = 35 семей
7. Ряды динамики
1. Основной задачей статистики является изучение изменений анализируемых показателей во времени. Для этой цели используются ряды динамики. Ряд расположенных в хронологической последовательности значений статистических показателей, представляет собой временной (динамический) ряд.
Ряд динамики состоит из двух элементов:
моментов или периодов времени, к которым относятся статистические данные;
самих данных, называемых уровнями ряда (у).
2. Динамические ряды классифицируются:
по времени:
моментные;
интервальные;
по полноте времени:
полные;
неполные;
по способу выражения уровней ряда:
абсолютных;
относительных;
средних величин.
Сравниваемый уровень называется текущим, а уровень, с которым производится сравнение, - базисным, либо предыдущим. Если сравнивается каждый уровень с базисным, то получают базисные показатели динамики, а при сравнении каждого уровня с предыдущим ему уровнем получают цепные показатели динамики.
Моментным динамическим рядом называется такой ряд, уровни которого характеризуют показатель на определенную дату. (НАПРИМЕР: численность населения на определенную дату). Интервальным называется ряд, уровни которого отражают изменение показателя за определенный период времени. Особенностью интервального ряда является то, что его уровни можно суммировать и получать так называемые накопленные итоги.
Рядом динамики относительных величин называется ряд цифровых данных, характеризующих изменение относительных размеров изучаемых явлений во времени. Например, темпы роста индекса потребительских цен.
3. В результате сравнения уровней динамического ряда получается система абсолютных и относительных показателей динамики, к которым относят:
абсолютный прирост;
коэффициент роста;
темп прироста;
абсолютное значение одного процента прироста;
пункты роста.
Если сравнению подлежат несколько последовательных уровней, то возможны два варианта сопоставления:
каждый уровень сравнивается с одним и тем же предшествующим уровнем, принятым за базу сравнения; в качестве базисного уровня выбирается либо начальный уровень динамического ряда, либо уровень, с которого начинается какой-то этап развития явления. Такое сравнение называется сравнением с постоянной базой сравнения;
каждый уровень динамического ярда сравнивается с непосредственно ему предшествующим - такое сравнение называют сравнением с переменной базой.
Базисные показатели характеризуют окончательный результат всех изменений в уровнях ряда от периода, к которому относится базисный уровень, до данного (і-го) периода.
Показатели динамики с переменной базой характеризуют изменения уровня от периода к периоду (или от даты к дате) в пределах определенного промежутка времени.
Абсолютный прирост (А) определяется как разность между двумя уровнями динамического ряда и показывает, насколько данный уровень ряда превышает уровень, принятый за базу сравнения:
А = уi - у0,
Где уi - уровень сравниваемого периода;
у0 - уровень базисного периода.
При сравнении с переменной базой абсолютный прирост (Аi) будет равен:
А = уi - уi-1,
Где уi-1 - уровень непосредственно предшествовавшего периода;
Абсолютный прирост с переменной базой называют скоростью роста.
Коэффициент роста (К) определяется как отношение двух сравниваемых уровней и показывает во сколько раз данный уровень превышает уровень данного ряда:
при сравнении с постоянной базой сравнения К=Уi / Уi;
при сравнении с переменной базой сравнения К=Уi / Уi-1.
Если коэффициенты роста выражают в процентах, то их называют темпами роста:
Тр = К* 100%.
Темп прироста показывает, на сколько процентов уровень данного периода больше (или меньше) базисного периода. Этот показатель может быть рассчитан двояко:
Тп = (Уi - Уо) / Уо * 100%;
Тп = (Уi - Уi-1) / Уi-1,
Как разность между темпом роста (в процентах) и 100%.
В тех случаях, когда сначала уровни ряда динамики представлены в одних границах или исчислены по одной методологии, а затем идут в других границах или по другой методологии исчислены, то уровни ряда становятся несопоставимыми между собой. Чтобы привести уровни ряда к сопоставимому виду следует применить прием смыкания рядов динамики. (путем определения коэффициента пересчета уровней).
8. Средние характеристики ряда динамики
Метод расчета среднего уровня ряда динамики зависит от вида временного ряда.
Для интервального временного ряда абсолютных показателей средний уровень за определенный период определяется по формуле простой арифметической:
Усред= ( Уi )/ n,
где n - число уровней ряда
Средний уровень моментного динамического ряда определяется иначе.
Рассмотрим пример такого моментного динамического ряда, когда промежутки между датами одинаковы. Известно, что остаток материалов на складе на 1 января составил 24,2 млн. тг, на 1 февраля - 25,1 млн, тг, на 1 апреля - 18,6 млн, тг.
При вычислении средней моментного ряда условно предполагается непрерывное, равномерное изменение уровня в промежутках между двумя датами. Основываясь на этом предположении, определяем средние остатки материалов на складе за каждый месяц как полусумму остатков на начало и конец месяца.
Средние остатки за месяц будут равны:
за январь - 24,65 млн. тг (24,2 + 25,1) / 2, за февраль - 23,20 млн. тг
(25,1 + 21,3) / 2 и за март - 19,95 млн. тг (21,3 + 18,6) / 2.
Средний остаток за квартал определяется как простая средняя арифметическая:
Усред = (24,65 + 23,20 + 19,95) / 3 = 22,6 млн. тг.
Приведенный расчет среднего уровня можно представить формулой средней хронологической:
Усред = (У1/ 2 + У2 + У3 +… +Уn-1 + Уn / 2)/(n - 1)
где n - число дат;
У1, У2,…Уn - уровни ряда в последовательные моменты времени.
3. Для определения среднего уровня моментного ряда с неравномерными промежутками между временными датами вычисляется средняя арифметическая взвешенная. В качестве весов принимается продолжительность промежутков времени между моментами, в которые происходят изменения в уровнях динамического ряда:
Усред = ( уi ti)/ ti;
где ti - количество дней (месяцев) между смежными датами.
НАПРИМЕР: на 1 января отчетного года стоимость основных фондов предприятия составляла 75 млн. тг. В марте были приобретены основные фонды на сумму 2 млн. тг., в мае выбыло основных фондов на 7 млн. тг., а в сентябре было еще приобретено на сумму 8 млн. тг. Определим среднюю годовую стоимость основных фондов предприятия:
Даты времени |
Стоимость ОФ, млн тг |
Число месяцев, в течение которых стоимость не изменялась |
уi ti |
|
1/1 1/4 1/6 1/10 |
75 77 70 78 |
3 2 4 3 |
225 154 280 234 |
|
итого |
- |
12 |
893 |
Среднегодовая стоимость основных фондов предприятия по данным приводимого примера равна:
Усред = 893 / 12 = 74,417 млн. тг
Если же ориентироваться на стоимость основных фондов предприятия на начало и конец отчетного года, то есть, например, использовать показатели балансового отчета предприятия, то получим иной показатель среднегодовой стоимости основных фондов предприятия:
Усред = (75 + 78) / 2 = 76,5 млн. тг,
где 78 млн. тг - стоимость основных фондов на конец года
78 = 75 + 2 - 7 + 8
Вот почему для анализа деятельности предприятия следует пользоваться данными внутренней отчетности, что позволяет получить более достоверную оценку результатов.
4. Средний абсолютный прирост (или средняя скорость роста) рассчитывается как средняя арифметическая из показателей скорости роста за отдельные промежутки времени:
А = ( А i)/(n-1);
где n - число уровней ряда;
А i - абсолютные изменения по сравнению с предшествующим уровнем.
Формулу расчета можно преобразовать в следующий вид:
Аср.= (Уn - У1) / (n - 1);
где Уn и У1 - соответственно, конечный и начальный уровни динамического ряда.
9. Структура ряда динамики
Одной из задач, возникающих при анализе рядов динамики, является установление закономерностей изменения уровней изучаемого показателя во времени.
В некоторых случаях эта закономерность развития объекта вполне ясно отображается уровнями динамического ряда. Однако часто приходится встречаться с такими рядами динамики, когда уровни ряда претерпевают самые различные изменения и можно говорить лишь об общей тенденции развития явления. Это может быть:
тенденция к росту;
тенденция к снижению.
Всякий ряд теоретически может быть представлен в виде составляющих:
тренд - основная тенденция развития динамического ряда (к увеличению, либо к снижению его уровней);
циклические (периодические) колебания (циклдік (кезе?дік) ауыт?улар), в том числе сезонные;
случайные колебания.
Изучение тренда включает два основных этапа:
ряд динамики проверяется на наличие тренда;
производится выравнивание временного ряда и непосредственное выделение тренда с экстраполяцией полученных результатов.
Для определения основной тенденции развития, достаточно устойчивой на протяжении данного периода, используют особые приемы обработки рядов динамики.
Подобные документы
Статистика как одна из древнейших отраслей знаний, возникшая на базе хозяйственного учета. Развитие статистики как науки. Определение предмета статистики. Статистическое наблюдение как этап статистического исследования. Методы и показатели статистики.
контрольная работа [38,9 K], добавлен 20.01.2010Информационная база статистического исследования: наблюдение и его этапы, принципы выборки. Программно-методологические задачи, формы, виды и способы проведения статистического исследования. Контроль за полнотой и достоверностью статистических данных.
курсовая работа [3,9 M], добавлен 07.12.2010История происхождения статистики как научной дисциплины. Сущности и свойства статистической совокупности. Понятие, формы организации, виды и документальное сопровождение статистического наблюдения. Описание ошибок регистрации и репрезентативности.
реферат [52,6 K], добавлен 13.11.2010Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Статистическое наблюдение как первый этап статистического исследования. Формы организации статистического наблюдения. Виды и способы статистического наблюдения. Организация сбора данных, план статистического наблюдения, ошибки и меры борьбы с ними.
реферат [19,6 K], добавлен 04.06.2010Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.
эссе [18,7 K], добавлен 17.10.2014Исследование направлений движения статистической информации. Сбор первичных данных в ходе статистического наблюдения. Сводка, группировка, обработка данных, осуществляемая органами государственной статистики. Использование статистической информации.
реферат [193,0 K], добавлен 26.05.2014Понятие о статистической информации. Статистическое наблюдение как стадия экономико-статистического исследования. Задачи и данные статистики при изучении доходов, расходов. Домашние хозяйства как источник информации. Доходная и расходная часть баланса.
контрольная работа [21,7 K], добавлен 06.12.2010Рассмотрение форм (отчетность, регистр), методов организации сбора, обработки данных статистического наблюдения, их структурного и содержательного анализа с помощью обобщающих показателей, способов статистического моделирования и прогнозирования.
методичка [3,0 M], добавлен 10.04.2010Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.
курс лекций [475,4 K], добавлен 11.02.2010