Организация выброчного наблюдения в статистике

Теоретические основы выборочного наблюдения. Средний арифметический показатель и особенности его использования. Дисперсия, ее сущность и значение. Определение ошибки выборки. Порядок исследования социально-экономических явлений выборочным методом.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 28.12.2012
Размер файла 56,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

  • Содержание
  • Введение
  • Глава I. Теоретические основы выборочного наблюдения
  • Глава II. Определение ошибки выборки
  • Заключение
  • Список использованной литературы
  • Приложение

Введение

Актуальность темы работы состоит в том, что выборочный метод важен в следующем отношении: при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

Выборочный метод получил широкое распространение в государственной и ведомственной статистике (например, бюджетные обследования семей рабочих, крестьян и служащих, обследования жилищных условий, заработной платы и др.). В торговле с помощью выборочного метода изучаются качество поступивших товаров, эффективность новых форм торговли, спрос населения на определенные виды товаров, степень его удовлетворения и др.

Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки. Она зависит от, ряда факторов; степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.

Цель работы состоит в общей теоретической и практической характеристике выборочного метода в статистике.

В соответствии с поставленной целью задачи работы предусмотрены следующие:

1. определение основных положений выборочного наблюдения

2. характеристика ошибки выборки

3. описание порядка расчёта выборочной совокупности на примере правовой статистики

Глава I. Теоретические основы выборочного наблюдения

Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило название закона больших чисел. Математической основой закона больших чисел, да и статистической науки в целом, служит теория вероятностей. Последняя представляет собой раздел математики, в котором изучаются случайные явления (события), имеющие устойчивую частость, а следовательно, и вероятность, что помогает выявлять закономерности при массовом повторении явлений.

Поскольку за внешними случайными явлениями стоят скрытые законы, то данные, характеризующие эти явления, должны распределяться определенным образом. Исходя из закона больших чисел, чем больше изученная совокупность случайных явлений, тем должно быть более упорядоченным распределение полученных данных.

Гистограмма, или полигон распределения, представляет собой ломаную кривую, характеризующую фактическое распределение полученных данных. Она позволяет выявить лишь приближенную картину распределения всей (генеральной) совокупности. Чем больше выборочное изучение, тем в большей мере будут сглаживаться влияние случайных причин и явственнее будет проступать действительная закономерность распределения. В этом случае кривая распределения фактических данных будет приближаться к теоретической кривой распределения.

В математической статистике теоретическую кривую распределения обычно называют кривой Лапласа-Гаусса, или нормальным распределением.

Нормальное распределение в чистом виде при выборочных исследованиях в социальных науках встречается нечасто. Тем не менее большинство распределений близки к нормальному. Фактическое распределение выборочных показателей отличается от теоретического, главным образом, нарушением симметрии, т. е. если в нормальном распределении частоты анализируемого признака убывают по обе стороны от вершины кривой равномерно, то в фактическом распределении вершина кривой может быть смещена влево или вправо от теоретической средней, быть крутой с одной стороны и пологой -- с другой. Причина таких смещений -- ошибки наблюдения и сбора данных Герчук Я.П. Графики в математико-статистическом анали-зе. - М.: Статистика, 1992. - С.115.

Распределение показателей характеризуется размахом вариации и отклонением от средней.

Размах вариации (колебаний) -- наиболее простой параметр измерения разброса значений варьирующего признака. Он исчисляется по формуле R = Хтт -- Хт.п.

Но при одном и том же размахе вариации совокупности могут существенно различаться по структуре, т. е. быть более или менее однородными.

Наиболее полная характеристика распределения раскрывается через значение отклонения всех вариант от средней или значение отклонения эмпирических вариант от теоретических. Причем важно не столько отклонение каждой варианты от средней, сколько среднее отклонение всех вариант от средней, или дисперсия (колеблемость, пестрота) изучаемого признака.

Средние величины -- наиболее распространенные показатели в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Приведем пример, характерный для студенческой аудитории. Строгое сравнение по баллам успеваемости студентов двух или более учебных групп нельзя произвести по оценкам одного или нескольких студентов из каждой группы. Но, рассчитав средний балл по группам, можно точно сопоставить их по успеваемости.

Средняя величина может раскрыть лишь общую тенденцию изучаемого явления и только тогда, когда она выведена из большого числа фактов и при изучении однородной совокупности. При несоблюдении этих условий средние показатели лишь введут в заблуждение. Примером такого несоответствия может служить средняя заработная штата в нашей стране, когда в одну совокупность зачисляют и богатых, и бедных, разрыв в уровне обеспечения которых в 1997 г. составил соответственно 24:1.

В статистике разработано множество средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая и др.), мода и медиана. Каждая из средних выполняет свои аналитические функции. Для расчета дисперсии и других показателей выборочного наблюдения нам необходима лишь средняя арифметическая.

Средний арифметический показатель -- наиболее распространенный вид средних. Он используется в качестве центрального значения в рядах распределения и выполняет функцию теоретической вероятности. Все другие варианты расцениваются как случайные отклонения от него. Чем больше отклоняется какое-либо значение признака от среднего арифметического, тем более случайным оно является.

Средняя арифметическая лежит в основе расчета дисперсии (колеблемости), которая представляет собой не что иное, как значение отклонения всех вариант от средней. Значение дисперсии и предопределяет объем выборочной совокупности. Чем больше дисперсия, тем больше разброс показателей от средней, а следовательно, нужен больший объем выборки, чтобы она была достаточно репрезентативной. Репрезентативность (представительность) объема выборки практически не зависит от объема генеральной совокупности. Последняя может быть даже не известна исследователю. Предположим, что мы изучаем пьянство (как фактор преступности) в нашей стране. При выборочном изучении пьяниц мы не можем располагать их более или менее точным количеством в стране, республике и даже городе. Но это не будет служить большой помехой для расчета ошибки выборки или объема выборочной совокупности. При расчете этих показателей определяющей является значение дисперсии изучаемого признака, и ее надо уметь рассчитывать. Расчет дисперсии качественных и количественных признаков неодинаков. Определение объема и представительности выборочной совокупности, а следовательно, и дисперсии производится не к самим явлениям, а лишь к их конкретным показателям. Последние могут быть качественными, или атрибутивными и количественными. Каждый признак имеет свою дисперсию, а следовательно, и необходимый объем выборки для надежного изучения. Это значит, что при выборочном изучении многих признаков, чтобы выявить совокупные отклонения, дисперсию надо рассчитывать по каждому из них. Иногда эти признаки исчисляются десятками и даже сотнями. Чтобы избежать множества расчетов, можно ограничить их только в отношении тех признаков, на базе которых делаются основные выводы. Общая численность выборки или ее общая репрезентативность определяются по совокупной представительности всех параметров.

Дисперсия -- это средний квадрат отклонения изучаемого признака от теоретического (среднего) показателя. Она характеризует уровень однородности исследуемой совокупности и обозначается символом «02» (сигма малая в квадрате). Расчет ее применительно к качественным признакам производится по одной формуле, а применительно к количественным -- по другой. Рябушкин Т.В., Ефимова М.Р., Ипатова И.М., Яковлева Н.И. Общая теория статистики. - М.: Финансы и статистика, 2001. - С.123

Второй общепринятой мерой вариации признака является среднее квадратическое отклонение. Оно обозначается символом «0 » (сигма малая без квадрата) и выводится как самостоятельно, так и на основе среднего квадрата отклонений, т. е. дисперсии, которая обозначается «02» (сигма малая в квадрате). Среднее квадратическое отклонение всегда выражается в тех именованных числах, в которых выражены варианта и средняя.

Глава II. Определение ошибки выборки

При выборочном наблюдении регистрируется только часть единиц генеральной совокупности. Но эта часть по объему должна быть такова, чтобы получаемые сведения оказались репрезентативными, т. е. достаточно верно отражали содержание и закономерности изучаемого явления в целом. Под репрезентативностью понимается свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.

Разность между данными генеральной и выборочной совокупностей называют ошибкой репрезентативности, или ошибкой выборки.

Ошибки бывают тенденциозными, или систематическими, и случайными. Первые -- результат неправильного или преднамеренного отбора исследователем тех или иных показателей, вторые -- результат случайностей неполного отбора.

Тенденциозные ошибки возникают тогда, когда исследователь неправильно сформировал выборку, не знал научных правил отбора единиц совокупности, сознательно отобрал наиболее показательные единицы. Например, исследуя правосознание граждан, анкетер в целях экономии времени воспользовался аудиторией студентов-юристов и опросил их. Полученные данные, естественно, отражали правовые взгляды лишь этих респондентов и не соответствовали взглядам всех граждан. Выводы, сделанные на основе тенденциозных выборок, будут ошибочными. Они могут причинить вред делу.

Истории известны многие курьезы, связанные с пренебрежением правилами выборочного наблюдения. Один из них произошел в США в 1936 г. при прогнозировании исхода президентских выборов. Журнал «Литерари Дайджест», используя телефонные книги, опросил свыше 2 млн. человек. По итогам опроса президентом должен быть избран Ландон. Социологи Геллап и другие опросили только 4 тыс. жителей и пришли к однозначному выводу: победит Рузвельт. Их прогноз оправдался. В чем причина таких расхождений? Первая выборка отражала мнение лишь состоятельных консервативных слоев населения, которые имели телефоны, вторая -- всех слоев населения. Она оказалась более представительной, хотя была в 500 раз меньше первой. Роковую роль сыграли тенденциозные ошибки.

Научно-практическая задача выборочного наблюдения сводитса не только к тому, чтобы при малых затратах сил и средств максимально приблизить данные выборки к данным всей генеральной совокупности, но и к тому, чтобы точно измерить, в каких пределах результаты выборки отличаются от данных генеральной совокупности. Здесь и встает вопрос о характере ошибок.

Тенденциозные (систематические) ошибки нельзя измерить. Они могут быть самыми разными по величине и содержанию. Тенденциозные ошибки тем меньше, чем выше квалификация исследователя, чем лучше он знаком с объектом изучения и возможными источниками систематических ошибок.

Измерить можно лишь случайные ошибки, т. е. ошибки, обусловленные неполнотой изучения реально существующей совокупности. Случайные ошибки -- непреднамеренные неточности статистического наблюдения, которые могут быть направлены как в сторону преувеличения показателей признака, так и в сторону их преуменьшения. При относительно большом изучении случайные ошибки взаимопогашаются, в результате чего данные выборочной совокупности становятся близкими к данным генеральной. Оставшиеся различия можно относительно точно измерить на основе теории вероятностей, закона больших чисел и закономерностей распределения случайных величин.

Для того чтобы избежать тенденциозных ошибок, необходимо строго соблюдать правила случайного отбора единиц выборочной совокупности. Случайные ошибки в выборочном наблюдении объективны. Их нельзя избежать, но можно уменьшить путем увеличения объема выборки и точно вычислить.

Необходимость в точном расчете ошибки выборки возникает тогда, когда произведенное выборочное наблюдение надо оценить с точки зрения его репрезентативности и достоверности. Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки . В математической статистике доказывается, что значения средней ошибки выборки определяются по формуле:

02

= ------

n

На практике для определения средней ошибки выборки обычно используются дисперсии выборочной совокупности 2.

n

02 = 2 (------)

n - 1

Если n достаточно велико, то отношение n/n-1 близко к единице.

При замене генеральной дисперсии 02 дисперсией выборочной 2 формула расчета средней ошибки записывается так:

2

= ----

n

Следует иметь в виду, что эта формула применяется для определения средней ошибки выборки лишь при так называемом повторном отборе.

Поскольку при бесповторном отборе численность генеральной совокупности в ходе выборки сокращается, то в формулу для расчета средней выборки включают дополнительный множитель 1 - n/N. Формула средней ошибки выборки принимает следующий вид:

2 n

= ----- (1 - -----).

n N

Для практики выборочных обследований важно, что средняя ошибка выборки применяется для установления предела отклонений характеристик выборки из соответствующих показателей генеральной совокупности небезотносительно. Лишь с определенной степенью вероятности можно утверждать, что эти отклонения не превысят величины t , которая в статистике называется предельной ошибкой выборки Ефимова М.Р., Рябцев В.М. Общая теория статистики.- М.: Финансы и статистика, 2001.- С.176.

Предельная ошибка выборки связана со средней ошибкой выборки отношением: t При этом t как коэффициент кратности средней ошибки выборки зависит от вероятности, с которой гарантируется величина предельной ошибки выборки.

Если в формулу подставить конкретное содержание , то расчет предельной ошибки выборки при бесповторном отборе можно записать следующими алгоритмами:

а) доля альтернативного признака:

(1 - ) n

= t --------------------- (1 - --------)

n N

б) средняя величина количественного признака:

х2 n

х = t ------ (1 - ---------)

n N

При этом следует иметь в виду, что при сравнительно небольшом проценте единиц, взятых в выборку (до 5 %), множитель (1 - n/N) близок к единице. Поэтому на практике при расчете величины предельной ошибки выборки (при бесповторном отборе) множитель (1 - n/N) можно опустить, и расчет производится по формулам повторного отбора, т.е.:

(1 - )

= t ------------

n

2

х = t --------

n

Исходя из этих формул, ошибка репрезентативности прямо пропорциональна дисперсии или среднему квадратическо-му отклонению и обратно пропорциональна числу единиц выборки. Ошибка выборки будет тем меньше, чем меньше дисперсия (колеблемость признака) и чем больше численность выборки. Объем выборочной совокупности, как правило, всегда известен, если исследование уже произведено.

Эти формулы позволяют рассчитывать ошибку выборки на основе исходных показателей.

Дисперсия и ошибка выборки количественных признаков выражаются не в относительных числах (процентах, долях), как у качественных показателей, а в именованных числах, т. е. в годах, рублях, классах, часах и т. д. Они могут иметь самые разные содержательные и численные значения. Их нельзя рассчитать заранее безотносительно к конкретному признаку, и поэтому готовых таблиц ошибок выборки для количественных признаков нет. Все предшествующие формулы и расчеты ошибки репрезентативности имеют значение для повторной выборки. При ней каждая отобранная из генеральной совокупности единица вновь возвращается в массив. Поэтому не исключена возможность ее повторного отбора. Наряду с таким отбором есть отбор бесповторный. При нем каждая отобранная единица исключается из числа единиц генеральной совокупности, а поэтому может попасть в выборку лишь один раз. Анализ формул ошибки бесповторной выборки показывает, что дополнительный множитель (1-- n/N) не может быть больше единицы, следовательно, он лишь уменьшает величину ошибки выборки. В данном случае этот множитель составил 0,98 и уменьшил все подкоренное выражение на 0,00001, а ошибку выборки -- на 0,1%. В других случаях это уменьшение может быть большим. Таким образом, наличие данного множителя позволяет более точно вычислить ошибку бесповторной выборки, причем в сторону ее минимизации. Поэтому, если исследователю неизвестна численность генеральной совокупности, а он произвел бес-повторную выборку, то можно рассчитать ошибку репрезентативности по формуле повторной выборки. Незначительной неточностью, связанной с завышением расчетной ошибки, можно пренебречь, поскольку социально-правовые исследования не требуют особой точности.

Символ t именуют коэффициентом кратности ошибки репрезентативности, или коэффициентом доверия. Его увеличение повышает репрезентативность выборки, но не само по себе, а через увеличение выборочной совокупности. Если, например, при проведении криминологического или социально-правового изучения есть необходимость в том, чтобы ошибка репрезентативности не превышала ± 4,8%, как было в нашем примере, а коэффициент доверия был равен не 1, а 3, т. е. t-- 3, то численность выборочной совокупности придется увеличить в 6 раз, или до 600 единиц. При t=2 численность выборки должна быть увеличена в 4 раза, т. е. до 400 единиц. Дружинин Н.К. Математическая статистика в экономике. Введ. в мат.-стат. методологию. - М.: Статистика, 2002. - С.89

Выше говорилось, что если уменьшить ошибку выборки в 2 раза, то выборочную совокупность следует увеличить в 4 раза. Поставим задачу по-иному. Если нас удовлетворяет величина ошибки выборки, но необходимо повысить коэффициент доверия до 1=2, чтобы в 954 случаях из 1000 величина единиц изучения не отклонялась от заданной ошибки, также надо увеличить объем выборочной совокупности в 4 раза. Ошибка сохраняется та же, а коэффициент доверия повышается. При криминологических, социально-правовых исследованиях и при изучении в практических оперативных целях может быть допустима точность с коэффициентом доверия 1. При решении важных научных или практических вопросов желательно, чтобы ошибка репрезентативности принималась с коэффициентом доверия t = 2. Изучение с коэффициентом доверия / = 3 в юридической статистике практически нигде не требуется.

Коэффициент доверия, равный 2, означающий, что в 954 случаях из 1000 единицы изучения не будут выходить за пределы заданной ошибки репрезентативности, практически надежен. Поэтому таблицы предельных ошибок рассчитаны применительно к нему Елисеева И.И., Юзбашев М.М. Общая теория статистики. - М.: Финансы и статистика, 2003. - С.172.

Заключение

выборочный наблюдение дисперсия

Изложим краткие выводы по работе.

Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной ее части. Одним из наиболее распространенных в статистике методов, применяющим несплошное наблюдение, является выборочный метод,

Под выборочным понимается метод статистического исследования, при котором обобщающе показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно до 5-10%, реже до 15-25%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью, или просто выборкой.

В основе отбора единиц для обследования положены принципы равных возможностей попадания в выборку каждой единицы генеральной совокупности. Именно в результате соблюдения этих принципов исключается образование выборочной совокупности только за счет лучших или худших образцов. Это предупреждает появление систематических (тенденциозных) ошибок и делает возможным производить количественную оценку ошибки представительства (репрезентативности).

Проведение исследования социально-экономических явлений выборочным методом складывается из ряда последовательных этапов:

1) обоснование (в соответствии с задачами исследования) целесообразности применения выборочного метода;

2) составление программы проведения статистического- исследования выборочным методом;

3) решение организационных вопросов сбора и обработки исходной информации;

4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности,

5) обоснование способов формирования выборочной совокупности;

6) осуществление отбора единиц из генеральной совокупности для их обследования;

7) фиксация в отобранных единицах (пробах) изучаемых признаков;

8) статистическая обработка полученной в Выборке информации с определением обобщающих характеристик изучаемых признаков;

9) определение количественной оценки ошибки выборки;

10) распространение обобщающих выборочных характеристик, на генеральную совокупность.

В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей, а средняя величина изучаемого варьирующего признака - генеральной средней.

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью, а среднюю величину в выборке - выборочной средней.

Список использованной литературы

1. Виноградова Н.М., Евдокимов В.Т., Хитарова Е.М., Яковлева Н.И. Общая теория статистики. - М.: Статистика, 1998. - 312 с.

2. Герчук Я.П. Графики в математико-статистическом анализе. - М.: Статистика, 1992. - 235 с.

3. Дружинин Н.К. Математическая статистика в экономике. Введ. в мат.-стат. методологию. - М.: Статистика, 2002. - 312 с.

4. Елисеева И.И., Юзбашев М.М. Общая теория статистики. - М.: Финансы и статистика, 2003. - 400 с.

5. Ефимова М.Р., Рябцев В.М. Общая теория статистики.- М.: Финансы и статистика, 2001.- 272 с.

6. Лунеев В.В. Юридическая статистика. М.: Юристъ, 1999. -400с

7. Рябушкин Т.В., Ефимова М.Р., Ипатова И.М., Яковлева Н.И. Общая теория статистики. - М.: Финансы и статистика, 2001. - 464 с.

8. Статистический анализ в экономике /Под ред. Г.Л. Громыко. - М.: Изд-во МГУ, 2002. - 434 с.

9. Статистическое моделирование и прогнозирование /Под ред. А.Г. Гранберга. - М.: Финансы и статистика, 2000. - 280 с.

Приложение

Вариант 2

Задача 1

За отчетный период имеются следующие данные о розничном товарообороте и издержках обращения по магазинам:

Магазин

№ п./п.

Объем розничного товарооборота, млн. руб.

Издержки обращения,

млн. руб.

1

20,1

1,62

2

59,1

3,74

3

82,5

4,66

4

47,1

3,90

5

24,5

1,51

6

39,0

2,70

7

51,1

3,09

8

40,6

2,96

9

64,2

4,47

10

42,5

3,72

11

56,9

3,85

12

47,2

2,86

13

28,0

1,84

14

66,6

3,91

15

73,6

3,78

16

56,2

3,66

17

33,8

2,67

18

56,1

2,91

19

69,5

4,00

20

59,0

3,67

Проведите аналитическую группировку. По каждой группе подсчитайте:

1) число магазинов;

2) средний размер розничного товарооборота;

3) сумму издержек обращения всего и в среднем на 1 магазин.

Сделайте краткие выводы.

Максимальное значение 82,5, минимальное - 20,1. Делим на три группы 18-40, 40-62, 62-84

Объем розничного товарооборота, млн. руб.

Издержки обращения,

млн. руб.

20,1

1,62

24,5

1,51

28

1,84

33,8

2,67

39

2,7

40,6

2,96

42,5

3,72

47,1

3,9

47,2

2,86

51,1

3,09

56,1

2,91

56,2

3,66

56,9

3,85

59

3,67

59,1

3,74

64,2

4,47

66,6

3,91

69,5

4

73,6

3,78

82,5

4,66

Группа

Число магазинов

Средний размер розничного товарооборота млн. руб.

Издержки обращения млн. руб.

Итого

В среднем

18-40

5

29,08

10,34

2,068

40-62

10

51,58

34,36

3,346

62-84

5

71,28

20,82

4,164

Вывод: средняя величина издержек обращения прямо пропорциональна величине товарооборота

Задача 2

Вычислить средние по нижеследующим признакам: К - количество студентов в институте; С - процент студентов, не получающих стипендии; Р - средний размер стипендии одного студента - стипендиата (руб.); Ч -среднее число студентов в группе.

Институты

К

С

Р

Ч

I

1000

20

200

25

II

1200

10

215

30

III

1250

15

241

27

Определим средние значения

К = (1000+1200+1250):3=1150

С=(20+15+10):3=15

Р=(200+215+241):3=218,67

Ч=(25+30+27):3=27

Задача 3

Для изучения оснащения заводов основными производственными фондами было проведено 10%-е выборочное обследование, в результате которого получены следующие данные о распределении заводов по стоимости основных производственных фондов:

Среднегодовая стоимость основных производственных фондов, млн. руб.

До 4

4-8

8-12

Свыше 12

Итого

Число заводов

6

13

21

10

50

Определите:

1) среднюю стоимость основных производственных фондов, моду, медиану;

2) дисперсию, среднее квадратичное отклонение;

3) коэффициент вариации;

4) с вероятностью 0.997 границы, в которых будет находиться среднегодовая стоимость основных производственных фондов всех заводов генеральной совокупности;

5) с вероятностью 0.954 границы, в которых будет находиться удельный вес заводов со стоимостью основных фондов свыше 8 млн. руб.

Интервал

Среднее

Количество

Частота

Сумма частот

До 4

2

6

0,12

0,12

4-8

6

13

0,26

0,38

8-12

10

21

0,42

0,8

12и выше

14

10

0,2

1

Итого

50

1

Средняя величина 2х0,12+6х0,26+10х0,42+14х0,2=8,8 млн. руб.

Модальный интервал 8-12. Он же медианный интервал, так как на нём сумма накопленных частот превышает 0,5. Медиана равна:

Медиана вычисляется по специальной формуле:

где:

x0 - нижняя граница медианного интервала;

i - величина медианного интервала;

SMe-1 - накопленная частота (частность) интервала, предшествующего медианному интервалу;

fMe - частота (частность) медианного интервала.

Ме=8 + 4 х (0,5 х 0,8 - 0,38) : 0,42 = 8,2 млн.руб.

Дисперсия и среднеквадратичное отклонение

Значение

Отклонение от среднего

Квадрат отклонения

Частота

Произведение

2

-6,8

46,24

0,12

5,5488

6

-4,8

23,04

0,26

5,9904

10

1,2

1,44

0,42

0,6048

14

6,2

38,44

0,2

7,688

Итого

1

19,832

По таблице дисперсия равна 19,832, среднеквадратичное отклонение (квадратный корень из дисперсии) - 4,45

Коэффициент вариации случайной величины -- мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет ее средний разброс. Равен отношению стандартного отклонения к математическому ожиданию.

В нашем случае Cv = 4,45 : 8,8 = 0,506

Предельная ошибка выборки X = 4,45 : (50)0,5 = 0,63

Для определения с вероятностью 0,997 предельную ошибку выборочной средней и границы, берём кратность 3

3 х 0,63 = 1,89

Это соответствует значениям интервала

8,8 - 1,89=6,91 и 8,8+1,89= 10,49

Для определения с вероятностью 0,954 возможные пределы удельного веса принимаем кратность 2. Доля по условию 0,62(31 завод), что соответствует

31 - 0,506 х 2 = 30,49 или доля равна 0,61

31 + 0,506 х 2 = 32,01 или доля равна 0,64

Задача 4

Имеются данные о продаже молока и молочных продуктов на душу населения по области за январь-сентябрь 2007 г. (л.):

Январь

Февраль

Март

Апрель

Май

Июнь

Июль

Август

Сентябрь

10,0

10,7

12,0

10,3

12,9

16,3

15,6

17,6

18,0

Требуется выяснить основную тенденцию продажи молока и молочных продуктов на душу населения за январь-сентябрь 2007 г.:

1) методом сглаживания рядов динамики с помощью скользящей средней;

2) методом аналитического выравнивания ряда динамики по уравнению прямой;

3) используя результаты п.2, дайте прогноз на октябрь;

4) охарактеризуйте среднегодовой абсолютный прирост и темп прироста, за период с январь по сентябрь.

Скользящая средняя равна

(10,0+10,7+12,0+10,3+12,9+16,3+15,6+17,6+18,0):9=13,7

Для выравнивания по прямой составим таблицу:

Х

1

2

3

4

5

6

7

8

9

45

У

10,0

10,7

12,0

10,3

12,9

16,3

15,6

17,6

18,0

123,4

Х2

1

4

9

16

25

36

49

64

81

285

ХУ

10

21,4

36

41,2

64,5

97,8

109,2

140,8

162

682,9

Исходя из этого, уравнение прямой имеет вид У=аХ+в, где

В = (123,4х285 - 682,9х45) : (9х285 - 452) = 8,22

А = (9х682,9 - 45 х 123,4) : (9х285 - 452) = 1,1

У (10) = 1,1х10+8,22 = 19,2

Задача 5

Имеются следующие данные о продаже на колхозном рынке города:

Наименование товара

Единица измерения

Базисный период

Отчетный период

количество

Средняя цена за единицу, руб.

количество

Средняя цена за единицу, руб.

Сметана

кг

90

40

85

45

Творог

кг

100

50

95

60

По приведенным данным вычислите:

1. индивидуальные индексы цен и физического объема продажи товаров;

2. общий индекс цен;

3. общий индекс товарооборота в фактических и неизменных ценах;

4. показать взаимосвязь между исчисленными индексами;

5. общую сумму экономии или перерасхода, которую имело население от изменения цен.

Индексы цен:

Ис=45:40=1,125

Ит=60:50=1,2

Индекс физического объёма:

Исо=85:90=0,945

Ито=95:100=0,95

Общий индекс товарооборота в фактических и неизменных ценах:

Итф=(85 х 45 + 95 х 60) : (90 х40 + 100 х 50) = 1,108

Итн=(85 х 40 + 95 х 50) : (90 х40 + 100 х 50) = 0,948

Связь индексов Итф = Итн х Иц

Поэтому индекс цен равен:

Иц=(85 х 45 + 95 х 60) : (85 х 40 + 95 х 50) = 1,169

Рост цен составил 16,9%

Общая сумма перерасхода

(85 х 45 + 95 х 60) - (90 х40 + 100 х 50) = 975 тыс. руб.

Задача 6

Имеются данные о работе универмага:

Виды товаров

Продано товаров, млн. руб.

Изменение количества проданных товаров в отчетном периоде по сравнению с базисным, %

прошлый период

отчетный период

Ткани

4,0

4,25

-15

Трикотажные изделия

4,5

4,7

+10

Обувь

5,0

5,5

-35

Вычислите:

1. Сводный индекс товарооборота.

2. Сводный индекс физического объема товарооборота.

3. Сводный индекс цен.

4. Абсолютную сумму прироста товарооборота в результате изменения:

а) количества проданных товаров;

б) цен.

Индексы по исходным данным по товарообороту: ткани 1,15, трикотаж 1,1, обувь 0,65

Индекс товарооборота в фактических ценах

Ит=(4,25+4,7+5,5) : (4,0+4,5+5,0) = 1,07

Индекс товарооборота в связи с изменением объёма реализации

Ито =(4,25:1,15+4,7:1,1+5,5:0,65) : (4,0+4,5+5,0) = 1,217

Индекс цен Иц = Ит : Ито = 0,879

Изменение товарооборота

(4,25+4,7+5,5) - (4,0+4,5+5,0) = 0,95 млн. руб.

За счёт объёма

(4,25:1,15+4,7:1,1+5,5:0,65) -(4,0+4,5+5,0) = 2,93

За счёт изменения цен 0,95 - 2,93 = 1,98 млн. руб.

Задача 7

Имеются данные об урожайности зерновых по районам области:

Районы

Урожайность в центнерах с 1 га

Посевная площадь, га

базисный год

отчетный год

базисный год

отчетный год

1

20

24

2200

2400

2

18

17

3000

2500

3

16

20

4500

5000

Определите:

1) индекс средней урожайности;

2) среднее изменение урожайности в целом по трем районам;

3) индекс структурных сдвигов.

Сделайте выводы.

Средняя урожайность в базисном году

(2200 х 20 + 3000 х 18 + 4500 х 16) : (2200 + 3000 + 4500) = 17,53 ц/га

То же в отчётном году:

(2400 х 24 + 2500 х 17 + 5000 х 20) : (2400 + 2500 + 5000) = 20,21 ц/га

Индекс урожайности:

(2400 х 24 + 2500 х 17 + 5000 х 20) : (2200 х 20 + 3000 х 18 + 4500 х 16) =1,177

Индекс структурных сдвигов:

(2200 х 24 + 3000 х 17 + 4500 х 20) : (2200 х 20 + 3000 х 18 + 4500 х 16) = 1,032

Урожайность возросла на 17,7 %, при этом только на 3,2 % за счёт интенсивного фактора, в остальном - за счёт увеличения посевной площади.

Задача 8

По исходным данным задачи 1 требуется:

1) определить коэффициент детерминации и эмпирическое корреляционное отношение по результатам проведенной в задаче 1 аналитической группировки;

2) по данным первых 10 магазинов, определить линейный коэффициент корреляции.

Сделайте выводы

Группа

Число магазинов

Средний размер розничного товарооборота млн. руб.

Издержки обращения млн. руб. (в среднем)

Откл.

Квадрат откл.

18-40

5

29,08

2,068

-1,199

1,438

40-62

10

51,58

3,346

0,079

0,006

62-84

5

71,28

4,164

0,897

0,805

Средняя величина издержек обращения 3,267 по выборке. Сумма квадратов отклонений 2,248

Детерминация слабая : R=(2,248)0,5: 3,267 = 0,46

Составим другую таблицу (в последней строке суммы)

Х

Y

X2

XY

Y 2

20,1

1,62

404,01

32,562

2,6244

59,1

3,74

3492,81

221,034

13,9876

82,5

4,66

6806,25

384,45

21,7156

47,1

3,90

2218,41

183,69

15,21

24,5

1,51

600,25

36,995

2,2801

39,0

2,70

1521

105,3

7,29

51,1

3,09

2611,21

157,899

9,5481

40,6

2,96

1648,36

120,176

8,7616

64,2

4,47

4121,64

286,974

19,9809

42,5

3,72

1806,25

158,1

13,8384

470,7

32,37

25230,19

1687,18

115,2367

Для метрических величин применяется коэффициент корреляции Пирсона,:

Пусть X,Y -- две случайные величины, определённые на одном вероятностном пространстве. Тогда их коэффициент корреляции задаётся формулой:

,

где cov обозначает ковариацию, а D -- дисперсию, или, что то же самое,

,

где символ обозначает математическое ожидание.

В нашем случае:

Rxy= (1687,18-470,7х32,37:10):((25230,19-470,72 : 10)х(115,2367-32,372:10))0,5 = 0,83

Теснота связи хорошая, но далеко от 1

Размещено на Allbest.ru


Подобные документы

  • Метод группировок в статистике. Понятие об интервале, их выбор по количественным и атрибутивным признакам. Понятие о структурных средних. Мода и медиана. Распределение населения по уровню среднедушевого месячного дохода. Ошибки выборочного наблюдения.

    контрольная работа [281,9 K], добавлен 22.06.2013

  • Средние величины как обобщающие показатели, выражающие типичные для определенного места и времени размеры и количественные соотношения явлений общественной жизни. Знакомство с основными способами определения дисперсии в статистике, анализ этапов.

    дипломная работа [1,2 M], добавлен 11.12.2013

  • Классификация взаимосвязи явлений, различаемых в статистике, их разновидности и характеристика, отличительные признаки. Сущность коэффициента парной корреляции, его особенности и методика оценки достоверности, применение доверительных интервалов.

    реферат [1,3 M], добавлен 30.04.2009

  • Среднее значение показателя (среднее арифметическое). Показатели вариации - размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации. Максимальное и минимальное значение статистического показателя.

    контрольная работа [159,7 K], добавлен 14.11.2008

  • Сущность выборочного исследования. Способы отбора единиц в выборочную совокупность. Средняя и предельная ошибка для показателей средней величины и показателей доли. Определение необходимого объема выборки при заданной предельной ошибке среднего значения.

    презентация [108,7 K], добавлен 16.03.2014

  • Табличный метод представления данных правовой статистики. Абсолютные и обобщающие показатели. Относительные величины, их основные виды и применение. Среднее геометрическое, мода и медиана. Метод выборочного наблюдения. Классификация рядов динамики.

    контрольная работа [756,5 K], добавлен 29.03.2013

  • Исторические аспекты развития статистики, ее предмет. Понятие статистической методологии. Организация государственной и международной статистики. Программа и формы статистического наблюдения. Формы вариационного ряда. Средняя арифметическая и ее свойства.

    шпаргалка [37,9 K], добавлен 12.12.2010

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация [140,3 K], добавлен 01.11.2013

  • Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.

    контрольная работа [77,6 K], добавлен 20.07.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.