Формирование массива значений

Оценка однородности совокупности с помощью коэффициента вариации. Проверка на нормальность распределения с помощью правила "трёх сигм". Среднее квадратическое отклонение. Коэффициент осцилляции. Построение графического определения моды и медианы.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 11.05.2012
Размер файла 965,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Используя базу данных официального сайта www.gks.ru , сформировать массив значений признака Y согласно выбранному варианту по всем субъектам РФ за последний опубликованный год. Оценить однородность совокупности с помощью коэффициента вариации и произвести проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.

Построить ряд распределения по сформированному массиву значений признака Y, рассчитав число групп по формуле Стерджесса.

Для построенного ряда определить показатели центра распределения, показатели вариации, дифференциации, формы распределения. Дать графическое определение Моды и Медианы.

В соответствии с распределением субъектов РФ по федеральным округам (Центральный, Северо-Западный, Приволжский и т.д.,) построить аналитическую группировку (факторный признак - федеральный округ, результативный признак - Y). По результатам группировки выполнить анализ по следующим направлениям:

сравнить средние значения признака Y в отдельных федеральных округах со средним значением по РФ в целом;

сравнить федеральные округа друг с другом по степени однородности распределения исследуемого признака Y.

Сформулировать вывод о различиях в социально-экономическом положении регионов России по исследуемому признаку Y

Используя правило сложения дисперсий применительно к данным, полученным в п. 4, определить долю вариации признака Y, обусловленную территориальным фактором.

Измерить тесноту связи между факторами с помощью эмпирического корреляционного отношения.

По материалам сайта www.gks.ru составим таблицу исходных данных -- среднедушевые денежные доходы населения в месяц в 2010 г. (тыс. руб. в ценах 1995 г.) по субъектам Российской Федерации (Таблица 1).

Таблица 1.

Из таблицы исходных данных построим ранжированный ряд в порядке возрастания значений признака Y. При построении используем только показатели субъектов РФ без деления на федеральные округа и исключив, для удобства, строки “в том числе...” и строки без значений (Таблица 2).

Таблица 2.

Оценим однородность совокупности с помощью коэффициента вариации.

Расчет коэффициента вариации выполним по формуле:

вариация мода медиана распределение

V? = ?/?x,

? = v(yi -- ?x)2/n.

= 16184,04 тыс. руб.

Построим расчетную таблицу (Таблица 3):

Таблица 3.

Итак, ? = v38507705,56 = 6205,46

V? = 6205,46 / 16184,04 = 0,3834 или 38,34% - считается, что если значение V? превышает 33%, то совокупность по рассматриваемому признаку является неоднородной.

Произведем проверку на нормальность распределения с помощью правила «трёх сигм».

Для нормального закона выполняется правило «трёх сигм», по которому вариация индивидуальных значений признака находится в пределах от величины средней.

x = 16184,04 тыс. руб.

16184,04 -- 6205,46*3 = -2432,33 тыс. руб.

16184,04 -- 6205,46*3 = 34800,41 тыс. руб.

Т.е. в случае нормального распределения все значения У должны находиться в пределах от -2432,33 до 34800,41 тыс. руб. В нашем случае, среднедушевые денежные доходы населения в Чукотском автономном округе и в г. Москва выше верхней границы указанного промежутка.

Таким образом, имеющеюся совокупность данных характеризуется ненормальным распределением. Исключим для проведения более объективного дальнейшего исследования из массива данных вышеназванные субъекты.

Построим ряд распределения по сформированному массиву значений признака Y, рассчитав число групп по формуле Стерджесса:

k = 1+ 3,32lgn,

где

k -- число интервалов,

n -- объем совокупности.

k = 1+3,32lg77 = 7,26

Таким образом, построим 7 групп.

Длина одного интервала

L = (ymax -- ymin)/ k = (31077,9 -- 1196,1)/7 = 4268,83 тыс. руб.

Результаты расчетов представлены в Таблице 4.

Таблица 4.

Для построенного ряда определим показатели центра распределения, показатели вариации, дифференциации, формы распределения.

Для удобства дальнейших вычислений составим расчетную таблицу (Таблица 5).

Таблица 5.

Показатели центра распределения:

хср = ?ху/?y -- показатель средней взвешенной.

хср = 1199860,71 / 77 = 15582,61

Если два соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих значений, т.е.

М0 = (11868,17 + 16137,00) / 2 = 14002,59 тыс. руб. - наиболее часто встречающееся значение ряда.

Медиану вычислим по формуле:

Ме = х0 + h (?уi/2 - Sm-1) / ym ,

где

х0 -- нижняя граница интервала, содержащего медиану

h -- величина интервала,

?y -- число членов ряда,

Sm-1 -- сумма накопленных частот интервала, предшествующего медианному,

ym -- частота медианного интервала.

Ме = 14002,59 + 4268,83 (77/2 - 33) / 30 = 14785,20 тыс. руб. - 50% совокупности имеет значения у меньше 14785,20 тыс. руб., а половина -- больше.

Показатели вариации:

Размах вариации

R = уmax - уmin = 31077,9 -- 1196,1 = 29881,8 тыс. руб.

Среднее линейное отклонение

d = ?(x -- xср)y / ?y = 22509,29 / 77 = 292,33

Каждое значение ряда отличается от другого не более, чем на 292,33 тыс.руб.

Дисперсия

D = ?(x -- xср)2y / ?y = 248264207 / 77 = 3224210,48

Среднее квадратическое отклонение

? = vD = v3224210,48 = 1795,61

Каждое значение ряда отличается от среднего значения не более, чем на 1795,61 тыс. руб.

Коэффициент вариации

V? = 1795,61 / 15582,61 = 0,1152 или 11,52% - поскольку V?<30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Показатели дифференциации:

Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.

Q1= х0 + h (?уi/4 - Sm-1) / ym = 9733,76 + 4268,83 (77/4 - 3) / 30 = 12046,04 тыс. руб.

Таким образом, что 25% единиц совокупности будут меньше по величине 12046,04 тыс. руб.

Q2 совпадает с медианой, Q2 = 14785,20 тыс. руб.

Q3= 14002,59 + 4268,83 (77/4 - 33) / 30 = 15959,13 тыс. руб.

Остальные 25% превосходят 15959,13 тыс. руб.

Децили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9.

D1= х0 + h (?уi/10 - Sm-1) / ym = 9733,76 + 4268,83 (77/10 - 3) / 30 = 10402,54 тыс. руб.

Таким образом, что 10% единиц совокупности будут меньше по величине 10402,54 тыс. руб.

D9= х0 + h (9?уi/10 - Sm-1) / ym = 22540,24 + 4268,83 (9*77/10 - 68) / 5 = 23650,14 тыс. руб.

Остальные 10% превосходят 23650,14 тыс. руб.

Показатели формы распределения:

Коэффициент осцилляции

VR = R / xср = 29881,8 / 15582,61 = 1,9176 или 191,76%

Относительное линейное отклонение

Kd = d / xср = 292,33 / 15582,61 = 0,0188 или 1,88%

Относительный показатель квартильной вариации

Kq = q1 / q2 = 12046,04 / 14785,20 = 0,8147 или 81,47%

Степень асимметрии

Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

Вычислим коэффициент асимметрии Пирсона:

Ка = (хср -- М0) / ? = (15582,61 - 14002,59) / 1795,61 = 0,8799

-- что свидетельствует о наличии правосторонней асимметрии.

Показатель эксцесса (островершинности)

Ех = (?(х-хср)4у / ?y) / ?4 -- 3 = (34013089187360800/77)/ 1795,614 -- 3 = 39,49

-- имеем островершинное распределение, характеризующееся скоплением частот в середине.

Дадим графическое определение Моды и Медианы.

Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. В нашем случае имеем два таких прямоугольника с одинаковыми частотами. Нижняя общая вершина этих прямоугольников, лежащая на оси абсцисс и будет модой распределения (вернее значение абсциссы данной точки) (Рис. 1).

Рисунок 1.

Медиана рассчитывается по кумуляте (Рис. 2). Для её определения из точки на шкале накопленных частот (частностей), соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Рисунок 2.

Построим аналитическую группировку распределения субъектов РФ по федеральным округам по среднедушевому денежному доходу населения (Таблица 6), используя данные Таблицы 1.

Таблица 6.

Согласно таблице 6, четыре федеральных округа (Северо-Кавказский, Сибирский, Южный и Приволжский) имеют уровень среднедушевого денежного дохода населения ниже значения этого показателя по РФ в целом. Уровень среднедушевого денежного дохода населения в Северо-Западном, Дальневосточном, Уральском и Центральном федеральных округах превышает соответствующее значение по РФ в целом.

Причем, наивысшие среднедушевые денежные доходы населения в месяц зафиксированы в Центральном федеральном округе и составляют 24525,4 тыс. руб., а наименьшим показателем характеризуется Северо-Кавказский федеральный округ (13249,4 тыс. руб.).

Сравним федеральные округа друг с другом по степени однородности распределения исследуемого признака Y. Для этого рассчитаем коэффициент вариации.

Составим расчетную таблицу (Таблица 7):

Таблица 7.

Итак, ? = v14051503,617 = 3748,53

V? = 3768,53 / 18191,34 = 0,2061 или 20,61% - совокупность однородна.

Таблица 6 построена на основе информации из таблицы исходных данных (Таблица 1). Приведенные в данной таблице значения средних показателей У отличны от рассчитанных нами, т.к. вероятно в таблице исходных данных приведена не вся информация, используемая для расчетов данных показателей. Поэтому для корректности, дальнейшие расчеты проведем ориентируясь на таблицу 8.

Таблица 8.

Правило сложения дисперсий:

?2 = ?2 + ?ср2

?2 = (х2)ср - (хср)2

Вычислим дисперсию для каждой группы (используем данные из Таблицы 1):

1) уср1 = 12099,17 тыс. руб.

?12 = ?(у - уср)2 / n = 3577017,14

Таблица 9.

2) уср2 = 14158,72 тыс. руб.

?22 = 43872113,23

Таблица 10.

3) уср3 = 13281,52 тыс. руб.

?32 = 8238720,50

Таблица 11.

4) уср4 = 13574,13 тыс. руб.

?42 = 21826545,07

Таблица 12.

5) уср5 = 18000,82 тыс. руб.

?52 = 18225641,37

Таблица 13.

6) уср6 = 23902,38 тыс. руб.

?62 = 52541534,19

Таблица 14.

7) уср7 = 20123,18 тыс. руб.

?72 = 30252325,16

Таблица 15.

8) уср8 = 16149,47 тыс. руб.

?82 = 50575293,48

Таблица 16.

Внутригрупповые дисперсии показывают вариации среднедушевого дохода в каждой группе, вызванные всеми возможными факторами, кроме территориального.

Вычислим среднюю из внутригрупповых дисперсий:

?ср2 = ??2у/?у = (3577017,14*6 + 43872113,23*12 + 8238720,50*6 + 21826545,07*14 + 18225641,37*10 + 52541534,19*9 + 30252325,16*4 + 50575293,48*18)/79 = 26779840,76

Межгрупповая дисперсия

?2 = ?(усрi - уср)2у / ?у = ((12099,17 -16184,04)2*6 + (14158,72 - 16184,04)2*12 + (13281,52 - 16184,04)2*6 + (13574,13 - 16184,04)2*14 + (18000,82 - 16184,04)2*10 + (23902,38 - 16184,04)2*9 + (20123,18 - 16184,04 )2*4 + (16149,47 - 16184,04)2*18) /79 = 11727864,79

Межгрупповая дисперсия характеризует вариацию среднедушевого денежного дохода населения, вызванную различием групп по территориальным признакам.

Суммарное влияние всех возможных факторов на вариацию среднедушевого денежного дохода населения отражает общая дисперсия.

Общая дисперсия расчитана выше (Таблица 3):

?2 =38507705,56

Согласно правилу сложения дисперсий:

?2 = ?2 + ?ср2 = 11727864,79 + 26779840,76 = 38507705,56

Для определения доли вариации признака Y, обусловленную территориальным фактором, вычислим имперический коэффициент детерминации:

?2 = ?2 / ?2 = 11727864,79 / 38507705,56 = 0,3046 или 30,46%.

Эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативными признаками. Рассчитывается как корень квадратный из эмпирического коэффициента детерминации:

? = v?2 / ?2 = v 0,3046 = 0,5519 или 55,19% - связь заметная.

Список литературы

1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 2007 г.

2. Ефимова М.Е., Петрова Е.В., Румянцев В.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 2005 г.

3. Спирина А.А., Башина О.Э. Общая теория статистики. - М.: Финансы и статистика, 2009 г.

4. Шмойлова Р.А. Теория статистики: Учебник. - М.: Финансы и статистика, 2009 г.

5. Харченко Л.П., Долженкова В.Г., Ионин В.Г. Статистика: Учебное пособие. - М.: ИНФРА-М, 2007 г.

Размещено на Allbest.ru


Подобные документы

  • Показатели признака вариации в ряду. Среднее квадратическое отклонение, линейное отклонение, дисперсия, коэффициент вариации. Нижняя граница модального интервала и его величина. Медиана дискретного вариационного ряда. Определение моды и медианы.

    лабораторная работа [30,8 K], добавлен 21.12.2012

  • Технико-экономические показатели групп заводов; ряды распределения. Относительные величины интенсивности, цепные и базисные индексы товарооборота. Расчет средней величины, моды и медианы. Среднее квадратическое отклонение; дисперсия, коэффициент вариации.

    контрольная работа [88,8 K], добавлен 06.10.2013

  • Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.

    контрольная работа [354,6 K], добавлен 26.04.2010

  • Сравнительный анализ равномерности поставок товара в магазин "Детский мир", составление таблицы по результатам анализа, построение графического изображения. Среднее квадратическое отклонение и коэффициент вариации. Процент степени выполнения плана.

    контрольная работа [79,9 K], добавлен 20.01.2012

  • Распределение клиентов, воспользовавшихся услугами данной туристской фирмы в течение летнего сезона, по возрастному составу. Определение однородности представленного признака путем расчета коэффициента вариации. Расчет моды, медианы, линейного отклонения.

    контрольная работа [164,9 K], добавлен 31.03.2016

  • Сущность статистических индексов. Построение статистического ряда распределения магазинов по признаку цена товара. Среднее арифметическое и квадратическое отклонение, коэффициент вариации, медиана. Исследование динамики цен и товарооборота предприятия.

    курсовая работа [374,3 K], добавлен 18.12.2013

  • Преобразование эмпирического ряда в дискретный и интервальный. Определение средней величины по дискретному ряду с использованием ее свойств. Расчет по дискретному ряду моды, медианы, показателей вариации (дисперсия, отклонение, коэффициент осцилляции).

    контрольная работа [689,8 K], добавлен 17.04.2011

  • Предельная ошибка выборки при установлении среднего значения. Цепные и базисные темпы роста. Среднее квадратическое отклонение и коэффициент вариации. Частоты интервалов предшествующего и последующего модальному. Индекс себестоимости переменного состава.

    контрольная работа [93,8 K], добавлен 02.12.2010

  • Средняя фондоотдача на основании показателей о производственной деятельности. Средняя жилая площадь на члена домохозяйств: среднее линейное и квадратическое отклонение, коэффициент вариации. Межгрупповая и средняя из групповых дисперсий задержки вылетов.

    контрольная работа [70,9 K], добавлен 15.01.2011

  • Основные показатели, характеризующие рабочих фирмы. Аналитическая группировка для оценки связи уровня образования со стажем работы, уровнями выработки и заработной платы. Среднее квадратическое отклонение размера вклада в районном отделении Сбербанка.

    контрольная работа [113,2 K], добавлен 25.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.