Корреляционно-регрессионный анализ взаимосвязи производительности и оплаты труда

Понятие значения статистических методов исследования производственных показателей в условиях экономики. Сущность корреляционно-регрессионного анализа и его отличия от аналитической группировки. Оценка регрессии и коэффициента корреляции показателей.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 28.10.2013
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

КУРСОВАЯ РАБОТА

по дисциплине: Статистика

на тему: Корреляционно-регрессионный анализ взаимосвязи производительности и оплаты труда

Москва, 2013 год

Введение

В условиях рынка предприятие является главным объектом хозяйствования, независимым товаропроизводителем, экономическое пространство для которого практически неограниченно, но всецело зависит от умения работать безубыточно, адаптируясь к условиям изменяющейся экономической среды.

Производственные показатели характеризуют эффективность деятельности предприятия. Обеспечение качества систем управления требует широкого применения статистических методов. Актуальностью данной работы является то, что статистические методы, позволяют установить закономерности и причины изменений явлений и процессов, имеющих место на предприятии или в организации, являются мощным инструментом обоснования принимаемых решений и оценки их эффективности. Одним из таких методов является корреляционно-регрессионный анализ.

Цель данной работы ознакомится с понятием корреляционно-регрессионного анализа, рассмотреть понятия, характеризующие его, узнать где и как можно применять метод корреляционно- регрессионного анализа.

В теоретической части данной работы дана общая характеристика корреляционно-регрессионного анализа как объекта статистического изучения.

В расчетной части работы проведен анализ, позволяющий утверждать о существовании корреляционной связи между изучаемыми показателями.

1. Теоретическая часть

1.1 Корреляционно-регрессионный анализ как объект статистического изучения

Современная наука исходит из взаимосвязи всех явлений природы и общества. Объем продукции предприятия связан с численностью работников, мощностью двигателей, стоимостью производственных фондов и ещё многими признаками.

Невозможно управлять явлениями, предсказывать их развитие без изменения характера, силы и других особенностей связей, поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.

Различают два вида связи между различными явлениями и их признаками: функциональную и жестко детерминированную, с одной стороны, и статистическую или стохастически детерминированную - с другой. Строго определить различия этих типов связи можно тогда, когда они получают математическую формулировку.

Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т. е., значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменой, связь между ними является функциональной.

Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но её среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону - связь является статистической. Иными словами, при статистической связи разным значениям одной переменной соответствует разные распределения значений другой переменой.

В настоящее время наука не знает более широкого определения связи. Все связи, которые могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Последние представляют собой частный случай статистических связей, когда значения одной переменной соответствуют «распределения» значений второй, состоящие из одного или нескольких значений и имеющие вероятность, равную единице. Конечно, качественное различие действительно вероятных распределений и отдельных значений, имеющих вероятность единицы (достоверных), настолько велико, что хотя функциональные связи и подходят в широком смысле под определение статистической связи, все же с полным основанием можно говорить о двух типах связей.

Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака x закономерным образом изменяется среднее значение признака y.

В то время как в каждом отдельном случае значение признака y (с различными вероятностями) может принимать множество различных значений.

Если же с изменением значения признака x среднее значение признака y не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (показатели вариации, эксцесса и т. п.), то связь является не корреляционной, хотя и статистической.

Корреляционная связь между признаками может возникать разными путями. Важнейший путь - причинная зависимость результативного признака (его вариации) от вариации факторного признака.

Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины. Данную корреляцию нельзя интерпретировать как связь причины и следствия.

Третий путь возникновения корреляции - взаимосвязь признаков, каждый из которых и причина и следствие.

Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины.

Третий путь возникновения корреляции - взаимосвязь признаков, каждый из которых и причина, и следствие.

1.2 Система статистических показателей, характеризующих корреляционно-регрессионный анализ

В соответствии с сущностью корреляционной связи её изучение имеет две цели:

1. Измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);

2. Измерение тесноты связи двух (или большего числа) признаков между собой.

Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнение связи является метод наименьших квадратов, разработанный К.Ф. Гауссом. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной y от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) x.

Для изменения тесноты связи применяется несколько показателей. При парной связи теснота связи изменяется прежде всего корреляционным отношением, которое означается греческой группой з. Квадрат корреляционного отношения - это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий факторного признака групп, на среднею величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий.

Квадрат корреляционного отношения называется коэффициентом детерминации:

(1)

Где:

к - число групп по факторному признаку;

- число единиц совокупности;

- индивидуальные значения результативного признака;

- его средние групповые значения;

- его общее среднее значение;

- частота в j-й группе.

Формула (1) применяется при расчете показателя тесноты связи по аналитической группировке.

При вычислении корреляционного отношения по уровню связи (уравнению парной или множественной регрессии) применяется формула (2):

(2)

Где:

- индивидуальные значения y по уравнению связи.

Сумма квадратов в числителе - это объясненная связью с фактором x (факторами) дисперсия результативного признака y. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.

Если уравнение выбрано неверно или сделана ошибка при расчете его параметров, то сумма квадратов в числителе может оказаться большей, чем в знаменателе, и отношение утратит тот смысл, которое оно должно иметь, а именно каково доля общей вариации результативного признака, объясняемая на основе выбранного уравнения в связи с его факторным признаком (признаками). Чтобы избежать ошибочного результата, лучше вычислять корреляционное отношение по другой формуле (3), не столь наглядно выявляющей сущность показателя, но зато полностью гарантирующей от возможного искажения:

(3)

В числителе формулы (3) стоит сумма квадратов отклонений фактических значений признака от его индивидуальных расчетных значений, т. е., доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать равной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.

В основе перехода от формулы (2) к формуле (3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:

Dобщ = Dмежгр + Dвнутригр

Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:

При расчете не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как:

Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков).

Меры тесноты связи измеряют долю вариации результативного признака, которая связана с вариацией факторного признака (признаков).

Интерпретировать корреляционные показатели строго следует лишь в терминах вариации (различий в пространстве) отклонений от средней величины.

Если же задача исследования состоит в измерении связи не между вариацией двух признаков в совокупности, а между изменениями признаков объекта во времени, то метод корреляционно-регрессионного анализа требует значительного изменения.

Итак, строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.

1.3 Применение метода корреляционно-регрессионного анализа в статистике

Коренное отличие метода корреляционно-регрессионного анализа от аналитической группировки состоит в том, что корреляционно-регрессионный анализ позволяет разделить влияние комплекса факторных признаков, анализировать различные стороны сложной системы взаимосвязей.

Если метод комбинированной аналитической группировки, как правило, не дает возможность анализировать более 3 факторов, то корреляционный метод при объеме совокупности около ста единиц позволяет вести анализ системы с 8-10 факторами и разделить их влияние.

Развивающиеся на базе корреляционно-регрессионного анализа многомерные методы (метод главных компонентов, факторный анализ) позволяют синтезировать влияние признаков (первичных факторов), выделяя из них непосредственно не учитываемые глубинные факторы (компоненты). Например, изучая корреляцию ряда признаков интенсификации сельскохозяйственного производства, таких, как фондообеспеченность, затраты труда на единицу площади, энергетическая обеспеченность, внесение удобрений на единицу площади, плотность поголовья скота, можно синтезировать общую часть их влияния на уровень продукции с единицы площади или на производительность труда, получив обобщенный фактор «интенсификация производства», непосредственно не измеримый, не отражаемый единым показателем.

Правильное применение и интерпретация результатов корреляционно-регрессионного анализа возможны лишь при понимании всех специфических черт, достоинств и ограничений метода.

Необходимо сказать и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер.

1. Задача выделения важнейших факторов, влияющих на результативный признак (т. е., на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.

2. Задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства.

3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков.

4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач.

При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы. С одной стороны, их идеал - измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариации признаков. А тогда связь является функциональной, и корреляционные методы анализа излишни. В реальных системах связь всегда имеет статистический характер, и тогда идеал методов корреляции становится недостижимым. Но это не значит, что эти методы не нужны.

Данное противоречие означает простоту недостижимость абсолютной истины в познании реальны связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности.

Всякая научная истина - относительна. Забывать об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.

2. Расчетная часть

Имеются следующие выборочные данные за отчётный период по предприятиям одного из регионов

Таблица 1. - Выборка 2%-ная, механическая, бесповторная:

№ предприятия п/п

Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год

Средняя годовая заработная плата в расчете на 1 работника, тыс. руб.

№ предприятия п/п

Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год

Средняя годовая заработная плата в расчете на 1 работника, тыс. руб.

1

1392

348

16

1788

447

2

1960

490

17

2100

525

3

800

200

18

1828

457

4

956

239

19

1468

367

5

1488

372

20

1688

422

6

1496

374

21

1180

295

7

1580

395

22

1840

460

8

1560

390

23

1768

442

9

2400

600

24

1672

418

10

2368

592

25

1320

330

11

2352

588

26

1568

392

12

2112

528

27

1900

475

13

1540

385

28

1736

434

14

1852

463

29

1648

412

15

1640

410

30

1160

290

2.1 Уровень производительности труда в расчете на 1 работника

Признак - уровень производительности труда в расчете на 1 работника.

1) Построение интервального ряда распределения предприятий по признаку производительности труда на 1 работника. Вычислим величину и границы интервалов ряда. Величина интервала h определяется по формуле:

Где:

xmax, xmin - наибольшее и наименьшее значения признака в исследуемой совокупности;

k - число групп интервального ряда.

Где:

n - число единиц совокупности.

k = 5.

xmax = 2400 тыс. руб./чел. в год;

xmin = 800 тыс. руб./чел. в год;

.

Составим табличное выражение.

Таблица 2. - Границы интервалов ряда распределения:

Нижняя граница

Верхняя граница

1

800

1120

2

1120

1440

3

1440

1760

4

1760

2080

5

2080

2400

Процесс группировки единиц совокупности по признаку - уровень производительности труда в расчете на 1 работника представлен во вспомогательной (разработочной) таблице 3.

На основе групповых итоговых строк «Всего» таблицы 3 формируется итоговая таблица 4, представляющая интервальный ряд распределения предприятий по уровню производительности труда в расчете на 1 работника.

Таблица 3. - Разработочная таблица для построения интервального ряда распределения и аналитической группировки:
Распределение предприятий по уровню производительности труда в расчете на 1 работника.

Таблица 4:

Рис. 1:
Частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаем путем последовательного суммирования частот всех предшествующих (j-1) интервалов. Накопленные части, рассчитываемые по формуле:
Структура предприятий по уровню производительности труда в расчете на 1 работника.

Таблица 5:

Рис. 2:
Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по уровню производительности труда не является равномерным:
- преобладают предприятия с уровнем производительности труда от 1440 тыс. руб. до 1760 тыс. руб. (это 12 предприятий, доля которых составляет 40%);
- 20% предприятий имеют уровень производительности труда менее 1440 тыс. руб.;
- 60% - менее 1760 тыс. руб.

2.2 Связь между признаками

Связь между признаками - уровень производительности труда и среднегодовая заработная плата.

Установим наличие и характер связи между уровнем производительности труда и среднегодовой заработной платой методом аналитической группировки. Аналитическая группировка показывает взаимосвязь между двумя признаками, один из которых будет рассматриваться как факторный, а другой как результативный. По условию Задания 2 факторным является признак уровень производительности труда (X), результативным - Среднегодовая заработная плата (Y).Построим вспомогательную таблицу:

Таблица 6. - Зависимость уровня производительности труда от размера среднегодовой заработной платы:

Анализ данных табл. 6 показывает, что с увеличением уровня производительности труда от группы к группе систематически возрастает и среднегодовая заработная плата по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения. Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели - эмпирический коэффициент детерминации n2 и эмпирическое корреляционное отношение n.

Эмпирический коэффициент детерминации n2 оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель n2 рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле:

Где:

- общая дисперсия признака Y;

- межгрупповая (факторная) дисперсия признака Y.

Значения показателя n2 изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство n2 = 0, а при наличии функциональной связи между ними - равенство n2 = 1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле:

Где:

yi - индивидуальные значения результативного признака;

- общая средняя значений результативного признака;

n - число единиц совокупности.

Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:

Или как средняя взвешенная по частоте групп интервального ряда:

Для вычисления удобно использовать формулу, т. к., в табл. 6 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет по формуле:

Для расчета общей дисперсии применяется вспомогательная таблица.

Таблица 7. - Вспомогательная таблица для расчета общей дисперсии:

Номер предприятия п/п

Среднегодовая заработная плата

1

2

3

4

5

1

348

-70

4900

121104

2

490

72

5184

240100

3

200

-218

47524

40000

4

239

-179

32041

57121

5

372

-46

2116

138384

6

374

-44

1936

139876

7

395

-23

529

156025

8

390

-28

784

152100

9

600

182

33124

360000

10

592

174

30276

350464

11

588

170

28900

345744

12

528

110

12100

278784

13

385

-33

1089

148225

14

463

45

2025

214369

15

410

-8

64

168100

16

447

29

841

199809

17

525

107

11449

275625

18

457

39

1521

208849

19

367

-51

2601

134689

20

422

4

16

178084

21

295

-123

15129

87025

22

460

42

1764

211600

23

442

24

576

195364

24

418

0

0

174724

25

330

-88

7744

108900

26

392

-26

676

153664

27

475

57

3249

225625

28

434

16

256

188356

29

412

-6

36

169744

30

290

-128

16384

84100

Итого

12540

264834

5506554

Расчет общей дисперсии по формуле:

Общая дисперсия может быть также рассчитана по формуле:

Где:

- средняя из квадратов значений результативного признака;

- квадрат средней величины значений результативного признака.

Для демонстрационного примера:

Тогда:

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле:

Где:

-групповые средние;

- общая средняя;

- число единиц в j-ой группе;

k - число групп.

Для расчета межгрупповой дисперсии строится вспомогательная таблица 8. При этом используются групповые средние значения из табл. 6 (графа 5).

Таблица 8. - Вспомогательная таблица для расчета межгрупповой дисперсии:

Группы предприятий по уровню производительности труда в расчете на 1 работника, тыс. руб./чел. в год

Число предприятий,

Среднее значение в группе

1

2

3

4

5

800-1120

2

219,5

-198,5

78804,5

1120-1440

4

317,25

-100,75

40602,25

1440-1760

12

397,58

-20,42

5003,717

1760-2080

7

462

44

13552

2080-2400

5

566,6

148,6

110409,8

Итого

30

248372,3

Расчет межгрупповой дисперсии по формуле:

Расчет эмпирического коэффициента детерминации по формуле:

Изменение уровня производительности труда:

- 93,7%, обусловлено изменением среднегодовой заработной платы;

- 6,3% - влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение .

Оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле:

Значение показателя изменяются в пределах .

Чем ближе значение n к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе n служит шкала Чэддока:

Рис. 3:

Расчет эмпирического корреляционного отношения n по формуле:

Согласно шкале Чэддока связь между производительностью труда и среднегодовой заработной платы является весьма тесной.

Оценка статистической значимости коэффициента детерминации n2.

Показатели n и n2 рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи n, n2 несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка. Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации n2 служит дисперсионный F-критерий Фишера, который рассчитывается по формуле:

Где:

n - число единиц выборочной совокупности;

m - количество групп;

- межгрупповая дисперсия;

- дисперсия j-ой группы (j=1,2,…,m);

- средняя арифметическая групповых дисперсий.

Величина рассчитывается, исходя из правила сложения дисперсий:

Где:

- общая дисперсия.

Для проверки значимости показателя n2 рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m:

k1 = m - 1

k2 = n - m

Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если Fрасч=Fтабл, коэффициент детерминации n2 признается статистически значимым, т. е., практически невероятно, что найденная оценка n2 обусловлена только стечением случайных обстоятельств.

В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если Fрасч=Fтабл, то показатель n2 считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений:

= 0,05;

k1 = 3, 4, 5;

k2 = 24-35 представлен ниже.

Таблица 9:

k2

k1

24

25

26

27

28

29

30

31

32

33

34

35

3

3,01

2,99

2,98

2,96

2,95

2,93

2,92

2,91

2,90

2,89

2,88

2,87

4

2,78

2,76

2,74

2,73

2,71

2,70

2,69

2,68

2,67

2,66

2,65

2,64

5

2,62

2,60

2,59

2,57

2,56

2,55

2,53

2,52

2,51

2,50

2,49

2,48

Расчет дисперсионного F-критерия Фишера для оценки:

n2 = 93,7%.

Полученной при:

= 8827,8;

= 8279,0766.

Таблица 10. - Табличное значение F-критерия при = 0,05:

n

m

k1=m-1

k2=n-m

Fтабл (,5, 60)

30

5

4

25

2,60

Поскольку Fрасч=Fтабл, то величина коэффициента детерминации n2 = 93,7% признается значимой (неслучайной) с уровнем надежности 94,3% и, следовательно, найденные характеристики связи между признаками производительностью труда и среднегодовой заработной платы правомерны не только для выборки, но и для всей генеральной совокупности банков.

2.3 Ошибки выборки среднего уровня производительности труда и выборки доли предприятий с уровнем производительности труда

По результатам выполнения пункта 2.2 с вероятностью 0.954 определите:

1. Ошибку выборки среднего уровня производительности труда и границы, в которых будет находиться средняя производительность труда для генеральной совокупности предприятий;

2. Ошибку выборки доли предприятий с уровнем производительности труда 1760,0 и более тыс. руб. и границы, в которых будет находиться генеральная доля.

Определить ошибку выборки среднего уровня производительности труда и границы, в которых будет находиться средняя производительность труда для генеральной совокупности предприятий. Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле:

Где:

- общая дисперсия выборочных значений признаков;

N - число единиц в генеральной совокупности;

n - число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

,

Где:

- выборочная средняя;

- генеральная средняя.

Границы задают доверительный интервал генеральной средней, т. е., случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней.

Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.

В экономических исследованиях чаще всего используются доверительные вероятности:

Р = 0.954;

Р = 0.997;

Р = 0,683.

В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t.

Называемым также коэффициентом доверия.

Этот коэффициент зависит от значения доверительной вероятности Р.

Для предельной ошибки выборочной средней это теоретическое положение выражается формулой:

Значения t вычислены заранее для различных доверительных вероятностей Р и табулированы (таблицы функции Лапласа). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл.):

Таблица 11:

Доверительная вероятность P

0,683

0,866

0,954

0,988

0,997

0,999

Значение t

1,0

1,5

2,0

2,5

3,0

3,5

По условию выборочная совокупность насчитывает 30 предприятий, выборка 2% механическая, генеральная совокупность включает 150 банков. Значения параметров, необходимых для решения задачи, представлены в табл. 12:

Таблица 12:

Р

t

N

N

0,954

2

30

150

418

8827,8

Расчет средней ошибки выборки:

Расчет предельной ошибки выборки по формуле:

Определение по формуле:

Доверительного интервала для генеральной средней:

На основании проведенного выборочного обследования предприятий региона с вероятностью 0,954.

Можно утверждать:

Для генеральной совокупности предприятий средний уровень производительности труда находится в пределах от 390,554 тыс. руб. до 445,446 тыс. руб.

Определить ошибку выборки доли предприятий с уровнем производительности труда 1760,0 и более тыс. руб. и границы, в которых будет находиться генеральная доля.

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой:

Где:

m - число единиц совокупности, обладающих заданным свойством;

n - общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле:

Где:

w - доля единиц совокупности, обладающих заданным свойством;

(1-w) - доля единиц совокупности, не обладающих заданным свойством;

N - число единиц в генеральной совокупности;

n - число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством:

По условию исследуемым свойством является равенство или превышение уровня производительности труда 1760,0 и более тыс. руб.

Число предприятий с заданным свойством определяется из табл. 3 (графа 3): m = 11.

Расчет выборочной доли по формуле:

Расчет по формуле:

Предельной ошибки выборки для доли:

Определение по формуле:

Доверительного интервала генеральной доли:

Или:

С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий доля предприятий с уровнем производительности труда 1760,0 тыс. руб. и выше будет находиться в пределах от 21% до 52,4%.

2.4 Расчет парной регрессии и коэффициент корреляции

По результатам выполнения задания №2 требуется:

Построить линейное уравнение парной регрессии, отражающее взаимосвязь между уровнем производительности труда и среднегодовой заработной платой работников предприятий. Дать экономическую интерпретацию коэффициента регрессии построенного уравнения.

Определить линейный коэффициент корреляции для построенной модели связи и сделать выводы.

Построить линейное уравнение парной регрессии, отражающее взаимосвязь между уровнем производительности труда и среднегодовой заработной платой работников предприятий. Дать экономическую интерпретацию коэффициента регрессии построенного уравнения.

Таблица 13. - Вспомогательная таблица для расчета параметров уравнения регрессии:

Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год х

Среднегодовая заработная плата в расчете на 1 работника, тыс. руб.

x2

ух

0,0967

0,6167

0,0093

0,0596

0,0799

0,5015

0,0064

0,0401

0,0638

0,3441

0,0041

0,0220

0,0738

0,4392

0,0054

0,0324

0,0852

0,4956

0,0073

0,0422

0,0689

0,4013

0,0047

0,0276

0,0822

0,4952

0,0068

0,0407

0,0773

0,4196

0,0060

0,0324

0,0668

0,3817

0,0045

0,0255

0,0708

0,4079

0,0050

0,0289

0,0737

0,4945

0,0054

0,0364

0,0649

0,3442

0,0042

0,0223

0,0642

0,3526

0,0041

0,0226

0,0650

0,3388

0,0042

0,0220

0,0831

0,5688

0,0069

0,0473

0,0678

0,4182

0,0046

0,0284

0,0645

0,3493

0,0042

0,0225

0,0633

0,3477

0,0040

0,0220

0,0632

0,3682

0,0040

0,0233

0,0703

0,3306

0,0049

0,0233

Итого:

1,4454

8,4155

0,1061

0,6215

Для наших данных система уравнений имеет вид:

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии:

b = 8,34;

a = -0,18.

Уравнение регрессии:

y = 8,34;

x - 0,18.

Так же мы можем получить уравнение регрессии в среде Excel.

Для этого выполняем команду: Сервис - Анализ данных - Регрессия - OK.

В результате получаем таблицу 12.

Таблица 12. - Дисперсионный анализ:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-0,1824927

0,058505382

-3,11924636

0,005924444

Переменная X 1

8,347553615

0,803400956

10,39027096

4,93895E-09

Мы получили коэффициенты уравнения регрессии, которое будет иметь вид:

y = 8,34;

x - 0,18.

Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b = 8.34 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. Построим линейное уравнение парной регрессии:

Рис. 4. - Построение линейного уравнения парной регрессии:

В данном примере с увеличением на 1 млн. руб./чел производительности труда, а среднегодовая заработная плата повышается в среднем на 8.34 млн. руб./чел.

Определение линейного коэффициента корреляции построенной модели.

Для того, чтоб вычислить коэффициент корреляции определим параметры уравнения регрессии.

Выборочные средние:

Выборочные дисперсии:

Среднеквадратическое отклонение:

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Таблица 15. - Для оценки коэффициента корреляции воспользуемся шкалой Чэддока:

0,1 - 0,3

0,3 - 0,5

0,5 - 0,7

0,7 - 0,9

0,9 - 0,99

Характеристика силы связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная

Согласно шкале Чэддока связь между фондовой вооруженностью и производительностью труда весьма тесная.

3. Аналитическая часть

3.1 Постановка задачи

На данном этапе написания курсовой работы по дисциплине «Статистика» целью является изложение результатов самостоятельно проведенных исследований с применением освоенного методологического аппарата и компьютерной техники. Одним из направлений изучения среднегодовой заработной платы является анализ динамики заработной платы полученных за все кварталы 2012 года.

Данные представляют в органы статистики сведения о своём экономическом состоянии.

Эти данные характеризуют результат экономической деятельности региона.

Имеются данные по Российской Федерации по начислению заработной платы за все кварталы 2012 года.

Таблица 16:

Квартал 2012 г.

I кв.

II кв.

III кв.

IV кв.

Номинальная заработная плата

24407

26547

26127

30233

Индекс потребительских цен

100,4

100,6

100,6

100,5

Реальная заработная плата

243,1

263,9

259,7

300,8

Номинальную заработную плату разделили на индекс потребительских цен и получили фактическую заработную плату.

По данным Службы государственной заработная плата по Российской Федерации за все кварталы 2012 г., представлены в таблице, проведём анализ динамики заработной платы по Российской Федерации, для чего рассчитаем следующие показатели:

- абсолютный прирост;

- темп роста;

- темп прироста;

- средний за период уровень ряда, абсолютный прирост, темпы роста и прироста.

3.2 Методика решения

Расчёт показателей анализа ряда динамики осуществим по формулам, представленных в таблице.

Таблица 17:

Средний уровень в интервальном ряду динамики с равноотстоящими интервалами вычисляется по формуле:

Для определения абсолютной величины, стоящей за каждым процентом прироста прибыли, рассчитывают показатель абсолютного значения 1% прироста (А%).

Рис. 5:

Рис. 6:

Числовые обозначения:

- уровень первого периода;

- уровень сравниваемого периода;

- уровень последнего периода.

3.3 Технология выполнения компьютерных расчётов

Расчёты показателей анализа динамики заработной платы выполнены с применением пакета прикладных программ обработки электронных таблиц MS Excel в среде Windows, были представлены в рисунках 5 и 6.

3.4 Анализ результатов статистических компьютерных расчётов

Рис. 7:

Объём заработной платы по Российской Федерации за все кварталы 2012 года вырос на 107,4%, что в абсолютном выражении составляет 1942 тыс. руб. Наблюдается положительная динамика в течении всего данного периода.

Заключение

Итак, в заключение отметим, что понятия «корреляция» и «регрессии» тесно связаны между собой. В экономических исследованиях корреляционный и регрессионный анализ нередко объединяют в один - корреляционно-регрессионный анализ. Подразумевается, что в результате такого анализа будет построена регрессионная зависимость (т. е., проведен регрессионный анализ) и рассчитаны коэффициенты ее тесноты и значимости.

Практическая реализация корреляционно-регрессионного анализа включает следующие этапы:

1. Постановка задачи - определяются показатели, зависимость между которыми подлежит оценке, формулируется экономически осмысленная и приемлемая гипотеза о зависимости между ними;

2. Формирование перечня факторов, их логический анализ - выбирается оптимальное число наиболее существенных переменных факторов, влияющих на зависимый показатель;

3. Спецификация функции регрессии - дается конкретная формулировка гипотезы о форме зависимости;

4. Оценка функции регрессии и проверка адекватности модели - определяются числовые значения параметров регрессии, вычисляется ряд показателей, характеризующих точность проведенного анализа;

5. Экономическая интерпретация - результаты анализа сравниваются с гипотезами, сформулированными на первом этапе исследования, оценивается их правдоподобие с экономической точки зрения, делаются аналитические выводы.

Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования. статистический экономика корреляция

Анализ отчетности не замыкается на специфических, разработанных в его рамках приемах, но активно использует самые разнообразные методики, творчески переработав их применительно к собственным требованиям. В частности, использование корреляционно-регрессионного анализа позволяет более эффективно решать задачи прогнозирования доходов организации и планирования ее будущего финансового состояния, в связи с чем, данный математический метод рекомендуется использовать более активно.

Список литературы

1. Статистика: учеб. пособие для студентов вузов, обучающихся по экономическим специальностям / В.М. Гусаров, Е.И. Кузнецова. - 2-е изд., перераб. и доп. - М.: ЮНИТИ-ДАНА, 2008.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА - М., 2007.

3. Л.С. Хромцова. Корреляционно-регрессионный анализ основных показателей нефтедобывающей промышленности - Журнал "Экономический анализ: теория и практика", 2007, N 7.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.