Корреляционно-регрессионный анализ взаимосвязи производительности и оплаты труда
Понятие значения статистических методов исследования производственных показателей в условиях экономики. Сущность корреляционно-регрессионного анализа и его отличия от аналитической группировки. Оценка регрессии и коэффициента корреляции показателей.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 28.10.2013 |
Размер файла | 1,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
КУРСОВАЯ РАБОТА
по дисциплине: Статистика
на тему: Корреляционно-регрессионный анализ взаимосвязи производительности и оплаты труда
Москва, 2013 год
Введение
В условиях рынка предприятие является главным объектом хозяйствования, независимым товаропроизводителем, экономическое пространство для которого практически неограниченно, но всецело зависит от умения работать безубыточно, адаптируясь к условиям изменяющейся экономической среды.
Производственные показатели характеризуют эффективность деятельности предприятия. Обеспечение качества систем управления требует широкого применения статистических методов. Актуальностью данной работы является то, что статистические методы, позволяют установить закономерности и причины изменений явлений и процессов, имеющих место на предприятии или в организации, являются мощным инструментом обоснования принимаемых решений и оценки их эффективности. Одним из таких методов является корреляционно-регрессионный анализ.
Цель данной работы ознакомится с понятием корреляционно-регрессионного анализа, рассмотреть понятия, характеризующие его, узнать где и как можно применять метод корреляционно- регрессионного анализа.
В теоретической части данной работы дана общая характеристика корреляционно-регрессионного анализа как объекта статистического изучения.
В расчетной части работы проведен анализ, позволяющий утверждать о существовании корреляционной связи между изучаемыми показателями.
1. Теоретическая часть
1.1 Корреляционно-регрессионный анализ как объект статистического изучения
Современная наука исходит из взаимосвязи всех явлений природы и общества. Объем продукции предприятия связан с численностью работников, мощностью двигателей, стоимостью производственных фондов и ещё многими признаками.
Невозможно управлять явлениями, предсказывать их развитие без изменения характера, силы и других особенностей связей, поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.
Различают два вида связи между различными явлениями и их признаками: функциональную и жестко детерминированную, с одной стороны, и статистическую или стохастически детерминированную - с другой. Строго определить различия этих типов связи можно тогда, когда они получают математическую формулировку.
Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т. е., значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменой, связь между ними является функциональной.
Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но её среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону - связь является статистической. Иными словами, при статистической связи разным значениям одной переменной соответствует разные распределения значений другой переменой.
В настоящее время наука не знает более широкого определения связи. Все связи, которые могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Последние представляют собой частный случай статистических связей, когда значения одной переменной соответствуют «распределения» значений второй, состоящие из одного или нескольких значений и имеющие вероятность, равную единице. Конечно, качественное различие действительно вероятных распределений и отдельных значений, имеющих вероятность единицы (достоверных), настолько велико, что хотя функциональные связи и подходят в широком смысле под определение статистической связи, все же с полным основанием можно говорить о двух типах связей.
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака x закономерным образом изменяется среднее значение признака y.
В то время как в каждом отдельном случае значение признака y (с различными вероятностями) может принимать множество различных значений.
Если же с изменением значения признака x среднее значение признака y не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (показатели вариации, эксцесса и т. п.), то связь является не корреляционной, хотя и статистической.
Корреляционная связь между признаками может возникать разными путями. Важнейший путь - причинная зависимость результативного признака (его вариации) от вариации факторного признака.
Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины. Данную корреляцию нельзя интерпретировать как связь причины и следствия.
Третий путь возникновения корреляции - взаимосвязь признаков, каждый из которых и причина и следствие.
Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины.
Третий путь возникновения корреляции - взаимосвязь признаков, каждый из которых и причина, и следствие.
1.2 Система статистических показателей, характеризующих корреляционно-регрессионный анализ
В соответствии с сущностью корреляционной связи её изучение имеет две цели:
1. Измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);
2. Измерение тесноты связи двух (или большего числа) признаков между собой.
Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнение связи является метод наименьших квадратов, разработанный К.Ф. Гауссом. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной y от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) x.
Для изменения тесноты связи применяется несколько показателей. При парной связи теснота связи изменяется прежде всего корреляционным отношением, которое означается греческой группой з. Квадрат корреляционного отношения - это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий факторного признака групп, на среднею величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий.
Квадрат корреляционного отношения называется коэффициентом детерминации:
(1)
Где:
к - число групп по факторному признаку;
- число единиц совокупности;
- индивидуальные значения результативного признака;
- его средние групповые значения;
- его общее среднее значение;
- частота в j-й группе.
Формула (1) применяется при расчете показателя тесноты связи по аналитической группировке.
При вычислении корреляционного отношения по уровню связи (уравнению парной или множественной регрессии) применяется формула (2):
(2)
Где:
- индивидуальные значения y по уравнению связи.
Сумма квадратов в числителе - это объясненная связью с фактором x (факторами) дисперсия результативного признака y. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.
Если уравнение выбрано неверно или сделана ошибка при расчете его параметров, то сумма квадратов в числителе может оказаться большей, чем в знаменателе, и отношение утратит тот смысл, которое оно должно иметь, а именно каково доля общей вариации результативного признака, объясняемая на основе выбранного уравнения в связи с его факторным признаком (признаками). Чтобы избежать ошибочного результата, лучше вычислять корреляционное отношение по другой формуле (3), не столь наглядно выявляющей сущность показателя, но зато полностью гарантирующей от возможного искажения:
(3)
В числителе формулы (3) стоит сумма квадратов отклонений фактических значений признака от его индивидуальных расчетных значений, т. е., доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать равной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.
В основе перехода от формулы (2) к формуле (3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:
Dобщ = Dмежгр + Dвнутригр
Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:
При расчете не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как:
Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков).
Меры тесноты связи измеряют долю вариации результативного признака, которая связана с вариацией факторного признака (признаков).
Интерпретировать корреляционные показатели строго следует лишь в терминах вариации (различий в пространстве) отклонений от средней величины.
Если же задача исследования состоит в измерении связи не между вариацией двух признаков в совокупности, а между изменениями признаков объекта во времени, то метод корреляционно-регрессионного анализа требует значительного изменения.
Итак, строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.
1.3 Применение метода корреляционно-регрессионного анализа в статистике
Коренное отличие метода корреляционно-регрессионного анализа от аналитической группировки состоит в том, что корреляционно-регрессионный анализ позволяет разделить влияние комплекса факторных признаков, анализировать различные стороны сложной системы взаимосвязей.
Если метод комбинированной аналитической группировки, как правило, не дает возможность анализировать более 3 факторов, то корреляционный метод при объеме совокупности около ста единиц позволяет вести анализ системы с 8-10 факторами и разделить их влияние.
Развивающиеся на базе корреляционно-регрессионного анализа многомерные методы (метод главных компонентов, факторный анализ) позволяют синтезировать влияние признаков (первичных факторов), выделяя из них непосредственно не учитываемые глубинные факторы (компоненты). Например, изучая корреляцию ряда признаков интенсификации сельскохозяйственного производства, таких, как фондообеспеченность, затраты труда на единицу площади, энергетическая обеспеченность, внесение удобрений на единицу площади, плотность поголовья скота, можно синтезировать общую часть их влияния на уровень продукции с единицы площади или на производительность труда, получив обобщенный фактор «интенсификация производства», непосредственно не измеримый, не отражаемый единым показателем.
Правильное применение и интерпретация результатов корреляционно-регрессионного анализа возможны лишь при понимании всех специфических черт, достоинств и ограничений метода.
Необходимо сказать и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер.
1. Задача выделения важнейших факторов, влияющих на результативный признак (т. е., на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.
2. Задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства.
3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков.
4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач.
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы. С одной стороны, их идеал - измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариации признаков. А тогда связь является функциональной, и корреляционные методы анализа излишни. В реальных системах связь всегда имеет статистический характер, и тогда идеал методов корреляции становится недостижимым. Но это не значит, что эти методы не нужны.
Данное противоречие означает простоту недостижимость абсолютной истины в познании реальны связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности.
Всякая научная истина - относительна. Забывать об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.
2. Расчетная часть
Имеются следующие выборочные данные за отчётный период по предприятиям одного из регионов
Таблица 1. - Выборка 2%-ная, механическая, бесповторная:
№ предприятия п/п |
Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год |
Средняя годовая заработная плата в расчете на 1 работника, тыс. руб. |
№ предприятия п/п |
Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год |
Средняя годовая заработная плата в расчете на 1 работника, тыс. руб. |
|
1 |
1392 |
348 |
16 |
1788 |
447 |
|
2 |
1960 |
490 |
17 |
2100 |
525 |
|
3 |
800 |
200 |
18 |
1828 |
457 |
|
4 |
956 |
239 |
19 |
1468 |
367 |
|
5 |
1488 |
372 |
20 |
1688 |
422 |
|
6 |
1496 |
374 |
21 |
1180 |
295 |
|
7 |
1580 |
395 |
22 |
1840 |
460 |
|
8 |
1560 |
390 |
23 |
1768 |
442 |
|
9 |
2400 |
600 |
24 |
1672 |
418 |
|
10 |
2368 |
592 |
25 |
1320 |
330 |
|
11 |
2352 |
588 |
26 |
1568 |
392 |
|
12 |
2112 |
528 |
27 |
1900 |
475 |
|
13 |
1540 |
385 |
28 |
1736 |
434 |
|
14 |
1852 |
463 |
29 |
1648 |
412 |
|
15 |
1640 |
410 |
30 |
1160 |
290 |
2.1 Уровень производительности труда в расчете на 1 работника
Признак - уровень производительности труда в расчете на 1 работника.
1) Построение интервального ряда распределения предприятий по признаку производительности труда на 1 работника. Вычислим величину и границы интервалов ряда. Величина интервала h определяется по формуле:
Где:
xmax, xmin - наибольшее и наименьшее значения признака в исследуемой совокупности;
k - число групп интервального ряда.
Где:
n - число единиц совокупности.
k = 5.
xmax = 2400 тыс. руб./чел. в год;
xmin = 800 тыс. руб./чел. в год;
.
Составим табличное выражение.
Таблица 2. - Границы интервалов ряда распределения:
№ |
Нижняя граница |
Верхняя граница |
|
1 |
800 |
1120 |
|
2 |
1120 |
1440 |
|
3 |
1440 |
1760 |
|
4 |
1760 |
2080 |
|
5 |
2080 |
2400 |
Процесс группировки единиц совокупности по признаку - уровень производительности труда в расчете на 1 работника представлен во вспомогательной (разработочной) таблице 3.
На основе групповых итоговых строк «Всего» таблицы 3 формируется итоговая таблица 4, представляющая интервальный ряд распределения предприятий по уровню производительности труда в расчете на 1 работника.
Таблица 3. - Разработочная таблица для построения интервального ряда распределения и аналитической группировки:
Распределение предприятий по уровню производительности труда в расчете на 1 работника.
Таблица 4:
Рис. 1:
Частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаем путем последовательного суммирования частот всех предшествующих (j-1) интервалов. Накопленные части, рассчитываемые по формуле:
Структура предприятий по уровню производительности труда в расчете на 1 работника.
Таблица 5:
Рис. 2:
Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по уровню производительности труда не является равномерным:
- преобладают предприятия с уровнем производительности труда от 1440 тыс. руб. до 1760 тыс. руб. (это 12 предприятий, доля которых составляет 40%);
- 20% предприятий имеют уровень производительности труда менее 1440 тыс. руб.;
- 60% - менее 1760 тыс. руб.
2.2 Связь между признаками
Связь между признаками - уровень производительности труда и среднегодовая заработная плата.
Установим наличие и характер связи между уровнем производительности труда и среднегодовой заработной платой методом аналитической группировки. Аналитическая группировка показывает взаимосвязь между двумя признаками, один из которых будет рассматриваться как факторный, а другой как результативный. По условию Задания 2 факторным является признак уровень производительности труда (X), результативным - Среднегодовая заработная плата (Y).Построим вспомогательную таблицу:
Таблица 6. - Зависимость уровня производительности труда от размера среднегодовой заработной платы:
Анализ данных табл. 6 показывает, что с увеличением уровня производительности труда от группы к группе систематически возрастает и среднегодовая заработная плата по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения. Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели - эмпирический коэффициент детерминации n2 и эмпирическое корреляционное отношение n.
Эмпирический коэффициент детерминации n2 оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель n2 рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле:
Где:
- общая дисперсия признака Y;
- межгрупповая (факторная) дисперсия признака Y.
Значения показателя n2 изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство n2 = 0, а при наличии функциональной связи между ними - равенство n2 = 1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле:
Где:
yi - индивидуальные значения результативного признака;
- общая средняя значений результативного признака;
n - число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
Или как средняя взвешенная по частоте групп интервального ряда:
Для вычисления удобно использовать формулу, т. к., в табл. 6 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле:
Для расчета общей дисперсии применяется вспомогательная таблица.
Таблица 7. - Вспомогательная таблица для расчета общей дисперсии:
Номер предприятия п/п |
Среднегодовая заработная плата |
||||
1 |
2 |
3 |
4 |
5 |
|
1 |
348 |
-70 |
4900 |
121104 |
|
2 |
490 |
72 |
5184 |
240100 |
|
3 |
200 |
-218 |
47524 |
40000 |
|
4 |
239 |
-179 |
32041 |
57121 |
|
5 |
372 |
-46 |
2116 |
138384 |
|
6 |
374 |
-44 |
1936 |
139876 |
|
7 |
395 |
-23 |
529 |
156025 |
|
8 |
390 |
-28 |
784 |
152100 |
|
9 |
600 |
182 |
33124 |
360000 |
|
10 |
592 |
174 |
30276 |
350464 |
|
11 |
588 |
170 |
28900 |
345744 |
|
12 |
528 |
110 |
12100 |
278784 |
|
13 |
385 |
-33 |
1089 |
148225 |
|
14 |
463 |
45 |
2025 |
214369 |
|
15 |
410 |
-8 |
64 |
168100 |
|
16 |
447 |
29 |
841 |
199809 |
|
17 |
525 |
107 |
11449 |
275625 |
|
18 |
457 |
39 |
1521 |
208849 |
|
19 |
367 |
-51 |
2601 |
134689 |
|
20 |
422 |
4 |
16 |
178084 |
|
21 |
295 |
-123 |
15129 |
87025 |
|
22 |
460 |
42 |
1764 |
211600 |
|
23 |
442 |
24 |
576 |
195364 |
|
24 |
418 |
0 |
0 |
174724 |
|
25 |
330 |
-88 |
7744 |
108900 |
|
26 |
392 |
-26 |
676 |
153664 |
|
27 |
475 |
57 |
3249 |
225625 |
|
28 |
434 |
16 |
256 |
188356 |
|
29 |
412 |
-6 |
36 |
169744 |
|
30 |
290 |
-128 |
16384 |
84100 |
|
Итого |
12540 |
264834 |
5506554 |
Расчет общей дисперсии по формуле:
Общая дисперсия может быть также рассчитана по формуле:
Где:
- средняя из квадратов значений результативного признака;
- квадрат средней величины значений результативного признака.
Для демонстрационного примера:
Тогда:
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле:
Где:
-групповые средние;
- общая средняя;
- число единиц в j-ой группе;
k - число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 8. При этом используются групповые средние значения из табл. 6 (графа 5).
Таблица 8. - Вспомогательная таблица для расчета межгрупповой дисперсии:
Группы предприятий по уровню производительности труда в расчете на 1 работника, тыс. руб./чел. в год |
Число предприятий, |
Среднее значение в группе |
|||
1 |
2 |
3 |
4 |
5 |
|
800-1120 |
2 |
219,5 |
-198,5 |
78804,5 |
|
1120-1440 |
4 |
317,25 |
-100,75 |
40602,25 |
|
1440-1760 |
12 |
397,58 |
-20,42 |
5003,717 |
|
1760-2080 |
7 |
462 |
44 |
13552 |
|
2080-2400 |
5 |
566,6 |
148,6 |
110409,8 |
|
Итого |
30 |
248372,3 |
Расчет межгрупповой дисперсии по формуле:
Расчет эмпирического коэффициента детерминации по формуле:
Изменение уровня производительности труда:
- 93,7%, обусловлено изменением среднегодовой заработной платы;
- 6,3% - влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение .
Оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле:
Значение показателя изменяются в пределах .
Чем ближе значение n к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе n служит шкала Чэддока:
Рис. 3:
Расчет эмпирического корреляционного отношения n по формуле:
Согласно шкале Чэддока связь между производительностью труда и среднегодовой заработной платы является весьма тесной.
Оценка статистической значимости коэффициента детерминации n2.
Показатели n и n2 рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи n, n2 несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка. Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации n2 служит дисперсионный F-критерий Фишера, который рассчитывается по формуле:
Где:
n - число единиц выборочной совокупности;
m - количество групп;
- межгрупповая дисперсия;
- дисперсия j-ой группы (j=1,2,…,m);
- средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
Где:
- общая дисперсия.
Для проверки значимости показателя n2 рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m:
k1 = m - 1
k2 = n - m
Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч=Fтабл, коэффициент детерминации n2 признается статистически значимым, т. е., практически невероятно, что найденная оценка n2 обусловлена только стечением случайных обстоятельств.
В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч=Fтабл, то показатель n2 считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений:
= 0,05;
k1 = 3, 4, 5;
k2 = 24-35 представлен ниже.
Таблица 9:
k2 |
|||||||||||||
k1 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
|
3 |
3,01 |
2,99 |
2,98 |
2,96 |
2,95 |
2,93 |
2,92 |
2,91 |
2,90 |
2,89 |
2,88 |
2,87 |
|
4 |
2,78 |
2,76 |
2,74 |
2,73 |
2,71 |
2,70 |
2,69 |
2,68 |
2,67 |
2,66 |
2,65 |
2,64 |
|
5 |
2,62 |
2,60 |
2,59 |
2,57 |
2,56 |
2,55 |
2,53 |
2,52 |
2,51 |
2,50 |
2,49 |
2,48 |
Расчет дисперсионного F-критерия Фишера для оценки:
n2 = 93,7%.
Полученной при:
= 8827,8;
= 8279,0766.
Таблица 10. - Табличное значение F-критерия при = 0,05:
n |
m |
k1=m-1 |
k2=n-m |
Fтабл (,5, 60) |
|
30 |
5 |
4 |
25 |
2,60 |
Поскольку Fрасч=Fтабл, то величина коэффициента детерминации n2 = 93,7% признается значимой (неслучайной) с уровнем надежности 94,3% и, следовательно, найденные характеристики связи между признаками производительностью труда и среднегодовой заработной платы правомерны не только для выборки, но и для всей генеральной совокупности банков.
2.3 Ошибки выборки среднего уровня производительности труда и выборки доли предприятий с уровнем производительности труда
По результатам выполнения пункта 2.2 с вероятностью 0.954 определите:
1. Ошибку выборки среднего уровня производительности труда и границы, в которых будет находиться средняя производительность труда для генеральной совокупности предприятий;
2. Ошибку выборки доли предприятий с уровнем производительности труда 1760,0 и более тыс. руб. и границы, в которых будет находиться генеральная доля.
Определить ошибку выборки среднего уровня производительности труда и границы, в которых будет находиться средняя производительность труда для генеральной совокупности предприятий. Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле:
Где:
- общая дисперсия выборочных значений признаков;
N - число единиц в генеральной совокупности;
n - число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
Где:
- выборочная средняя;
- генеральная средняя.
Границы задают доверительный интервал генеральной средней, т. е., случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней.
Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности:
Р = 0.954;
Р = 0.997;
Р = 0,683.
В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t.
Называемым также коэффициентом доверия.
Этот коэффициент зависит от значения доверительной вероятности Р.
Для предельной ошибки выборочной средней это теоретическое положение выражается формулой:
Значения t вычислены заранее для различных доверительных вероятностей Р и табулированы (таблицы функции Лапласа). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл.):
Таблица 11:
Доверительная вероятность P |
0,683 |
0,866 |
0,954 |
0,988 |
0,997 |
0,999 |
|
Значение t |
1,0 |
1,5 |
2,0 |
2,5 |
3,0 |
3,5 |
По условию выборочная совокупность насчитывает 30 предприятий, выборка 2% механическая, генеральная совокупность включает 150 банков. Значения параметров, необходимых для решения задачи, представлены в табл. 12:
Таблица 12:
Р |
t |
N |
N |
|||
0,954 |
2 |
30 |
150 |
418 |
8827,8 |
Расчет средней ошибки выборки:
Расчет предельной ошибки выборки по формуле:
Определение по формуле:
Доверительного интервала для генеральной средней:
На основании проведенного выборочного обследования предприятий региона с вероятностью 0,954.
Можно утверждать:
Для генеральной совокупности предприятий средний уровень производительности труда находится в пределах от 390,554 тыс. руб. до 445,446 тыс. руб.
Определить ошибку выборки доли предприятий с уровнем производительности труда 1760,0 и более тыс. руб. и границы, в которых будет находиться генеральная доля.
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой:
Где:
m - число единиц совокупности, обладающих заданным свойством;
n - общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле:
Где:
w - доля единиц совокупности, обладающих заданным свойством;
(1-w) - доля единиц совокупности, не обладающих заданным свойством;
N - число единиц в генеральной совокупности;
n - число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством:
По условию исследуемым свойством является равенство или превышение уровня производительности труда 1760,0 и более тыс. руб.
Число предприятий с заданным свойством определяется из табл. 3 (графа 3): m = 11.
Расчет выборочной доли по формуле:
Расчет по формуле:
Предельной ошибки выборки для доли:
Определение по формуле:
Доверительного интервала генеральной доли:
Или:
С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий доля предприятий с уровнем производительности труда 1760,0 тыс. руб. и выше будет находиться в пределах от 21% до 52,4%.
2.4 Расчет парной регрессии и коэффициент корреляции
По результатам выполнения задания №2 требуется:
Построить линейное уравнение парной регрессии, отражающее взаимосвязь между уровнем производительности труда и среднегодовой заработной платой работников предприятий. Дать экономическую интерпретацию коэффициента регрессии построенного уравнения.
Определить линейный коэффициент корреляции для построенной модели связи и сделать выводы.
Построить линейное уравнение парной регрессии, отражающее взаимосвязь между уровнем производительности труда и среднегодовой заработной платой работников предприятий. Дать экономическую интерпретацию коэффициента регрессии построенного уравнения.
Таблица 13. - Вспомогательная таблица для расчета параметров уравнения регрессии:
Уровень производительности труда в расчете на 1 работника, тыс. руб./чел. в год х |
Среднегодовая заработная плата в расчете на 1 работника, тыс. руб. |
x2 |
ух |
||
0,0967 |
0,6167 |
0,0093 |
0,0596 |
||
0,0799 |
0,5015 |
0,0064 |
0,0401 |
||
0,0638 |
0,3441 |
0,0041 |
0,0220 |
||
0,0738 |
0,4392 |
0,0054 |
0,0324 |
||
0,0852 |
0,4956 |
0,0073 |
0,0422 |
||
0,0689 |
0,4013 |
0,0047 |
0,0276 |
||
0,0822 |
0,4952 |
0,0068 |
0,0407 |
||
0,0773 |
0,4196 |
0,0060 |
0,0324 |
||
0,0668 |
0,3817 |
0,0045 |
0,0255 |
||
0,0708 |
0,4079 |
0,0050 |
0,0289 |
||
0,0737 |
0,4945 |
0,0054 |
0,0364 |
||
0,0649 |
0,3442 |
0,0042 |
0,0223 |
||
0,0642 |
0,3526 |
0,0041 |
0,0226 |
||
0,0650 |
0,3388 |
0,0042 |
0,0220 |
||
0,0831 |
0,5688 |
0,0069 |
0,0473 |
||
0,0678 |
0,4182 |
0,0046 |
0,0284 |
||
0,0645 |
0,3493 |
0,0042 |
0,0225 |
||
0,0633 |
0,3477 |
0,0040 |
0,0220 |
||
0,0632 |
0,3682 |
0,0040 |
0,0233 |
||
0,0703 |
0,3306 |
0,0049 |
0,0233 |
||
Итого: |
1,4454 |
8,4155 |
0,1061 |
0,6215 |
Для наших данных система уравнений имеет вид:
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии:
b = 8,34;
a = -0,18.
Уравнение регрессии:
y = 8,34;
x - 0,18.
Так же мы можем получить уравнение регрессии в среде Excel.
Для этого выполняем команду: Сервис - Анализ данных - Регрессия - OK.
В результате получаем таблицу 12.
Таблица 12. - Дисперсионный анализ:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
-0,1824927 |
0,058505382 |
-3,11924636 |
0,005924444 |
|
Переменная X 1 |
8,347553615 |
0,803400956 |
10,39027096 |
4,93895E-09 |
Мы получили коэффициенты уравнения регрессии, которое будет иметь вид:
y = 8,34;
x - 0,18.
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b = 8.34 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. Построим линейное уравнение парной регрессии:
Рис. 4. - Построение линейного уравнения парной регрессии:
В данном примере с увеличением на 1 млн. руб./чел производительности труда, а среднегодовая заработная плата повышается в среднем на 8.34 млн. руб./чел.
Определение линейного коэффициента корреляции построенной модели.
Для того, чтоб вычислить коэффициент корреляции определим параметры уравнения регрессии.
Выборочные средние:
Выборочные дисперсии:
Среднеквадратическое отклонение:
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Таблица 15. - Для оценки коэффициента корреляции воспользуемся шкалой Чэддока:
0,1 - 0,3 |
0,3 - 0,5 |
0,5 - 0,7 |
0,7 - 0,9 |
0,9 - 0,99 |
||
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Согласно шкале Чэддока связь между фондовой вооруженностью и производительностью труда весьма тесная.
3. Аналитическая часть
3.1 Постановка задачи
На данном этапе написания курсовой работы по дисциплине «Статистика» целью является изложение результатов самостоятельно проведенных исследований с применением освоенного методологического аппарата и компьютерной техники. Одним из направлений изучения среднегодовой заработной платы является анализ динамики заработной платы полученных за все кварталы 2012 года.
Данные представляют в органы статистики сведения о своём экономическом состоянии.
Эти данные характеризуют результат экономической деятельности региона.
Имеются данные по Российской Федерации по начислению заработной платы за все кварталы 2012 года.
Таблица 16:
Квартал 2012 г. |
I кв. |
II кв. |
III кв. |
IV кв. |
|
Номинальная заработная плата |
24407 |
26547 |
26127 |
30233 |
|
Индекс потребительских цен |
100,4 |
100,6 |
100,6 |
100,5 |
|
Реальная заработная плата |
243,1 |
263,9 |
259,7 |
300,8 |
Номинальную заработную плату разделили на индекс потребительских цен и получили фактическую заработную плату.
По данным Службы государственной заработная плата по Российской Федерации за все кварталы 2012 г., представлены в таблице, проведём анализ динамики заработной платы по Российской Федерации, для чего рассчитаем следующие показатели:
- абсолютный прирост;
- темп роста;
- темп прироста;
- средний за период уровень ряда, абсолютный прирост, темпы роста и прироста.
3.2 Методика решения
Расчёт показателей анализа ряда динамики осуществим по формулам, представленных в таблице.
Таблица 17:
Средний уровень в интервальном ряду динамики с равноотстоящими интервалами вычисляется по формуле:
Для определения абсолютной величины, стоящей за каждым процентом прироста прибыли, рассчитывают показатель абсолютного значения 1% прироста (А%).
Рис. 5:
Рис. 6:
Числовые обозначения:
- уровень первого периода;
- уровень сравниваемого периода;
- уровень последнего периода.
3.3 Технология выполнения компьютерных расчётов
Расчёты показателей анализа динамики заработной платы выполнены с применением пакета прикладных программ обработки электронных таблиц MS Excel в среде Windows, были представлены в рисунках 5 и 6.
3.4 Анализ результатов статистических компьютерных расчётов
Рис. 7:
Объём заработной платы по Российской Федерации за все кварталы 2012 года вырос на 107,4%, что в абсолютном выражении составляет 1942 тыс. руб. Наблюдается положительная динамика в течении всего данного периода.
Заключение
Итак, в заключение отметим, что понятия «корреляция» и «регрессии» тесно связаны между собой. В экономических исследованиях корреляционный и регрессионный анализ нередко объединяют в один - корреляционно-регрессионный анализ. Подразумевается, что в результате такого анализа будет построена регрессионная зависимость (т. е., проведен регрессионный анализ) и рассчитаны коэффициенты ее тесноты и значимости.
Практическая реализация корреляционно-регрессионного анализа включает следующие этапы:
1. Постановка задачи - определяются показатели, зависимость между которыми подлежит оценке, формулируется экономически осмысленная и приемлемая гипотеза о зависимости между ними;
2. Формирование перечня факторов, их логический анализ - выбирается оптимальное число наиболее существенных переменных факторов, влияющих на зависимый показатель;
3. Спецификация функции регрессии - дается конкретная формулировка гипотезы о форме зависимости;
4. Оценка функции регрессии и проверка адекватности модели - определяются числовые значения параметров регрессии, вычисляется ряд показателей, характеризующих точность проведенного анализа;
5. Экономическая интерпретация - результаты анализа сравниваются с гипотезами, сформулированными на первом этапе исследования, оценивается их правдоподобие с экономической точки зрения, делаются аналитические выводы.
Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования. статистический экономика корреляция
Анализ отчетности не замыкается на специфических, разработанных в его рамках приемах, но активно использует самые разнообразные методики, творчески переработав их применительно к собственным требованиям. В частности, использование корреляционно-регрессионного анализа позволяет более эффективно решать задачи прогнозирования доходов организации и планирования ее будущего финансового состояния, в связи с чем, данный математический метод рекомендуется использовать более активно.
Список литературы
1. Статистика: учеб. пособие для студентов вузов, обучающихся по экономическим специальностям / В.М. Гусаров, Е.И. Кузнецова. - 2-е изд., перераб. и доп. - М.: ЮНИТИ-ДАНА, 2008.
2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА - М., 2007.
3. Л.С. Хромцова. Корреляционно-регрессионный анализ основных показателей нефтедобывающей промышленности - Журнал "Экономический анализ: теория и практика", 2007, N 7.
Размещено на Allbest.ru
Подобные документы
Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.
курсовая работа [151,0 K], добавлен 27.03.2009Проведение корреляционно-регрессионного анализа в зависимости выплаты труда от производительности труда. Построение поля корреляции, выбор модели уравнения и расчет его параметров. Вычисление средней ошибки аппроксимации и тесноту связи между признаками.
практическая работа [13,1 K], добавлен 09.08.2010Сущность корреляционно-регрессионного анализа и экономико-математической модели. Обеспечение объема и случайного состава выборки. Измерение степени тесноты связи между переменными. Составление уравнений регрессии, их экономико-статистический анализ.
курсовая работа [440,3 K], добавлен 27.07.2015Контроль информации на наличие выбросов в массиве. Описательная статистика, вывод итогов. Матрица коэффициентов парной корреляции. Количественный критерий оценки тесноты связи. Регрессионный анализ статистических данных. Анализ качества модели регрессии.
контрольная работа [5,7 M], добавлен 14.12.2011Особенности корреляционно-регрессионного анализа, его основные этапы. Характеристика показателей социально-экономического развития стран Африки. Этапы построения уравнения регрессии. Анализ средней продолжительности жизни населения в странах Африки.
контрольная работа [47,2 K], добавлен 17.04.2012- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Метод статистического исследования. Генеральная совокупность и выборка. Приведение статистики темпа инфляции за 10 лет. Выборочное обследование торговых предприятий, оценка величины запаса (в днях оборота). Этапы корреляционно-регрессионного анализа.
контрольная работа [170,0 K], добавлен 20.01.2014Объемы валового внутреннего продукта и национального дохода. Тенденции развития отраслей экономики. Состояние финансовых и товарных рынков. Производственные показатели предприятия. Понятия корреляции и регрессии. Корреляционно-регрессионный анализ.
курсовая работа [214,8 K], добавлен 21.01.2011Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.
контрольная работа [4,2 M], добавлен 14.06.2014Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.
контрольная работа [633,2 K], добавлен 10.12.2013