Статистическое изучение взаимосвязи социально-экономических явлений
Методы изучения связи социальных явлений. Парная множественная корреляция. Регрессионный анализ в изучении взаимосвязей социально-экономических явлений. Метод наименьших квадратов. Множественная (многофакторная) регрессия. Оценка существенности связи.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 14.08.2010 |
Размер файла | 170,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Статистическое изучение взаимосвязи социально-экономических явлений
План
1. Методы изучения связи социальных явлений
2. Парная множественная корреляция
3. Методы изучения связи социальных явлений
4.Регрессионный анализ в изучении взаимосвязей социально-экономических явлений
5.Парная регрессия на основе метода наименьших квадратов (МНК)
6. Множественная (многофакторная) регрессия
7. Оценка существенности связи
Литература
1. Методы изучения связи социальных явлений
Исследуя природу, общество, экономику, необходимо считаться с взаимосвязью наблюдаемых явлений. Полнота описания определяется количественными характеристиками причинно-следственных связей между ними.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. При функциональной связи величине факторного признака соответствует одно или несколько значений функции. Этот вид связи часто проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Корреляционная связь (неполная) проявляется в среднем, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Каждому значению аргумента соответствуют случайно распределенные значения функции.
По направлению связи бывают:
- прямыми (положительными), когда зависимая переменная растет с увеличением факторного признака;
- обратными (отрицательными), при которых рост факторного признака сопровождается уменьшением функции.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные отношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Если характеризуется связь двух признаков, то ее называют парной.
Если изучается связь более двух переменных, то называют множественной.
Задачи корреляционного анализа сводятся к измерению тесноты связи между признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.
Традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ.
Методы оценки тесноты связи подразделяются на:
- параметрические (корреляционные);
- непараметрические.
Параметрические (корреляционные) основаны на использовании оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения.
Непараметрические методы не накладывают ограничений на законы распределения изучаемых величин.
2. Парная множественная корреляция
Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы (см. табл. 1).
Таблица 1
y x |
…. |
Итого |
|||||
… |
|||||||
… |
|||||||
... |
… |
… |
… |
… |
… |
… |
|
… |
|||||||
Итого |
… |
n |
|||||
… |
- |
В основу группировки положены два признака: x и y. Частоты графика показывают количество сочетаний x и y. Если расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания допустимо утверждение о связи между x и y. При этом, если концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь.
Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точками. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Если между x и y графика есть корреляция, то в размещении точек наблюдается определенная закономерность: они размещены в форме полосы или эллипса, оси которых не параллельны осям координат.
При наличии связи точки размещены или в виде эллипса, неориентированного вдоль осей координат, случай линейной зависимости (см. рис. 1), либо в виде неправильной полосы, случай нелинейной связи (см. рис. 2).
Рис. 1. Прямая линейная связь Рис. 2. Прямая нелинейная связь
При отсутствии связей имеет место беспорядочное расположение точек на графике.
Рис. 3. Связь отсутствует Рис. 4. Связь отсутствует
Теснота корреляционной связи между факторными и результативными признаками может исчисляться с помощью линейного коэффициента корреляции. Линейный коэффициент корреляции (r) характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости. В теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:
(1)
Преобразования данной формулы позволяют получить следующие формулы линейного коэффициента корреляции:
(2)
или
(3)
где n - число наблюдений.
Производя расчет по итоговым значениям переменных, линейный коэффициент корреляции можно вычислить по формуле
(4)
Коэффициент корреляции может быть выражен через дисперсии слагаемых:
(5)
или
(6)
Приведенные соотношения для коэффициента корреляции применяются при изучении совокупностей малого объема
Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Легко доказать, что условие r = 0 является необходимым и достаточным для того, чтобы величины x и y были независимы. Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Принято считать, что если это средняя связь, при сильная или тесная связи. Когда связь функциональная.
Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента:
(7)
При большом числе наблюдений (n > 100) используется следующая формула t-критерия Стьюдента:
(8)
Если расчетное значение (табличное), то это свидетельствует о значимости линейных коэффициентов корреляции, следовательно, и о статистической существенности зависимости между параметрами.
Для статистически значимого линейного коэффициента корреляции можно построить интервальные оценки с помощью z-распределения Фишера:
(8)
Пример. На основе выборочных данных о деловой активности однотипных коммерческих структур оценить тесноту связи между прибылью (тыс. руб.) (y) и затратами на 1 руб. произведенной продукции (x). Расчетные данные для определения коэффициента корреляции приведены в табл. 2.
Таблица 2
№ п/п |
y |
x |
yx |
y2 |
x2 |
|
1 2 3 4 5 6 |
221 1 070 1 001 606 779 789 |
96 77 77 89 82 81 |
21 216 82 390 77 077 53 934 63 878 63 909 |
48 841 1 144 900 1 002 000 367 236 606 841 622 520 |
9 216 5 929 5 929 7 921 6 724 6 561 |
|
Сумма |
4 466 |
502 |
362 404 |
3 792 338 |
42 280 |
|
Средняя |
744,33 |
83,67 |
60 400,67 |
63 2056,33 |
7 046,67 |
Решение. Используя формулу коэффициента корреляции
(10)
получаем
Проверка значимости коэффициента корреляции:
Так как можно сделать заключение о значимости данного коэффициента корреляции.
В случае наличия линейной и нелинейной зависимостей между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.
Эмпирическое корреляционное отношение рассчитывается по данным группировки, когда межгрупповая дисперсия () характеризует отклонения групповых средних результативного показателя от общей средней:
(11)
где - корреляционное отношение;
общая дисперсия;
- средняя из частных (групповых) дисперсий;
межгрупповая дисперсия (дисперсия групповых средних).
Все эти дисперсии являются дисперсиями результативного признака. Теоретическое корреляционное отношение определяется по формуле
(12)
где дисперсия выравненных значений результативного признака, рассчитанных по уравнению регрессии;
дисперсия эмпирических (фактических) значений результативного признака.
Дисперсии выравненных и эмпирических значений результативного признака рассчитываются по формулам:
(13)
Тогда
(14)
объясняется влиянием факторного признака.
Корреляционное отношение изменяется в пределах от 0 до 1 и анализ степени тесноты связи полностью соответствует линейному коэффициенту корреляции. Корреляционное отношение является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции.
Множественный коэффициент корреляции. Для измерения тесноты связи при множественной корреляционной зависимости вычисляются множественный или частные коэффициенты корреляции. Множественый коэффициент рассчитывается при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.
В случае оценки связи между результативным (y) и двумя факторными признаками (x1) и (x2) множественный коэффициент корреляции можно определить по формуле
, 15)
где r - парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: . Приближение коэффициента к единице свидетельствует о сильной зависимости между признаками.
Проверка значимости коэффициента множественной корреляции осуществляется на основе F-критерия Фишера-Снедекора:
(16)
Если Fр > Fкр (табличное), это свидетельствует о значимости коэффициента множественной корреляции.
Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками - х1 и х2 при фиксированном значении других факторных признаков, т. е. когда влияние х3 исключается и оценивается связь между х1 и х2 в “чистом виде”.
В случае зависимости y от двух факторных признаков х1 и х2 коэффициент частной корреляции следующий:
(17)
(18)
где r - парные коэффициенты корреляции между указанными в индексе переменными.
Проверка значимости аналогична проверке значимости для парных коэффициентов.
3. Методы изучения связи социальных явлений
Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки.
Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. При исследовании связи числовой материал располагают в виде таблиц сопряженности. Для вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (например: хороший - плохой). Для вычисления коэффициентов ассоциации и контингенции приведена в табл. 3.
Таблица 3
a |
b |
a+b |
|
c |
d |
c+d |
|
a +c |
b+d |
a+b+c+d |
Коэффициенты определяются по формулам:
ассоциации (19)
контингенции (20)
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если или
Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона-Чупрова.
Этот коэффициент вычисляется по следующим формулам:
(21)
(22)
где ц2 - показатель взаимной сопряженности;
ц - определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответсвующего столбца и строки (вычитая из этой суммы 1, получим величину ц2);
К1 - число значений (групп) первого признака;
К2 - число значений (групп) второго признака.
Чем ближе величины и Кч к 1, тем связь теснее.
В анализе социально - экономических явлений часто приходится прибегать к различным условным оценкам, например, рангам, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи. Данные коэффициенты исчисляются при условии, что иследуемые признаки подчиняются различным законам распределения.
Ранжирование - это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.
Ранг - это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называются связными.
Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле (для случая, когда нет связных рангов):
(23)
где - квадрат разности рангов;
n - число наблюдений (число пар рангов).
Коэффициент Спирмена принимает любые значения в интервале Значимость коэффициента корреляции рангов Спирмена проверяется на основе t-критерия Стьюдента. Расчетное значение критерия определяется по формуле
(24)
Значение коэффициента корреляции считается статистически существенным, если
Ранговый коэффициент корреляции Кендалла (ф) может также использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты, ранжированные по одному принципу. Расчет рангового коэффициента Кендалла осуществляется по формуле
(25)
где n - число наблюдений;
S - сумма разностей между числом последовательностей и числом инверсий по второму признаку.
Коэффициент Кендалла должен стремиться к единице в случае сильной связи.
Как правило, коэффициент Кендалла меньше коэффициента Спирмена. При достаточно большом объеме совокупности значения данных коэффициентов имеют следующую зависимость:
.
Связь между признаками можно признать статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.
Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) (W), который вычисляется по формуле
(26)
где m - количество факторов;
n - число наблюдений;
S - отклонение суммы квадратов рангов от средней квадратов рангов.
Коэффициент конкордации принимает любые значения в интервале (-1 до +1).
4. Регрессионный анализ в изучении взаимосвязей социально-экономических явлений
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (у) от факторных . Регрессия может быть однофакторной (парной) и многофакторной (множественной).
По форме зависимости различают:
1) линейную регрессию, которая выражается уравнением прямой (линейной функцией) вида
; (27)
2) нелинейную регрессию, которая выражается уравнениями вида:
параболы
(28)
гиперболы
. (29)
Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая.
Если результативный признак увеличивается в арифметической прогрессии, а факторный - значительно быстрее, то используется параболическая или степенная регрессия.
По направлению связи различают:
прямую (положительную) регрессию, появляющуюся при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;
обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.
Основной предпосылкой регрессионного анализа является то, что только результативный признак (у) подчиняется нормальному закону распределения, а факторные признаки могут иметь произвольный закон распределения. При этом заранее подразумевается наличие причинно-следственных связей между результативным (у) и факторными признаками . Число факторных признаков должно быть в 5-6 раз меньше объема изучаемой совокупности.
5. Парная регрессия на основе метода наименьших квадратов (МНК)
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов (МНК), в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
Сущность метода МНК заключается в нахождении параметров модели (), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
. (30)
Для прямой зависимости:
.
Рассматривая S в качестве функции параметров и проводя математические преобразования (дифференцирование), получаем
Откуда система нормальных уравнений для нахождения параметров линейной парной регрессии МНК имеет вид
,
где n - объем исследуемой совокупности (число единиц наблюдения).
Число уравнений в системе равно числу искомых параметров.
В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр (а в уравнении параболы и ) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Пример. Имеются следующие данные по 10 однородным предприятиям (см. табл. 4). Найти зависимость между электровооруженностью труда и продукцией на одного работника.
Решение. По данным табл. 4 зависимость между электровооруженностью труда и продукцией на одного работника выражается уравнением прямой:
,
где - выпуск готовой продукции;
- параметры уравнения регрессии,
- электровооруженность.
Таблица 4
Номер завода |
Электровоор-ть труда на 1 раб., Квт. ч. х |
Выпуск готовой продукции на 1 раб., тыс. руб. у |
ху |
|||
1 |
2 |
3 |
6 |
4 |
3,61 |
|
2 |
5 |
6 |
30 |
25 |
6,0 |
|
3 |
3 |
4 |
12 |
9 |
4,41 |
|
4 |
7 |
6 |
42 |
49 |
7,59 |
|
5 |
2 |
4 |
8 |
4 |
3,61 |
|
6 |
6 |
8 |
48 |
36 |
6,80 |
|
7 |
4 |
6 |
24 |
16 |
5,20 |
|
8 |
9 |
9 |
81 |
81 |
9,19 |
|
9 |
8 |
9 |
72 |
64 |
8,38 |
|
10 |
4 |
5 |
20 |
16 |
5,20 |
|
Итого |
50,0 |
60,0 |
343 |
304 |
60 |
|
В среднем |
5,0 |
6,0 |
34,3 |
30,4 |
6,0 |
Подставим в систему нормальных уравнений фактические данные из табл. 4:
Домножаем на 5 первое уравнение:
Параметры уравнения регрессии можно определить по формулам:
После определения параметров уравнения регрессии рассчитываем теоретическую линию регрессии путем подстановки значений х в уравнение связи:
Если параметры уравнения связи определены правильно, то , т. е. 60=60.
Окончательная проверка правильности расчета параметров уравнения связи производится подстановкой и в систему уравнений.
Используя уравнение связи , можно определить теоретическое значение для любой промежуточной точки.
Коэффициент регрессии уточняет связь между х и у. Он показывает на сколько единиц увеличится результативный признак при увеличении факторного признака на единицу.
Если значения признаков х и у заданы в определенном интервале (а-b), то для каждого интервала сначала определяют середину интервала а затем строят уравнение регрессии между ними.
Если связь между признаками у и х нелинейная и описывается уравнением параболы второго порядка, то
В данном случае задача сводится к определению неизвестных параметров: . Параметры находят по МНК, и система уравнений имеет вид:
Решая систему нормальных уравнений, определяют параметры параболы второго порядка.
Пример. В табл. 5 приведены данные о стаже рабочего и его выработке. Определить связь между стажем и выработкой рабочего.
Решение. Связь между стажем рабочего и выработкой криволинейная и выражается параболой второго порядка . Составляем систему нормальных уравнений по данным табл. 5.
Домножим первое уравнение на 5 и вычтем первое уравнение из второго:
Домножим второе на 6,08 и вычтем его из третьего уравнения.
Таблица 5
№ п/п |
Стаж, лет х |
Выработка, шт. в час у |
|||||||
1 |
9 |
9 |
81 |
729 |
6 561 |
81 |
729 |
9,0 |
|
2 |
8 |
9 |
64 |
512 |
4 096 |
72 |
576 |
8,3 |
|
3 |
4 |
5 |
16 |
64 |
256 |
20 |
80 |
5,3 |
|
4 |
2 |
3 |
4 |
8 |
16 |
6 |
12 |
3,5 |
|
5 |
5 |
6 |
25 |
125 |
625 |
30 |
150 |
6,1 |
|
6 |
3 |
4 |
9 |
27 |
81 |
12 |
36 |
4,4 |
|
7 |
7 |
6 |
49 |
343 |
2 401 |
42 |
294 |
7,7 |
|
8 |
2 |
4 |
4 |
8 |
16 |
8 |
16 |
35 |
|
9 |
6 |
8 |
36 |
216 |
1 296 |
48 |
288 |
6,9 |
|
10 |
4 |
6 |
16 |
64 |
256 |
24 |
96 |
5,3 |
|
Итого |
50 |
60 |
304 |
2 096 |
15 604 |
343 |
2 277 |
60 |
Уравнение А домножим на 4,5876 и вычтем из уравнения В.
Подставим и в первое уравнением вычислим параметр .
Уравнение связи тогда будет
.
Теоретическая линия регрессии:
и т. д.
Уравнение гиперболы. Если результативный признак с увеличением факторного признака возрастает (или убывает) не бесконечно, а стремится к конечному пределу, то применяется уравнение гиперболы:
Чтобы определить параметры уравнения гиперболы методом наименьших квадратов, необходимо привести его к линейному виду. Для этого производится замена переменных получается система уравнений:
Решая систему уравнений, определяются параметры уравнения гиперболы.
Уравнение степенной функции. Степенная функция
(31)
применяется в экономических исследованиях для характеристики слабо нелинейной связи между результативными и факторными признаками. Параметр имеет экономический смысл - это коэффициент эластичности. Он показывает, что с увеличением признака фактора на 1 % результативный признак увеличивается на %.
Для определения параметров степенной функции методом наименьших квадратов степенную функцию необходимо привести к линейному виду путем логарифмирования. В результате логарифмирования получим уравнение вида
Заменим
Запишем уравнение:
Строим систему нормальных уравнений:
Решая систему нормальных уравнений, определяем параметры и Переходя к первоначальным обозначениям определяем параметр
6. Множественная (многофакторная) регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т. е. требуется определить аналитическое выражение связи между результативным признаком у и факторными признаками , найти функцию:
Построение моделей множественной регрессии включает несколько этапов:
выбор формы связи (уравнения регрессии);
выбор факторных признаков;
3) обеспечение достаточного объема совокупности для получения несмещенных оценок.
Выбор формы связи затрудняется тем, что, используя математический аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций.
Выбор типа уравнения осложнен тем, что для любой формы зависимости выбирается целый ряд уравнений, которые в определенной степени будут описывать эти связи. Некоторые предпосылки для выбора уравнения регрессии получают на основе анализа предшествующих аналогичных исследований.
Наиболее приемлемым способом определения вида уравнения регрессии является метод перебора различных уравнений.
Сущность метода заключается в том, что большое число уравнений (моделей) регрессии реализуется на ЭВМ с помощью специально разработанного алгоритма перебора с последующей статистической проверкой, главным образом на основе t-критерия Стьюдента и F-критерия Фишера-Снедекора.
В практике построения многофакторных моделей взаимосвязи социально-экономических явлений используются пять типов моделей:
линейная:
(32)
степенная:
(33)
показательная:
(34)
параболическая:
(35)
гиперболическая:
(36)
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.
Проблема размерности модели связи, т. е. определение оптимального числа факторных признаков, является одной из основных проблем построения множественного уравнения регрессии. Модель размером более 100 факторных признаков сложно реализуема и требует больших затрат времени.
Существует несколько методов отбора факторных признаков для построения модели взаимосвязи. Один из методов - метод экспертных оценок - основан на интуитивно-логических предпосылках, содержательно-качественном анализе. Наиболее приемлемым способом отбора является шаговая регрессия. Сущность метода заключается в последовательном отборе факторов в уравнение регрессии и последующей проверке их значимости.
Сложность и взаимное переплетение отдельных факторов, обуславливающих исследуемое экономическое явление, могут проявляться в так называемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 () и др.
Устранение мультиколлинеарности может реализовываться через исключение из модели одного или нескольких линейно-связаных факторных признаков. На основе качественного и количественного анализов отбрасываются некоторые факторные признаки. Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности.
Пример. По данным табл. 6 о прибыли (y), затратах на 1 руб. произведенной продукции (х1) и стоимости основных фондов (х2) необходимо определить зависимость между признаками.
Таблица 6
№ п/п |
Затраты на 1 руб. произведенной продукции, коп. x1 |
Стоимость основных фондов млн. руб., x2 |
Прибыль, тыс. руб. y |
yx1 |
yx2 |
|||||
1 2 3 4 5 6 |
77 77 81 82 89 96 |
5,9 5,9 4,9 4,3 3,9 4,3 |
1 070 1 001 789 779 606 221 |
5 929 5 929 6 561 6 724 7 921 9 216 |
454,3 454,3 396,3 352,6 347,1 412,8 |
82 390 77 077 63 909 63 878 53 934 21 216 |
34,81 34,81 24,01 18,49 15,21 18,49 |
6 313,0 5 905,9 3 866,1 3 349,7 2 363,4 950,3 |
1 012,8 1 012,8 854,7 817,8 530,8 237,1 |
|
Итого |
502 |
29,2 |
4 466 |
42 280 |
2 418 |
362 404 |
145,82 |
22 748,4 |
4 466,0 |
Решение. По данным табл. 6 составим систему нормальных уравнений:
Таким образом,
[1, 7-11].
7. Оценка существенности связи
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.
Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента:
, (37)
где - дисперсия коэффициента регрессии.
Параметр модели признается статистически значимым, если
где б - уровень значимости статической существенности связи;
V = n - k - 1 - число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности.
Наиболее сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом:
1) приближенная оценка: ,
где - дисперсия результативного признака;
k - число факторных признаков в уравнении;
2) более точная оценка: ,
где - величина множественного коэффициента корреляции по фактору с остальными факторами.
Проверка адекватности всей модели осуществляется с помощью расчета F-критерия Фишера и величины средней ошибки аппроксимации З.
Значение F-критерия Фишера определяется по формуле:
, (38)
где - теоретические значения результативного признака, полученные по уравнению регрессии;
n - объем исследуемой совокупности;
k - число факторных признаков в модели.
Если Fp>Fб при б = 0,05 или б = 0,01, то уравнение регрессии соответствует или адекватно эмпирическим данным. Величина Fб определяется по специальным таблицам на основании величины б = 0,05 или б = 0,01 и числа степеней свободы V1 = k + 1 V2 = n - k - 1, где n - число наблюдений, k - число факторных признаков.
Значение средней ошибки аппроксимации
(39)
не должно превышать 12-15 %.
Интерпретация моделей регрессии начинается со статистической оценки. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак “+”, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком “-“, то с его увеличением результативный признак уменьшается. Интерпретация этих знаков полностью определяется социально-экономическим содержанием.
При анализе адекватности уравнения регрессии исследуемому процессу возможны следующие варианты:
1) если построенная модель после проверки по F-критерию Фишера в целом адекватна и все коэффициенты регрессии значимы, то она может быть использована для принятия решений к осуществлению прогнозов;
2) если модель по F-критерию Фишера адекватна, но часть коэффициентов регрессии незначима, то она пригодна для принятия некоторых решений, но не для производства прогнозов;
3) если модель по F-критерию Фишера адекватна, но все коэффициенты регрессии незначимы, то модель считается неадекватной и по ней не принимаются решения и не осуществляются прогнозы.
С целью расширения возможности экономического анализа используется частный коэффициент эластичности:
, (40)
где - среднее значение соответствующего факторного признака;
- среднее значение результативного признака;
- коэффициент регрессии при соответствующем факторном признаке.
Коэффициент эластичности показывает на сколько % в среднем изменится значение результативного признака при изменении факторного признака на 1 %.
Множественный коэффициент детерминации (RІ) представляет собой множественный коэффициент корреляции в квадрате, характеризует, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.
Для более точной оценки влияния каждого факторного признака на моделируемый используют Q-коэффициент:
, (41)
где - коэффициент вариации соответствующего факторного признака .
Литература
1. Теория статистики: Учебник / Под ред. проф. Р. А. Шмойловой. - М.: Финансы и статистика, 2007. - 560 с.
2. Практикум по теории статистики: Учеб. Пособие/ Под ред. Р. А. Шмойловой. - М.: Финансы и статистика, 2004. - 416 с.
3. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: ИНФРА-М.2002. - 387 с.
4. Ефимова М.Р., Петрова Е.В., румянцев В.Н. Общая теория статистики: Учебник. - М.:ИНФРА-М,2001. - 346 с.
5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности /Под ред. О. Э. Башиной, А. А Спирина. - М.: Финансы и статистика, 2003. - 298 с.
6. Экономическая статистика: Учебник/ Под ред. Ю. Н. Иванова. - М.: ИНФРА-М, 2007. - 480 с.
7. Гусаров В.М. Статистика: Учеб. Пособие для вузов. - М.: ЮНИТИ-ДАНА, 2003. - 463 с.
Подобные документы
Виды и формы связей между явлениями. Методы изучения взаимосвязи экономических явлений. Статистические методы изучения взаимосвязи. Метод аналитических группировок. Дисперсионный и корреляционно-регрессионный анализ. Непараметрические методы оценки связи.
курсовая работа [235,9 K], добавлен 10.12.2008Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014Виды и методы взаимосвязи. Виды взаимосвязи. Методы взаимосвязи. Аналитические группировки. Метод параллельных рядов. Балансовый метод. Корреляционно-регрессионный анализ. Графики, характеризующие связь социальных явлений.
курсовая работа [141,7 K], добавлен 26.03.2007Особенности построения статистических сводок и рядов распределения в экономическом исследовании. Практическое применение метода группировок при анализе кадрового состава современной организации. Этапы изучения взаимосвязей социально-экономических явлений.
курсовая работа [240,4 K], добавлен 20.01.2015Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.
контрольная работа [228,2 K], добавлен 02.04.2013Корреляционный и регрессионный приемы выявления связей между признаками. Оценка значимости параметров и взаимосвязи. Виды, формы (открытая, подавленная), способы измерения инфляции. Методология расчета и сезонной корректировки индекса потребительских цен.
курсовая работа [223,3 K], добавлен 25.08.2010Анализ обобщающих показателей и закономерностей социально-экономических явлений и процессов в конкретных условиях места и времени. Описание количественной стороны массовых социально-экономических явлений, отражаемых посредством показателей статистики.
контрольная работа [761,6 K], добавлен 22.01.2015Виды и формы связей социально-экономических явлений. Корреляционно-регрессионный анализ. Уравнение парной регрессии: экономическая интерпретация и оценка значимости. Качество однофакторных линейных моделей. Прогнозирование экономических показателей.
реферат [154,7 K], добавлен 19.12.2010Предмет, метод и организация статистики - науки, изучающей количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной. Причинность, регрессия, корреляция, как основные статистические методы выявления взаимосвязи.
учебное пособие [3,8 M], добавлен 05.02.2011Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.
курсовая работа [786,2 K], добавлен 15.03.2011