Корреляционно-регрессионный анализ
Сущность и содержание, назначение и задачи корреляционного и регрессивного анализа, особенности и инструментарий их практического применения. Параметры уравнения парной линейной регрессии. Корреляционная связь между признаками, ее направление и значение.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 16.01.2012 |
Размер файла | 452,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Введение
Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. Сейчас очень трудно назвать ту сферу, в которой она бы не использовалась. Ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных.
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
1. Теоретический аспект изучения корреляционно-регрессионного анализа
Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак.
Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).
Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель - это аналог, условный образ (изображение, описание, схема, чертёж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий «оригинал». Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, даёт возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение и модели в виде функциональных уравнений используют для расчёта средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов.
По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).
В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.
Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ). Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного анализа х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.
Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типов функции может опираться на теоретические знания об изучаемом явлении, опят предыдущих аналогичных исследований, или осуществляться эмпирически - перебором и оценкой функций разных типов и т.п.
При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчётов преобразуют (путём логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет вид:
y = a0 + a1x, (1)
где y - теоретические значения результативного признака, полученные по уравнению регрессии;
a0, a1 - коэффициенты (параметры) уравнения регрессии.
Поскольку a0 является средним значением у в точке х=0, экономическая интерпретация часто затруднена или вообще невозможна.
Коэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак a1 указывает направление этого изменения.
Параметры уравнения a0, a1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных y:
(yi - y)2 = (yi - a0 - a1xi)2 min (2)
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
(3)
(4)
Запишем эту систему в общем виде:
(5)
(6)
Или (7)
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
(8)
Определив значения a0, a1 и подставив их в уравнение связи y = a0 + a1x, находим значения y, зависящие только от заданного значения х.
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции - параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.
Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия
(9)
Для параметра a0:
(10)
Для параметра a1:
(11)
где n - объём выборки;
- среднее квадратическое отклонение результативного признака от выравненных значений y;
или (12) или (13)
- среднеквадратическое отклонение факторного признака x от общей средней.
Вычисленные по вышеприведенным формулам значения сравнивают с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости б и числом степеней свободы вариации
(14)
В социально-экономических исследованиях уровень значимости б обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч> tтабл. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.
Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением зэ, когда д2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней:
(15)
Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения - теоретическое.
Теоретическое корреляционное отношение з представляет собой относительную величину, получающуюся в результате сравнения среднеквадратического отклонения выравненных значений результативного признака д, то есть рассчитанных по уравнению регрессии, со среднеквадратическим отношением эмпирических (фактических) значений результативности признака у:
(16)
Где (17)
Тогда (18)
Изменение значения з объясняется влиянием факторного признака.
В основе расчёта корреляционного отношения лежит правило сложения дисперсий, то есть
(19)
где - отражает вариацию у за счёт всех остальных факторов, кроме х, то есть являются остаточной дисперсией:
(20)
Тогда формула теоретического корреляционного отношения примет вид:
(21)
Или (22)
Подкоренное выражение корреляционного выражения представляет собой коэффициент детерминации (мера определенности, причинности).
Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора.
Теоретическое корреляционное выражение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.
Как видно из вышеприведенных формул корреляционное отношение может находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи - линейный коэффициент корреляции:
(23)
где n - число наблюдений.
Для практических вычислений при малом числе наблюдений (n?20ч30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:
(24)
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1? r ? 1.
Отрицательные значения указывают на обратную связь, положительные - на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 - связь функциональная.
Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0?r2?1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции.
Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента корреляции r используется для оценки формы связи.
Значения з и r совпадают только при наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов з и r не превышает 0,1, то гипотезу о прямолинейной форме связи можно считать подтвержденной. В моем случае наблюдается примерное совпадение линейного коэффициента детерминации и теоретического корреляционного отношения, что дает мне основание считать связь между капиталом банков и их работающими активами прямолинейной.
Показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.
Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.
При линейной однофакторной связи t-критерий можно рассчитать по формуле:
(25)
где (n - 2) - число степеней свободы при заданном уровне значимости б и объеме выборки n.
Полученное значение tрасч сравнивают с табличным значением t-критерия (для б = 0,05 и 0,01). Если рассчитанное значение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (то есть отклоняется гипотеза о его случайности).
После проверки адекватности, установления точности и надежности построенной модели (уравнения регрессии), ее необходимо проанализировать. Прежде всего нужно проверить, согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).
Для удобства интерпретации параметра a1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:
(26)
Таким образом, мы рассмотрели все теоретические аспекты корреляционно-регрессионного анализа. Во второй главе курсовой работы исследуем практическое применение корреляционно - регрессионного статистического метода.
корреляционный связь регрессивный уравнение
2. Применение корреляционно-регрессионного метода на практике
Корреляционная связь между признаками проявляется не в индивидуальных случаях, а в массе случаев в среднем при большом числе наблюдений в форме тенденции.
Признаки по их значению в таких взаимосвязях делятся на два класса: признаки, обусловливающие изменение других, связанных с ними признаками, называются факторными (или экзогенными переменными), или просто факторами, а признаки, изменяющиеся под действием первых, факторных, называются результативными (или эндогенными переменными).
Статистическая связь двух признаков x и y называется парной корреляцией. Влияние же нескольких факторов на результативный признак y называется множественной корреляцией.
По направлению выделяются прямые и обратные связи (положительные и отрицательные корреляции):
ь при прямых связях с увеличением признака x увеличивается и признак y (например, автоматизация труда способствует росту рентабельности производства),
ь при обратных - с увеличением признака x признак y уменьшается (так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции).
Для установления наличия корреляционной связи и формы регрессионной зависимости в случае парной корреляции широко используется графический метод построения диаграммы рассеяния, являющейся геометрическим местом точек с абсциссами, определяющимися значениями факторной переменной, и ординатами, которые определяются соответствующими значениями зависимой, результативной, переменной.
В качестве примера построим диаграмму рассеивания оценок 10 учащихся по математике и физике. В таблице 2.1. приведены баллы успеваемости школьников.
Таблица 2.1. Баллы успеваемости школьников
школьник |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
|
Математика |
50 |
58 |
14 |
40 |
70 |
96 |
80 |
24 |
40 |
62 |
|
Физика |
50 |
56 |
28 |
42 |
62 |
76 |
70 |
34 |
46 |
56 |
Рисунок 2.1
По диаграмме видно, что связь между x и y прямая, т.е. корреляция - положительная, а так как точки диаграммы лежат на прямой линии, между признаками имеется положительная линейная корреляция.
Другой пример. Диаграмма (рис. 2.2), построенная на основании таблицы успеваемости (таблица 2.2), изображает наличие отрицательной корреляции между значениями параметров.
Таблица 2.2
школьник |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
|
Математика |
26 |
34 |
8 |
48 |
96 |
26 |
62 |
16 |
78 |
38 |
|
Литература |
58 |
48 |
90 |
38 |
14 |
62 |
28 |
76 |
20 |
48 |
Диаграмма рассеивания приведена на рис. 2.2.
Рисунок 2.2
Но, поскольку точки на графике не лежат на прямой, связь между параметрами не является линейной.
Таблица 2.3. Баллы успеваемости школьников
школьник |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
|
Математика |
21 |
63 |
42 |
75 |
12 |
97 |
49 |
71 |
37 |
95 |
|
Физкультура |
41 |
25 |
21 |
62 |
89 |
21 |
52 |
89 |
72 |
91 |
Рисунок 2.3
Следующая диаграмма рассеяния (рис. 2.3), построенная по данным таблицы 2.3, отображает отсутствие корреляции между параметрами.
В качестве грубой количественной оценки корреляции используется коэффициенты корреляции рангов Спирмена и Кендалла, меняющиеся от -1 до +1, и чем ближе они по модулю к 1, тем теснее зависимость.
Ранг - это порядковый номер единицы совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении: либо от меньших значений к большим, либо наоборот.
Идея использования ранговых коэффициентов состоит в следующем: если проранжировать совокупность по двум признакам, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь.
Ранговый коэффициент Спирмена рассчитывается согласно формуле:
(27)
Где - сумма квадратов разностей рангов,
- разность рангов каждой пары значений x и y,
n - общее число вариант, имеющих оба признака (число наблюдений).
Ранговый коэффициент корреляции Кендалла использует несколько другую методику вычислений и определяется согласно формуле:
(28)
Здесь - сумма положительных и отрицательных баллов (фактическая сумма рангов), где P - общая сумма числа рангов для каждого значения более высокого порядка (эти баллы учитываются со знаком «плюс»), Q - общая сумма числа рангов следующих для каждого значения , меньших по значению (эти баллы учитываются со знаком «минус»).
Рассмотрим методику вычислений обоих ранговых коэффициентов на примере измерения тесноты связи между объёмом выпуска продукции (y, млн руб.) и стоимостью основных производственных фондов (x, млн руб.) по данным 10 предприятий.
Расчет необходимых показателей (графы 3 - 8) на основе исходных данных (графы 1 и 2) дается в следующей таблице:
Таблица 2.4. Расчет ранговых коэффициентов
Х |
У |
Nx |
Ny |
D= Nx - Ny |
D2 |
Подсчет баллов |
||
+ |
- |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1,5 |
3,9 |
1 |
3 |
-2 |
4 |
7 |
2 |
|
1,8 |
4,4 |
2 |
5 |
-3 |
9 |
5 |
3 |
|
2 |
3,8 |
3 |
2 |
1 |
1 |
6 |
1 |
|
2,2 |
3,5 |
4 |
1 |
3 |
9 |
6 |
0 |
|
2,3 |
4,8 |
5 |
6 |
-1 |
1 |
4 |
1 |
|
2,6 |
4,3 |
6 |
4 |
2 |
4 |
4 |
0 |
|
3 |
7 |
7 |
9 |
-2 |
4 |
1 |
2 |
|
3,1 |
6,5 |
8 |
8 |
0 |
0 |
1 |
1 |
|
3,5 |
6,1 |
9 |
7 |
2 |
4 |
1 |
0 |
|
3,8 |
8,2 |
10 |
10 |
0 |
0 |
- |
- |
|
- |
- |
- |
- |
- |
SD2=36 |
Р=35 |
Q=-10 |
Коэффициент корреляции рангов Спирмена получается равным
Для расчета коэффициента корреляции рангов Кендэлла находим общую сумму баллов (эти баллы даны в графах 7 и 8): S = P + Q = 35 + (-10) = 25.
Тогда ранговый коэффициент Кендалла равен
Следует заметить, что коэффициент Кендалла всегда меньше, чем коэффициента Спирмена, так как .
Если значения, или точки, диаграммы рассеяния расположены строго на прямой или лежат на линии, приближающейся к прямой, то для установления тесноты парной связи используется линейный коэффициент корреляции (или называемый просто коэффициент корреляции).
Эмпирическая (т.е. выборочная) оценка этой характеристики вычисляется по следующим формулам:
(29)
Здесь черта сверху означает операцию среднего арифметического:
Величина
(30)
называется ковариацией и обозначается как cov (x, y).
Величину выборочного коэффициента корреляции следует считать достаточной для статистического обоснованного вывода о наличии корреляционной связи между исследуемыми переменными, если будет выполнено условие:
(31)
Где - табличное значение квантили распределения Стьюдента с (n - 2) - мя степенями свободы и уровнем значимости, равным a/2.
В альтернативном случае неравенства принимается гипотеза об отсутствии корреляционной связи.
Доверительный интервал для теоретического (т.е. истинного) коэффициента корреляции r заключен в пределах:
th z1 < r< th z2,
где
- квантиль нормального распределения с уровнем значимости a/2, причем величина
(32)
находится при заданном по таблицам z-преобразования Фишера (или прямым вычислением).
По данным n = 39 предприятий получен коэффициент корреляции =-0,654, характеризующий тесноту связи между себестоимостью продукции (y) и производительностью труда (x). Найти доверительную оценку для r, задавшись 95%-й доверительной вероятностью (или 5%-м уровнем значимости).
Из таблиц z-преобразования Фишера (или прямым вычислением)
находим z = - 0,7823.
Тогда получим
Далее, по таблицам z-преобразования Фишера, но уже по значениям: функции и находим аргументы и = - 0,756, = - 0,420.
Таким образом, можно утверждать, что с доверительной вероятностью P = 95% истинное значение коэффициента корреляции r между себестоимостью продукции (y) и производительностью труда x будет лежать в интервале от - 0,756 до - 0, 420.
Парная и множественная регрессия. Показатели измерения тесноты связи
Уравнение регрессии - это уравнение, описывающее в функциональной форме корреляционную связь между результативным признаком y и факторным признаком одним x (называемое уравнением парной регрессии y на x) или несколькими(называемое уравнением множественной регрессии y на)
Линейное парное уравнение регрессии имеет вид:
(33)
Оценка параметров регрессии a, b и c осуществляется методом наименьших квадратов (МНК), суть которого заключается в минимизации суммы квадратов отклонений фактических значений результативного признакаот теоретических, полученных по уравнению регрессии:
(34)
В случае парной линейной регрессии для определения параметров а и b по методу МНК получается система нормальных уравнений
(35)
(36)
из которой, используя правило Крамера, получаются следующие оценки параметров:
(37)
(38)
Параметр b можно выразить через коэффициент корреляции следующим образом:
(39)
Для определения параметров гиперболической функции система нормальных уравнений следующая:
(40)
(41)
Для определения параметров параболы второго порядка система нормальных уравнений имеет вид:
(42)
(43)
(44)
Для 10 случайно выбранных студентов одного института даны пары значений, где - число пропущенных занятий по условной дисциплине, - оценка на экзамене по той же дисциплине. Вычислить коэффициент корреляции с оценкой его статистической значимости и построить уравнение парной линейной регрессии.
Представим данные в первой и второй графах следующей таблицы:
Таблица 2.5. Выборка студентов с данными о значениях признаков
№ наблюдения |
Xi |
Yi |
Xi2 |
Xi Yi |
Yi2 |
ei |
ei2 |
(yср.* )2 |
(yi - )2 |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
1 |
3 |
4 |
9 |
12 |
16 |
3.8238 |
0.1762 |
0.03104 |
0.17978 |
0.36 |
|
2 |
4 |
3 |
16 |
12 |
9 |
3.4978 |
0.4978 |
0.2478 |
0.0960 |
0.16 |
|
3 |
1 |
5 |
1 |
5 |
25 |
4.4758 |
0.5242 |
0.27479 |
1.15778 |
2.56 |
|
4 |
2 |
4 |
4 |
8 |
16 |
4.1498 |
-0.1498 |
0.02244 |
0.5622 |
0.36 |
|
5 |
10 |
2 |
100 |
20 |
4 |
1.5418 |
0.4582 |
0.20995 |
3.45212 |
1.96 |
|
6 |
6 |
3 |
36 |
18 |
9 |
2.8458 |
0.1542 |
0.02378 |
0.30692 |
0.16 |
|
7 |
2 |
4 |
4 |
8 |
16 |
4.1498 |
-0.1498 |
0.02244 |
0.5622 |
0.36 |
|
8 |
5 |
3 |
25 |
115 |
9 |
3.1718 |
-0.1718 |
0.02952 |
0.05198 |
0.16 |
|
9 |
3 |
4 |
9 |
12 |
16 |
3.8328 |
0.1762 |
0.03106 |
0.17978 |
0.36 |
|
10 |
7 |
2 |
49 |
14 |
4 |
2.5198 |
-0.5198 |
0.27019 |
0.77475 |
1.96 |
|
Итого |
43 |
34 |
253 |
124 |
124 |
34.002 |
0 |
1.0163 |
7.237 |
8.4 |
Для выборочных оценок средних и дисперсий рядов признаков x и y имеем следующие значения: = 43/10 = 4,3, = 34/10 = 3,4, = =(253/10) - 4,32 = 6,81, = (124/10) - 3,42 = 0,84
Тогда выборочный коэффициент корреляции будет равен:
= = [(124/10) - 4,3Ч3,4] / = (124/10) - 4,3Ч3,4)/(2,6096Ч0,9165) = - 0,928.
Корреляционная связь является статистически значимой при уровне значимости a = 0,95, т.к. выполнено неравенство:
к к = 0,928 = 7,04 > = 2,31.
Для выборочного уравнения парной линейной регрессии = получаются следующие значения оценок параметров:
= - 0,326, 4,802.
Значения приведены в 6-й графе таблицы. Статистическая значимость фактора регрессии д-y) демонстрируется таблицей результатов дисперсионного анализа (так называемого F-теста), используя при этом итоговые значения граф 8, 9 и 10 предыдущей таблицы:
Таблица 2.6. Таблица результатов дисперсионного анализа
Источник дисперсии |
Показатель дисперсии сумма квадратов |
Число степеней свободы |
Несмещенная дисперсия |
Результаты F-теста |
|
Регрессия |
S (-yср.)2=7,237 |
k-1=1 |
7.237/1=7.237 |
F=7.237/0.149=49.9 |
|
Не обусловленная регрессией |
S(-y)2=1.163 |
n-k=8 |
1.163/8=0.145 |
F=9.95/1.8=5.32 |
|
Общая дисперсия |
S(yi-yср)=8,4 |
n-1=9 |
8.4/9=0.933 |
Мы рассмотрели применение корреляционно-регрессионного анализа на практических примерах.
Заключение
Корреляционный и регрессионный анализ позволяет определить зависимость между факторами, а так же проследить влияние задействованных факторов. Эти показатели имеют широкое применение в обработке статистических данных для достижения наилучших показателей.
Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемую обработку биржевых ставок. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак статистической обработки биржевых ставок. Если факторный признак имеет плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Список литературы
1. Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. - 2-е изд., перераб. и доп. - М.: ЮНИТИ-ДАНА, 2007.
2. Еремина Н.М., Маршалова В.П. Статистика: Учебник. - М.: Финансы и статистика, 2008.
3. Кожухарь Л.И. Основы общей теории статистики. - М.: Финансы и статистика, 2010.
4. Козлов А.Ю., Мхитарян В.С., Шишов В.Ф. Статистические функции MS Excel в экономико-статистических расчетах: Учеб. пособие для вузов/ Под ред. проф. В.С. Мхитаряна. - М.: ЮНИТИ - ДАНА, 2005.
5. Колесникова И.И. Социально-экономическая статистика: Учеб. пособие. - М.: Новое Издание, 2007.
6. Курс социально-экономической статистики: Учебник для вузов / Под ред. проф. М.Г. Назарова. - М.: ОМЕГА-Л, 2006.
7. Лукасевич И.Я. Анализ статистических расчетов. Методы, модели, техника вычислений: Учебн. пособие для вузов. - М.: Финансы, ЮНИТИ, 2008.
8. Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учеб. пособие. - М.: Финансы и статистика, 2008.
9. Мелкумов Я.С. Социально-экономическая статистика: Учебно-методическое пособие. - М.: ИМПЭ-ПАБЛИШ, 2005.
10. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник/ Под ред. О.Э. Башиной, А.А. Спирина. - М.: Финансы и статистика, 2005.
11. Попов Л.А. Анализ и моделирование статистических показателей показателей: Учебник. - М.: Финансы и статистика. 2009.
12. Пудова Н.В. Статистика рынка: Учебное пособие. - М.: Изд-во Рос. Экон. Акад., 20062.
13. Статистика: Учебник / Под. ред. Е.В. Заровой, Г.И. Чудилина. - М.: Финансы и статистика, 2006.
14. Салин В.Н., Медведев В.А., Кудряшова С.И., Шпаковская. Е.П. Микроэкономическая статистика: Учеб. пособие. - М.: Дело, 2009.
15. Салин В.Н., Чурилова Э.Ю. Практикум по курсу «Статистика» (в системе STATISTICA). - М.: Социальные отношения, Перспектива, 2007.
16. Салин В.Н., Шпаковская Е.П. Социально-экономическая статистика: Учебник. - М.: Юристъ, 2008.
17. Социальная статистика: Учебник/ Под ред. чл. - корр. РАН И.И. Елисеевой. - М.: Финансы и статистика, 2006.
18. Социально-экономическая статистика: учебник для вузов (Под ред проф. Б.И. Башкатова. - М.: ЮНИТИ - ДАНА, 2008.
Размещено на Allbest.ru
Подобные документы
Основные черты, задачи и предпосылки применения корреляционно-регрессионного метода. Методы корреляционного и регрессионного анализа. Коэффициент ранговой корреляции Кендалла, Спирмена, Фехнера. Определение тесноты взаимосвязи между показателями.
контрольная работа [558,5 K], добавлен 08.04.2013- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Эконометрическое изучение и анализ производственных затрат и себестоимости зерна. Многофакторный корреляционно-регрессионный анализ. Параметры парной регрессии и корреляции. Автокорреляция временного ряда и в остатках, расчет критерия Дарбина-Уотсона.
курсовая работа [234,8 K], добавлен 21.01.2011Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.
курсовая работа [290,2 K], добавлен 29.11.2011Направление деятельности ОАО "Татнефть", его место на рынке. Система управления компанией. Исследование зависимости прибыли от совокупных активов компании методом корреляционно-регрессионного анализа. Анализ и прогнозирование деятельности предприятия.
курсовая работа [600,9 K], добавлен 30.10.2011Обработка данных лесной промышленности: получение распределения случайной величины, проверка гипотезы, проведение дисперсионного, корреляционного и регрессивного анализа. Сущность и содержание, особенности применения теории принятия решений, ее принципы.
контрольная работа [314,2 K], добавлен 12.02.2013Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Корреляционно-регрессионный анализ как объект статистического изучения, система статистических показателей, его характеризующих. Особенности и принципы применения метода корреляционно-регрессионного анализа. Построение статистического ряда распределения.
курсовая работа [453,1 K], добавлен 28.01.2014