Парная нелинейная корреляционная зависимость в исследованиях экономических вопросов

Определение корреляционной зависимости между величинами. Характеристика значимости нелинейной корреляции для множественного уравнения парной регрессии. Оценка качества модели функции регрессии и её параметров. Изучение методов наименьших квадратов.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 26.04.2013
Размер файла 374,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Институт Экономики и Антикризисного управления

Кафедра Экономики и управления

Курсовая работа

По дисциплине: Статистика

Тема: Парная нелинейная корреляционная зависимость в исследованиях экономических вопросов

Москва, 2010

Введение

Величины, характеризующие различные свойства объектов, могут быть независимыми или взаимосвязанными. Различают два вида зависимостей между величинами (факторами): функциональную и статистическую.

При функциональной зависимости двух величин значению одной из них обязательно соответствует одно или несколько точно определенных значений другой величины. Функциональная связь двух факторов возможна лишь при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. Функциональная связь одной величины с множеством других возможна, если эта величина зависит только от этого множества факторов. В реальных ситуациях существует бесконечно большое количество свойств самого объекта и внешней среды, влияющих друг на друга, поэтому такого рода связи не существуют, иначе говоря, функциональные связи являются математическими абстракциями. Их применение допустимо тогда, когда соответствующая величина в основном зависит от соответствующих факторов.

При исследовании многие параметры следует считать случайными, что исключает проявление однозначного соответствия значений. Воздействие общих факторов, наличие объективных закономерностей в поведении объектов приводят лишь к проявлению статистической зависимости. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения других (другой), и эти другие величины принимают некоторые значения с определенными вероятностями. Функциональную зависимость в таком случае следует считать частным случаем статистической: значению одного фактора соответствуют значения других факторов с вероятностью, равной единице. Однако на практике такое рассмотрение функциональной связи применения не нашло.

Более важным частным случаем статистической зависимости является корреляционная зависимость, характеризующая взаимосвязь значений одних случайных величин со средним значением других, хотя в каждом отдельном случае любая взаимосвязанная величина может принимать различные значения.

Если же у взаимосвязанных величин вариацию имеет только одна переменная, а другая является детерминированной, то такую связь называют не корреляционной, а регрессионной. Например, при анализе скорости обмена с жесткими дисками можно оценивать регрессию этой характеристики на определенные модели, но не следует говорить о корреляции между моделью и скоростью.

При исследовании зависимости между одной величиной и такими характеристиками другой, как, например, моменты старших порядков (а не среднее значение), то эта связь будет называться статистической, а не корреляционной.

Корреляционная связь описывает следующие виды зависимостей:

- причинную зависимость между значениями параметров, "зависимость" между следствиями общей причины.

Корреляционная зависимость определяется различными параметрами, среди которых наибольшее распространение получили показатели, характеризующие взаимосвязь двух случайных величин (парные показатели): корреляционный момент, коэффициент корреляции.

Одной из типовых задач обработки статистических данных является определение количественной зависимости показателей качества объекта от значений его параметров и характеристик внешней среды.

Примером такой постановки задачи является установление зависимости между временем обработки запросов к базе данных и интенсивностью входного потока.

Время обработки зависит от многих факторов, в том числе от размещения искомой информации на внешних носителях, сложности запроса. Следовательно, время обработки конкретного запроса можно считать случайной величиной.

Но вместе с тем, при увеличении интенсивности потока запросов следует ожидать возрастания его среднего значения, т.е. считать, что время обработки и интенсивность потока запросов связаны корреляционной зависимостью.

1. Нелинейная корреляция

1. Нелинейная корреляция для парного уравнения регрессии.

Уравнение нелинейной регрессии, как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции:

Где:

Так как то индекс корреляции можно выразить как:

Величина данного показателя находится в границах: 0?R?1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадает с индексом корреляции:

y = a + b / x

Заменив 1/x на z, имеем линейное уравнение:

y = a + bx

Для которого может быть определен линейный коэффициент корреляции:

r = b z / y

Возводя данное выражение в квадрат, получим:

Преобразовывая далее, придем к следующему выражению для:

Следовательно:

Но так как:

и

Таким образом, приходим к формуле индекса корреляции:

Аналогично для других функций подобного вида, в которых образования в линейный вид не затрагивают зависимую переменную, и требование:

МНК

Требование выполнимо.

Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции. Например, степенная функция после перехода к логарифмически линейному уравнению:

Может быть найден линейный коэффициент корреляции не для фактических значений х и у, а для их логарифмов, то есть . Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, его логарифмов:

Между тем при расчете индекса корреляции корреляции используются суммы квадратов отклонений признака у, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, то есть у, как антилогарифм рассчитанной по уравнению величины lny и остаточная сумма квадратов как:

Индекс корреляции определяется по формуле:

В знаменателе расчета участвует сумма квадратов отклонений фактических значений у от их средней величины, а в расчете участвует:

Соответственно различаются числители рассматриваемых показателей:

В индексе корреляции:

- в коэффициенте корреляции. Необходимо также помнить, что если при линейной зависимости признаков сопряженные регрессии имеют один и тот же коэффициент корреляции, то есть , то при криволинейной зависимости они не равны, то есть . Так как в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.

Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции. Индекс детерминации используется для проверки существенности в целом уравнения линейной регрессии по F -критерию Фишера:

Где: n- число наблюдений,

m - число параметров при переменной х.

Величина m характеризует число степеней свободы для факторной суммы квадратов, а - число степеней свободы для остаточной суммы квадратов. Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации меньше индекса детерминации. Близость иx означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Если:

То предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия и , вычисленных по данным через t-критерий Стьюдента:

Где:

- ошибка разности между и .

Если tф > tт, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Если t < 2, то различия несущественны и, следовательно, возможно применение линейной регрессии.

2. Нелинейная корреляции для множественного уравнения регрессии

Для криволинейной зависимости, нелинейной по переменным индекс множественной корреляции равен совокупному коэффициенту корреляции.

Например, если для фирмы модель прибыли у имеет вид:

У = a + b1x1 + b2x2 + b3lnx3 + b4lnx4

Где:

х1 - удельные расходы на рекламу;

х2 - капитал фирмы;

х3 - доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х4 - процент увеличения объема продаж фирмы по сравнению с предыдущим годом. Тогда независимо от того, что фактор х1 задан линейно, а х2, х3, х4 - в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба-Дугласа:

Где:

P- объем продукции, L - затраты труда, К - величина капитала:

b1+b2=1

Логарифмируя ее, получим линейное уравнение в логарифмах:

Ln P = lna + b1lnL + b2lnK

Индекс детерминации для нелинейных по оцениваемым параметрам функции принять называть «квази R2» определения по функциям, использующим логарифмические преобразования (степенная, экспонента), необходимо найти сначала теоретические значения ln y, затем трансформировать их через антилогарифмы, то есть найти теоретические значения результативного признака и далее определять индекс детерминации как «квази R2» по формуле:

Величина индекса множественной корреляции, определенная как «квази R2» не будет совпадать с совокупным коэффициентом корреляции. Для того, чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции. Он содержит поправку на число степеней свободы и рассчитывается по формуле:

Где:

n - число наблюдений, m - число факторов.

Чем больше величина m, тем сильнее различия между .

Для линейной зависимость признаков скорректированный коэффициент корреляции определяется по той же формуле, что и индекс множественной корреляции. Отличие заключается лишь в том, что в линейной зависимости под m понимается число факторов, включенных в анализ, а в криволинейной зависимости это число параметров при х. Например, если:

y = f * ( x1 x2 )

То для линейной зависимости m = 2, а для регрессии вида:

у = a + b1x12+b12x1 + b2x2 +b22x22

Число параметров при х = 4, то есть m = 4.

3. Парная регрессия и корреляция

В математике мы привыкли к тому, что речь идет о функциональной зависимости, когда каждому значению одной переменной соответствует вполне определенное значение другой.

В экономике в большинстве случаев, между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной (или определенное условное распределение другой переменной). Такая зависимость получила название статистической, вероятностной.

Возникновение такой связи обусловлено тем, что зависимая переменная подвержена влиянию неконтролируемых или неучтенных факторов, а также случайными ошибками.

В силу неоднозначности статистической зависимости между и , представляет интерес усредненная по схема зависимости, т.е. закономерность в измерении условного математического ожидания (математическое ожидание случайной переменной , вычисленного в предположении, что переменная приняла значение ) в зависимости .

- независимая переменная, объясняющая, входная, предсказывающая, экзогенная, фактор, регрессор, факторный признак.

- зависимая переменная, функция отклика, объясняемая, выходная, результирующая, эндогенная переменная, результативный признак.

Нас интересует односторонняя зависимость случайной переменной от независимой переменной .

Определение: Когда каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой, то такая зависимость называется корреляционной.

Иначе, корреляционной зависимостью между двумя переменными называется функциональная зависимость между значениями одной и средним значением другой (условным математическим ожиданием), это уравнение называется модельным уравнением регрессии (или просто уравнением регрессии, или функцией регрессии, а её график - линией регрессии).

Для точного описания уравнения регрессии необходимо знать условный закон распределения переменной при условии, что переменная примет значение .

В статистической практике такой информации получить не удается, т.к. обычно имеется выборка пар значений объема .

В этом случае речь может идти о приближенном выражении, аппроксимации по выборке функции регрессии. Такой оценкой является выборочная линия (кривая) регрессии:

- условная средняя переменной при фиксированном значении ,

- параметры кривой.

При:

Должна сходиться по вероятности к функции регрессии .

Таким образом, эконометрическая модель имеет вид:

Где:

- наблюдаемое значение зависимой переменной,

- объясненная часть, зависящая от значений объясняющих переменных,

- случайная составляющая.

В многомерном случае, когда х - вектор, , где - могут считаться как случайными, так и детерминированными.

Итак, чтобы получить достаточно достоверные и информативные данные о распределении какой-либо случайной величины, необходимо иметь выборку её наблюдений достаточно большого объема. Такие выборки представляют собой наборы значений:

- количество объясняющих переменных.

Рассмотрим .

Парная регрессия - уравнение связи двух переменных .

Определение. Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки (выбора) вида модели, исходя из соответствующей теории связи между переменными.

Различают линейные и нелинейные регрессии. Нелинейные регрессии делят на два класса: регрессии, нелинейные относительно включенных объясняющих переменных, но линейных по оцениваемым параметрам, и, регрессии, нелинейные по оцениваемым параметрам.

Линейная:

Нелинейные по объясняющим параметрам:

Регрессии, нелинейные по оцениваемым параметрам:

Степенная:

Показательная:

Экспоненциальная:

Логарифмическая:

Полулогарифмическая:

Обратная:

Если у нас есть набор значений двух переменных то на плоскости эти значения можно отобразить точками, таким образом получаем поле корреляции, которое изображено на рис. 1.

Рис.1 - Поле корреляции:

Предположим, что нашей задачей является подобрать (подогнать) функцию из параметрического семейства функций , наилучшим способом описывающую зависимость y от x.

Подобрать функцию - это два шага:

1 шаг: спецификация модели,

2 шаг: выбрать наилучшие значения параметров и .

В качестве меры отклонения функции от набора наблюдений можно взять:

В общем случае:

Где:

- мера, с которой отклонение:

Входит в функционал .

Примером такой меры может служить функция Хубера, которая при малых отклонениях квадратична, а при больших линейна:

Наиболее употребительной является функция g вида 1.

4. Оценка значимости уравнения регрессии

Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.

Обозначим через:

Это теоретически вычисляемые по формуле значения, тогда:

Преобразуем формулу дисперсии с учетом вышеуказанной суммы:

Далее:

Так как имеет место равенство:

И из МНК следуют два соотношения:

То:

Введем обозначения:

TSS (total sum of sguares) - вся дисперсия: сумма квадратов отклонений от среднего.

RSS (regression sum of sguares) - объясненная часть всей дисперсии (обусловленная регрессией), факторная, объясненная дисперсия.

ESS (error sum of sguares) - остаточная сумма, дисперсия остаточная.

Определение.

Коэффициентом детерминации, или долей объясненной дисперсии называется:

В силу определения:

Если , то это означает, что регрессия ничего не дает, т.е. не улучшает качество предсказания , по сравнению с тривиальным .

Если , то лежат на линии регрессии и между и y существует линейная функциональная зависимость, т.е. абсолютно точное совпадение: .

Для линейной регрессии определяется коэффициент регрессии по формуле:

Тогда:

Так получившаяся формула есть дисперсия объясненная, факторная:

Отсюда, можно построить коэффициент (индекс корреляции ) для нелинейной регрессии:

Т.к. формулы для связи TSS, RSS, ESS мы получили в предположении что:

То при , полученная формула не будет справедливой.

5. Оценка качества модели

Оценку качества построенной модели можно определить через коэффициент (индекс) детерминации, а также с помощью средней ошибки аппроксимации.

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических в процентах:

Предел значений:

Считаем допустимым при построении модели.

Средний коэффициент эластичночти показывает, на сколько % в среднем по совокупности изменится результат от своей средней величины при изменении фактора на 1% от своего среднего значения:

- характеризует соотношение прироста результата и фактора для соответствующей формы связи.

Т.к., коэффициент Э не всегда const, то используем среднее значение - . В таблице представлены формулы эластичности для наиболее употребительных функций.

Таблица:

y

Иногда коэффициент Э экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах. Например, изменение роста заработной платы с ростом стажа работы на 1%.

Если линеаризация не затрагивает зависимую переменную, например:

То требование МНК:

Выполнимо, то (коэффициент корреляции совпадает с индексом корреляции), в этом легко убедиться.

Использование F-критерия:

С помощью F-критерия можно оценить качество построенной функции.

Поскольку при заданном объеме наблюдений (,) факторная сумма квадратов при линейной регрессии зависит только от одной константы - коэффициента регрессии , то говорят, что данная сумма квадратов имеет одну степень свободы.

К этому же выводу мы придем формальным путем, а именно:

Но свободный член:

Тогда:

При заданном наборе переменных и , расчетное значение является в линейной регрессии функцией только одного параметра . Соответственно факторная сумма квадратов отклонений имеет число степеней свободы равное 1.

Любая сумма квадратов отклонений связана с числом степеней свободы, т.е. с числом свободы независимого варьирования признака. Значит число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показывать, сколько независимых отклонений из возможных:

Требуется для образования данной суммы квадратов. Так для общей суммы квадратов:

Требуется независимое отклонение, ибо по совокупности из единиц после расчета среднего уровня , свободно варьируют лишь числом отклонений.

Например, имеем ряд 1, 2, 3, 4, 5. Среднее =3, тогда n отклонений от среднего: -2, -1, 0, 1, 2. Т.к.:

То свободно варьируют 4 отклонения, а пятое может быть определено, если 4 известны.

Число степеней свободы в левой и правой частях соотношения (*) должно совпадать, то число степеней свободы второго слагаемого должно быть равно (n - 2).

То есть:

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что тоже самое, дисперсию на одну степень свободы D:

Это приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточные дисперсии в расчете на одну степень свободы, получим величину F - отношения (F- критерия):

Где:

F- критерий для проверки нулевой гипотезы:

:

Если нулевая гипотеза справедлива, то и не отличаются друг от друга. Для необходимо опровержение, то есть, чтобы факторная дисперсия превышала остаточную в несколько раз.

- это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности.

F-критерий - это оценивание качества уравнения регрессии, которое состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого производится сравнение фактического и значений F критерия Фишера-Снедекора. определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

- это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - это вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно .

Если <, то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.

Если >, то - гипотеза не отклоняется и признается статистическая не значимость, ненадежность уравнения регрессии.

6. Интервальная оценка функции регрессии и её параметров

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается - критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью - критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки. Рассчитываются:

Уравнение регрессии:

Представимо в виде:

Стандартная ошибка:

Т.е. стандартная ошибка прогнозного значения зависит от ошибки и ошибки коэффициента регрессии. Для доказательства рассмотрим дисперсии:

Здесь учтено, что неслучайная (детерминированная) величина, при вынесении которой за знак дисперсии её необходимо возвести в квадрат,

Определим стандартную ошибку через остаточную дисперсию на одну степень свободы:

Сравнивая фактические и табличные значения - статистики и принимаем или отвергаем гипотезу . Установим связь между F-критерием Фишера и - статистикой Стьюдента:

Итак, очевидно

Следовательно: .

Т.о. проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

Если <, но отклоняется, т.е. не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора . Если >, то не отклоняется и признается случайная природа формирования или .

Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:

Тогда формула для расчета доверительных интервалов имеют следующий вид:

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, т.к. он не может одновременно принимать и положительное и отрицательное значения. Прогнозное значение определяется путем подстановки в уравнение регрессии:

Соответствующего прогнозного значения . Вычисляется средняя стандартная ошибка прогноза :

И строится доверительный интервал прогноза:

Рассмотренные формулы стандартных ошибок предсказываемого среднего значения при заданном характеризует ошибку положения линии регрессии, при , и возрастает при удалении от .

Но фактические значения варьируют около среднего , индивидуальные значения могут отклоняться на величину , дисперсия которой оценивается как остаточная дисперсия на одну степень свободы, поэтому ошибка предсказываемого индивидуального значения должна включать не только , но и случайную составляющую , или:

7. Метод наименьших квадратов

При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно случайной составляющей

- ненаблюдаемая величина. После того, как произведена оценка параметров модели, рассчитывая разности фактических и теоретических значений , можно определить оценки случайной составляющей . Поскольку они не являются реальными случайными остатками, их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения, т.е. . При изменении спецификации модели, добавлении в неё новых наблюдений, выборочные оценки остатков могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений , т.е. остатков.

До сих пор мы останавливались на формальных проверках статистической достоверности коэффициентов регрессии и корреляции с помощью - критерия Стьюдента, - критерия Фишера. Оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными.

Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Следовательно, при большом числе выборочных оцениваний, остатки не будут накапливаться и найденный параметр можно рассматривать как среднее значение из возможного большого числа несмещенных оценок.

Эффективность оценки - оценки, характеризующиеся наименьшей дисперсией.

Состоятельность оценок характеризует увеличение их точности с увеличением выборки.

Указанные критерии должны учитываться при разных способах оценивания. МНК строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии .

Исследования остатков предполагают проверку наличия следующих предпосылок МНК (т.е. при выполнении их получаются несмещенные эффективные и состоятельные оценки):

1. случайный характер остатков.

2. нулевая средняя величина , не зависящая от .

3. гомоскедастичность - дисперсия каждого одинакова для всех значений .

4. отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга.

5. остатки подчиняются нормальному распределению.

Если не все предпосылки выполняются, то следует корректировать модель. Рассмотрим все предпосылки.

1). На рис. ниже изображено поведение остатков в различных случаях:

Рисунок:

2). Эта предпосылка означает, что:

Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. Для моделей нелинейных относительно оцениваемых параметров и приводимых к линейному виду, например, логарифмированием, средняя ошибка равна нулю для логарифмов.

Вместе с тем несмещенность оценок регрессии означает независимость случайных остатков и . Строятся графики, если полоса, то независимы от , если график показывает зависимость, то модель неадекватна.

5). Предпосылка о нормальным распределении остатков позволяет проводить проверку параметров регрессии с помощью критериев и . Вместе с тем оценки регрессии, найденные с МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков.

Совершенно необходимы 3) и 4) предпосылки.

3). Для каждого фактора остатки имеют одинаковую дисперсию, если это условие не выполняется, то имеет место гетероскедастичность.

Рисунок:

Для каждого значения распределения остатков одинаковы и диапазон варьирования остатков меняется с переходом от одного значения к другому. Наличие гомо и гетероскедастичности можно видеть и по рассмотренным выше двум графикам зависимости остатков от .

Рисунок:

Итак, основные предпосылки регрессионного анализа:

1. В модели:

Возмущение есть величина случайная, а объясняющая переменная - величина детерминированная.

2. Математическое ожидание возмущения равно нулю.

3. Дисперсия возмущения постоянна.

Указывает на некоррелированность ошибок для разных наблюдений. Это условие часто нарушается в случае, когда данные являются временными рядами. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок.

4. Возмущение есть нормально распределенная случайная величина. В этом случае модель называется нормальной линейной регрессионной (CNLR model). Итак, мы хотим оценить и наилучшим способом. Что значит «наилучшим»? Например, найти в классе линейных (по ) несмещенных оценок наилучшую в смысле минимальной дисперсии.

Заметим, что когда такая оценка найдена, это вовсе не означает, что не существует нелинейной несмещенной оценки с меньшей дисперсией.

Заключение

корреляционный нелинейный уравнение

Любой показатель практически зависит от бесконечного количества факторов. Однако лишь ограниченное количество факторов действительно существенно воздействуют на исследуемый показатель. Доля влияния остальных факторов столь незначительна, что их игнорирование не может привести к существенным отклонениям в поведении исследуемого объекта. Выделение и учет в модели лишь ограниченного числа реально доминирующих факторов является важной задачей качественного анализа, прогнозирования и управления ситуаций.

Если в естественных науках большей частью имеют дело со строгими (функциональными) зависимостями, при которых каждому значению одной переменной соответствует единственное значение другой, то между экономическими переменными, в большинстве случаев, таких зависимостей нет, и дело имеют с корреляционными зависимостями.

Список литературы

1. Годин А. М. «Статистика» Донецк, 2007.

2. Дуброва Т.А. Статистические методы прогнозирования в экономике», МЭСИ, М.,2000.

3. Сиротина Т.П. Руководство по изучению дисциплины «Экономика и статистика» М., МЭСИ,2001.

4. Сиротина Т.П. «Экономика и статистика предприятия», М., МЭСИ, 2001.

5. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А. А. Эконометрия. - Новосибирск: Издательство СО РАН, 2005. - 744с.

6. Сиротина Т.П. Практикум по дисциплине «Экономика и статистика предприятия» МЭСИ, М.,2001.

7. Зарубин В. С., Крищенко А. П. «Математическая статистика». М.: МГТУ Баумана, 2002.

8. Иванов Ю. Н. «Экономическая статистика». М.: Инфра-М, 2002.

Размещено на Allbest.ru


Подобные документы

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Уравнение нелинейной регрессии и вид уравнения множественной регрессии. Преобразованная величина признака-фактора. Преобразование уравнения в линейную форму. Определение индекса корреляции и числа степеней свободы для факторной суммы квадратов.

    контрольная работа [501,2 K], добавлен 27.06.2011

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.

    контрольная работа [222,5 K], добавлен 08.05.2014

  • Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.

    курсовая работа [449,1 K], добавлен 22.01.2015

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.