Эконометрика и ее методы
Понятие парной и множественной регрессии. Суть метода наименьших квадратов для линейной регрессионной модели. Определение коэффициентов корреляции и эластичности. Средняя ошибка аппроксимации. Виды временных рядов. Гетероскедастичность случайных ошибок.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 08.02.2022 |
Размер файла | 464,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Эконометрика
1. Дайте понятие эконометрики. Расскажите о связи эконометрики с другими областями знаний
Эконометрика как наука возникла в первой половине 20-го века в результате активного использования для решения задач экономической теории математических и статистических методов. В дословном переводе слово эконометрика означает «экономические измерения». Это очень широкое толкование данного понятия. Как правило, термин эконометрика применяется в более узком смысле. А именно, эконометрика - это наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей.
Можно сказать, что главной задачей эконометрики является количественная оценка имеющихся взаимосвязей между экономическими явлениями и процессами, которая распадается на составные части: - построение эконометрических моделей, оценивание параметров моделей, проверка гипотез о свойствах экономических показателей и формах их связи.
Закономерности в экономике выражаются в виде зависимостей экономических показателей и математических моделей их поведения. Такие зависимости и модели могут быть получены только путем обработки реальных статистических данных, с учетом внутренних связей и случайных факторов.
Экономические явления взаимосвязаны и взаимообусловлены. Следствием этого является то, что значения соответствующих экономических показателей изменяются во времени с учетом этих взаимосвязей. Так, например, известно, что совокупный спрос зависит от уровня цен, потребление - от располагаемого дохода, инвестиции - от процентной ставки и так далее.
В основе любого эконометрического исследования лежит построение экономико-математической модели, адекватной изучаемым реальным экономическим явлениям и процессам. Процесс построения эконометрических моделей начинается с качественного исследования проблемы методами экономической теории, формулируются цели исследования, выделяются факторы, влияющие на изучаемый показатель, и формулируются предположения о характере предполагаемой зависимости.
Основным методом исследования в эконометрике является метод экономико-математического моделирования. Правильно построенная модель должна давать ответ на вопрос о количественной оценке величины изменения изучаемого явления или процесса в зависимости от изменений внешней среды. Например, как скажется увеличение или уменьшение уровня инвестиций на совокупном валовом продукте, какие дополнительные ресурсы понадобятся для запланированного увеличения выпуска продукции и т. п.
Практическая значимость эконометрики определяется тем, что применение ее методов позволяет выявить реально существующие связи между явлениями, дать обоснованный прогноз развития явления в заданных условиях, проверить и численно оценить экономические последствия принимаемых управленческих решений.
2. Какая регрессионная модель называется парной?
Регрессией в теории вероятностей и математической статистике принято называть зависимость среднего значения какой-либо величины y от некоторой другой величины или от нескольких величин хi.
Парной регрессией называется модель, выражающая зависимость среднего значения зависимой переменной y от одной независимой переменной х
y? = f(x) (1)
где у - зависимая переменная (результативный признак); х - независимая, объясняющая переменная (признак-фактор). Парная регрессия применяется, если имеется доминирующий фактор, обуславливающий большую долю изменения изучаемой объясняемой переменной, который и используется в качестве объясняющей переменной.
Используя уравнение регрессии (1), соотношение между значениями переменными у и х (модель связи) можно записать как
y = f(x)+е (2)
Наличие случайного члена е (ошибка модели) связано с воздействием на зависимую переменную других неучтенных в уравнении факторов, с возможной нелинейностью модели и ошибками измерения. Величина е представляет собой случайную величину, удовлетворяющую определенным предположениям. По виду аналитической зависимости различают линейные и нелинейные регрессии.
Линейная парная регрессия описывается уравнением y? = a+b·x.
Примеры наиболее часто используемых нелинейных регрессий:
- полиномы разных степеней y? = a+b1·x + b2·x2+ b3·x3,
- степенная y? = a·b·x,
- равносторонняя гипербола y? = a+b·x,
- логистическая y? = K1+ae-b·x
- экспоненциальная y? = ae+b·x,
- показательная y? = a·b·x,
3. В чем суть традиционного метода наименьших квадратов (МНК) для линейной регрессионной модели?
Наиболее часто используется линейная форма зависимости - y? = a·b·x
Построение линейной регрессии сводится к нахождению оценок ее параметров - a и b. Оценки параметров линейной регрессии могут быть найдены различными методами.
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК), позволяющем получить такие оценки a и b, при которых сумма квадратов отклонений фактических значений результативного признака Y от расчетных (теоретических)
, (3)
была бы минимальной. С учетом вида линейной парной регрессии (2) величина R(a,b) является функцией неизвестных параметров а и b. Следовательно, оптимальные значения параметров а и b удовлетворяют условиям (необходимые условия экстремума)
(4)
Значения yi и xi нам известны, это данные наблюдений. Используя необходимое условие существования экстремума функции R(a,b) (4), получим следующую систему линейных уравнений относительно а и b:
Откуда, после некоторых преобразований получается система нормальных уравнений метода наименьших квадратов
(5)
Используя соотношения nx=Уxi, ny=Уyi, nx2=Уx2i, nyx=Уyixi из (5) и, сократив уравнения на число n, получим систему
Откуда следуют следующие выражения для определения параметров а и b
a=y-bx (6)
b=xy-yx/x2-x2
Коэффициент b из (6) есть угловой коэффициент регрессии, он показывает, на сколько единиц в среднем изменяется переменная у при увеличении независимой переменной х на единицу. Например, допустим, что зависимость между затратами (тыс. руб.) и объемом выпуска продукции описывается соотношением
y = 23000+0,47·x.
В этом случае увеличение объема выпуска на 1 единицу потребует дополнительных затрат на 470 рублей. Постоянная а дает прогнозируемое значение зависимой переменной при х = 0. Это может иметь смысл в зависимости от того, как далеко находится х = 0 от выборочных значений х. В других случаях, параметр a может не иметь экономической интерпретации.
регрессия корреляция аппроксимация гетероскедастичность
4. Какие методы оценки параметров линейных эконометрических моделей Вы знаете?
Одним из основных методов оценки регрессионных моделей является метод наименьших квадратов - это статистический метод нахождения оценок параметров генеральной совокупности. В случае линейных связей, когда наблюдения содержат лишь случайные ошибки (без систематических), то оценки, полученные с помощью метода наименьших квадратов, являются линейными функциями от наблюдаемых значений. Они называются несмещенными. Если ошибки наблюдения независимы и подчиняются нормальному распределению, то метод наименьших квадратов даёт оценки с наименьшей дисперсией, то есть эти оценки являются эффективными. В этом и состоит преимущество данного метода оценки регрессных моделей от всех остальных методов, поскольку он позволяет находить несмещенные оценки.
В то же время обычный метод наименьших квадратов, примененный к каждому уравнению эконометрической модели изолированно, может привести и к несостоятельным оценкам. В этом случае для оценивания параметров эконометрической модели применяют специальные методы одновременного оценивания. Наиболее используемыми методами одновременного оценивания эконометрической модели являются двухшаговый и трёхшаговый методы наименьших квадратов. Однако если распределение случайных ошибок существенно отличается от нормального, то метод наименьших квадратов может и не быть наилучшим. В этом случае можно использовать метод максимального правдоподобия и метод моментов.
Оценка линейных эконометрических моделей с помощью метода максимального правдоподобия производится на основе общего оценивания неизвестных параметров распределения. Оценки методом максимального правдоподобия - это те значения параметров, которые отвечают максимуму совместной плотности или функции правдоподобия. Но для малых объёмов выборки данный метод не применим, поскольку если параметры модели имеют эффективную оценку, то она совпадает с оценкой метода максимального правдоподобия.
Метод моментов - один из общих методов оценивания неизвестных параметров распределения. Суть его заключается в том, что некоторые моменты генеральной совокупности как функция неизвестных параметров приравниваются к соответствующим выборочным моментам, после чего система уравнений решается относительно неизвестных параметров. Полученные значения называют оценками метода моментов. Доказывается, что метод моментов может привести к состоятельным оценкам.
5. Какие существуют показатели качества регрессии?
Качеством модели регрессии называется адекватность построенной модели исходным (наблюдаемым) данным. Для оценки качества модели регрессии используются специальные показатели.
Основные показатели качества:
1. Коэффициент детерминации R2.
2. Значение F-статистики.
3. Коэффициент корреляции rxy.
4. Сумма квадратов остатков (RSS).
5. Стандартная ошибка регрессии Se.
6. Средняя ошибка аппроксимации.
Коэффициент R2 показывает долю объясненной вариации зависимой переменной:
Используется для предварительной оценки качества модели и как основа для расчета других показателей
Отношение объясненной части D(y) дисперсии переменной у ко всей дисперсии D(y)
(10) называют коэффициентом детерминации
Основные свойства коэффициента детерминации:
1. 0 R2 1.
2. Чем ближе R2 к 1, тем лучше регрессия аппроксимирует статистические данные, тем теснее линейная связь между зависимой и объясняющими переменными.
3. Если R2 = 1, то статистические данные лежат на линии регрессии, т.е. между зависимой и объясняющими переменными имеется функциональная зависимость. Если R2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных.
4. В случае парной регрессии R2 = rxy2.
Согласно F-критерию Фишера, выдвигается «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии (т. е. о статистически незначимом отличии величины F от нуля).
Эта гипотеза отвергается при выполнении условия Fнабл > Fкрит, где Fкрит определяется по таблицам F-критерия Фишера при числе степеней свободы k1 = k, k2 = n - k - 1 и заданному уровню значимости б (таблица 3).
Уровнем значимости (обозначается б) в статистических гипотезах называется вероятность отвергнуть верную гипотезу (это, так называемая, ошибка первого рода).Уровень значимости б обычно принимает значения 0,05 и 0,01, что соответствует вероятности совершения ошибки первого рода 5% и 1%. Используя соотношение (10), величину Fнабл можно выразить через коэффициент детерминации R2
Fнабл = R2/(1?R2) • (n?k?1)/ k .
Например, по данным 10 наблюдений было получено уравнение регрессии
y=-1,82+0.09x и R2=0.93
Необходимо проверить его значимость при уровне значимости б = 0,05. Определим величину F-статистики, учитывая, что k = 1
Fнабл = R2/(1?R2) • (n?k?1)/ k .=0.93/ (1-0.93)• (10 ? 1 - 1)/ 1 = 106,3
По таблицам распределения Фишера - Снедекора находят критическое значение F-статистики - Fкрит. Для определения Fкр при уровне значимости б = 0,05 и двумя числами степеней свободы k1 = k = 1 и k2 = n - 1 - 1 =10 - 2 = 8. Для нашего варианта Fкрит = 5,32 (табл.3).
Сравнивая Fнабл с Fкр, получим Fнабл = 106,3 > Fкр = 5,32. Если Fнабл > Fкр, то основную гипотезу H0 отвергают и принимают альтернативную гипотезу о статистической значимости уравнения регрессии.
6. Дайте определение коэффициента корреляции. Перечислите его свойства
Коэффициент корреляции - это статистический показатель зависимости двух случайных величин. Коэффициент корреляции может принимать значения от 1 до +1. При этом, значение 1 будет говорить об отсутствии корреляции между величинами, 0 - о нулевой корреляции, а +1 - о полной корреляции величин. Т.е., че ближе значение коэффициента корреляции к +1, тем сильнее связь мезду двумя случайными величинами.
Коэффициент корреляции - это корреляцинное отношение, математическая мера корреляции двух случайных величин. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.
Где уx,уy - средние квадратические отклонения. Коэффициент парной корреляции отражает взаимосвязь случайных величин и не зависит от того, какая из величин (X или Y) является причиной, а какая следствием.
1. Коэффициент корреляции независимых случайных величин равен нулю.
Это свойство вытекает из определения коэффициента корреляции. Таким образом, т.к. из независимости случайных величин следует их некоррелированность, то отличие коэффициента корреляции от нуля свидетельствует о наличии зависимости между величинами.
Как же именно коэффициент корреляции характеризует зависимость между случайными величинами?
Оказывается, что коэффициент корреляции является мерой линейной зависимости между величинами (говорят также, мерой прямолинейности) :показывает , насколько хорошо в среднем может быть представлена каждая из величин в виде линейной функции от другой. Это видно из следующих свойств коэффициента корреляции.
2. Если коэффициент корреляции положительный, то связь между переменными также положительна и значение переменной увеличивается и уменьшается одновременно.
Если r - имеет отрицательное значение, то при уменьшении одной переменной уменьшаются и другие.
3. Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, то есть от любых постоянных а1 b1, а2 b2.
r(а1х+b1;a2x+b2)=r(x;y) a1,a2>0,
таким образом переменные х и у можно уменьшать или увеличивать в а-раз, а также вычитать и прибавлять одно и тоже число b, в результате величина коэффициента корреляции не изменяется.
4. Если случайные величины х и у линейно зависимы, т.е. существует между ними соотношения у=ах+b, то |rху|=1
7. Дайте определение коэффициента детерминации. Что такое средняя ошибка аппроксимации?
Отношение объясненной части D(y) дисперсии переменной у ко всей дисперсии
D(y) R2=D(y') /D(y) (10)
называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соответственно, величина 1-2R характеризует долю вариации (дисперсии) y, необъясненную уравнением регрессии, а значит, вызванную влиянием прочих неучтенных в модели факторов.
Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0 ?R2 ? 1. Коэффициент детерминации показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Например, значение R2=0,56говорит о том, что соответствующее уравнение регрессии объясняет 56 % дисперсии результативного признака, в то время как на все остальные неучтенные факторы приходится 43%.
Чем больше R2, тем большая часть дисперсии результативного признака y объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между у и x коэффициент 8 детерминации R2 будет близок к нулю. То есть, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии.
Проверка значимости полученного уравнения регрессии производится на основе дисперсионного анализа с использованием статистических методов проверки гипотез.
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
где yx - расчетное значение по уравнению.
Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения.
8. Как можно проверить гипотезу о значимости параметров регрессии, коэффициента корреляции или уравнения регрессии в целом?
Оценки коэффициентов регрессии, полученные согласно формулам (6), зависят от используемой выборки значений переменных x и y и являются случайными величинами. Представление о точности полученных оценок, о том насколько далеко они могут отклониться от истинных значений коэффициентов можно получить используя, так называемые «стандартные ошибки» коэффициентов регрессии.
Стандартной ошибкой коэффициента регрессии является оценка стандартного отклонения функции плотности вероятности коэффициента.
Проверка значимости оценок параметров ничего не говорит о том, насколько эти оценки могут отличаться от точных значений. Ответ на этот вопрос дает построение доверительных интервалов.
Под доверительным интервалом понимаются пределы, в которых лежит точное значение определяемого показателя с заданной вероятностью г = 1 - б.
Доверительные интервалы для параметров a и b уравнения линейной регрессии определяются соотношениями:
Величина tг,n-2 представляет собой табличное значение t-критерия Стьюдента на уровне значимости б при числе степеней свободы n-2 (таблица 4).
Если в границы доверительного интервала попадает ноль, т. е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается равным нулю, так как он не может одновременно принимать и положительное, и отрицательное значения.
9. Какая регрессионная модель называется нелинейной парной регрессией?
Парная нелинейная регрессия применяется для описания нелинейных видов зависимостей результирующего фактора (у) от одного независимого фактора (.х).
Нелинейные уравнения регрессии можно разделить на два класса:
- уравнения, которые с помощью замены переменных можно привести к линейному виду в новых переменных (линеаризация);
- уравнения, для которых это невозможно. Назовем их внутренне нелинейными.
В первом случае, уравнения регрессии преобразуются к линейному виду с помощью введения новых (линеаризующих) переменных x', y'. При этом предварительно формируются новые массивы значений. В последующем, после определения параметров линейного уравнения регрессии с помощью обратного преобразования можно получить параметры исходного уравнения регрессии, представляющие интерес для исследователя.
Для оценки параметров внутренне нелинейных зависимостей также можно применить метод наименьших квадратов и определять оптимальные значения параметров а и b, исходя из условия (3).
Но в данном случае, условия (4) уже не являются линейными алгебраическими уравнениями относительно параметров а и b, поэтому величины параметров а и b удобнее определять непосредственно из условия (3) как значения, доставляющие минимум величине R.
10. Перечислите виды нелинейной парной регрессии. Что такое линеаризация модели парной регрессии?
В общем случае такие регрессии принято делить на две группы:
1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные но оцениваемым параметрам;
2) регрессии, нелинейные по оцениваемым параметрам.
К первой группе относятся следующие функции:
* полиномы разных степеней у = а + Ьхх + Ь^х2 + 63х3+ ...
* равносторонняя гипербола у = а + Ь/х.
Ко второй группе относятся следующие функции:
* степенная у = ахР
* показательная у = аЪх
* экспоненциальная у = еа+Ьх.
Первая группа нелинейных функций легко может быть линеаризована (приведены к линейному виду). Например, для полинома к-го порядка
производя замену:
, , ,…,
получим линейную модель вида
.
Аналогично могут быть линеаризованы и другие виды нелинейных функций 1-й группы, производя соответствующие замены.
11. Какая модель называется моделью множественной регрессии? Запишите линейную модель множественной регрессии в общем виде
В экономике часто возникает задача исследования зависимости одной зависимой переменной y от нескольких объясняющих переменных x1, x2, …, xm. Эта задача решается с помощью множественного регрессионного анализа. Уравнение множественной регрессии - уравнение связи с несколькими независимыми переменными:
y'=f(x1, x2, … xm) (1)
Переменная у называется зависимой, объясняемой или результативным признаком. x1, x2, … xm - независимые, объясняющие переменные или факторные признаки (факторы).
Соответствующая регрессионная модель имеет вид
y'=f(x1, x2, … xm)+е
где е - ошибка модели, являющаяся случайной величиной.
Множественная регрессия применяется в ситуациях, когда из множества факторов, влияющих на результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать влияние нескольких факторов. Например, объем выпуска продукции определяется величиной основных и оборотных средств, численностью персонала, уровнем менеджмента и т. д., уровень спроса зависит не только от цены, но и от имеющихся у населения денежных средств.
Основная цель множественной регрессии - построить модель с несколькими факторами и определить при этом влияние каждого фактора в отдельности, а также их совместное воздействие на изучаемый показатель.
Постановка задачи множественной регрессии: по имеющимся данным n наблюдений (табл. 1) необходимо определить аналитическую зависимость (1), наилучшим образом описывающую
Каждая строка таблицы содержит m +1 число и представляет собой результат одного наблюдения. Наблюдения различаются условиями их проведения.
Вопрос о том, какую зависимость следует считать наилучшей, решается на основе какого-либо критерия. В качестве такого критерия обычно используется минимум суммы квадратов отклонений расчетных или модельных значений результативного показателя yi'=f(x1i, x2i, … xmi) от наблюдаемых значений yi.
(2)
Построение уравнения множественной регрессии, как и в случае парной регрессии, предполагает решение двух задач (или, другими словами, осуществляется в два этапа):
1) спецификация модели;
2) оценка параметров выбранной модели.
В свою очередь, спецификация модели включает в себя решение двух задач: отбор факторов xj, подлежащих включению в модель и выбор вида аналитической зависимости (1).
12. Традиционный метод наименьших квадратов (МНК) для линейной модели множественной регрессии. В чем его суть. Какие методы оценки параметров линейных моделей множественной регрессии Вы знаете?
Рассмотрим уравнение линейной множественной регрессии
(3)
Для оценки параметров уравнения множественной регрессии (3) обычно применяется метод наименьших квадратов (МНК), согласно которому следует выбирать такие значения параметров b0 и bi, при которых сумма квадратов отклонений фактических значений результативного признака yi от теоретических значений yi'=f(x1i, x2i, … xmi) минимальна, то есть
(4)
С учетом (3) величина S является функцией неизвестных параметров b0 и bi.
Оптимальные значения параметров b0 и bi удовлетворяют условиям
Находим частные производные по b0 и bi и, подставляя соответствующие результаты в соотношения (4), получим для определения параметров b0 и bi. следующую систему уравнений
В этих обозначениях система примет вид
(XT ·X)B= XTY (5)
где XT - транспонированная матрица X.
Решая матричное уравнение (5), получим B= (XT *X)-1 XTY.
13. Какой коэффициент называется коэффициентом эластичности?
Последовательный отсев несущественных факторов составляет основу многошагового регрессионного анализа. Однако по коэффициентам регрессии нельзя определить, какой из факторов оказывает наибольшее влияние на зависимую переменную, так как коэффициенты регрессии между собой могут быть несопоставимы (они измерены разними единицами).
Различия в единицах измерения факторов устраняют с помощью частных коэффициентов эластичности, рассчитываемые по формуле
(6)
где xi xi - среднее значение изучаемого фактора xi; y - среднее значение фактора y; bi - коэффициенты множественной регрессии.
Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется зависимая переменная с изменением на 1% каждого фактора при фиксированном значении других факторов.
В случае парной регрессии используют такой показатель, как коэффициент эластичности. Если зависимость между переменными x и y имеет вид y=f(x), то коэффициент эластичности Э вычисляется по формуле
Э =f'(x)·x/y (7)
Коэффициент эластичности Э показывает, на сколько процентов в среднем изменится результативный признак у при изменении фактора х на 1% от своего 12 номинального значения. Для линейной регрессии y=a+bx коэффициент эластичности равен
Э =b*(x/y) (8)
Коэффициент эластичности Э в общем случае зависит от величины x и является величиной переменной. Чтобы исключить эту зависимость применяется средний коэффициент эластичности
Э =f'(x)·x/y= b*(x/y)
который уже является величиной постоянной.
Средний коэффициент эластичности Э показывает, на сколько процентов в среднем по совокупности значений фактора х изменится результативный признак у при изменении фактора х на 1 %.
14. С какой целью находят стандартизованные коэффициенты регрессии?
Независимые переменные xi имеют различный экономический смысл, разные единицы измерения и масштаб. Если нужно определить степень относительного влияния отдельных xi факторов на изменение результативной переменной y, то переменные xi следует привести к сопоставимому виду. Это можно осуществить, вводя, так называемые, «стандартизованные» переменные с помощью соотношений
, , (i=1,2,…,m)
где y, xi - средние значения, уy, уxi - средние квадратические отклонения переменных y и xi.
Стандартизованные переменные обладают следующими свойствами:
1) средние значения равны нулю, т.е. ty=0, txi=0;
2) средние квадратические отклонения равны единице или уy=1, уxi=1.
Уравнение множественной регрессии в стандартизованных переменных принимает вид
ty= в1·tx1+ в2·tx2 + … + вm·txm+е (10)
Величины вi называются стандартизованными коэффициентами. Их связь c коэффициентами множественной регрессии bi задается соотношениями
(i=1,2,…,m)
Стандартизованные коэффициенты регрессии вi показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результативный признак y за счет изменения соответствующего фактора на одну сигму при неизмененном значении других факторов, закрепленных на среднем уровне.
Стандартизованные коэффициенты регрессии вi сравнимы между собой, что позволяет ранжировать факторы по силе их воздействия на результат. Большее относительное влияние на изменение результативной переменной y оказывает тот фактор, которому соответствует большее по модулю значение коэффициента вi.
Отметим, что в случае парной линейной регрессии стандартизованный коэффициент регрессии в совпадает с линейным коэффициентом корреляции rxy.
Для оценки параметров нелинейных уравнений множественной регрессии предварительно осуществляется преобразование последних в линейную форму (с помощью замены переменных) и МНК применяется для нахождения параметров линейного уравнения множественной регрессии в преобразованных переменных.
В случае внутренне нелинейных зависимостей (которые невозможно привести к линейному виду) для оценки параметров по методу наименьших квадратов приходится применять методы нелинейной оптимизации.
15. Частная корреляция. Как найти коэффициенты множественной детерминации и корреляции?
Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результативный фактор уi фактора хi при неизменном уровне других факторов. Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (уi и хi) при условии, что влияние на них остальных факторов хj устранено. В случае использования двух факторов формулы имеют вид:
(11)
Существенность влияния корреляционной связи проанализируем на примере. Рассмотрим переменную y и два фактора x1 и x2, находящиеся в корреляционной связи, и предположим, что парные коэффициенты корреляции имеют следующие значения ryx1=0,52, ryx2=0,1, rx1x2=0,7. Вычисления по формулам (11) дают такие результаты
Значения коэффициентов ryx1 и ryx1/x2 близки между собой, а значения коэффициентов ryx2 и ryx2/x1 отличаются по величине более, чем в четыре раза и имеют разные знаки.
Частные коэффициенты корреляции ryxi/xm позволяют ранжировать факторы по степени влияния на результативный признак и находят применение в процедуре отбора факторов для включения их в уравнение регрессии (учитываются факторы, которым соответствуют значимые коэффициенты частной корреляции).
В случае парной регрессии для оценки качества полученного множественной уравнения регрессии (3) можно использовать коэффициент детерминации, представляющий собой отношение объясненной части D(y) дисперсии переменной у ко всей дисперсии D(y)
(12)
Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0? R2? 1. Коэффициент детерминации показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Чем выше значение R2, тем лучше данная модель согласуется с данными наблюдений.
Для оценки тесноты связи факторов с исследуемым признаком, задаваемой построенным уравнением (1), используется коэффициент множественной корреляции
Коэффициент множественной корреляции R принимает значения в диапазоне 0 ? R ? 1.
Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость (1) согласуется с данными наблюдений. При R = 1 (R2=1) связь становится функциональной, т. е. соотношение (1) точно выполняется для всех наблюдений.
Коэффициент множественной корреляции может использоваться как характеристика качества построенного уравнения регрессии (1) и точности построенной модели.
В случае линейной зависимости (3) коэффициент корреляции R связан с парными коэффициентами корреляции ryxi соотношением
,
где вi - стандартизованные коэффициенты регрессии (3).
Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает его величину.
16. Как находится оценка значимости уравнения множественной регрессии?
Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации R2) осуществляется с помощью F-критерия Фишера
,
где m - число независимых переменных в уравнении регрессии (3).
Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условия F > Fкрит, где Fкрит определяется по таблицам F-критерия Фишера (см. раздел «Модель парной регрессии») по двум степеням свободы k1 = m, k2 = n - m - 1 и заданному уровню значимости б.
17. Множественная регрессия в нелинейных моделях. Как осуществить линеаризацию нелинейной модели множественной регрессии?
Соотношения между реальными физическими явлениями и процессами далеко не всегда можно выразить линейными моделями, т.к. при этом могут возникнуть недопустимые ошибки. Нелинейными оказываются производственные функции, функции спроса и т.д.
Для оценки параметров нелинейных моделей, как правило, используют линеаризацию модели, которая заключается в том, что с помощью подходящих преобразований исходных переменных исследуемого зависимость представляют в виде линейного соотношения между преобразованиями переменными: (х,у) -> (х',у'), где у- зависимая переменная( результативная призак), х - независимая переменная (признак-фактор).
Различают два класса нелинейных регрессий:
1. Регрессия, нелинейные относительно фактора, но линейные по параметрам
2. Регрессия, нелинейные по параметрам
Для оценки параметров нелинейных уравнений множественной регрессии предварительно осуществляется преобразование последних в линейную форму (с помощью замены переменных) и МНК применяется для нахождения параметров линейного уравнения множественной регрессии в преобразованных переменных.
В случае внутренне нелинейных зависимостей (которые невозможно привести к линейному виду) для оценки параметров по методу наименьших квадратов приходится применять методы нелинейной оптимизации.
18. Дайте определение мультиколлинеарности
Мультиколлинеарность (multicollinearity) -- в эконометрике (регрессионный анализ) -- наличие линейной зависимости между объясняющими переменными (факторами) регрессионной модели. При этом различают полную коллинеарность, которая означает наличие функциональной (тождественной) линейной зависимости и частичную или просто мультиколлинеарность -- наличие сильной корреляции между факторами.
Полная коллинеарность приводит к неопределенности параметров в линейной регрессиионной модели независимо от методов оценки. Рассмотрим это на примере следующей линейной модели
У= b1x1+b2x2+b3x3+e
Количественная оценка параметров уравнения регрессии предполагает выполнение условия линейной независимости между независимыми переменными. Однако на практике объясняющие переменные часто имеют высокую степень взаимосвязи между собой, что является нарушением указанного условия. Данное явление носит название мультиколлинеарности.
Термин коллинеарность (collinear) обозначает линейную корреляцию между двумя независимыми переменными, а Мультиколлинеарность (multi-collinear) - между более чем двумя независимыми переменными. Обыкновенно под мультиколлинеарностью понимают оба случая.
Таким образом, мультиколлинеарность означает наличие тесной линейной зависимости или сильной корреляции между двумя или более объясняющими (независимыми) переменными. Одной из задач эконометрии является выявление мультиколлинеарности между независимыми переменными.
Различают совершенную и несовершенную мультиколлинеарность. Совершенная мультиколлинеарность означает, что вариация одной из независимых переменных может быть полностью объяснена изменением другой (других) переменной.
Иначе, взаимосвязь между ними выражается линейной функцией
Несовершенная мультиколлинеарность может быть определена как линейная функциональная связь между двумя или более независимыми переменными, которая настолько сильна, что может существенно затронуть оценки коэффициентов при переменных в модели.
Рис. 1 Графическая интерпретация данного случая:
Несовершенная мультиколлинеарность возникает тогда, когда две (или более) независимые переменные находятся между собой в линейной функциональной зависимости, описываемой уравнением
Графически данный случай представлен следующим образом:
Рис. 2
В каких же случаях может возникнуть мультиколлинеарность? Их, по крайней мере, два.
1. Имеет место глобальная тенденция одновременного изменения экономических показателей. В качестве примера можно привести такие показатели как объем производства, доход, потребление, накопление, занятость, инвестиции и т.п., значения которых возрастают в период экономического роста и снижаются в период спада.
Одной из причин мультиколлинеарности является наличие тренда (тенденции) в динамике экономических показателей.
2. Использование лаговых значений переменных в экономических моделях.
В качестве примера можно рассматривать модели, в которых используются как величины дохода текущего периода, так и затраты на потребление предыдущего.
В целом при исследовании экономических процессов и явлений методами эконометрии очень трудно избежать зависимости между показателями.
Последствия мультиколлинеарности сводятся к снижению точности оценивания, которая проявляется через:
a. слишком большие ошибки некоторых оценок,
b. высокую степень корреляции между ошибками.
19. Как используются регрессионные модели с переменной структурой?
При изучении экономических взаимосвязей возникает необходимость учесть в модели влияние качественного фактора (фактора, не имеющего количественного выражения), например, пол потребителя, фактор сезонности, наличие государственных программ. Влияние качественных признаков может приводить к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака. Такие модели называются регрессионными моделями с переменной структурой.
Если в модель нужно ввести качественные переменные, то им требуется присвоить те или иные «цифровые метки», другими словами, качественные переменные должны быть переведены в количественные. Такого рода сконструированные переменные в эконометрике принято называть фиктивными переменными.
Для этого в рамках одного регрессионного уравнения вводятся, так называемые, фиктивные переменные с двумя значениями 0 и 1. Например, изучается зависимость потребления товара y от величины дохода x с учетом пола потребителя. С использованием фиктивной переменной z
z = { 1, мужской пол; 0, женский пол.
Уравнение регрессии принимает вид
y=a+bx+cz+е
Вводя новый член регрессии cz, мы тем самым предполагаем, что пол потребителя влияет только на величину свободного члена уравнения (параметр a характеризует объем потребления). Чтобы учесть влияние пола потребителя на величину коэффициента регрессии b (характеризующего «склонность» к потреблению), следует в модель регрессии ввести дополнительное слагаемое.
Если качественный признак имеет более двух градаций признака, то вводится несколько фиктивных переменных, число которых на единицу меньше числа градаций признака. Например, чтобы учесть сезонность, вводятся три фиктивные переменные. При этом необходимо исключить линейную зависимость между переменными, так как в противном случае, это приведет к абсолютной мультиколлинеарности.
В общем случае, в эконометрических моделях обычно используются фиктивные переменные бинарного типа:
zt={1, наличие признака в момент t; 0, отсутствие признака в момент t.
20. Фиктивные переменные. Когда их можно применить?
При изучении экономических взаимосвязей возникает необходимость учесть в модели влияние качественного фактора (фактора, не имеющего количественного выражения), например, пол потребителя, фактор сезонности, наличие государственных программ. Влияние качественных признаков может приводить к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака. Такие модели называются регрессионными моделями с переменной структурой.
Если в модель нужно ввести качественные переменные, то им требуется присвоить те или иные «цифровые метки», другими словами, качественные переменные должны быть переведены в количественные. Такого рода сконструированные переменные в эконометрике принято называть фиктивными переменными.
Для этого в рамках одного регрессионного уравнения вводятся, так называемые, фиктивные переменные с двумя значениями 0 и 1. Например, изучается зависимость потребления товара y от величины дохода x с учетом пола потребителя. С использованием фиктивной переменной z
z = { 1, мужской пол; 0, женский пол.
Уравнение регрессии принимает вид
y=a+bx+cz+е
Вводя новый член регрессии cz, мы тем самым предполагаем, что пол потребителя влияет только на величину свободного члена уравнения (параметр a характеризует объем потребления). Чтобы учесть влияние пола потребителя на величину коэффициента регрессии b (характеризующего «склонность» к потреблению), следует в модель регрессии ввести дополнительное слагаемое.
Если качественный признак имеет более двух градаций признака, то вводится несколько фиктивных переменных, число которых на единицу меньше числа градаций признака. Например, чтобы учесть сезонность, вводятся три фиктивные переменные. При этом необходимо исключить линейную зависимость между переменными, так как в противном случае, это приведет к абсолютной мультиколлинеарности.
В общем случае, в эконометрических моделях обычно используются фиктивные переменные бинарного типа:
zt={1, наличие признака в момент t; 0, отсутствие признака в момент t.
Фиктивные переменные могут быть использованы в качестве зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, то зависимая переменная имеет два возможных значения: 0, если машины нет, и 1, если машина есть.
Однако если для моделей данного типа использовать обыкновенный МНК, то оценки, получаемые с его помощью, не обладают свойствами наилучших линейных несмещенных оценок. Поэтому для оценки коэффициентов такой модели используют метод максимального правдоподобия. Модели с фиктивной зависимой переменной называют линейными вероятностными моделями.
Введение в регрессию фиктивных переменных существенно улучшает качество ее оценивания.
21. Временные ряды: Перечислите общие сведения и задачи их анализа
Развитие социально-экономических явлений во времени изучают с использованием особого типа статистических данных, которые называют временными рядами (или рядами динамики). Примеры временных рядов: ежегодные данные по объёму выпуска продукции, квартальные данные по уровню инфляции, ежедневный объём выручки в торговой точке и т. д. Во всех примерах очевидна зависимость экономических показателей от времени t получения соответствующих статистических данных.
Временной ряд (ряд динамики, динамический ряд) - упорядоченная во времени последовательность численных показателей (yi, ti), i = 1,2,...,n, характеризующих уровни развития изучаемого явления в последовательные моменты или периоды времени.
Величины yi называются уровнями ряда, а ti - временными метками (моменты или интервалы наблюдения). Обычно рассматриваются временные ряды с равными интервалами между наблюдениями, в качестве значений ti берутся порядковые номера наблюдений и временной ряд представляется в виде последовательности y1, y2, … , yn, где n количество наблюдений.
Целью исследования временного ряда является выявление закономерностей в изменении уровней ряда и построении его модели в целях прогнозирования и исследования взаимосвязей между явлениями.
При исследовании экономического временного ряда его обычно представляют в виде совокупности трех составляющих: - долговременной тенденции (Т), т. е. устойчивого увеличения или уменьшения значений уровней ряда (тренда); - периодических колебаний (S); - случайных колебаний (E). На рис. 1 показан график временного ряда, на котором прослеживаются все три составляющие.
Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной
y(t) T(t) S(t) (t).
Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной
y(t) T(t)S(t)(t) .
Модель, в которой временной ряд представлен как произведение и сумма перечисленных компонент, называют смешанной
y(t) T(t)S(t)+(t)
В экономике периодические колебания принято подразделять на сезонные, у которых период колебаний не превышает одного года (цены на сельскохозяйственную продукцию), вызванные климатическими или социально - экономическими причинами, и циклические с периодом колебаний несколько лет, связанные с циклами деловой активности.
Основная задача эконометрического исследования временного ряда заключается в выявлении и придании количественного выражения составляющим его отдельным компонентам.
Как правило, наличие той или иной составляющей можно определить с помощью визуального анализа графика временного ряда (рис. 1).
Перед построением модели исходные данные проверяются на сопоставимость (применение одинаковой методики получения или расчета данных), однородность (отсутствие случайных выбросов), устойчивость (наличие закономерности в изменении уровней ряда) и достаточность (число наблюдений должно в 7-10 превосходить число параметров модели).
22. Для чего строятся стационарные и нестационарные временные ряды?
Различают два вида рядов: стационарные и нестационарные. Стационарные ряды - это такие ряды, в которых не содержится тренд
Стационарный временной ряд - это такой, статистические свойства которого, такие как среднее значение, дисперсия, автокорреляция и т. Д., Не зависят от времени. Стационарный ряд относительно легко предсказать: вы просто прогнозируете, что его статистические свойства в будущем будут такими же, как и в прошлом. Таким образом, большинство статистических методов прогнозирования основаны на предположении, что временные ряды являются приблизительно стационарными.
Большинство статистических методов прогнозирования предполагают, что ряды могут быть (приблизительно) стационарными с помощью математических преобразований.
Нестационарные временные ряды
Нестационарный ряд - это тот, статистические свойства которого меняются со временем. Существует множество способов нестационарности временных рядов, таких как изменение дисперсии, сдвиги уровней, сезонность в 6-й момент и т. Д. Вот наиболее распространенные модели нестационарности:
Трендовый компонент: Тенденция показывает общую тенденцию увеличения или уменьшения данных в течение длительного периода времени. Тенденция - это плавная, общая, долгосрочная, средняя тенденция. Не всегда необходимо, чтобы увеличение или уменьшение было в одном и том же направлении в течение данного периода времени.[8], Если временной ряд не показывает возрастающую или убывающую модель, то ряд в среднем является стационарным.
Рис. 3 Временные ряды с трендом[4]
Циклический компонент: Любой паттерн, показывающий движение вверх и вниз вокруг данного тренда, идентифицируется как циклический паттерн. В циклическом паттерне движения вверх и вниз не происходят через постоянные промежутки времени, их невозможно предсказать.
Сезонная составляющая: Если пики и провалы серии происходят через равные промежутки времени, модель называется сезонной (например, продажи мороженого).
Случайный компонент: Остаток - это то, что осталось, когда все шаблоны были удалены. Остатки - это случайные колебания. Вы можете думать о них как о компоненте шума.
Рис. 4 Слева Сезонная картина, справа случайный остаток
Большинство статистических методов прогнозирования основаны на предположении, что временные ряды являются приблизительно стационарными. Стационарный ряд относительно легко предсказать: вы просто прогнозируете, что его статистические свойства в будущем будут такими же, как и в прошлом. Анализ моделей временных рядов является первым шагом преобразования нестационарных данных в стационарные данные (например, путем удаления трендов), чтобы можно было применять методы статистического прогнозирования.[5], Существует три основных шага построения модели временных рядов качественного прогнозирования: обеспечение стационарности данных, выбор правильной модели и оценка точности модели.
23. Гетероскедастичность. Как устраняется гетероскедастичность?
Гетероскедастичность (англ. heteroscedasticity) -- понятие, используемое в прикладной статистике (чаще всего -- в эконометрике), означающее неоднородность наблюдений, выражающуюся в неодинаковой (непостоянной) дисперсии случайной ошибки регрессионной (эконометрической) модели. Гетероскедастичность противоположна гомоскедастичности, означающей однородность наблюдений, то есть постоянство дисперсии случайных ошибок модели.
Наличие гетероскедастичности случайных ошибок приводит к неэффективности оценок, полученных с помощью метода наименьших квадратов. Кроме того, в этом случае оказывается смещённой и несостоятельной классическая оценка ковариационной матрицы МНК-оценок параметров. Следовательно, статистические выводы о качестве полученных оценок могут быть неадекватными. В связи с этим тестирование моделей на гетероскедастичность является одной из необходимых процедур при построении регрессионных моделей.
Гетероскедастичность возникает чаще всего тогда, когда выборка берется в пространственном разрезе, когда имеют место большие различия между наименьшими и наибольшими значениями наблюдений, т.е. когда дисперсия значений наблюдений достаточно высока. Другой причиной гетероскедастичности является существенное изменение качества исходных данных внутри выборки.
Для устранения гетероскедастичности нужно найти способ придать наибольший вес наблюдению i, у которого среднее квадратическое отклонение случайной составляющей а(е,) максимально (отметим, что такие наблюдения обладают самым низким качеством), и малый вес наблюдению, у которого среднее квадратическое отклонение случайной составляющей а(в/) минимально (такие наблюдения обладают самым высоким качеством). Тогда мы получим более точные (эффективные) оценки параметров уравнения регрессии
24. Автокорреляция уровней временного ряда. Устранение автокорреляции
Важной особенностью временных рядов по сравнению с данными наблюдений, относящихся к одному периоду времени, является, как правило, наличие связи между последовательными уровнями ряда, вызванное действием каких-либо долговременных причин, что приводит к наличию таких составляющих ряда, как долговременная тенденция и периодическая составляющая.
Корреляционная зависимость между последовательными уровнями временного ряда называется автокорреляцией уровней временного ряда.
Степень тесноты автокорреляционной связи между уровнями ряда может быть определена с помощью коэффициентов автокорреляции, т. е. коэффициентов линейной корреляции между уровнями исходного временного ряда и уровнями ряда, сдвинутыми на несколько шагов назад во времени.
(1)
где ф - величина сдвига, называемая лагом, определяет порядок коэффициента автокорреляции,
Подобные документы
Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Понятие взаимосвязи между случайными величинами. Ковариация и коэффициент корреляции. Модель парной линейной регрессии. Метод наименьших квадратов, теорема Гаусса-Маркова. Сравнение регрессионных моделей. Коррекция гетероскедастичности, логарифмирование.
курс лекций [485,1 K], добавлен 02.06.2011Построение обобщенной линейной модели множественной регрессии, ее суть; теорема Айткена. Понятие гетероскедастичности, ее обнаружение и методы смягчения проблемы: тест ранговой корреляции Спирмена, метод Голдфелда-Квандта, тесты Глейзера, Парка, Уайта.
контрольная работа [431,2 K], добавлен 28.07.2013Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.
контрольная работа [192,2 K], добавлен 23.06.2012Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.
контрольная работа [99,2 K], добавлен 27.04.2011Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.
контрольная работа [1,1 M], добавлен 23.06.2011Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.
контрольная работа [547,6 K], добавлен 21.03.2015Исследование зависимости сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии. Построение поля корреляции. Определение интервальных оценок заданных коэффициентов. Средняя ошибка аппроксимации.
контрольная работа [2,1 M], добавлен 09.08.2013