Законы распределения переменной
Нахождение закона распределения переменной и построение гистограммы. Выбор наиболее типичного значения переменной, средний разброс ее значений. Расчет коэффициента корреляции. Оценка линейного уравнения регрессии. Проверка качества построенной модели.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 11.06.2012 |
Размер файла | 127,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
37
Содержание
Задание на курсовую работу
1 Оценивание распределения переменной У
1.1 Нахождение закона распределения переменной и построение гистограммы
1.2 Определение, можно ли признать имеющийся набор данных нормально распределенным и укажем, как можно устранить существующие проблемы в данных
1.3 Определение наиболее типичного значения переменной и средний разброс ее значений
1.4 Вывод о наиболее типичном значении данного показателя в генеральной совокупности с 90%-ной уверенностью
2 Исследование взаимосвязи между переменными X и Y
2.1 Расчет коэффициента корреляции между переменными и оценивание силы и направления взаимосвязи между ними
2.2 Проверка сделанных выводов с помощью поля корреляции
2.3 Определение формы зависимости между переменными
3 Моделирование взаимосвязи между переменными Х и У с помощью линейной функции
3.1 Оценка с помощью МНК линейное уравнение регрессии
3.2 Проверка качества построенной модели при уровне значимости 0,05
3.3 проверка наличия автокорреляции остатков графическим методом и методом рядов при уровне значимости 0,05
3.4 Проверка наличия гетероскедастичности графическим методом и с помощью теста Голдфелда - Квандта при уровне значимости0,01
3.5 Вывод, можно ли использовать линейную модель для прогнозирования
4 Составление спецификации степенной регрессионной модели и расчет параметров нового уравнения
5 Проверка качества новой модели при том же уровне значимости, а также наличие автокорреляции остатков
6 Нанесение на поле корреляции графиков двух функций регрессии. Сравнение качества построенных моделей. Выбор модели для выражения исследуемой зависимости
7 Расчет по наилучшей модели точечных прогнозов. Построение 90%-ных доверительных интервалов для индивидуальных значений уровня дивидендов. Определение наиболее точного прогноза
Список литературы
Приложение А - Регрессия
Приложение Б - Регрессия
Приложение В - Критические значения количества рядов
Приложение Г - Таблица распределения Стьюдента
Приложение Д - Таблица распределения Фишера
Задание
корреляция распределение модель регрессия
Изучается зависимость между уровнем дивидендов, выплачиваемых фирмой по обыкновенным акциям (Y, %), и среднегодовой стоимостью основных фондов фирмы (Х, млн. руб.) за последние 20 лет:
Х |
73,81 |
74,22 |
74,52 |
75,18 |
75,34 |
76,06 |
76,4 |
76,63 |
76,98 |
77,4 |
|
Y |
4,79 |
3,97 |
3,59 |
3,62 |
2,3 |
1,9 |
2,69 |
2,93 |
2,43 |
1,98 |
Х |
77,97 |
78,14 |
78,79 |
79 |
79,81 |
79,86 |
80,67 |
80,64 |
81,2 |
81,65 |
|
Y |
1,94 |
2,26 |
1,4 |
1,79 |
1,27 |
1,58 |
1,41 |
1,12 |
0,94 |
1,01 |
Задание:
1. Оцените распределение переменной У:
найдите закон распределения переменной и постройте гистограмму;
определите, можно ли признать имеющийся набор данных нормально распределенным; укажите, как можно устранить существующие проблемы в данных;
определите наиболее типичное значение переменной и средний разброс ее значений;
сделайте вывод о наиболее типичном значении данного показателя в генеральной совокупности с 90%-ной уверенностью.
2. Исследуйте взаимосвязь между переменными У и Х:
рассчитайте коэффициент корреляции между переменными и оцените силу и направление связи между ними;
проверьте сделанные выводы с помощью поля корреляции;
определите форму зависимости между переменными.
3. Произведите моделирование взаимосвязи между переменными У и Х с помощью линейной функции:
оцените с помощью метода наименьших квадратов линейное уравнение регрессии
Y = b0 + b1 ? X;
проверьте качество построенной модели при уровне значимости 0,05;
проверьте наличие автокорреляции остатков графическим методом и методом рядов при уровне значимости 0,05;
проверьте наличие гетероскедастичности графическим методом и с помощью теста Голдфелда-Квандта при уровне значимости 0,01;
сделайте вывод, можно ли использовать линейную модель для прогнозирования. Совпадают ли ваши выводы с предположениями, сделанными в п. 2?
4. Составьте спецификацию степенной регрессионной модели и рассчитайте параметры нового уравнения.
5. Проверьте качество новой модели при том же уровне значимости, а также наличие автокорреляции остатков. Как вы объясните изменения показателей?
6. Если необходима дальнейшая корректировка модели, внесите предложения по изменению спецификации.
7. Нанесите на поле корреляции графики двух функций регрессии. Сравните качество построенных моделей. Какая из моделей, на ваш взгляд, предпочтительнее для выражения исследуемой зависимости и почему?
Рассчитайте 99%-ые доверительные интервалы для теоретических коэффициентов наилучшей регрессии.
8. По наилучшей регрессионной модели рассчитайте точечные прогнозы среднего значения уровня дивидендов при стоимости основных фондов 82 млн. руб. и 79 млн. руб. Постройте 90%-ные доверительные интервалы для индивидуальных значений уровня дивидендов. Какой прогноз является более точным?
Таблица 1 - Исходные данные
X |
Y |
|
73,81 |
4,79 |
|
74,22 |
3,97 |
|
74,52 |
3,59 |
|
75,18 |
3,62 |
|
75,34 |
2,3 |
|
76,06 |
1,9 |
|
76,4 |
2,69 |
|
76,63 |
2,93 |
|
76,98 |
2,43 |
|
77,4 |
1,98 |
|
Y |
||
0,94 |
||
1,01 |
||
1,12 |
||
1,27 |
||
1,4 |
||
1,41 |
||
1,58 |
||
1,79 |
||
1,9 |
||
1,94 |
||
X |
Y |
|
77,97 |
1,94 |
|
78,14 |
2,26 |
|
78,79 |
1,4 |
|
79 |
1,79 |
|
79,81 |
1,27 |
|
79,86 |
1,58 |
|
80,67 |
1,41 |
|
80,64 |
1,12 |
|
81,2 |
0,94 |
|
81,65 |
1,01 |
|
Y |
||
1,98 |
||
2,26 |
||
2,3 |
||
2,43 |
||
2,69 |
||
2,93 |
||
3,59 |
||
3,62 |
||
3,97 |
||
4,79 |
1 Оценивание распределения переменной У
1.1 Нахождение закона распределения переменной У и построение гистограммы
Для построения закона распределения случайной величины необходимо сделать следующее:
1. Упорядочить набор данных, т.е. расположить данные в порядке возрастания (см. таблицу 1);
2. Разбить набор данных на несколько интервалов равной ширины. Для этого нужно выбрать наибольшее и наименьшее значение из исходных данных, из наибольшего значения вычесть наименьшее и разделить на количество интервалов. Для наглядности гистограммы выделим 7 интервалов.
(1)
Частота-это количество попаданий значений случайной величины в определенный интервал.
Частота определяется с помощью статистической формулы Microsoft Excel.
Функция ЧСТРОК (2)
Синтаксис:
ЧСТРОК (диапазон_ячеек)
Результат:
Подсчитывает количество строк в выделенном диапазоне ячеек.
Аргументы:
диапазон_ячеек: диапазон ячеек, для которого нужно подсчитать количество строк.
Функцию ЧСТРОК удобно использовать для подсчета частоты попадания значений в определенный интервал.
Закон распределения случайной величины - представляет собой соотношение между средним значением случайной величины Yi в интервале и вероятностью попадания в этот интервал Pi (см. таблица 2).
Таблица 2 - Нахождение закона распределения
Ymin |
Ymax |
h |
n (групп) |
Интервалы |
Частота |
Yi |
Pi |
||
0,94 |
4,79 |
0,55 |
7 |
0,94 |
1,49 |
6 |
1,215 |
0,3 |
|
1,49 |
2,04 |
5 |
1,765 |
0,25 |
|||||
2,04 |
2,59 |
3 |
2,315 |
0,15 |
|||||
2,59 |
3,14 |
2 |
2,865 |
0,1 |
|||||
3,14 |
3,69 |
2 |
3,415 |
0,1 |
|||||
3,69 |
4,24 |
1 |
3,965 |
0,05 |
|||||
4,24 |
4,79 |
1 |
4,515 |
0,05 |
|||||
Нахождение значений случайной величины (Yi) определяется по следующей формуле:
(3)
ai - нижняя граница i-интервала;
bi - верхняя граница i-интервала;
(4)
Вероятность попадания Pi значений случайной величины Yi определяется по следующей формуле:
(5)
где:
Частота i - количество попаданий значений в соответствующий i-интервал;
n - объем выборки;
Например,
На основе закона распределения строится диаграмма. Для того чтобы построить диаграмму, следует выбрать команду «Диаграмма» меню «Вставка». В диалоговом окне «Мастер диаграмм» необходимо выбрать тип диаграммы ( в нашем случае - гистограмму), указать диапазон данных для построения диаграммы (Yi и Pi), а также подписи по оси X и Y (закладка «Ряд») (см. рисунок 1).
Рисунок 1 - Закон распределения переменной У
При анализе построенной диаграммы видно, что присутствует ассиметричное распределение.
1.2 Определим, можно ли признать имеющийся набор данных нормально распределенным и укажем, как можно устранить существующие проблемы в данных.
Нормальное распределение - это непрерывное распределение, имеющее графическое представление в виде симметричной колоколообразной кривой.
Набор данных можно считать нормально распределенным, если форма гистограммы напоминает колокол, к котором большинство значений сконцентрировано в средней части, а остальные распределены равномерно с затуханием по обе стороны от центра. На графике отчетливо видно, что набор данных имеет ассиметричное распределение, в котором значения с одной стороны от пика затухают резко в сторону больших значений. Поэтому имеющийся набор данных нельзя назвать нормально распределенным (может быть, причина в том, что количество имеющихся данных недостаточно). В этом случае необходимо преобразовать данные к нормальному виду (например, путем логарифмирования).
1.3 Определим наиболее типичное значение переменной и средний разброс ее значений
Так как чаще всего отсутствует информация обо всех объектах генеральной совокупности, есть данные лишь о нескольких объектах из генеральной совокупности - о выборке. Каждый параметр генеральной совокупности имеет оценку - выборочный параметр, который приблизительно его определяет:
- оценкой математического ожидания является выборочное среднее (ВС);
- оценкой среднего квадратичного отклонения - выборочное среднее квадратичное отклонение (ВСКО);
Наиболее типичное значение переменной: ВС =2,246
Определяется с помощью статистической функции Microsoft Excel.
Функция СРЗНАЧ (6)
Синтаксис:
СРЗНАЧ (диапазон_ячеек)
Результат:
Рассчитывает математическое ожидание (среднее значение) набора данных.
Аргументы:
диапазон_ячеек: диапазон ячеек, в котором содержится набор данных.
Средний разброс ее значений: ВСКО=1,06732
Определяется с помощью статистической функции Microsoft Excel.
Функция СТАНДОТКЛОН (7)
Синтаксис:
СТАНДОТКЛОН (диапазон_ячеек)
Результат:
Рассчитывает среднее квадратичное отклонение набора данных.
Аргументы:
диапазон_ячеек: диапазон ячеек, в котором содержится набор данных.
1.4 Сделаем вывод о наиболее типичном значении данного показателя в генеральной совокупности с 90%-ной уверенностью
Имея информацию о выборке, можно приблизительно оценить, чему может быть равна ошибка оценивания - разность между выборочным средним и математическим ожиданием генеральной совокупности. Такой оценкой является стандартная ошибка, которая рассчитывается по формуле:
(8)
где:
S - ВСКО;
n - объем выборки;
Таким образом, чем больше объем выборки, тем точнее выборочное среднее оценивает математическое ожидание генеральной совокупности. Для более точного вывода о типичном значении параметра генеральной совокупности оценивание завершается определением интервальной оценки - доверительного интервала.
Доверительным интервалом называется интервал, который с определенной вероятностью содержит значение неизвестного параметра генеральной совокупности.
Рассчитаем доверительный интервал с 90%-ной вероятностью.
Объем выборки: n=20;
Число степеней свободы: н=n-1=20-1=19;
Доверительная вероятность: г=90%
Уровень значимости: у=1- г=1-0,90=0,1
Критическая точка: tkp=1,72913
Критическая точка распределения Стьюдента определяется с помощью статистической функции Microsoft Excel или с помощью таблицы распределения Стьюдента (см. приложение Г).
Функция СТЬЮДРАСПОБР (9)
Синтаксис:
СТЬЮДРАСПОБР (вероятность; степени_свободы)
Результат:
Рассчитывает критические точки для распределения Стьюдента.
Аргументы:
- вероятность: уровень значимости б, соответствующий двустороннему распределению Стьюдента;
- степени свободы: число степеней свободы.
Границы доверительного интервала рассчитываются по формуле:
(10)
Нижняя граница доверительного интервала:
2,0246-1,72913*0,23866=1,83332
Верхняя граница доверительного интервала:
2,246+1,72913*0,23866=2,65867
Вывод: Можно быть на 90% уверенным, что наиболее типичное значение уровня дивидендов по обычным акциям окажется в интервале от 1,83332 до 2,65867.
2. Исследуем взаимосвязь между переменными Y и X
2.1 Рассчитаем коэффициент корреляции между переменными и оценим силу и направление взаимосвязи между ними
Одним из показателей силы взаимосвязи между двумя переменными является коэффициент корреляции, который рассчитывается с помощью статистической функции Microsoft Excel.
Функция КОРРЕЛ (11)
Синтаксис:
КОРРЕЛ (массив_1; массив_2)
Результат:
Рассчитывает коэффициент корреляции между двумя переменными.
Аргументы:
- массив_1: диапазон значений первой переменной;
- массив_2: диапазон значений второй переменной.
R=-0,9077534
Так как коэффициент корреляции равен -0,9077534, то это означает, что существует сильная обратная взаимосвязь. Точки на поле корреляции сгруппированы вокруг прямой линии, направленной вниз и вправо.
2.2 Проверим сделанные выводы с помощью поля корреляции
Структуру двумерных данных проще всего увидеть с помощью поля корреляции. Каждая точка на этом графике соответствует одному наблюдению - по горизонтали откладывается значение одной из переменных (Х), полученное в результате наблюдения, по вертикали - значение второй переменной (Y), полученное в результате того же наблюдения (см.рисунок 2)
Рисунок 2 - Поле корреляции
Вывод: на поле корреляции видна плотная группировка точек вокруг линии, направленной вниз и вправо, т.е. коэффициент корреляции соответствует полю корреляции.
2.3 Определим фору зависимости между переменными
Между дивидендами, выплачиваемыми фирмой по обыкновенным акциям и среднегодовой стоимостью основных фондов фирмы существует сильная обратная зависимость. Точки на поле корреляции плотно сгруппированы вокруг прямой линии, направленной вниз и вправо.
3. Моделирование взаимосвязи между переменными Y и X с помощью линейной функции
3.1 Оценим с помощью метода наименьших квадратов линейное уравнение регрессии
Линейный регрессионный анализ позволяет предсказать одну переменную на основании другой с использованием прямой линии, характеризующей взаимосвязь между этими переменными:
(12)
где:
b0 - свободный член;
b1 - угловой коэффициент;
Построим уравнение линейной регрессии методом наименьших квадратов. С помощью этого метода строится уравнение регрессии, которое характеризуется наименьшей суммой квадратов отклонений реальных точек наблюдений от линии регрессии.
С помощью функции ЛИНЕЙН найдем коэффициенты:
Таблица 3 - ЛИНЕЙН
-0,397312332 |
33,12253192 |
|
0,043277695 |
3,364833792 |
|
0,824016292 |
0,460014532 |
|
84,28219519 |
18 |
|
17,83523934 |
3,809040657 |
|
b1 |
b0 |
|
Sb1 |
Sb0 |
|
R2 |
Se |
|
F |
|
|
ssоб |
ssост |
Линейное уравнение регрессии:
Y=33,12253-0,39731*X
Функция ЛИНЕЙН (13)
Синтаксис:
ЛИНЕЙН (известные_значения_у; известные_значения_х; константа; статистика)
Результат:
Рассчитывает массив данных, описывающих уравнение линейной регрессии на основе метода наименьших квадратов.
Аргументы:
- известные_значения_у: диапазон значений результирующего показателя Y;
- известные_значения_х: диапазон значений фактора Х;
- константа: логическое значение: если оно равно 0, свободный член b0 равен 0;
если оно равно 1, то b0 вычисляется обычным образом.
- статистика: логическое значение:
если оно равно 0, то функция рассчитывает только коэффициенты b0 и b1;
если оно равно 1, то функция рассчитывает дополнительную регрессионную статистику.
b1 и b0 - значения коэффициентов регрессии;
Sb1 и Sb0 - стандартные ошибки коэффициентов регрессии;
R2 - величина коэффициента детерминации;
Se - величина стандартной ошибки регрессии;
F - значение критерия Фишера для проверки гипотезы о значимости R2;
- число степеней свободы, равное n-2;
ssоб - объясненная сумма квадратов отклонений - У(yi - y)2;
ssост - остаточная сумма квадратов отклонений - Уеi2.
На поле корреляции линия регрессии отражает основную структуру данных, однако каждая отдельная точка отклоняется от этой линии на некоторую случайную величину ei, которая называется случайным отклонением. Она рассчитывается с помощью регрессии (см. приложение А).
Построим линию регрессии, добавив на поле корреляции рассчитанные значения yi (см.рисунок 3)
Рисунок 3 - Линия регрессии на поле корреляции
3.2 Проверим качество построенной модели при уровне значимости 0,05
Для двумерных данных существуют отклонения относительно линии регрессии, которые характеризуются стандартной ошибкой регрессии:
Se=0,460014532 определяем ее значение по таблице 3.
Стандартная ошибка регрессии показывает величину, на которую в среднем отклоняется значения результирующего показателя от уравнения регрессии. Чем меньше стандартная ошибка регрессии, тем точнее предсказанные данные, осуществляемые на основании этого уравнения.
Также существует еще одна характеристика точности предсказания -коэффициент детерминации (R^2).
R^2=0,824016292 (см.таблицу 3)
Значение коэффициента детерминации показывает, что 82,4% вариации результирующего показателя объясняется с помощью уравнения регрессии, а 17,6% случайностью.
Если существует значимая линейная взаимосвязь между фактором и результирующим показателем, построенное уравнение регрессии будет адекватно данным генеральной совокупности. Проверка адекватности уравнения сводится к проверке значимости линейной взаимосвязи между двумя переменными.
Проверить значимость линейной взаимосвязи можно несколькими способами:
1) Проверить значимость углового коэффициента регрессии;
2) Проверить значимость коэффициента детерминации;
Проверка значимости углового коэффициента регрессии:
Угловой коэффициент b1 показывает изменение (уменьшение) дивидендов на -0,39731 выплачиваемых фирмой по обыкновенным акциям при изменении среднегодовой стоимости основных фондов на 1 единицу.
При изменении среднегодовой стоимости основных фондов фирмы на 1 млн.руб., дивиденды уменьшаться на -0,39731.
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0: в1=0 - значение углового коэффициента генеральной совокупности незначимо, отсутствует значимая взаимосвязь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов.
Н1: в1?0 - значение углового коэффициента генеральной совокупности значимо, существует значимая взаимосвязь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов.
Для проверки используется критерий Стьюдента (t b1) и стандартная ошибка углового коэффициента регрессии (S b1).
t b1=-9180533491 (см. приложение А)
S b1=0.43277695 (см приложение А);
Критерий t b1 имеет распределение Стьюдента числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,95=0,05.
Критическая точка: t kp=2,100922037. Так как значение t-критерия попадает в одну из критических областей, то нулевая гипотеза отклоняется и принимается альтернативная.
Можно сделать выводы, что:
1) Угловой коэффициент признается значимым;
2) Существует значимая линейная взаимосвязь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов;
3) Построенной уравнение адекватно данным генеральной совокупности;
Проверка гипотезы о значимости свободного члена регрессии
Если стоимость основных фондов будет равно нулю, уровень выплачиваемых дивидендов по обыкновенным акциям будет равен 31,1285%.
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0: в0=0 - значение свободного члена генеральной совокупности незначимо.
Н1: в0?0 - значение свободного члена генеральной совокупности значимо.
Для проверки используется критерий Стьюдента (t b0) и стандартная ошибка свободного члена регрессии (S b0).
t b0=9,843734927 (см. приложение А)
S b0=3,364833792 (см приложение А);
Критерий t b0 имеет распределение Стьюдента числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,95=0,05.
Критическая точка: t kp=2,100922037. Так как значение t-критерия попадает в одну из критических областей (t b0?t kp), то нулевая гипотеза отклоняется и принимается альтернативная.
Можно сделать вывод, что:
Угловой коэффициент признается значимым, т.е. значимо отличается от нуля, это говорит о том, что линия регрессии должна проходить не через начало координат.
Проверим значимость коэффициента детерминации на уровне 0,05
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0: R^2=0 - значение коэффициента детерминации незначимо, влияние среднегодовой стоимости основных фондов объясняет незначительную долю разброса уровня выплачиваемых дивидендов.
Н1: R^2>0 - значение коэффициента детерминации значимо, влияние среднегодовой стоимости основных фондов объясняет значительную долю разброса уровня выплачиваемых дивидендов.
Для проверки используется критерий Фишера:
F=84,28219519 (см. приложение А или приложение Д)
Критерий F имеет распределение Фишера с числами степеней свободы н1=1 и н2=n-2=18 и уровнем значимости у=1-г-1-0,95=0,05.
Критическая точка: f kp=4,4138733405 рассчитывается по следующей формуле:
Функция FРАСПОБР (14)
Синтаксис:
FРАСПОБР(вероятность; степени_свободы1; степени_свободы2)
Результат:
Рассчитывает критические точки для распределения Фишера.
Аргументы:
- вероятность: уровень значимости б, соответствующий одностороннему распределению Фишера;
- степени_свободы1: первое число степеней свободы;
- степени_свободы2: второе число степеней свободы.
Значение критерия F попадает в критическую область (F?f kp), то нулевая гипотеза отклоняется и принимается альтернативная.
Можно сделать выводы, что:
1) Коэффициент детерминации признается значимым;
2) Существует значимая линейная связь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов
3) Построенное уравнение адекватно данным генеральной совокупности;
В приложении приведен режим регрессии, для проведения статистической обработки информации табличный процессор Microsoft Excel включает в себя программную надстройку «Пакет анализа», эта надстройка вызывается командой меню «Сервис - Анализ данных». В появившимся диалоговом окне, можно выбрать один из режимов статистической обработки данных. Режим работы «Регрессия» служит для расчета параметров уравнения линейной регрессии и проверки его качества.
3.3 Проверим наличие автокорреляции остатков графическим методом и методом рядов при уровне значимости 0,05
Наиболее наглядный способ проверки наличия автокорреляции остатков состоит в построении диагностической диаграммы: поля корреляции между случайными отклонениями ei и значениями фактора xi. Значения случайного отклонения откладываются по вертикальной оси, прогнозируемые значения результирующего показателя - по горизонтальной оси. (см. рисунок 4).
Рисунок 4 - Диагностическая диаграмма
При анализе диагностической диаграммы можно сделать вывод, что: между точками на поле взаимосвязи не наблюдается, диаграмма представляет собой облако из точек, расположенных хаотично и неупорядоченно, следовательно, автокорреляция остатков отсутствует, значит, предпосылки МНК выполняются.
Автокорреляцией остатков называется зависимость между значениями случайных отклонений, упорядоченными по значениям фактора.
Таблица 4 - Данные для метода рядов
X |
ei |
|
73,81 |
0,993091311 |
|
74,22 |
0,335989368 |
|
74,52 |
0,075183067 |
|
75,18 |
0,367409207 |
|
75,34 |
-0,88902082 |
|
76,06 |
-1,00295594 |
|
76,4 |
-0,07786975 |
|
76,63 |
0,253512088 |
|
76,98 |
-0,1074286 |
|
77,4 |
-0,39055742 |
|
X |
ei |
|
77,97 |
-0,204089387 |
|
78,14 |
0,18345371 |
|
78,79 |
-0,418293274 |
|
79 |
0,055142315 |
|
79,81 |
-0,143034696 |
|
79,86 |
0,186830921 |
|
80,64 |
0,03673454 |
|
80,67 |
0,33865391 |
|
81,2 |
0,079229446 |
|
81,65 |
0,328019995 |
Упорядочиваем наблюдения по увеличению значения фактора X;
1) Определяем знаки всех случайных отклонений;
2) Определяем количество рядов k=9 (ряд - это последовательность случайных отклонений с одинаковым знаком);
3) Определяем общее количество случайных отклонений со знаком + (n1=12) и общее количество случайных отклонений со знаком - (n2=8).
4) По таблице метода рядов (см. приложение В) определяем k1=6 - нижнюю границу количества рядов и k2=16 - верхнюю границу.
5) Т.к. k1<k<k2, то можно сделать вывод о том, что автокорреляция остатков отсутствует.
3.4 Проверим наличие гетероскедастичности графическим методом и с помощью теста Голдфелда-Квандта при уровне значимости 0,01
Гетероскедастичность - различные дисперсии случайных отклонений. Проверим наличие гетероскедастичности графическим методом (см. рисунок 5)
Рисунок - 5 Диагностическая диаграмма
Можно сделать вывод, что гетероскедастичность присутствует. Дисперсия случайных отклонений различается для разных значений Y.
Проверим наличие гетероскедастичности с помощью теста Голдфелда-Квандта.
Определим размерность частей, на которые необходимо разбить исследуемую совокупность. При n=30, k=11, а нашем случае n=20, тогда k=7.
Размерность первой части будет равна, k=7, второй части n-2*k=20-2*7=6, третьей части k=7.
Таблица 5 - Первая часть исследуемой совокупности
Первая часть |
|||
i |
Xi |
Yi |
|
1 |
73,81 |
4,79 |
|
2 |
74,22 |
3,97 |
|
3 |
74,52 |
3,59 |
|
4 |
75,18 |
3,62 |
|
5 |
75,34 |
2,3 |
|
6 |
76,06 |
1,9 |
|
7 |
76,4 |
2,69 |
Для оценки первой части воспользуемся функцией ЛИНЕЙН.
Таблица 6 - Функция ЛИНЕЙН для 1 части
-0,92486 |
72,70020483 |
|
0,236313 |
17,74261339 |
|
0,753901 |
0,551495243 |
|
15,31706 |
5 |
|
4,658636 |
1,520735018 |
Остаточная дисперсия Se1^2=0,551495243^2=0,304147004
Таблица 7 - Третья часть исследуемой совокупности
Третья часть |
|||
i |
Xi |
Yi |
|
1 |
79 |
1,79 |
|
2 |
79,81 |
1,27 |
|
3 |
79,86 |
1,58 |
|
4 |
80,64 |
1,12 |
|
5 |
80,67 |
1,41 |
|
6 |
81,2 |
0,94 |
|
7 |
81,65 |
1,01 |
Для оценки уравнения регрессии третьей части воспользуемся функцией ЛИНЕЙН
Таблица 8 - Функция ЛИНЕЙН для 3 части
-0,30077 |
25,48632 |
|
0,07297 |
5,86741 |
|
0,772623 |
0,162062 |
|
16,98992 |
5 |
|
0,446223 |
0,13132 |
Остаточная дисперсия Se3^2=0,162062^2=0,02626
Найдем значение F-критерия:
Таблица 9 - Расчетное значение F-критерия
F |
f kp |
|
11,58038446 |
10,96702065 |
Критерий F имеет распределение Фишера с числами степеней свободы
н1=н2=k-m-1=7-1-1=5
Так как F>f kp, следовательно, присутствует гетероскедастичность.
3.5 Вывод, можно ли использовать линейную модель для прогнозирования
Точки на поле корреляции связаны линейной связью. Угловой коэффициент регрессии и свободный член регрессии значимы, автокорреляция остатков отсутствует, но присутствует гетероскедастичность, следовательно, линейную модель нельзя использовать для прогнозирования.
4 Составление спецификации степенной регрессионной модели и расчет параметров нового уравнения
Степенная функция представляет собой зависимость:
Y = b0 ? Xb1
Для определения коэффициентов степенной функции необходимо построить уравнение линейной регрессии, в котором результирующим показателем является переменная Y' = ln Y, а фактором переменная X' = ln X:
Y' = b0' + b1 ? X'
Коэффициент b0 степенной функции можно определить следующим образом: b0 = eb0'
Таблица 10 - Расчет значений для определения экспоненциальной функции
X |
Y |
X" |
Y" |
|
1 |
2 |
3 |
4 |
|
73,81 |
4,79 |
4,301494224 |
1,566530411 |
|
74,22 |
3,97 |
4,307033656 |
1,378766095 |
|
74,52 |
3,59 |
4,311067546 |
1,278152203 |
|
1 |
2 |
3 |
4 |
|
75,18 |
3,62 |
4,319885 |
1,286474026 |
|
75,34 |
2,3 |
4,322011 |
0,832909123 |
|
76,06 |
1,9 |
4,331523 |
0,641853886 |
|
76,4 |
2,69 |
4,335983 |
0,989541194 |
|
76,63 |
2,93 |
4,338989 |
1,075002423 |
|
76,98 |
2,43 |
4,343546 |
0,887891257 |
|
77,4 |
1,98 |
4,348987 |
0,683096845 |
|
77,97 |
1,94 |
4,356324 |
0,662687973 |
|
78,14 |
2,26 |
4,358502 |
0,815364813 |
|
78,79 |
1,4 |
4,366786 |
0,336472237 |
|
79 |
1,79 |
4,369448 |
0,58221562 |
|
79,81 |
1,27 |
4,379649 |
0,2390169 |
|
79,86 |
1,58 |
4,380275 |
0,457424847 |
|
80,67 |
1,41 |
4,390367 |
0,343589704 |
|
80,64 |
1,12 |
4,389995 |
0,113328685 |
|
81,2 |
0,94 |
4,396915 |
-0,061875404 |
|
81,65 |
1,01 |
4,402442 |
0,009950331 |
Рассчитаем новые значения экспоненциальной функции с помощью ЛИНЕЙН:
Таблица 11 - Значения экспоненциальной функции
-14,00041364 |
61,64357 |
|
1,168336118 |
5,08538 |
|
0,888611967 |
0,159869 |
|
143,5972518 |
18 |
|
3,670068717 |
0,460045 |
Рассчитаем значение b0 = eb0':
b0=EXP(61,64375)= 5,90832E+26
Y=5,90832E+26*X^-14,0004
5 Проверка качества новой модели при новом уровне значимости, а также наличие автокорреляции остатков
5.1 Проверка качества степенной функции при уровне значимости 0,05
Для двумерных данных существуют отклонения относительно линии регрессии, которые характеризуются стандартной ошибкой регрессии, для ее расчета и расчета коэффициента детерминации воспользуемся функцией ЛИНЕЙН:
Таблица 12 - ЛИНЕЙН
-14,00041364 |
61,64357465 |
|
1,168336118 |
5,08537992 |
|
0,888611967 |
0,159868917 |
|
143,5972518 |
18 |
|
3,670068717 |
0,460045273 |
Se=0,159868917
R^2=0,888611967
Значение коэффициента детерминации показывает, что 88,9%вариации уровня выплачиваемых дивидендов объясняется с помощью уравнения регрессии действием среднегодовой стоимости основных фондов, а 11,1% случайностью.
Проверим значимость углового коэффициента регрессии:
При изменении среднегодовой стоимости основных фондов на 1 млн.руб., дивиденды, выплачиваемые фирмой уменьшаться на 14,0004%
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0:в1=0 - Значение углового коэффициента генеральной совокупности незначимо, отсутствует значимая взаимосвязь между среднегодовой стоимостью
H1:в?0 - Значение углового коэффициента генеральной совокупности значимо, существует значимая взаимосвязь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов.
Для проверки используется критерий Стьюдента. Критерий t b1 рассчитывается из функции РЕГРЕССИИ (см. приложение Б). Критерий t b1 имеет распределение Стьюдента с числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,95=0,05.
S b1=1,16834 (см.приложение Б);
t b1=-11,98321 (см. приложение Б);
Критическая точка: t kp=2,10092. Так как значение t-критерия попадает в одну из критических областей (t b1?t kp), следовательно, нулевая гипотеза отклоняется и принимается альтернативная.
Вывод:
1) Угловой коэффициент признается значимым;
2) Существует значимая линейная связь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов;
3) Построенное уравнение адекватно данным генеральной совокупности;
Проверка гипотезы о значимости свободного члена регрессии
Если стоимость основных фондов будет равна нулю, уровень выплачиваемых дивидендов по обыкновенным акциям будет равен 33,1285%.
Проверка значимости свободного члена регрессии.
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0:в1=0 - Значение свободного члена генеральной совокупности незначимо;
H1:в?0 - Значение свободного члена генеральной совокупности значимо;
Критерий t b0 рассчитывается из функции РЕГРЕССИИ (см. приложение Б). Критерий t b0 имеет распределение Стьюдента с числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,95=0,05.
S b0=5,08538 (см.приложение Б);
t b0=12,12172 (см. приложение Б);
Критическая точка: t kp=2,10092. Так как значение t-критерия попадает в одну из критических областей (t b0?t kp), следовательно, нулевая гипотеза отклоняется и принимается альтернативная.
Вывод: Свободный член признается значимым, т.е. значимо отличающимся от нуля. Это говорит о том, что линия регрессии не должна проходить через начало координат.
Проверим значимость коэффициента детерминации:
Проверим значимость коэффициента детерминации на уровне 0,05
Нулевая и альтернативная гипотезы формулируются следующим образом:
H0: R^2=0 - значение коэффициента детерминации незначимо, влияние среднегодовой стоимости основных фондов объясняет незначительную долю разброса уровня выплачиваемых дивидендов.
Н1: R^2>0 - значение коэффициента детерминации значимо, влияние среднегодовой стоимости основных фондов объясняет значительную долю разброса уровня выплачиваемых дивидендов.
Для проверки используется критерий Фишера:
F=143,5972 (см. приложение Б )
Критерий F имеет распределение Фишера с числами степеней свободы н1=1 и н2=n-2=18 и уровнем значимости у=1-г-1-0,95=0,05.
Критическая точка: f kp=4,41387
Значение критерия F попадает в критическую область (F?f kp), то нулевая гипотеза отклоняется и принимается альтернативная.
Можно сделать выводы, что:
1) Коэффициент детерминации признается значимым;
2) Существует значимая линейная связь между среднегодовой стоимостью основных фондов и уровнем выплачиваемых дивидендов;
3) Построенное уравнение адекватно данным генеральной совокупности;
Проверим наличие автокорреляции остатков графическим методом
Для нахождения значений ei и yi воспользуемся режимом регрессии (см. приложение), на основании этих данных построим диагностическую диаграмму:
Рисунок 6 - Диагностическая диаграмма
Между точками на поле взаимосвязи не наблюдается, диаграмма представляет собой облако из точек, расположенных хаотично, неупорядоченно, следовательно, автокорреляция остатков отсутствует, значит, предпосылки МНК выполняются.
6 Нанесение на поле корреляции двух графиков функций регрессии. Сравнивание качества построенных моделей. Выбор модели для выражения исследуемой зависимости
Построение линий тренда можно использовать для определения коэффициентов уравнения регрессии и величины коэффициента детерминации, что удобно для сравнения качества нескольких регрессионных моделей.
Линии тренда наносятся на уже готовое поле корреляции.
Чтобы построить линию тренда необходимо:
1) Выделить область диаграммы;
2) Выбрать команду меню Диаграмма - Добавить линию тренда;
3) На закладке «Тип» выбрать тип линии тренда;
4) На закладке «Параметры» установить флажки: «показывать уравнение на диаграмме» и «поместить на диаграмму величину достоверности аппроксимации» (см. рисунок 7)
Рисунок 7 - Линейная и степенная регрессионные модели
Адекватность, согласно этому признаку, лучшей считается степенная функция, так как, R^2=0,888>0,824
Согласованность с теорией, в линейной функции присутствует гетероскедастичность, значит одна из предпосылок МНК не выполняется, для степенной функции стандартная ошибка меньше(0,159869) чем для линейной(0,4600145);
Простота - лучшей является линейная функция;
Соответствие прогнозам, в линейной функции присутствует гетероскедастичность, значит прогнозы будут недостаточно точны;
Предпочтительней является степенная функция.
Построение 99%-ого доверительного интервала для теоретических коэффициентов наилучшей регрессии, т.е. для степенной регрессионной модели
Построим 99% доверительный интервал для теоретического значения углового коэффициента
Критерий t b1 имеет распределение Стьюдента с числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,99=0,01
Критическая точка: t kp=2,878
Нижняя граница интервала равна:
-14,0004-2,878*1,16834=-17,363
Верхняя граница интервала равна:
-14,0004+2,878*1,16834=-10,637
На 99% можно быть уверенными, что значение углового коэффициента находится в интервале от -17,3634 до -10,6374.
Критерий t b0 имеет распределение Стьюдента с числом степеней свободы н=n-2=20-2=18 и уровнем значимости у=1-г=1-0,99=0,01
Критическая точка: t kp=2,878
Нижняя граница интервала равна:
61,64357-2,878*5,08538=47,006
Верхняя граница интервала равна:
61,64357+2,878*5,08538=76,282
На 99% можно быть уверенными, что значение свободного члена находится в интервале от 47,006 до 76,282
7 Расчет по наилучшей регрессионной модели точечных прогнозов
Расчет по наилучшей регрессионной модели точечных прогнозов среднего значения уровня дивидендов при стоимости основных фондов 82 млн. руб. И 79 млн. руб.. Построение 90%-х доверительных интервалов для индивидуальных значений уровня дивидендов. Определение наиболее точного прогноза.
Точечная оценка - определяется путем подстановки заданного значения фактора в уравнение регрессии: Y=b0*X^b1.
b0 =5,90832E+26 (см. приложение Б)
b1= -14,0004136 (см. приложение Б)
x1=82
x2=79
Y1=b0+b1*x1= 61,64357465-14,0004136*82=-0,052317615
Y2=b0+b1* x2= 61,64357465-14,0004136*79=0,469497329
Таблица 13 - Данные для расчета точечного прогноза
Xcp |
(X0-Xcp)^2(1) |
Sb1^2 |
Se^2 |
|
4,352561 |
0,002933111 |
1,365009 |
0,025558 |
Для отдельного наблюдения результирующего показателя при заданном значении x0, доверительный интервал строится следующим образом:
(Y0- t kp*SY|X0 ; Y0- t kp*SY|X0 ) (15)
где:
SY|X0 - стандартная ошибка нового наблюдения, которая рассчитывается по формуле:
SY|X0 = (16)
Для х1=82:
SY|X0 1 |
0,176016157 |
||
Нижняя граница |
-0,35754082 |
0,699394146 |
|
Верхняя граница |
0,252905595 |
1,2877617 |
|
Критич.точка |
|||
1,734063592 |
Вывод: С вероятность 90% можно утверждать, что при среднегодовой стоимости основных фондов 82 млн.руб. значение уровня дивидендов по обычным акциям попадет в интервал от 0,699394146 до 1,2877617
Для х2=79:
SY|X0 2 |
0,165000686 |
||
Нижняя граница |
0,183375648 |
1,201265576 |
|
Верхняя граница |
0,755619011 |
2,128928946 |
|
Критич.точка |
|||
1,734063592 |
Вывод: С вероятность 90% можно утверждать, что при среднегодовой стоимости основных фондов 79 млн.руб. значение уровня дивидендов по обычным акциям попадет в интервал от 1,201265576 до 2,128928946
Вывод: Прогноз является более точным при стоимости основных фондов 79 млн.руб., чем при значении 82 млн.руб., видно, что величина стандартной ошибки тем меньше, чем ближе заданное значение основных фондов находится к среднему значению (77,7135)
Список литературы
1 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №1, 2011 г., 13 стр.
2 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №2, 2011 г., 12 стр.
3 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №3, 2011 г., 15 стр.
4 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №4, 2006 г., 14 стр.
5 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №5, 2006 г., 16 стр.
6 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №6, 2006 г., 15 стр.
7 Саяпина Е.Д. Методические указания по выполнению лабораторных работ, Лабораторная работа №7, 2006 г., 19 стр.
8 Саяпина Е.Д., Кулакова Ю.В. Методическое пособие: методические указания по выполнению курсовой работы по курсу «Эконометрика» для студентов дневного отделения, 2012 г., 56 стр.
9 Саяпина Е. Д. Лекции «Эконометрика» для студентов 3-го курса специальности «Бухгалтерский учет, анализ и аудит» дневного отделения
Размещено на Allbest.ru
Подобные документы
Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Оценка распределения переменной Х1. Моделирование взаимосвязи между переменными У и Х1 с помощью линейной функции и методом множественной линейной регрессии. Сравнение качества построенных моделей. Составление точечного прогноза по заданным значениям.
курсовая работа [418,3 K], добавлен 24.06.2015Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.
контрольная работа [441,9 K], добавлен 13.10.2014Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Расчет уравнения линейной регрессии. Построение на экран графика и доверительной области уравнения. Разработка программы, генерирующей значения случайных величин, имеющих нормальный закон распределения для определения параметров уравнения регрессии.
лабораторная работа [18,4 K], добавлен 19.02.2014