Взвешенный метод наименьших квадратов
Вектор оценок параметров регрессионного уравнения. Классическая оценка ковариационной матрицы метода наименьших квадратов, оценка параметров. Разработка программного обеспечения. Дисперсия ошибки. Однородные группы наблюдений, формула Стерджесса.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 02.02.2019 |
Размер файла | 991,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Статья по теме:
Взвешенный метод наименьших квадратов
Д.Ч. Абдильдинова, О.Н. Канева, Е.С. Дубейко Федеральное учреждение Омский государственный технический университет, Россия г. Омск
В процессе исследования был изучен взвешенный метод наименьших квадратов, разработано и реализовано программное обеспечение. Проведены численные эксперименты.
Ключевые слова: аппроксимация, интерполяция, уравнение регрессии, метод наименьших квадратов, взвешенный метод наименьших квадратов, гетероскедастичность
Развитие новых технологий, применение новых наблюдательных методик и компьютеризация способствуют повышению точности измерений. Для реализации точности вычислений методы обработки данных также должны постоянно совершенствоваться.
Метод наименьших квадратов (МНК) -- математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений аппроксимирующих функций от искомых переменных. МНК является одним из базовых методов регрессионного анализа и используется для оценки неизвестных параметров регрессионных моделей по выборочным данным.
Обычно в качестве регрессионного уравнения используется функция линейная относительно своих параметров[1]. Общий вид такой функции:
(1)
где заданные функции от факторов(i=), X=(t, ).
Критерием МНК является сумма квадратов ошибок, которая в данном случае выглядит следующим образом:
SSE= (2)
где =(, ), (i=); e вектор ошибок.
Введем векторно-матричное обозначение:
(3)
, ,
где y-вектор-столбец наблюдений объясняемой переменной.
Тогда вектор оценок параметров регрессионного уравнения находятся по формуле:
B=, (4)
где обратная.
Для того чтобы вектор оценок B полученный с помощью МНК являлся состоятельным, несмещенным и эффективным должен выполнятся ряд условий, называемых условиями выполнимости метода наименьших квадратов. Одним из таких условий является условие гомоскедастичности данных, т.е. дисперсии ошибок модели должны быть одинаковы для всех точек данных. Невыполнение этого условия называется гетероскедастичностью данных. Наличие гетероскедастичности случайных ошибок приводит к неэффективности оценок, полученных с помощью обычного метода наименьших квадратов. Кроме того, в этом случае оказывается смещённой и несостоятельной классическая оценка ковариационной матрицы МНК-оценок параметров.
Так как
SSE= (5)
где Wковариационная матрица ошибок, которая в случае гетероскедастичности данных является диагональной матрицей.
Если ковариационная матрица ошибок диагональная (имеется гетероскедастичность ошибок, но нет автокорреляции), то обобщённая сумма квадратов является фактически взвешенной суммой квадратов, где веса обратно пропорциональны дисперсиям ошибок. В этом случае говорят о взвешенном МНК.
(6)
Как и в общем случае, дисперсии ошибок неизвестны и их необходимо оценить из тех же данных. Поэтому делают некоторые упрощающие предположения о структуре гетероскедастичности.
В данной работе рассмотрены два подхода:
Дисперсия ошибки пропорциональна некоторой переменной. В основе этого подхода ложится предположение о том, что дисперсия ошибок будет изменяться при изменении значений какого-либо фактора, т.е. величины ошибок и фактора X должны быть коррелированны.
Рассчитывается коэффициент корреляции Спирмена по формуле:
.
Проводится его тест на значимость. Если тест подтверждает значимость коэффициента корреляции, то разделить все переменные на фактор X(включая константу, то есть появится новая переменная 1/ X).
К преобразованным данным применяется обычный МНК для получения оценок параметров.
2) Однородные группы наблюдений[2].
Определяем число групп по формуле Стерджесса:
(7)
Величина интервала группировки находится по формуле: .
Модель оценивают обычным МНК и находят остатки.
По остаткам внутри каждой группы оценивают дисперсии .
Данные каждой j-й группы наблюдений делятся на .
К преобразованным подобным образом данным применяется обычный МНК.
Для анализа эффективности взвешенного метода наименьших квадратов были проведены численные эксперименты для различных временных рядов. Пример сравнения оценок качества одной из этих моделей представлен на рисунке 1. На рисунке изображена модель до преобразования и после, так же показаны графики остатков.
Рисунок 1 - Результат численного эксперимента
На рисунке 2 приведен пример реализации метода однородных групп наблюдений в MSExcel и на языке программирования C#. На рисунке 3 приведен пример реализации метода, когда дисперсия ошибок пропорциональна фактору X.
Рисунок 2 - Результат численного эксперимента для однородных групп наблюдения
регрессионный уравнение матрица квадрат
Рисунок 3 - Результат численного эксперимента при гетероскедастичности данных
Библиографический список
1. Дрейпер, Н. Прикладной регрессионный анализ [Текст]: пер. с англ. Ю.П. Адлером, В.Г. Горским. / Н. Дрейпер, Г. Смит. - книга 2, 2-е изд. - М.: Финансы и статистика, 2012. - 304 с.
2. Понятский, В.М. Использование метода группового учета аргументов для выбора структуры модели динамического объекта [Текст] / В.М. Понятский, С.И. Велешки, А.В. Жирнова. // Известия Тульского государственного университета. Технические науки. - 2013. - №2.
Размещено на Allbest.ru
Подобные документы
Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.
реферат [383,7 K], добавлен 19.08.2015Оценка неизвестных величин по результатам измерений, содержащим случайные ошибки, при помощи метода наименьших квадратов. Аппроксимация многочленами, обзор существующих методов аппроксимации. Математическая постановка задачи аппроксимации функции.
курсовая работа [1,9 M], добавлен 12.02.2013Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.
курсовая работа [1,0 M], добавлен 29.01.2010Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Неопределенный интеграл. Объем тела вращения. Эмпирическая формула. Сходимость ряда. Вычисление объема тела, образованного вращением вокруг оси ОХ фигуры, ограниченной линиями. Исследование на условную сходимость по признаку Лейбница.
контрольная работа [25,8 K], добавлен 27.05.2004Градиентные уравнения и уравнения в вариациях, функционалы метода наименьших квадратов. Численное решение градиентных уравнений: полиномиальные системы, метод рядов Тейлора и метод Рунге-Кутта. Числовые модели осциллирующих процессов в живой природе.
реферат [221,4 K], добавлен 10.08.2010Аппроксимация и теория приближений, применение метода наименьших квадратов для оценки характера приближения. Квадратичное приближение таблично заданной функции по дискретной норме Гаусса. Интегральное приближение функции, которая задана аналитически.
реферат [82,0 K], добавлен 05.09.2010Закон больших чисел. Нахождение точечных оценок. Построение неизвестной дисперсии погрешности измерений. Выборочная функция распределения. Теорема Ляпунова и распределение Стьюдента. Вычисление доверительных интервалов. Построение интервальных оценок.
курсовая работа [4,3 M], добавлен 18.12.2011Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.
лабораторная работа [166,4 K], добавлен 13.04.2016