Метод непараметрической оценки закона распределения случайного параметра по малому числу наблюдений
Разработка и исследование метода проверки гипотез о виде функции плотности распределения случайной величины в условиях значительной априорной неопределенности. Особенности оценки потенциальной возможности повышения достоверности их классификации.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 29.06.2017 |
Размер файла | 97,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Метод непараметрической оценки закона распределения случайного параметра по малому числу наблюдений
Введение
распределение плотность неопределенность
Нестационарные системы характеризуются быстрым изменением значений параметров, поэтому для осуществления их эффективного мониторинга представляется целесообразным использование методов статистического анализа случайных процессов, ориентированных на работу с малым числом наблюдений. В основу традиционных методов обработки статистической информации положена идея группировки данных (гистограммы, Критерий Пирсона и пр.), что при анализе выборок значительного объема позволяет добиться заданной достоверности оценок. Однако, как показано в работе [1], группировка наблюдений неизбежно связана с потерей информации, которую теоретически возможно извлечь из массива данных. Это говорит о том, что выборки большого объема содержат избыточную для достижения заданной точности оценок информацию. Исходя из этого, можно естественным образом определить понятие «малой выборки»: выборку следует считать «малой», если при ее обработке методами, основанными на группировке наблюдений, нельзя достичь заданной точности [1].
Таким образом, при работе с малыми выборками данных следует отказаться от группировки наблюдений и перейти к методам, основанным на использовании каждой отдельной реализации. В работе представлен метод имитационного дополнения малой выборки, основанный, во-первых, на идее аддитивной аппроксимации плотности распределения случайной величины симметричными вкладами [1,4,6], во-вторых, на использовании численных методов и возможности имитационного моделирования случайных процессов при помощи современных ЭВМ [3].
Метод имитационного дополнения
Суть метода имитационного дополнения состоит в генерации дополняющих массивов в окрестности каждого элемента исходной выборки, как показано на рис.1. Этот процесс логически близок к сглаживанию ступенчатой функции распределения и позволяет свести обработку малой выборки к существующим хорошо разработанным технологиям, таким как, например, критерий Пирсона, который, как известно, дает устойчивый результат при анализе выборок данных, объемом более пятидесяти значений [2].
Рис. 1. - Имитационное дополнение малой выборки
Для исследования предлагаемого метода в программной среде MatLab был проведен следующий статистический эксперимент. Формировалась генеральная совокупность (ГС) путем преобразования массива данных, распределенных по равновероятному закону. Например, для получения распределения Рэлея:
(1)
где - случайные числа, распределенные равномерно; - параметр распределения.
Генеральная совокупность проверялась на соответствие заданному закону распределения критерием согласия Пирсона. Если проверка давала значение , соответствующие вероятности менее 0.5, результаты эксперимента отбрасывались, поскольку принималась гипотеза о несостоятельности начальных условий [4]. Из генеральной совокупности извлекалась серия малых выборок путем формирования массива случайных номеров элементов ГС. Для анализа были выбраны следующие законы распределения: распределение Рэлея; Нормальное распределение; Логарифмическое нормально распределение; Экспоненциальное и Бета распределения.
Метод имитационного дополнения реализовывался следующим образом. При помощи встроенных средств MatLab генерировалась серия случайных величин , математические ожидания которых совпадали с соответствующими элементами анализируемой выборки (назовем их вкладами по аналогии с методом аддитивной аппроксимации), а дисперсия вычислялась по формуле:
(2)
где и - априорно известные границы диапазона изменения параметра, в эксперименте они брались равными наибольшему и наименьшему значениям ГС соответственно; - коэффициент дисперсии вклада, .
Расширенная выборка (РВ) формировалась в соответствии со следующим правилом:
(3)
Классификация осуществлялась следующим образом. По малым выборкам производилась оценка математического ожидания и дисперсии, в соответствии с которыми задавался ряд гипотетических распределений. Затем выборки (как малые, так и расширенные) проверились при помощи критерия согласия Пирсона на степень соответствия каждому из гипотетических распределений. Из полученных значений строился вариационный ряд. Как истинная принималась гипотеза о распределении, давшем наименьшее значение в этом ряду. Поскольку исходное распределение ГС известно, имелась возможность оценить число ошибок классификации. Следует отметить, что абсолютные значения расширенных выборок значительно превышали значения, рассчитанные для необработанных выборок, однако как устойчивость, так и различимость результатов в этом случае была выше.
Совершенно очевиден тот факт, что достоверность классификации в значительной степени зависит от параметров вкладов. Для определения оптимальных значений n и k был проведен двухфакторный эксперимент, позволивший получить зависимости числа верных классификаций от этих параметров. Алгоритм данного эксперимента представлен на рис. 2.
Рис. 2. - Алгоритм оценки зависимости эффективности метода от параметров вкладов.
Зависимости числа правильно классифицированных выборок от коэффициента дисперсии вклада k и числа элементов во вкладе n для различных законов распределения случайной величины представлены на рис. 3 - 5.
Рис. 3 - Зависимость числа правильно классифицированных выборок (из 100) от коэффициента дисперсии вклада k и числа элементов во вкладе n для распределения Рэлея.
Рис. 4 - Зависимость числа правильно классифицированных выборок (из 100) от коэффициента дисперсии вклада k и числа элементов во вкладе n для Логарифмического нормального распределения.
Из графиков, показанных на рис. 3 - 4, видно, что для распределения Рэлея и Логарифмического нормального распределений число верно классифицированных выборок максимизируется при n>10 и k=0.2. Для нормального распределения оптимальные значения параметров другие: k=0.1, n>10, что следует из рис. 5.
Таким образом, при правильном выборе параметров вкладов количество верно классифицированных выборок может достигать 80% [10], однако сам факт зависимости оптимального значения коэффициента дисперсии вклада от вида плотности распределения исходной случайной величины, очевидно, требует дальнейшего исследования.
Рис. 5 - Зависимость числа правильно классифицированных выборок (из 100) от коэффициента дисперсии вклада k и числа элементов во вкладе n для Нормального распределения.
Результаты исследований, изложенные в данной статье, получены при финансовой поддержке Минобрнауки РФ в рамках реализации госзадания №213.01-11/2014-47 «Разработка систем диагностики состояния биологических и технических объектов с использованием алгоритмов анализа нестационарных сигналов».
Литература
1. Гаскаров Д.В., Шаповалов В.И. Малая выборка. М.: Статистика, 1978. 248 с.
2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.
3. Жовинский А.Н., Жовинский В.Н. Инженерный экспресс-анализ случайных процессов. М: Энергия, 1979. 112 с.
4. Гузик В.Ф., Кидалов В.И., Самойленко А.П. Статистическая диагностика неравновесных объектов. СПб: Судостроение, 2009. 304 с.
5. Лапко А.В., Шарков Н.А. Непараметрические методы обнаружения закономерностей в условиях малых выборок. Приборостроение 2008. №8, Т.51., с. 62-67.
Размещено на Allbest.ru
Подобные документы
Оценивание параметров закона распределения случайной величины. Точечная и интервальная оценки параметров распределения. Проверка статистической гипотезы о виде закона распределения, нахождение параметров системы. График оценки плотности вероятности.
курсовая работа [570,4 K], добавлен 28.09.2014Определение вероятности случайного события, с использованием формулы классической вероятности, схемы Бернулли. Составление закона распределения случайной величины. Гипотеза о виде закона распределения и ее проверка с помощью критерия хи-квадрата Пирсона.
контрольная работа [114,3 K], добавлен 11.02.2014Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.
контрольная работа [38,5 K], добавлен 25.03.2015Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.
курсовая работа [57,0 K], добавлен 13.10.2009Генеральная совокупность подлежащих изучению объектов или возможных результатов наблюдений, производимых в одинаковых условиях над одним объектом. Описание наблюдаемых значений случайной величины Х. Характеристика статистической функции распределения.
курсовая работа [216,5 K], добавлен 03.05.2011Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Конечное или счетное множество как совокупность возможных значений дискретной случайной величины. Анализ закона распределения функции одного случайного аргумента. Характеристика условий, от которых зависит монотонное возрастание и убывание функции.
презентация [443,3 K], добавлен 24.04.2019Особенности функции распределения как самой универсальной характеристики случайной величины. Описание ее свойств, их представление с помощью геометрической интерпретации. Закономерности вычисления вероятности распределения дискретной случайной величины.
презентация [69,1 K], добавлен 01.11.2013Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.
контрольная работа [104,7 K], добавлен 24.01.2013Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.
контрольная работа [318,9 K], добавлен 26.04.2013