Кумулянтный метод идентификации вида закона распределения результатов измерений

Новый кумулянтный метод, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений, при этом правильность гипотезы может быть проверена с помощью известных критериев, например Колмогорова или Стьюдента.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 21.11.2020
Размер файла 120,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Ростовский технологический институт туризма и сервиса (филиал ФГОУ ВПО «Южно-российского государственного университета экономики и сервиса»

Кумулянтный метод идентификации вида закона распределения результатов измерений

Дмитрий Анатольевич Безуглов - д.т.н., проф., проректор по учебно-методической работе,

Иван Владимирович Андрющенко - аспирант, каф. «Информационные технологии в сервисе»,

Светлана Александровна Швидченко - ассистент, каф. «Информационные технологии в сервисе»,

A new cumulant method is designed to fully automate the process of determining type of distribution function for results of measurement, and the correctness of the hypothesis can be tested in future using the known criteria, such as Kolmogorov's or Student's; authors present a practical implementation of the method on the example of computational experiment.

Key words: identification of distribution function type, cumulant analysis method of measurement results, moments of distribution, cumulants of distribution.

Разработан новый кумулянтный метод, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений, при этом правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента; представлена практическая реализация метода на примере проведения вычислительного эксперимента.

Ключевые слова: идентификации вида закона распределения, кумулянтный метод анализа результатов измерений, моменты распределения, кумулянты распределения.

кумулянтный измерение стьюдент

Под идентификацией закона распределения наблюдаемой случайной величины понимается нахождение такого закона, который бы в статистическом смысле не противоречил имеющимся наблюдениям. Практика использования нормального закона распределения для описания ошибок средств измерения не всегда оправдана [1, 5]. В основе измерительных приборов и систем лежат различные физические принципы, методы измерений и преобразования измерительных сигналов. Погрешности измерений являются следствием влияния множества факторов случайного и неслучайного характера, действующих постоянно или эпизодически. Поэтому понятно, что только при выполнении определенных предпосылок (теоретических и технических) погрешности измерений достаточно хорошо описываются нормальным законом распределения.

При автоматизации обработки результатов измерений рассматривается задача идентификации закона распределения случайных величин, которая обычно решается с применением статистических критериев согласия Пирсона, Колмогорова, Колмогорова - Смирнова, а также критерия омега-квадрат. В последние годы появились предложения об аппроксимации законов распределения без использования критериев согласия. Задача выбора закона распределения для данной выборки значений случайной величины решается в этом случае как задача приближения функции на заданных аналитических законах распределений. В качестве закона распределения выбирается закон такого распределения, которое находится на минимальном расстоянии (например, может быть выбрана статистика Пирсона, Колмогорова и др.) от эмпирического закона распределения, построенного по соответствующей выборке. Выбор числовых параметров законов распределений выполняется на основе обработки всех данных единственной выборки случайной величины, в то время как при использовании критериев согласия параметры требуется определять по иной выборке значений случайной величины.

Однако недостатком всех рассмотренных выше подходов является то, что гипотеза о виде распределения определяется эмпирически. То есть исследователь должен по виду полученной функции распределения вероятностей (эмпирической функции распределения или гистограммы) исходя из своего опыта, определить теоретический закон, которым она описывается.

Целью данной работы является разработка кумулянтного метода идентификации вида закона распределения на базе анализа результатов измерений. В дальнейшем правильность гипотезы может быть проверена с помощью известных критериев, например Колмогорова или Стьюдента.

Кумулянтный анализ

Кумулянтное описание случайных величин дает столь же полное их статистическое представление, сколь и моментное, и обладает важными преимуществами [3], первое из которых заключается в том, что кумулянты, в отличие от моментов, имеют четко выраженный самостоятельный статистический характер и могут быть заданы в определенной степени независимо друг от друга, являясь с этой точки зрения некоторыми «нормальными координатами» статистического описания. Это приводит, например, к тому, что различные статистические средние «выходов» нелинейных преобразований выражаются простым образом именно через кумулянты «входных» переменных [3, 5].

Второе преимущество кумулянтов связано с тем, что учет их высших порядков позволяет просто описать любую степень негауссовости случайных величин. По этой причине основную ценность кумулянтное описание имеет именно для негауссовых переменных [2, 5].

Третье, весьма важное преимущество кумулянтного описания случайных величин обусловлено тем, что конечному набору кумулянтов всегда соответствует некоторая вещественная функция, аппроксимирующая вероятностное распределение. Это обстоятельство имеет особое значение при приближенном представлении вероятностных распределений тех случайных величин, для которых можно отыскать лишь конечные наборы кумулянтов [5].

Кумулянтный метод анализа результатов измерений

Рассмотрим сущность предлагаемого метода. Характеристическую функцию можно записать в виде , где, очевидно, должно быть . Разложим функцию в степенной ряд [3]:

, (1)

где - коэффициенты этого ряда, которые носят название кумулянтов или семиинвариантов и, как и моменты, являются характеристиками распределения:

. (2)

Таким образом, характеристическую функцию можно представить в виде

. (3)

Кумулянты однозначно определяют случайную величину, если ряд (3) сходится для всех . Поэтому набор кумулянтов …, также может служить тождественным представлением закона распределения.

Если известны моменты , то кумулянты могут быть найдены из следующих соотношений [4, 5]:

,

,

,

, (4)

,

Верхним индексом в дальнейшем будем обозначать принадлежность моментов и кумулянтов к тому или иному распределению. В выражениях (4) были использованы только шесть первых кумулянтов. Это связано с тем, что, как показали проведенные авторами исследования на различных выборках, такого количества кумулянтов достаточно для раскрытия сущности предложенного подхода. Однако при алгоритмической реализации предложенного метода число кумулянтов может быть увеличено.

В аналитическом виде моменты распределений могут быть вычислены через производящую функцию. В качестве примера рассмотрим выражения моментов гауссовского, равномерного и экспоненциального законов распределения. В дальнейшем эти выражения будут использованы для подстановки в (4) и определения кумулянтов соответствующих распределений.

Пусть имеется случайная величина X с распределением . Тогда ее производящей функцией моментов называется функция, имеющая вид

, (5)

где E[*] - оператор математического ожидания.

Моменты случайной величины вычисляются через производящую функцию следующим образом [4]:

(6)

Для гауссовского закона с распределением

(7)

производящая функция моментов будет иметь вид

. (8)

Тогда моменты могут быть вычислены в соответствии со следующими выражениями:

,

,

,

,

,

Во многих практически важных случаях нечетные моменты в (9) равны 0.

Для равномерного закона с распределением

(10)

производящая функция моментов будет иметь вид

. (11)

Соответственно, моменты могут быть найдены из следующих выражений:

,

,

,

,

,

.

Для экспоненциального закона с распределением (13) производящая функция моментов будет иметь вид

(14)

Тогда моменты могут быть найдены из следующих выражений:

.

Для набора распределений теоретические значения кумулянтов вычисляются с использованием выражений (4), (9), (12), (15). При автоматизации предложенного подхода число видов используемых распределений может быть значительно увеличено и оно будет ограничиваться лишь рамками решаемой при этом метрологической задачи.

Пусть имеются результаты измерений . Эмпирические моменты могут быть найдены на основе обработки входной реализации:

,

,

,

,

,

,

где - эмпирический момент -го порядка -го закона распределения; - размерность выборки.

По ним в соответствии с выражением (4) определяются эмпирические значения кумулянтов. При этом необходимо обеспечить нормировку по второму кумулянту.

В данном случае критерием «близости» исследуемого распределения к тому или иному виду может служить следующее выражение:

(17)

где - вид распределения, i = 1, 2, 3; - кумулянты, рассчитанные аналитически; - кумулянты, рассчитанные эмпирически.

Предлагаемый метод может быть реализован, как это показано ниже на рисунке.

Блок-схема реализации кумулянтного метода идентификации вида закона распределения: 1 - блок вычисления эмпирических значений кумулянтов; 2 - блок вычисления значений критерия S; 3 - блок анализа и определения вида закона распределения; 4 - блок вычисления (хранения) аналитических значений кумулянтов

Для проверки метода был проведен вычислительный эксперимент. При этом использовался математический пакет Mathcad 14. Суть эксперимента состоит в следующем: с помощью датчиков случайных чисел генерировались реализации случайных чисел, распределенных по гауссовскому, равномерному и экспоненциальному законам распределения. При проведении вычислительного эксперимента размер выборки был . Сначала вычислялись теоретические значения кумулянтов в соответствии с выражениями (4), (9), (12), (15). При этом в качестве параметров законов распределений были выбраны следующие величины: для гауссовского и равномерного распределения математическое ожидание дисперсия для экспоненциального распределения Затем вычислялись значения эмпирических моментов в соответствии с выражениями (16) и значения эмпирических кумулянтов в соответствии с выражениями (4). Результаты сведены в табл. 1.

Таблица 1. Значения кумулянтов

Закон распределения

Гауссовский

Теоретические

Эмпирические

Равномерный

Теоретические

Эмпирические

Экспоненци-альный

Теоретические

Эмпирические

Для каждого набора теоретических и эмпирических кумулянтов по формуле (17) вычислялись значения критерия Si , которые сведены в табл. 2.

Таблица 2. Значения критериев Si для различных законов распределений

Закон распределения

S1

S2

S3

Гауссовский

S1г=0,0024

S2г=0,55

S3г=15028,65

Равномерный

S1р=48,54

S2р=0,0006

S3р=13433,7

Экспоненциальный

S1е=15477,09

S2е=15417,43

S3е=3,99

Рассмотрим подробно алгоритм расчета первой строки табл. 2, где проанализирована выборка, сгенерированная датчиком случайных чисел, распределенных по гауссовскому закону распределения. Расчет проводился в соответствии со следующими выражениями:

При этом были использованы результаты расчета теоретических и эмпирических значений кумулянтов для гауссовского, равномерного и экспоненциального законов распределения из табл. 1. Аналогичным образом рассчитываются остальные строки табл. 2.

Из табл. 2 видно, что для первого эксперимента наименьшие значение критерия S1г соответствует гауссовскому распределению, для второго эксперимента наименьшее значение критерия S2р соответствует равномерному распределению, для третьего - наименьшие значение критерия S3э соответствует экспоненциальному распределению. Проведя вычисления по формулам (4), (9), (12), (15), (17), можно определить вид закона распределения, которым описывается выборка результатов измерений .

Таким образом, разработан новый кумулянтный метод распределения, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений. Правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента.

Для сложных физических процессов при реализации предложенного подхода могут быть использованы методы аппроксимации полученных экспериментальных распределений физических величин обобщенными распределениями.

Данная статья выполнена в рамках проекта по аналитической ведомственной целевой программе «Развитие научного потенциала высшей школы (2009 - 2010 годы)» на 2009 год, подраздел 2.1.2 «Проведение фундаментальных исследований в области технических наук», проект «Теоретические основы решения задач управления - идентификации - оценивания на основе объединенного принципа максимума».

Литература

Алешкин А.Н., Лабутин С.А. Идентификация формы закона распределения случайных величин как задача приближения функций // Мат. заочных ВНТК «Современные проблемы математики и естествознания» и «Методы и средства измерений». 2002. Н. Новгород: МВВО АТН РФ. C. 6 - 9.

Безуглов Д. А. Кумулянтный метод оценки эффективности сегментированного зеркала адаптивной оптической системы // Оптика атмосферы и океана. 1996. №1. C.78 - 84.

Безуглов Д.А., Поморцев П.М., Скляров А.В. Обработка результатов измерений на базе аппроксимации плотности распределения сглаживающими кубическими В- сплайнами // Измерительная техника. 2000. №9. C. 32 - 36.

Крамер. Г. Математические методы статистики. М.: ИЛ. 1948.

Малахов А. Н. Кумулянтный анализ случайных негауссовых процессов и их преобразований. М.: Сов. радио. 1978.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.