Несколько слов о теории статистических ошибок
Основы статистического метода исследования. Детерминированная теория ошибок и дисперсии искомых оценок. Применение принципа наименьших квадратов в экспериментальной науке. Выведение погрешности наблюдений из распределения среднего арифметического.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 15,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Сургутский государственный педагогический университет
Несколько слов о теории статистических ошибок
(A few words about the theory of statistical errors)
Носкова А.А.
Сургут, Россия
Колмогоров и Прохоров (1984) определили математическую статистику как ветвь математики, систематизирующую, обрабатывающую и применяющую статистические данные, под которыми понимается число объектов в некоторых совокупностях. Разумеется, они исключили сбор данных и их предварительное исследование, которое по существу появилось в середине ХХ в. и является важной главой теоретической статистики. Споры о различии между математической и теоретической статистиками можно решить, полагая, что именно сбор и исследование данных относятся к последней и определяют ее отличие от первой.
Первое достойное определение теории статистики (которая, видимо, почти совпадает с теоретической статистикой) предложил Butte: это - наука о понимании и оценке статистических данных, их сбору и систематизации. Неясно, включал ли он в свое определение и приложения статистики.
Громадное количество определений статистики (без каких-либо прилагательных) было предложено начиная со Шлёцера, но указанного выше достаточно. Впрочем, упомянем еще Гаттерера, у которого цели статистики частично относились к новому государствоведению: понять состояние государства, исходя из его прежних состояний.
Статистический метод - это метод исследования, основанный на математической обработке количественных данных, и в основном его имеют в виду в связи с естествознанием. Его первая стадия была характерна выявлением статистических закономерностей, основанных на общих представлениях; вот афоризм Гиппократа (1952): полные люди склонны умирать в более раннем возрасте, чем остальные.
Здесь можно усмотреть качественную корреляцию, вполне совместимую с качественным характером древней науки. Во время второй стадии выводы основывались на статистических данных (Граунт). Нынешняя, третья стадия началась в середине XIX в. с появлением первых стохастических критериев для проверки статистических выводов, см. Пуассон (1837), Sheynin. Впрочем, эти стадии не отделены друг от друга полностью: даже древние астрономы накапливали свои количественные наблюдения [1]. Исключительно важные открытия удалось сделать без применения критериев. Оказалось, например, что очистка питьевой воды в восемь раз снижала смертность от холеры, что объясняло пути распространения холерных эпидемий. Аналогично, проявился полный успех оспопрививания (Дженне, в 1798 г.), хотя потребовались дополнительные статистические исследования технологии прививок и без разочарований обойтись не удалось.
Теория ошибок относится к статистическому методу. Ее основная особенность - применение истинного значения измеряемых констант. Фурье определил его как предел среднего арифметического из измерений, что эвристически схоже с частотным определением вероятности по Мизесу и означает, что остаточные систематические ошибки включаются в это значение.
С момента своего зарождения во второй половине XVIII в. Т. Симпсон (1756; 1757) и Ламберт, который и ввел термин теория ошибок до 1920-х годов эта теория оставалась основным полем приложения теории вероятностей, а математическая статистика переняла у нее принципы наибольшего правдоподобия и наименьшей дисперсии.
Первое гауссово обоснование метода (точнее, принципа) наименьших квадратов (1809) для уравнивания косвенных наблюдений (т. е. для оценивания неизвестных, входящих в избыточную систему линейных уравнений, коэффициенты которой задаются соответствующей теорией, а свободные члены - результаты непосредственных наблюдений) было основано на (независимо введенном им) принципе наибольшего правдоподобия и на предположении о том, что среднее арифметическое - лучшая оценка истинного значения непосредственных наблюдений [2].
Его второе обоснование 1823 г., весьма тяжело написанное, было основано на принципе наименьшей дисперсии искомых оценок. Колмогоров (1946) мимоходом заметил, что можно было бы принять выведенную Гауссом формулу выборочной дисперсии за её определение. Во всяком случае, её вывод несложен, а принцип наименьших квадратов последует сразу же, потому что указанный вывод требует только линейности и независимости исходных уравнений и несмещённости оценок неизвестных. Можно предположить, что Гаусс это прекрасно знал и ввёл два независимых обоснования принципа наименьших квадратов. Оставив только второе, можно будет отказаться от рассуждений 1809 г., которые ввиду своего изящества и сравнительной простоты оставались основными.
Многие авторы предпочли обоснование 1823 г., и в том числе Марков, который тем не менее отрицал всякую оптимальность метода наименьших квадратов (МНК) в и тем самым обесценил своё предпочтение. Вопреки его мнению, в случае нормального распределения ошибок наблюдения МНК в обеспечивает совместную эффективность оценок (Петров 1954).
Один из первых методов уравнивания косвенных наблюдений предложил Бошкович, который участвовал в прокладке градусного измерения в Италии. В некотором смысле его рекомендация приводила к выбору медианы.
Уже Кеплер считал среднее арифметическое буквой закона. Уравнивая косвенные наблюдения, он, видимо, применял элементы принципа минимакса (выбора решения избыточной системы уравнений, соответствующего наименьшему абсолютному максимальному остаточному свободному члену) и метода Монте-Карло: он искажал наблюдения произвольными малыми поправками так, чтобы они соответствовали друг другу.
Древние астрономы считали непосредственные наблюдения своей собственностью; они не сообщали об отброшенных результатах и выбирали любую разумную оценку. Погрешности наблюдений были значительными, и теперь известно, что при плохих распределениях среднее арифметическое не лучше отдельного наблюдения, а иногда хуже его.
Бируни, арабский учёный X - XI вв., который превзошёл Птолемея, ещё не придерживался среднего арифметического, а выбирал различные оценки (Шейнин). статистический арифметический квадрат ошибка
Существует и детерминированная теория ошибок, которая исследует весь процесс наблюдений без применения стохастических представлений и близка к предварительному исследованию данных и планированию эксперимента. Уже древние астрономы умели выбирать наилучшие моменты наблюдений, чтобы неизбежные ошибки меньше всего влияли на результаты.
Не позднее XVII в. естествоиспытатели включая Ньютона начали учитывать подобные соображения. Даниил Бернулли чётко определил случайные и систематические ошибки, Гаусс и Бессель породили новую стадию экспериментальной науки, предполагая, что каждый инструмент должен быть полностью исследован и отъюстирован. Бессель (1839) определял, в каких двух точках должны находиться опоры измерительного жезла, чтобы он в наименьшей степени изгибался (и изменял свою длину) под влиянием собственного веса.
Последний пример: выбор исходных данных. Некоторые естествоиспытатели XIX в. полагали, что можно надежно использовать разнородные данные. Английский хирург Дж. Симпсон тщетно изучал смертность от ампутации конечности по данным многих больниц за 45 лет.
С другой стороны, заключения иногда делались при отсутствии данных. У. Гершель заявил, что размер звезды, случайно отобранной из многих тысяч, вряд ли будет существенно отличаться от их среднего размера. Он не знал, что размеры звезд чудовищно различны, так что их среднее не имеет смысла, да и вообще нельзя ничего узнать из незнания[3].
Список используемых источников
1. Статистические методы. [Электронный ресурс] - Режим доступа: http://diplomba.ru/work/74016
2. Теория статистических методов. [Электронный ресурс] - Режим доступа:http://www.0zd.ru/ekonomika_i_ekonomicheskaya_teoriya/teoriya_statistic heskix_metodov.html
3. Теория статистики. [Электронный ресурс] - Режим доступа: http://www.e-reading.club/bookreader.php/99603/ Burhanova_Teoriya_ statistiki. html
Размещено на Allbest.ru
Подобные документы
Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Закон больших чисел. Нахождение точечных оценок. Построение неизвестной дисперсии погрешности измерений. Выборочная функция распределения. Теорема Ляпунова и распределение Стьюдента. Вычисление доверительных интервалов. Построение интервальных оценок.
курсовая работа [4,3 M], добавлен 18.12.2011Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.
реферат [383,7 K], добавлен 19.08.2015Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.
курсовая работа [1,0 M], добавлен 29.01.2010Обоснование оценок прямых и косвенных измерений и их погрешностей. Введение доверительного интервала в асимптотическом приближении бесконечно большого числа экспериментов. Вычисление коэффициента корреляции для оценки зависимости случайных величин.
реферат [151,5 K], добавлен 19.08.2015Аппроксимация и теория приближений, применение метода наименьших квадратов для оценки характера приближения. Квадратичное приближение таблично заданной функции по дискретной норме Гаусса. Интегральное приближение функции, которая задана аналитически.
реферат [82,0 K], добавлен 05.09.2010Цель и задачи статистического анализа. Методы получения оценок: максимального правдоподобия, моментов. Доверительный интервал. Точечная оценка параметров распределения. Генеральная и выборочная дисперсии. Интервальное оценивание математического ожидания.
презентация [395,9 K], добавлен 19.07.2015Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.
контрольная работа [62,6 K], добавлен 20.02.2011Обработка данных измерений величин и представление результатов с нужной степенью вероятности. Определение среднего арифметического и вычисление среднего значения измеренных величин. Выявление грубых ошибок. Коэффициенты корреляции. Косвенные измерения.
реферат [116,2 K], добавлен 16.02.2016Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.
контрольная работа [148,8 K], добавлен 12.02.2012