Математическая статистика
Основные понятия математической статистики, ее виды и их характеристики. Анализ экономической информации с помощью однофакторного дисперсионного анализа на примере города. Вычисление статистик, гипотез или выводов по существу эмпирических данных.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 08.01.2014 |
Размер файла | 173,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
2
Содержание
- Введение
- 1. Основные понятия математической статистики
- 1.1 Дисперсионный анализ
- 1.2 Однофакторный дисперсионный анализ
- 2. Анализ экономической информации с помощью однофакторного дисперсионного анализа
- 2.1 Рентабельность продаж
- Заключение
- Список используемой литературы
- Введение
- Математическая статистика -- это раздел математики, посвященный методам анализа данных, преимущественно вероятностной природы. Она занимается систематизацией, обработкой и использованием статистических данных для теоретических и практических выводов.
- Статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Здесь важно понять, что статистика имеет дело именно с количеством объектов, а не с их описательными признаками.
- Цель статистического анализа - исследование свойств случайной величины. Для этого приходится несколько раз измерять значения изучаемой случайной величины. Полученная группа значений рассматривается как выборка из гипотетической генеральной совокупности.
- Производится статистическая обработка выборки, и после этого принимается решение. Важно заметить, что вследствие начального условия неопределённости, принятое решение всегда носит характер "нечёткого высказывания". Иными словами, в статистической обработке приходится иметь дело с вероятностями, а не с точными утверждениями.
- Главное в статистическом методе - это подсчёт числа объектов, входящих в различные группы. Объекты собираются в группу по какому-то определённому общему признаку, а затем рассматривается распределение этих объектов в группе по количественному выражению данного признака. В статистике часто применяется выборочный метод анализа, т.е. анализируется не вся группа объектов, а небольшая выборка -- несколько объектов, взятых из большой группы. Широко используется теория вероятностей при статистической оценке наблюдений и при формировании выводов.
- Основным предметом математической статистики является вычисление статистик, являющихся критериями для оценки достоверности априорных предположений, гипотез или выводов по существу эмпирических данных.
- Другое определение - “Статистики - это предписания, по которым из выборки рассчитывается некоторое число - значение статистики для данной выборки”. Выборочные среднее и дисперсия, отношение дисперсий двух выборок или любые другие функции от выборки могут рассматриваться как статистики.
- Математическую статистику подразделяют на теоретическую и прикладную.
- Теоретическая статистика доказывает научность и правильность самой статистики.
- Теоретическая математическая статистика - наука, изучающая методы раскрытия закономерностей, свойственных большим совокупностям однородных объектов, на основании их выборочного обследования.
- Этим разделом статистики занимаются математики, и они любят с помощь своих теоретических математических доказательств убеждать нас в том, что статистика сама по себе научна и ей можно доверять. Беда в том, что эти доказательства способны понять только другие математики, а обычным людям, которым нужно пользоваться математической статистикой эти доказательства всё равно не доступны, да и совершенно не нужны!
- Прикладная статистика учит пользователей работать с любыми данными и получать обобщённые результаты. Неважно, какие именно это данные, важно, какое количество этих данных находится в вашем распоряжении. Кроме того, прикладная статистика подскажет нам, насколько можно верить в то, что полученные результаты отражают действительное положение дел.
- 1 Основные понятия математической статистики
- В данном пункте мною будут рассмотрены основные понятия, которые используются в данном курсовом проекте.
- Случайной величиной называется величина, которая в результате опыта может принять то или иное значение, причем неизвестно заранее, какое именно.
- Пусть проведено экспериментов, в которых регистрируются значения, принимаемые некоторой теоретической случайной величиной . Ее функция распределения также теоретическая функция распределения. Пусть эксперименты проводятся в одинаковых условиях и независимо друг от друга. И пусть - результаты этих экспериментов, т.е. чисел. В этом случае набор чисел называется конкретной выборкой объема из теоретического распределения .
- Пусть - предполагаемые результаты экспериментов, которые мы хотим произвести. В этом случае случайные величины имеют одно и тоже распределение, совпадающее с теоретическим, и независимые. В этом случае - абстрактная выборка объема из распределения .
- Числовые характеристики теоретической случайной величины называются теоретическими характеристиками.
- Теоретическим математическим ожиданием или средним случайной теоретической величины называется число .
- Теоретической дисперсией теоретической случайной величины называется число .
- Нормальное распределение - распределение непрерывной случайной величины с плотностью:
- ,
- где - математическое ожидание, -дисперсия.
- Статистической гипотезой называется любое предположение о виде распределения, о параметрах распределения. Гипотезы обозначаются . Гипотеза, которая проверяется, обозначается - основная (нулевая) гипотеза.
- Число степеней свободы - это количество значений, которые могут свободно изменяться после того, так по выборке было вычислено значение статистики.
- Уровнем значимости гипотезы называют вероятность совершить ошибку первого рода, то есть принять гипотезу в то время, как она не верна.
- 1.1 Дисперсионный анализ
- Дисперсионный анализ - статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.
- Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.
- Английский статистик Р. Фишер определил этот метод как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”.
- Анализ производится следующим образом:
1. Группируют совокупность наблюдений по факторному признаку
2. Находят среднее значение результата и дисперсию по каждой группе.
3. Определяют общую дисперсию и вычисляют, какая доля ее зависит от условий, общих для всех групп, какая -- от исследуемого фактора, а какая -- от случайных причин.
4. С помощью специального критерия определяют, насколько существенны различия между группами наблюдений и, следовательно, можно ли считать ощутимым влияние тех или иных факторов.
Дисперсионный анализ применяется в планировании эксперимента и в ряде областей экономических исследований, где он служит, в частности, предварительным этапом к регрессионному анализу статистических данных, поскольку позволяет выделить относительно небольшое (но достаточное для целей исследования) количество параметров регрессии.
В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.
В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.
При проведении дисперсионного анализа должны выполняться следующие статистические допущения: независимо от уровня фактора величины отклика имеют нормальный (Гауссовский) закон распределения и одинаковую дисперсию. Такое равенство дисперсий называется гомогенностью. Таким образом, изменение способа обработки сказывается лишь на положении случайной величины отклика, которое характеризуется средним значением или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому семейству нормальных распределений.
Говорят, что техника дисперсионного анализа является "робастной". Этот термин, используемый статистиками, означает, что данные допущения могут быть в некоторой степени нарушены, но несмотря на это, технику можно использовать.
При неизвестном законе распределения величин отклика используют непараметрические (чаще всего ранговые) методы анализа.
1.2 Однофакторный дисперсионный анализ
Предположим, что наблюдается независимых нормально распределенных случайных величин, имеющих одну и ту же дисперсию , и пусть . Пусть каждое измеряется раз:
По сравнению с тем, что рассматривалось ранее, у нас имеется не одна теоретическая случайная величина, а независимых теоретических величин, и каждая изменяется раз. При этом случайных величин независимы между собой (когда выборки рассматриваются как абстрактные).
Мы хотим проверить нулевую гипотезу
.
Результаты эксперимента удобно записать в виде таблицы:
Номер случайной величины (группы) |
Номер измерения |
Средние |
|||||
1 |
2 |
3 |
… |
||||
1 |
… |
||||||
2 |
… |
||||||
3 |
… |
||||||
… |
Здесь
- средние арифметические результатов измерений внутри групп. Пусть
- среднее арифметическое всех измерений.
Разложим полную сумму квадратов отклонений выборочных значений от выборочной средней по всем измерениям:
Но полная сумма
так как
Таким образом,
Где
- полная сумма квадратов,
- межгрупповая сумма квадратов (характеризуют степень расхождения систематических погрешностях групп),
- внутригрупповая сумма квадратов (характеризует степень расхождения внутри групп).
Предположим, что гипотеза верна. Тогда все наблюдений можно рассматривать как выборку из одного и того же нормального распределения . Поэтому по определению случайной величины
Очевидно, независимы, . Поэтому
Далее,
Откуда
Так как при различных эти случайные величины независимы, то
то есть
Поэтому, в предположении, что гипотеза верна, статистика
есть отношение Фишера с и степенями свободы. Пусть - процентная точка - распределения, т.е. корень уравнения
По заданному уровню значимости по таблицам процентных точек - распределения находим .
Критерий проверки гипотезы выглядит так:
если , то гипотеза отвергается;
если , то гипотеза не противоречит экспериментальным данным.
Схему однофакторного дисперсионного анализа удобно представить в виде таблицы (см. табл. 1).
При этом для вычислений удобно пользоваться следующими формулами:
Таблица 1.
Компонента дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
|
Между группами (факторная) |
||||
Внутри групп (остаточная) |
||||
Общая |
Рассмотрим случай, когда числа наблюдений в группах могут отличаться. Если - число наблюдений в -й группе, , то рассмотренная схема останется справедливой со следующими изменениями:
,
где теперь
Табличная схема изменится следующим образом:
Таблица 2
Компонента дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
|
Между группами (факторная) |
||||
Внутри групп (остаточная) |
||||
Общая |
2. Анализ экономической информации с помощью однофакторного дисперсионного анализа
2.1 Рентабельность продаж
На сайте национального статистического комитета Республики Беларусь в подразделе «Годовые данные» раздела «Регионы Беларуси в цифрах» взяты показатели рентабельностей продаж в следующих городах Республики Беларусь: Брест, Витебск, Гомель, Гродно, Минск, Могилев.
Проверим гипотезу о равенстве средних рентабельностей по областным городам Беларуси. Данные по областям приведены в таблице:
2008 2009 2010 2011 2012
Брест 6,0 5,7 4,6 7,2 5,7
Витебск 5,3 5,3 4,3 5,7 7,7
Гомель 9,3 10,0 9,7 11,1 10,9
Гродно 7,6 6,3 6,2 7,2 8,6
Минск 6,4 5,9 5,7 9,0 8,5
Могилев 4,9 4,5 4,3 6,0 5,9
, где - количество рассматриваемых годов, - количество рассматриваемых городов Беларуси, - уровень значимости.
Нулевая гипотеза имеет вид:
Далее нахожу среднее по каждому городу:
Общее среднее:
Вычисляю критерий Фишера:
следовательно, гипотеза отвергается на уровне 0,01, то есть рентабельность продаж зависит от города.
Рассмотрим теперь в отдельности западные и восточные областные центры Беларуси:
Запад:
2008 2009 2010 2011 2012
Брест 6,0 5,7 4,6 7,2 5,7
Гродно 7,6 6,3 6,2 7,2 8,6
Нулевая гипотеза:
Среднее по городам:
Критерий Фишера:
- следовательно, гипотеза не противоречит экспериментальным данным, то есть можно считать, что среднее рентабельностей продаж совпадают.
Восток:
2008 2009 2010 2011 2012
Витебск 5,3 5,3 4,3 5,7 7,7
Гомель 9,3 10,0 9,7 11,1 10,9
Минск 6,4 5,9 5,7 9,0 8,5
Могилев 4,9 4,5 4,3 6,0 5,9
Нулевая гипотеза:
Расчет средних описан выше:
Критерий Фишера:
следовательно, гипотеза отвергается на уровне 0,01, то есть среднее рентабельностей продаж зависит от города.
Разобьем теперь города на пары и проверим равенство средних рентабельностей продаж в них:
2008 2009 2010 2011 2012
Витебск 5,3 5,3 4,3 5,7 7,7
Гомель 9,3 10,0 9,7 11,1 10,9
Нулевая гипотеза:
Среднее по городам:
Критерий Фишера:
- следовательно, гипотеза отвергается на уровне 0,01, то есть среднее рентабельностей продаж зависит от города.
2008 2009 2010 2011 2012
Минск 6,4 5,9 5,7 9,0 8,5
Могилев 4,9 4,5 4,3 6,0 5,9
Нулевая гипотеза:
Среднее по городам:
Критерий Фишера:
- следовательно, гипотеза не противоречит экспериментальным данным, то есть можно считать, что среднее рентабельностей продаж совпадают.
В ходе проверки средних попарно, я увидела, что в городах Брест и Гродно, Минск и Могилев среднее рентабельностей продаж совпадают. Проверим теперь эти города в совокупности:
2008 2009 2010 2011 2012
Брест 6,0 5,7 4,6 7,2 5,7
Гродно 7,6 6,3 6,2 7,2 8,6
Минск 6,4 5,9 5,7 9,0 8,5
Могилев 4,9 4,5 4,3 6,0 5,9
Критерий Фишера:
- следовательно, гипотеза не противоречит экспериментальным данным, то есть можно считать, что среднее рентабельностей продаж совпадают. Значит, мы пришли к выводу, что средние рентабельностей продаж городов Брест, Гродно, Минск и Могилев совпадают. Добавим к ним еще один и город и проверим, поменяется и ситуация.
2008 2009 2010 2011 2012
Брест 6,0 5,7 4,6 7,2 5,7
Витебск 5,3 5,3 4,3 5,7 7,7
Гродно 7,6 6,3 6,2 7,2 8,6
Минск 6,4 5,9 5,7 9,0 8,5
Могилев 4,9 4,5 4,3 6,0 5,9
Критерий Фишера:
- следовательно, гипотеза не противоречит экспериментальным данным, то есть можно считать, что среднее рентабельностей продаж совпадают.
И снова мы пришли к результату, что среднее рентабельностей уже по 5ти городам совпадает.
Заключение
В данном курсовом проекте проведен анализ экономической информации с помощью однофакторного дисперсионного анализа. (фактором является город). В результате анализа выявлено, что, при рассмотрении группы из 5ти городов (Брест, Витебск, Гродно, Минск, Могилев) и последующего проведения однофакторного дисперсионного анализа рентабельности продаж в этих городах , их средние рентабельности продаж совпадают. Однако при анализе рентабельностей продаж всех городов получили отрицательный результат. Исследование проводилось Таким образом, можно сделать вывод, что среднее рентабельности продаж в Гомеле оказывает существенное влияние на общий результат.
Список используемой литературы
математика статистика гипотеза дисперсионный
1. Национальный Статистический комитет Республики Беларусь.
2. Кобзарь А.И. Прикладная математическая статистика. - М.: ФИЗМАТЛИТ, 2006. - 816 с.
3. Hoeffding W. A non-parametric test of independence. // AMS. 1961 V. 19. P. 546-557.
4. Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учеб. пособие - М.: Вузовский учебник, 2007.
5. Никитина Н.Ш. Математическая статистика для экономистов.. 2-е изд., перераб. и доп. - М.: Инфра-М; Новосибирск: НГТУ, 2001. -- 170 с
Размещено на Allbest.ru
Подобные документы
Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.
практическая работа [132,1 K], добавлен 24.05.2013Изучение раздела математической статистики, посвященного методам выявления влияния отдельных факторов на результат эксперимента. Эффекты взаимодействия. Использование однофакторного дисперсионного анализа для сравнения средних значений нескольких выборок.
презентация [110,0 K], добавлен 09.11.2014Общее понятие о дисперсионном анализе, его сущность и значение. Использование INTERNET и компьютера для проведения дисперсионного анализа, особенности работы в среде MS Excel. Примеры применения однофакторного и двухфакторного дисперсионного анализа.
курсовая работа [820,4 K], добавлен 17.02.2013Основные методы формализованного описания и анализа случайных явлений, обработки и анализа результатов физических и численных экспериментов теории вероятности. Основные понятия и аксиомы теории вероятности. Базовые понятия математической статистики.
курс лекций [1,1 M], добавлен 08.04.2011Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.
контрольная работа [328,2 K], добавлен 07.12.2013Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.
учебное пособие [279,6 K], добавлен 24.04.2009Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Программа курса, основные понятия и формулы теории вероятностей, их обоснование и значение. Место и роль математической статистики в дисциплине. Примеры и разъяснения по решению самых распространенных задач по различным темам данных учебных дисциплин.
методичка [574,5 K], добавлен 15.01.2010Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
дипломная работа [850,9 K], добавлен 18.01.2016