Статистические методы обработки и анализа экспериментальных данных
Задачи математической статистики на примере двух массивов, числовые характеристики непрерывной случайной величины, вероятность попадания в заданный интервал, закон распределения. Характеристики отклонения теоретического распределения от нормального.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 13.11.2009 |
Размер файла | 38,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
15
Балтийская государственная академия рыбопромыслового флота
Кафедра высшей математики
Курсовая работа
Статистические методы обработки и анализа
экспериментальных данных
Выполнила: Крупнова А.С.
Группа: ЗЧС - 22
Проверила: Кузнецова Н.Р.
Калининград 2008
Содержание
- Задание
- Введение
- Основная часть
- Порядок анализа (компьютерный вариант)
- Порядок анализа (не компьютерный вариант)
- Расчётная часть
- 1 часть. Компьютерный вариант
- Не компьютерный вариант
- 2 часть. Компьютерный вариант
- Не компьютерный вариант
- Результаты анализа
- 1 часть. Компьютерный вариант
- Не компьютерный вариант
- 2 часть. Компьютерный вариант
- Не компьютерный вариант
- Заключение
- Список использованной литературы
- Задание
- Дано 2 массива А и В: А - среднесуточный вылов рыбы судном данного типа; В - среднесуточный выпуск рыбной муки 1 судном в тоннах.
- На основании двух массивов проанализировать экспериментальные данные при помощи статистических методов обработки.
Введение
Математическая статистика - это раздел математики, посвящённый математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.
Статистическое описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по её общим свойствам, совсем не требующим её расчленения на отдельные объекты, - с другой.
Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод используется в самых различных областях знаний.
Общие черты статистического метода в различных областях знаний сводятся к подсчету числа объектов, входящих в те или иные группы, рассмотрению распределения количественных признаков, применению выборочного метода, использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов. Эта формальная математическая сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математической статистики.
Задачи математической статистики:
1) указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате поставленных экспериментов;
2) разработать методы анализа статистических данных в зависимости от целей исследования:
а оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого неизвестен; оценка зависимости случайной величины от одной или нескольких случайных величин;
б проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.
Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
Основная часть
Порядок анализа (компьютерный вариант)
1. Вводим два массива
2. Составляем вариационные (упорядоченные) ряды
3. Находим числовые характеристики средствами пакета: минимальные и максимальные значения массивов, математические ожидания Математическое ожидание, среднее значение - одна из числовых характеристик распределения вероятностей случайной величины, вычисляемое по формуле , общую и исправленную дисперсии, общее и исправленное среднее квадратическое отклонение, моду и медиану
4. Находим те же числовые характеристики при помощи стандартных формул
5. При помощи эксцесса Эксцесс - это величина, равная отношению центрального момента 4-гог порядка к среднему квадратичному отклонению в 4-й степени за вычетом 3 и асимметрии Асимметрия - это величина, равная отношению центрального момента 3-го порядка к среднему квадратичному отклонению в 3-й степени. оценим отклонение теоретического распределения от нормального
6. Построение гистограммы относительных частот
7. Проверка гипотезы о нормальном законе распределения (критерий Пирсона)
8. Нахождение коэффициентов корреляции и ковариации
Порядок анализа (не компьютерный вариант)
1. Составляем вариационные ряды для массивов и вычисляем среднее
2. Составляем интервальные ряды для массивов и строим гистограммы частот
3. Проверка гипотезы о нормальном законе распределения (критерий Пирсона) и построение гистограммы относительных частот
4. Вычисление доверительного интервала для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении
Расчётная часть
Результаты анализа
1 часть. Компьютерный вариант
1. Введено два массива или генеральные совокупности - совокупности объектов, из которых производится выборка, а также объем генеральной совокупности - число объектов этой совокупности
2. При помощи функции sort получили вариационные ряды - ранжированные в порядке возрастания (упорядоченные) перечни вариант или частот
3. Средствами пакета нашли следующие числовые характеристики и их значения:
· минимальное значение массивов А и В = 2,2 и 0,1 соответственно;
· максимальное значение массивов А и В = 42,3 и 2,1 соответственно;
· математическое ожидание массивов А и В = 22,058 и 1,262 соответственно;
· общая дисперсия массивов А и В = 100,798 и 0,278 соответственно;
· исправленная дисперсия массивов А и В = 102,856 и 0,284 соответственно;
· общее среднее квадратическое отклонение Среднее квадратическое отклонение - это величина, равная у(х)= массивов А и В = 10,04 и 0,527 соответственно;
· исправленное среднее квадратическое отклонение массивов А и В = 10,142 и 0,533 соответственно;
· медиана Медиана - это то возможное значение непрерывной случайной величины, которое определяется равенством Р(Х<Ме)=Р(Х>Ме) массивов А и В = 20,7 и 1,4 соответственно;
· мода Мода - это то возможное значение непрерывной случайной величины, которое соответствует максимуму дифференциала функции для массива В = 1,1, а для массива А её нет, так как есть три числа, которые встречаются с одинаковой частотой;
4. При использовании стандартных формул в Маткаде видим, что значения числовых характеристик получаем те же, что и при помощи пакета.
5. Нашли значения эксцессов для массивов А и В. Они равны - 0,87 и - 0,751 соответственно. Можно сделать следующий вывод о крутости вариационного ряда по сравнению с нормальным распределением: как для массива А, так и для массива В видим, что кривая имеет вершину, расположенную ниже вершины нормальной кривой. Также нашли значения асимметрии: она соответственно равна для массивов А и В 0,079 и -0,456. Делаем вывод о том, что пологая часть кривой распределения массива А расположена справа от математического ожидания, а массива В - слева от математического ожидания.
6. Находим интервал вариационного ряда h, интервалы сгруппированных частот Wk и количество частот, попавших в эти интервалы F. По этим данным строим гистограмму - ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты) или Wi/h (плотность относительной частоты).
7. Используя функцию нормального распределения и пределы интегрирования, находим вероятности появления относительных частот в данном промежутке. Сумма данных вероятностей близка к единице. На основании этих вероятностей по формуле определим критерий Пирсона (хи-квадрат), который позволяет проверить гипотезу о любом виде распределения. Делаем вывод, что массивы и А, и В распределены не по нормальному закону распределения.
8. Средствами пакета определяем коэффициент корреляции Корреляция - вероятностная (статистическая) зависимость между величинами, не имеющая строго функционального характера. Корреляционная зависимость возникает тогда, когда одна из величин зависит не только от данной второй, но и от ряда случайных факторов, или когда среди условий, от которых зависят и та и другая величины, имеются общие для них обоих условия.. Он показывает связь между массивами А и В. Чем ближе этот коэффициент к 1, тем теснее связь между массивами. В данном случае коэффициент корреляции = 0,767. Связь эту можно отобразить при помощи графика, из которого мы видим, что среднесуточный выпуск рыбной муки больше среднесуточного вылова рыбы. Также средствами пакета найдем коэффициент ковариации, который = 4,058. Теперь найдем эти характеристики при помощи формул: для корреляции и для ковариации . Сравнив их, замечаем, что значения, полученные средствами пакета и при помощи формул равны.
Не компьютерный вариант
1. Составили вариационный ряд и нашли среднее для обоих массивов по формуле . Получили для массива А - 22,058, для массива В - 1,262.
2. На основе вариационных рядов составили интервальные ряды и построили гистограммы частот, по которым видим, что массивы А и В распределены не по нормальному закону распределения.
3. Для проверки гипотезы о том, распределены ли массивы А и В по нормальному закону, используем критерий Пирсона. Для этого используем интервальные ряды, частоты ni, относительные частоты Wi, вероятности попадания относительных частот в заданные интервалы Pi и теоретические частоты ni?. По формуле . При этом учитываем, что в каждом интервале должно быть как минимум 5 вариант. В противном случае соседние интервалы объединяются. Получили, что чІ=0,915 для массива А, для массива В чІ=9,92. Затем находим хи-квадрат критическое по заданному уровню значимости и числу степеней. В данном случае берем уровень значимости для массива А б = 0,95 и для массива В б = 0,05 и число степеней свобод k= 3 (для массива А) и k=4 (для массива В). Получаем, что чкр?= 0,352 и чкр?= 9,5 для массивов А и В соответственно. Делаем вывод о том, что обе гипотезы о распределении массивов по нормальному закону опровергнуть.
4. Используя формулу для определения доверительного интервала для оценки математического ожидания, получаем, что математическое ожидание массива А заключено в интервале (18,358; 25,758), а математическое ожидание массива В - (1,068; 1,456).
Вывод
Оба массива распределены по нормальному закону. Для того чтобы получить массивы, распределенные нормально, необходимо обратить внимание на частоту попадания значений массивов в заданные интервалы. Изменим некоторые значения в массивах и проделаем аналогичный анализ.
2 часть. Компьютерный вариант
1. Введено два исходных массива, исправленные таким образом, чтобы они были распределены нормально.
2. При помощи функции sort получили вариационные ряды - ранжированные в порядке возрастания (упорядоченные) перечни вариант или частот
3. Средствами пакета нашли следующие числовые характеристики и их значения:
· минимальное значение массивов А и В = 2,2 и 0,1 соответственно;
· максимальное значение массивов А и В = 42,3 и 2,1 соответственно;
· математическое ожидание массивов А и В = 21,612 и 1,142 соответственно;
· общая дисперсия массивов А и В = 91,65 и 0,213 соответственно;
· исправленная дисперсия массивов А и В = 93,521 и 0,217 соответственно;
· общее среднее квадратическое отклонение массивов А и В = 9, 573 и 0,461 соответственно;
· исправленное среднее квадратическое отклонение массивов А и В = 9,671 и 0,466 соответственно;
· медиана массивов А и В = 20,7 и 1,2 соответственно;
· мода для массивов А и В = 23,5 и 1,2 соответственно;
4. При использовании стандартных формул в Маткаде видим, что значения числовых характеристик получаем те же, что и при помощи пакета.
5. Нашли значения эксцессов для массивов А и В. Они равны - 0,675 и - 0,337 соответственно. Можно сделать следующий вывод о крутости вариационного ряда по сравнению с нормальным распределением: как для массива А, так и для массива В видим, что кривая имеет вершину, расположенную ниже вершины нормальной кривой. Также нашли значения асимметрии: она соответственно равна для массивов А и В 0,127 и -0,161. Делаем вывод о том, что пологая часть кривой распределения массива А расположена справа от математического ожидания, а массива В - слева от математического ожидания.
6. Находим интервал вариационного ряда h, интервалы сгруппированных частот Wk и количество частот, попавших в эти интервалы F. По этим данным строим гистограмму - ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты) или Wi/h (плотность относительной частоты).
7. Используя функцию нормального распределения и пределы интегрирования, находим вероятности появления относительных частот в данном промежутке. Сумма данных вероятностей близка к единице. На основании этих вероятностей по формуле определим критерий Пирсона (хи-квадрат), который позволяет проверить гипотезу о любом виде распределения. Делаем вывод, что массивы и А, и В распределены по нормальному закону распределения.
8. Средствами пакета определяем коэффициент корреляции. Он показывает связь между массивами А и В. Чем ближе этот коэффициент к 1, тем теснее связь между массивами. В данном случае коэффициент корреляции = 0,73. Связь эту можно отобразить при помощи графика, из которого мы видим, что среднесуточный выпуск рыбной муки больше среднесуточного вылова рыбы. Также средствами пакета найдем коэффициент ковариации, который = 3,225. Теперь найдем эти характеристики при помощи формул: для корреляции и для ковариации . Сравнив их, замечаем, что значения, полученные средствами пакета и при помощи формул равны.
Не компьютерный вариант
1. Составили вариационный ряд и нашли среднее для обоих массивов по формуле . Получили для массива А - 21,13, для массива В - 1,058.
2. На основе вариационных рядов составили интервальные ряды и построили гистограммы частот, по которым видим, что массивы А и В распределены по нормальному закону распределения.
3. Для проверки гипотезы о том, распределены ли массивы А и В по нормальному закону, используем критерий Пирсона. Для этого используем интервальные ряды, частоты ni, относительные частоты Wi, вероятности попадания относительных частот в заданные интервалы Pi и теоретические частоты ni?. По формуле . При этом учитываем, что в каждом интервале должно быть как минимум 5 вариант. В противном случае соседние интервалы объединяются. Получили, что чІ=0,982 для массива А, для массива В чІ=2,996. Затем находим хи-квадрат критическое по заданному уровню значимости и числу степеней. В данном случае берем уровень значимости для массива А и для массива В б = 0,05 и число степеней свобод k= 5 (для массива А) и k=4 (для массива В). Получаем, что чкр?= 11,1 и чкр?= 9,5 для массивов А и В соответственно. Делаем вывод о том, что обе гипотезы о распределении массивов по нормальному закону принять.
4. Используя формулу для определения доверительного интервала для оценки математического ожидания, получаем, что математическое ожидание массива А заключено в интервале (17,6; 24,66), а математическое ожидание массива В - (0,912; 1,252
Заключение
В данной курсовой работе были воспроизведены задачи математической статистики на примере двух массивов, а также рассмотрены числовые характеристики непрерывной случайной величины, вероятность попадания в заданный интервал, закон нормального распределения, оценочные характеристики отклонения теоретического распределения от нормального и прочее.
В ходе выполненной работы я приобрела новые знания в области высшей математики и навыки в области пользования программой Mathcad.
Можно сделать вывод о том, что математическая статистика может охватывать обширные области знаний, систематизировать их, а также обрабатывать.
Список использованной литературы
1. В.Е. Гмурман Руководство к решению задач по теории вероятностей и математической статистике «Высшая школа» Москва 2004
2. В.Е. Гмурман Теория вероятностей и математическая статистика «Высшая школа» Москва 2003
3. Ю.В. Прохоров Математический энциклопедический словарь «Большая российская энциклопедия» Москва 1995
4. лекции по высшей математике
Подобные документы
Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.
контрольная работа [318,9 K], добавлен 26.04.2013Определение, доказательство свойств и построение графика функции распределения. Вероятность попадания непрерывной случайной величины в заданный интервал. Понятие о теореме Ляпунова. Плотность распределения "хи квадрат", Стьюдента, F Фишера—Снедекора.
курсовая работа [994,4 K], добавлен 02.10.2011Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.
контрольная работа [104,7 K], добавлен 24.01.2013История открытия нормального закона, его применение в науке и технике. Вероятность попадания случайной величины, подчиненной нормальному закону, на заданный участок. Нормальная функция распределения. Геометрическая интерпретация вероятного отклонения.
контрольная работа [506,3 K], добавлен 21.04.2019Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.
курсовая работа [57,0 K], добавлен 13.10.2009Нормальное распределение на прямой, нормальная кривая. Влияние параметров нормального распределения на форму нормальной кривой. Вероятность отклонения в заданный интервал нормальной случайной величины. Вычисление вероятности заданного отклонения.
курсовая работа [1,7 M], добавлен 06.12.2012Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.
лекция [387,7 K], добавлен 12.12.2011Дискретные системы двух случайных величин. Композиция законов распределения, входящих в систему. Определение вероятности попадания случайной величины в интервал; числовые характеристики функции; математическое ожидание и дисперсия случайной величины.
контрольная работа [705,1 K], добавлен 22.11.2013Классическая формула для вероятности события, отношение благоприятного числа исходов опыта к общему числу всех равновозможных несовместных исходов. Понятие непрерывной и дискретной случайной величины, их числовые характеристики и законы распределения.
презентация [5,5 M], добавлен 19.07.2015