Статистический анализ случайных величин

Определение дисперсии, средних квадратичных отклонений, моды и медианы выборки по X и по Y, корреляционного момента. Построение диаграммы рассеивания полигонов, гистограмм частот, эмпирических функций распределения. Линейная и параболическая регрессии.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 17.01.2013
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Оглавление

Введение

1. Постановка задачи

2. Теоретическая часть. Основные понятия

3. Диаграмма рассеивания

4. Корреляционная таблица

5. Полигоны и гистограммы

6. Регрессионный анализ

Заключение

Список литературы

дисперсия корреляционный регрессия

Введение

Математическая статистика -- раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений, наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.

Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (например, оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).

1. Постановка задачи

Дана выборка (интернет ресурс: http://valuta.investfunds.ru/indicators/view/132/#beginf), состоящая из 100 пар чисел: Xi (Курс USD/RUR), Yi (Курс EUR/RUR), где i =1, 2, …, 100.

1. Построить диаграмму рассеивания.

2. Составить коррекционную таблицу размерностью (8 на 8).

3. Найти: дисперсии, средние квадратичные отклонения, моды и медианы выборки по X и по Y, корреляционный момент и коэффициент корреляции.

4. Построить полигоны, гистограммы нормированных относительных частот, эмпирические функции распределения по X и по Y.

5. Вычислить параметры для уравнения линейной регрессии, построить линию регрессии на диаграмме рассеивания.

6. Вычислить параметры для уравнения параболической регрессии, построить найденную параболу на диаграмме рассеивания.

2. Теоретическая часть. Основные понятия

Статистика -- отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.

Выборка -- множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Генеральная совокупность -- совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

Репрезентативность -- соответствие характеристик выборки характеристикам генеральной совокупности в целом.

Теория вероятностей -- математическая наука, изучающая закономерности случайных явлений. Под случайными явлениями понимаются явления с неопределенным исходом, происходящие при неоднократном воспроизведении определенного комплекса условий.

Дискретная величина -- случайная величина, возможные значения которой есть отдельные изолированные числа, которые эта величина принимает с определенными вероятностями.

Частота -- (p) число, которое показывает, сколько раз встречается данный вариант события:

, (1)

где ni -- число события;

n -- полное число событий.

Относительная частота -- () отношение частоты pi к объему выборки n.

, (2)

где pi -- частота;

n --интервал.

Математическое ожиданием -- (M(x)) среднее значение дискретной случайной величины, распределение вероятностей случайной величины. Если дискретная случайная величина принимает счетное множество возможных значений, то:

, (3)

где xi -- случайная величина;

pi -- частота.

, (4)

где xi -- случайная величина;

n -- количество случайных величин.

Дисперсией (D(X)) дискретной случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

(5)

Средним квадратичным отклонением случайной величины X называют квадратный корень из дисперсии:

(6)

Модой M0 называют случайную величину, которая имеет наибольшую частоту.

Медианой mi называют случайную величину, которая делит вариационный ряд на две части, равные по числу вариант.

Начальным моментом порядка k случайной величины X называют математическое ожидание величины Xk:

(7)

В частности, начальный момент первого порядка равен математическому ожиданию.

Центральным моментом порядка k случайной величины X называют математическое ожидание величины:

(8)

В частности, центральный момент первого порядка равен нулю:

(9)

центральный момент второго порядка равен дисперсии:

(10)

центральный момент третьего порядка равен:

(11)

центральный момент четвертого порядка равен:

(12)

Исправленной выборочной дисперсией называют произведение выборочной дисперсии на коэффициент:

(13)

Выборочным исправленным средним квадратичным отклонением называют квадратный корень от исправленной выборочной дисперсии:

(14)

Корреляционная таблица -- является вспомогательными средствами при анализе выборочных данных. В каждой клетке корреляционной таблицы приводятся численности тех пар (X, Y), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.

Корреляционным моментом -- Сxy случайных величин X и Y называют математическое ожидание произведения отклонений этих величин:

(14а)

Для вычисления корреляционного момента используют формулу:

(15)

Две случайные величины Y и X называются коррелированными, если их корреляционный момент отличен от 0; Y и X называются некоррелированными величинами, если их корреляционный момент равен 0.

Коэффициентом корреляции -- rxy случайных величин X и Y называют отношение корреляционного момента к произведению средних квадратичных отклонений этих величин:

(16)

Гистограмма нормированных относительных частот -- диаграмма, на которой изображены столбцы, при этом ось Х - это интервалы, а ось Y - это относительная частота встречаемости:

(17)

Полигон частот -- представляет собой ломаную, соединяющую точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов.

Функцией распределения -- называют функцию, определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х:

(18)

Функцией распределения выборки является эмпирическая функция распределения.

Эмпирической функцией распределения называют функцию, определяющую для каждого значения х относительную частоту события Х < х:

(19)

где nx -- число вариант, меньших х;

n -- объем выборки.

Регрессионный анализ

Регрессионный анализ -- статистический метод исследования влияния одной или нескольких независимых переменных X на зависимую переменную Y.

Линейная регрессия выражается уравнением прямой:

, (20)

где a, b -- неизвестные параметры.

Определим коэффициенты линейной функции (20) методом наименьших квадратов. Для этого составим сумму:

(21)

Для того чтобы эта сумма была минимальной, необходимо, чтобы ее частные производные по параметрам a и b были равны нулю:

, (22)

. (23)

Раскрыв скобки, мы получим:

(24)

(25)

Перепишем (24) и (25) в удобном виде и запишем в систему, которую можно решить по методу Крамара:

(26)

Параболическая регрессия -- уравнение выражается:

, (27)

где a, b и c - неизвестные параметры.

Определим коэффициенты параболической функции (27) методом наименьших квадратов. Для этого составим сумму:

(28)

Для того чтобы эта сумма была минимальной, необходимо, чтобы ее частные производные по параметрам a и b были равны нулю:

, (29)

, (30)

. (31)

После преобразований уравнения примут следующий вид:

. (32)

Подставив соответствующие значения в полученные формулы, и решив систему уравнений, мы получим искомую функцию параболической регрессии.

Обработка исходных данных

Дана выборка (интернет ресурс: http://valuta.investfunds.ru/indicators/view/132/#beginf), состоящая из 100 пар чисел: Xi (Курс USD/RUR), Yi (Курс EUR/RUR), где i =1, 2, …, 100.

Таблица 1 Исходные данные

x

y

x

y

x

y

x

y

32,20

40,63

32,46

39,75

32,94

41,20

31,38

39,77

32,46

0,67

32,33

39,82

32,84

41,02

31,06

39,74

32,20

40,62

32,21

39,51

33,17

41,50

31,16

39,81

32,42

40,76

32,19

39,55

33,17

41,50

31,39

39,75

32,57

40,72

32,21

39,60

33,52

42,05

30,94

39,39

32,29

40,53

32,62

39,64

32,91

41,72

30,98

39,33

32,09

40,28

32,97

39,84

32,52

41,24

30,33

38,98

32,02

39,97

32,63

39,54

32,53

41,01

30,27

39,01

31,87

39,84

32,38

39,16

32,13

40,82

30,18

38,98

31,81

39,91

31,95

39,17

32,39

40,91

30,23

39,05

31,68

39,75

32,08

39,42

32,58

40,94

30,19

39,12

31,81

39,62

32,40

39,80

32,73

40,94

29,81

39,00

31,96

39,54

32,50

39,92

32,59

40,79

29,59

38,92

32,02

39,55

32,62

39,90

32,74

40,91

29,46

38,74

31,85

39,37

32,66

39,83

32,19

40,42

29,37

38,82

31,90

39,14

32,72

40,01

32,79

40,95

29,36

38,92

31,85

39,28

32,83

40,26

33,20

41,51

29,42

38,75

31,77

39,29

32,98

40,54

34,04

42,25

29,28

38,74

31,87

39,15

32,99

40,55

33,74

41,68

29,30

38,66

31,90

39,19

32,62

40,39

32,92

40,81

29,45

38,80

31,48

38,95

32,47

40,69

32,45

40,46

29,49

38,84

31,69

39,23

32,21

40,55

32,09

40,24

29,52

38,81

31,66

39,23

32,48

40,93

31,83

40,12

29,51

38,72

31,95

39,54

32,53

41,06

31,76

39,84

29,50

38,67

32,54

39,67

32,82

41,32

31,62

39,77

29,64

38,85

С помощью выборки можно посчитать оценки X и Y:

Числовые характеристики X вычисленные при помощи выборки

Математическое ожидание считаем по формуле (3.2):

, (33)

Дисперсия вычисляется по формуле (4), преобразовав данную формулу получим:

(34)

Среднеквадратичное отклонение вычисляется по формуле (5):

(35)

Исправленная выборочная дисперсия считается по формуле (12):

(36)

Выборочным исправленным средним квадратичным отклонением вычисляется по формуле (5):

(37)

(x)=0,676

Мода:

(x)=32,200

Медиана:

(x)=32,160

Начальный момент вычисляется по формуле (6) в частности начальный момент первого порядка равен математическому ожиданию:

(38)

Центральный момент вычисляется по формуле (7) в частности центральный момент первого порядка равен нулю:

(39)

Числовые характеристики Y вычисленные при помощи выборки

Математическое ожидание считаем по формуле (3.2):

, (40)

Дисперсия вычисляется по формуле (4), преобразовав данную формулу получим:

(41)

Среднеквадратичное отклонение вычисляется по формуле (5):

(42)

Исправленная выборочная дисперсия считается по формуле (12):

(43)

Выборочным исправленным средним квадратичным отклонение вычисляется по формуле (5):

(44)

(y)=0,381

Мода:

(y)=40,630

Медиана:

(y)=39,8

Начальный момент вычисляется по формуле (6) в частности начальный момент первого порядка равен математическому ожиданию:

(45)

Центральный момент вычисляется по формуле (7) в частности центральный момент первого порядка равен нулю:

(46)

3. Диаграмма рассеивания

Чтобы построить диаграмму рассеивания нужно отложить по оси абсцисс данные по Xi, a по оси ординат данные Yi.

Рис 1 диаграмма рассеивания

4. Корреляционная таблица

Для построения корреляционной таблицы следует разбить оси на 8 равных отрезков: ось абсцисс с шагом 0,625; ось ординат с шагом 0,5. И провести подсчет количества точек в интервалы равные одному шагу по оси абсцисс и оси ординат с замкнутым интервалом справа.

Данный расчет проводится при помощи программных средств

Таблица 2 Корреляционная таблица

(USD/RUR)/(EUR/RUR)

Корреляционная таблица

[38,5 39]

(39 39,5]

(39,5 40]

(40 40,5]

(40,5 41]

(41 41,5]

(41,5 42]

(42 42,5]

[29,2 29,825]

13,00

1,00

0,00

0,00

0,00

0,00

0,00

0,00

(29,825 30,45]

2,00

3,00

0,00

0,00

0,00

0,00

0,00

0,00

(30,45 31,075]

0,00

2,00

1,00

0,00

0,00

0,00

0,00

0,00

(31,075 31,7]

1,00

2,00

5,00

0,00

0,00

0,00

0,00

0,00

(31,7 32,325]

0,00

8,00

11,00

4,00

5,00

0,00

0,00

0,00

(32,325 32,95]

0,00

1,00

9,00

4,00

12,00

6,00

1,00

0,00

(32,95 33,575]

0,00

0,00

1,00

0,00

2,00

2,00

1,00

1,00

(33,575 34,2]

0,00

0,00

0,00

0,00

0,00

0,00

1,00

1,00

Исследование столбца X

Таблица 3 Столбец X

Курс USD/RUR

ni

(0 29,2)

[29,2 29,825]

14

(29,825 30,45]

5

(30,45 31,075]

3

(31,075 31,7]

8

(31,7 32,325]

28

(32,325 32,95]

33

(32,95 33,575]

7

(33,575 34,2]

2

С помощью корреляционной таблицы мы сможем найти оценки для X:

Математическое ожидание считаем по формуле (3.1)

, (47)

где xi -- центр диапазонов,

pi -- частота определяемая формулой (1):

, (48)

Проведя вычисления с помощью программных средств получим:

Дисперсия вычисляется по формуле (4), преобразовав данную формулу получим:

(49)

Среднеквадратичное отклонение вычисляется по формуле (5):

(50)

Исправленная выборочная дисперсия считаем по формуле (12):

(51)

Выборочное исправленное среднее квадратичное отклонение вычисляется по формуле (5):

(52)

(x)=1,176

Начальный момент вычисляется по формуле (6) в частности начальный момент первого порядка равен математическому ожиданию:

(53)

Центральный момент вычисляется по формуле (7) в частности центральный момент первого порядка равен нулю:

(54)

Исследование столбца Y

Таблица 4 Столбец Y

Курс EUR/RUR

ni

(0 38,5)

[38,5 39]

16

(39 39,5]

17

(39,5 40]

27

(40 40,5]

8

(40,5 41]

19

(41 41,5]

8

(41,5 42]

3

(42 42,5]

2

С помощью корреляционной таблицы мы сможем найти оценки для Y:

Математическое ожидание считаем по формуле (3.1)

, (55)

где xi -- центр диапазонов, pi -- частота определяемая формулой (1):

, (56)

Проведя вычисления с помощью программных средств получим:

Дисперсия вычисляется по формуле (4), преобразовав данную формулу получим:

(57)

Среднеквадратичное отклонение вычисляется по формуле (5):

(58)

Исправленная выборочная дисперсия считаем по формуле (12):

(59)

Выборочное исправленное среднее квадратичное отклонение вычисляется по формуле (5):

(60)

(y)=0,597

Начальный момент вычисляется по формуле (6) в частности начальный момент первого порядка равен математическому ожиданию:

(61)

Центральный момент вычисляется по формуле (7) в частности центральный момент первого порядка равен нулю:

(62)

Корреляционный момент и коэффициент корреляции

Корреляционный момент находим по формуле (15):

Коэффициент корреляции находится по формуле (16):

Данные случайные величины имеют линейную зависимость.

5. Полигоны и гистограммы

Графики по X:

Рис 2. Гистограмма частот

Рис. 3 Гистограмма относительных частот

Рис. 4 Гистограмма относительных нормированных частот

Рис. 5 Эмпирической функцией распределения

Рис. 6 Полигоны относительных нормированных частот

Рис. 7 Полигон частот

Рис. 8 Полигоны относительных частот

Графики по Y:

Рис. 9 Гистограмма частот

Рис. 10 Гистограмма относительных частот

Рис. 11 Гистограмма относительных нормированных частот

Рис. 12 Эмпирической функцией распределения

Рис. 13 Полигоны относительных нормированных частот

Рис. 14 Полигон частот

Рис. 15 Полигоны относительных частот

6. Регрессионный анализ

Линейная регрессия

Для того чтобы получить уравнение линейной регрессии следует записать уравнение (26) для конкретных величин и решить его по методу Крамара:

{

3 995,94

=

a*

3 180,88

+b*

100

127189,0997

=

a*

101316,64

+b*

3 180,88

Рис 16 Система уравнений Линейной регрессии

Для решения этого уравнения следует найти определители:

д=

-13658,958

дa=

-8311,400

дb=

-281427,508

Рис. 17 Определители системы уравнений

Получаем коэффициенты:

a=

0,6085

b=

20,604

Рис. 18 Коэффициенты

Получаем уравнение:

Рис. 19 Линейная регрессия

Параболическая регрессия

Для того чтобы получить уравнение параболической регрессии следует записать уравнение (32) для конкретных величин и решить его по методу Крамара:

{

3 995,94

=

a*

101316,64

+b*

3 180,88

+с*

100

127189,0997

=

a*

3231306,28

+b*

101316,64

+с*

3 180,88

403783,181

=

a*

103185317,79

+b*

3231306,28

+с*

101316,64

Рис. 20 Система уравнений параболической регрессии

Для решения этого уравнения следует найти определители:

д=

-2637409,75

дa=

-485539,3438

дb=

28768810

дc=

-528558760

Рис. 21 Определители системы уравнений

Получаем коэффициенты:

a=

0,184

b=

10,908

c=

200,41

Рис. 22 Коэффициенты

Получаем уравнение:

Рис. 23 Параболическая регрессия

Заключение

В курсовой работе был проведен Статистический анализ случайных величин. Производя этот анализ, мы использовали не только аналитические функции, но и графические данные.

В результате работы были получены основные значения, которые требуются для статистического анализа случайной величины.

Список литературы

1 Гмурман, В.Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов. -- М.: Высшая школа, 2001.

2 Гмурман, В.Е. Руководство по решению задач по теории вероятностей и математической статистике. Учебное пособие для вузов. -- М.: Высшая школа, 1979.

3 Электронная библиотека Википедия [Электронный ресурс]: Режим доступа: http://ru.wikipedia.org

Размещено на Allbest.ru


Подобные документы

  • Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.

    курсовая работа [511,8 K], добавлен 08.12.2013

  • Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.

    курсовая работа [698,0 K], добавлен 08.05.2012

  • Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.

    контрольная работа [77,6 K], добавлен 20.07.2010

  • Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.

    презентация [92,4 K], добавлен 01.11.2013

  • Обработка случайных выборок с нормальным законом распределения. Оценка коэффициентов регрессии и доверительных интервалов. Оценка значимости факторов по доверительным интервалам и корреляционного момента. Построение эмпирической интегральной функции.

    курсовая работа [135,7 K], добавлен 03.05.2011

  • Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.

    курсовая работа [1,1 M], добавлен 16.11.2013

  • Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.

    задача [143,4 K], добавлен 31.01.2011

  • Двумерная функция распределения вероятностей случайных величин. Понятие условной функции распределения и плотности распределения вероятностей. Корреляция двух случайных величин. Система произвольного числа величин, условная плотность распределения.

    реферат [325,3 K], добавлен 23.01.2011

  • Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа [109,3 K], добавлен 26.07.2012

  • Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.

    курсовая работа [1,3 M], добавлен 10.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.