Общая теория статистики

Рассмотрение основных теоретических положений по определению средних величин, структурных средних и показателей вариации. Расчет общей, межгрупповой и средней внутригрупповой дисперсии. Анализ основных положений корреляционного и регрессионного анализа.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»

КУРСОВАЯ РАБОТА

по дисциплине:

«Общая теория статистики»

Автор работы Надеждин М.И.

Специальность: 38.03.01 Экономика. Финансы и кредит

Группа 16ЭЭ1

Руководитель работы В.Н. Деркаченко

Пенза 2017

Задание для выполнения курсовой работы

на тему:

«Построение нелинейных регрессионных моделей для прогнозирования курса валют»

Вариант 12

по дисциплине «Общая теория статистики»

студенту группы 16ЭЭ1

Надеждину Михаилу Игоревичу

Исходные данные к курсовой работе:

Исходные данные к курсовой работе приведены в пояснительной записке для каждой индивидуальной задаче.

Перечень подлежащих разработке вопросов:

рассмотреть основные теоретические положения по определению средних величин, структурных средних и показателей вариации;

определить среднее значение, моду, медиану, дисперсию, коэффициент вариации;

рассчитать общую, межгрупповую и среднюю внутригрупповую дисперсию;

рассмотреть теоретические положения корреляционного и регрессионного анализа;

определить коэффициенты корреляции и проанализировать их значимость;

Проанализировать применение нелинейных регрессионных моделей для прогнозирования курса валют;

Найти коэффициент корреляции и провести его статистический анализ;

построить линейную регрессионную модель, оценить ее качество и спрогнозировать курс валют страны в зависимости от индивидуального задания;

выполнить комплексный статистический анализ инвестиций в основной капитал регионов Приволжского ФО и построить регрессионную трендовую модель для региона, указанного в индивидуальном задании;

сделать выводы и дать рекомендации.

Дата выдачи задания «28» октября 2017г.

Научный руководитель Деркаченко В.Н.

Задание принял к исполнению Надеждин М.И.

Отзыв научного руководителя на курсовую работу

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Кафедра «Экономика и финансы»

ОТЗЫВ

на курсовую работу, выполненную на тему:

«Построение нелинейных регрессионных моделей для прогнозирования курса валют»

(вариант 12)

по дисциплине «Общая теория статистики»

студентом группы 16ЭЭ1

Надеждиным Михаилом Игоревичем

№ п/п

Основание оценки

Критерии

оценивания

Шкала оценивания

100-балльная

4-балльная

1

По результатам собеседования

Степень авторского вклада в формулировании выводов и рекомендаций по результатам проекта

35 баллов

5 баллов

2

По результатам собеседования

Степень достижения студентом учебных целей и выполнения учебных задач

35 баллов

5 баллов

3

По результатам собеседования

Показанный при защите проекта уровень освоения необходимых компетенций

35 баллов

5 баллов

4

По результатам оформления

Качество подготовки и оформления основных разделов пояснительной записки проекта

35 баллов

5 баллов

Суммарный балл текущего рейтинга

53 баллов

5 баллов

Средний балл по критериям оценивания курсовой работы

35 баллов

Оценка за курсовую работу 88 баллов по 100 балльной шкале, 5 баллов по 4 балльной шкале

Научный руководитель Деркаченко В.Н.

Дата составления отзыва «20» декабря 2017г.

Отчет о проверке курсовой работы на плагиат

ПРОТОКОЛ

проверки на оригинальность в системе «Антиплагиат.ВУЗ» курсовой работы по дисциплине «Общая теория статистики» на тему: «Построение нелинейных регрессионных моделей для прогнозирования курса валют» (вариант 12)» студента учебной группы 16ЭЭ1 Надеждина Михаила Игоревича направления подготовки бакалавриата 38.03.01 «Экономика», профиля подготовки бакалавриата «Финансы и кредит»

Руководитель курсовой работы к.т.н., профессор Деркаченко В.Н

«16» декабря 2017г. Деркаченко В.Н.

Содержание

Введение

1. Средние величины и показатели вариации

Задание 1.1

Задание 1.2

Задание 1.3

Задание 1.4

Задание 1.5

2. Корреляционный анализ

Задание 2.1

Задание 2.2

Задание 2.3

3. Регрессионный анализ

Задание 3.1

Задание 3.2

Задание 3.3

Задание 3.4

Задание 3.5

Задание 3.6

Вывод

Список использованных источников

Введение

Термин «статистика» происходит от латинского слова «status», что в средние века означало политическое состояние государства. В науку этот термин введен немецким ученым Готфридом Аванхелем, и означал он тогда «государствоведение».

Первые учетные операции проводились еще в глубокой древности. За 5 тыс. лет до н. э. проводился подсчет населения в Китае, велся учет имущества в Древнем Риме, в средние века проводились переписи населения, домашнего имущества, земель. Все эти эпизодические учеты носили примитивный характер и использовались в основном в военных целях и при налогообложении.

По мере развития производительных сил расширялся круг учитываемых явлений и собираемых о них сведений. Производство требовало информации об источниках сырья, рынках труда и сбыта продукции, международная торговля - информации об иностранных государствах, их городах, населения, ремеслах, торговле, ценах и т.д. Начиная с 16 века в Италии, Голландия и других странах создаются сборники, посвященные разным странам, их политическому устройству, населению, промышленности, с\х, торговле, путям сообщения. В странах начинают регулярно проводится статистические работы по рождаемости и смертности населения, по учету явлений хозяйственной жизни. Накапливается опыт, появляются рекомендации о том, как организовать учет и обработать собранные сведения, чтобы обобщить их, проанализировать и выявить различные закономерности. Так постепенно сформировалась отрасль знаний, названная в последствии «статистикой». Ее возникновение связано с потребностями общества в различного рода информации, без которой невозможно управлять государством, изучать отдельные явления и процессы, происходящие в различных областях жизни и сферах деятельности.

В процессе статистического наблюдения получают данные о значениях тех или иных признаков, характеризующих каждую единицу исследуемой совокупности. Для характеристики совокупности в целом или отдельных ее частей данные по отдельным единицам совокупности подвергают сводке и получают обобщающие показатели, в которых отражаются результаты познания количественной стороны изучаемых явлений. Обобщающие показатели могут быть представлены абсолютными, относительными и средними величинами.

Основная цель курсовой работы - развитие системного подхода при анализе статистических закономерностей в массовых социально-экономической явлениях, практическое применение классических методов статистической обработки данных, в целях эффективного информационного обеспечения управленческой деятельности.

Курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой части я рассмотрел теорию, привел все расчеты и сделал вывод.

Цель данной работы заключается в проведении корреляционно-регрессионного анализа и расчете средних величин. Главными задачами в работе являются: Теоретическое обоснование сущности, общих понятий и методов расчета средних величин, исследование системы показателей и информационной базы корреляционно-регрессионного анализа, выполнение расчетов. А также всестороннее изучение статистического наблюдения; умение идентифицировать данные задачи в реальной организационно-экономической среде; владение основными методами и алгоритмами, используемыми при статистической обработке данных.

вариация дисперсия корреляционный регрессионный

1. Средние величины и показатели вариации

Средняя величина представляет собой обобщенную характеристику уровня значений признака, которая получена в расчете на единицу совокупности. В отличие от относительной величины, которая является мерой соотношения показателей, средняя величина является мерой признака на единицу совокупности. Средние величины делятся на основные две категории: степенные средние; структурные средние.

Существуют разные виды средних величин. Среднее хронологическое :

. (1.1)

Среднее арифметическое простое:

(1.1.1),

где xi - i-тое значение случайной величины, n -число, вариант. Среднее арифметическое взвешенное:

= (1.1.2) ,

где mi - частота.[1]

Другие средние можно определить по общей формуле:

(1.1.3),

где k - степень, определяющая различные средние.

Средняя гармоническая высчитывается по формуле:

гм= (1.1.4),

где Vi - i-тый объем реализации. Ее используют в тех случаях, когда неизвестна частота, а известен только объем реализации.

Мода - значение признака, который встречается в совокупности наиболее часто.

М0 = хн + i (1.1.5),

где Хн - нижняя граница интервала, содержащего моду;

i - ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Для дискретных распределений модой считают любое значение ai, вероятность которого pi больше, чем вероятности соседних значений [1].

Медиана - значение признака, который приходится на середину ранжированной совокупности.

Ме = Xн + i ) (1.1.6),

где Хн - нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений)

- накопленная частота интервала, предшествующего медианному;

mме - частота медианного интервала;

Вариация - это изменение признака в пределах изучаемой совокупности. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

Размах колебаний (вариации) - разность между максимальным и минимальным значениями признака в изучаемой совокупности:

R = xmax - xmin, (1.1.7), где

xmax - наибольшее значение признака;

xmin - наименьшее значение признака

Среднее линейное отклонение:

= (1.1.8),

где - среднее значение показателя.

Взвешенное среднее линейное отклонение:

вз = (1.1.9)

Среднеквадратическое отклонение:

у = (1.2),

де - дисперсия.

Средняя дисперсия :

уІ(sІ) = (1.2.1).

Ее можно рассчитать еще таким образом:

уІ(sІ) = (1.2б)

Взвешенная дисперсия:

уІвз = (1.2.2).

Ее используют, когда все данные представлены в виде интервального ряда и вместо xi берем среднее значение интервала и соответственно частота i- ого интервала (mi).

Еще есть среднеквадратическое отклонение:

) = (1.2.3)

Взвешенное среднеквадратическое отклонение:

= (1.2.4)

Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квадратического отклонения к средней величине признака:

V = 100% (1.2.5)

Коэффициент вариации показывает, какую долю среднего значения этой величины составляет её средний разброс. Коэффициент вариации имеет смысл использовать при ненулевых средних значениях.

Коэффициент полезен в ситуациях, когда о размерах отклонения величины можно судить, зная ее среднее значение. Номер моего варианта 12.

Задание 1.1

По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение было увеличено на номер классного журнала (12). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Дано (х): 15; 17; 14; 16; 19; 15; 20; 15; 22;

Определим среднее значение:

(1.2)

Моду: - наиболее часто встречающееся значение ряда.

Медиана. Для ее расчета расположим ряд в порядке возрастания:

14, 15, 15, 15, 16, 17, 19, 20, 22.

Количество элементов 9, нечетное количество, медианой будет являться число 16, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.

Вычислим дисперсию:

= 6,7 (2)

Вычислим среднеквадратическое отклонение: (1.9)

И коэффициент вариации составит:

(2.5).

Задание 1.2

По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 33%, стоимость основных фондов увеличилась на 22%. Определить изменение фондоотдачи.

Фондоотдача - это финансовый коэффициент, характеризующий эффективность использования основных средств организации. Фондоотдача показывает, сколько выручки приходится на единицу стоимости основных средств.

, соответственно изменение фондоотдачи:

= 9,02%

Таким образом, фондоотдача увеличилась на 9,02%

Задание 1.3

Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Определим среднее значение моду и медиану. Промежуточные вычисления приведены в таблице1.1

Таблица 1.1 - промежуточные вычисления.

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

У?

90

110

130

150

170

190

m*У?

540

1870

3250

4200

2380

1900

У?/2

45

55

65

75

85

95

Накопл. частота

6

23

48

76

90

100

Общее число работников составляет человек

Среднее значение

x?=(1)

Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение . (76>50). Вычислим моду:

(1.4)

Вычислим медиану:

(1.5)

Задание 1.4

По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi было увеличено на номер классного журнала (12).

Таблица 2 - Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

13,0-13,2

3

3

13,2-13,4

4

4

13,4-13,6

17

17

13,6-13,8

11

15

26

13,8-13,0

13

6

19

14,0-14,2

18

5

23

14,2-14,4

6

6

14,4-14,6

2

2

50

50

100

Для удобства расчета составим таблицу 2.1, в которой будут отражены промежуточные вычисления по нахождению общей дисперсии.

Таблица 2.1 - Расчет общей дисперсии

Число предприятий

Расчет дисперсии

Хi (млн. руб)

mгi

mчi

moi

Хср.i

Хср.i*moi

(Хср.i-X?o)^2

(Хср.i-X?o)^2*moi

13.0

13.2

3

3

13.1

39.3

0.509796

1.529388

13.2

13.4

4

4

13.3

53.2

0.264196

1.056784

13.4

13.6

17

17

13.5

229.5

0.098596

1.676132

13.6

13.8

11

15

26

13.7

356.2

0.012996

0.337896

13.8

14.0

13

6

19

13.9

264.1

0.007396

0.140524

14.0

14.2

18

5

23

14.1

324.3

0.081796

1.881308

14.2

14.4

6

6

14.3

85.8

0.236196

1.417176

14.4

14.6

2

2

14.5

29

0.470596

0.941192

50

50

100

1381.4

8.9804

Общее среднее: млн. руб.

Общая дисперсия: у2о= млн.руб. (89804 руб.)

Далее рассчитаем дисперсию по группам: для государственных и частных предприятий.

Таблица 2.2 - расчет дисперсии (гос. предприятия)

Хi (млн. руб)

mгi

Хср.i

Хср.i*mгi

(Хср.i-X?г)^2

(Хср.i-X?o)^2*mгi

13.6

13.8

11

13.7

150.7

0.09

0.99

13.8

14.0

13

13.9

180.7

0.01

0.13

14.0

14.2

18

14.1

253.8

0.01

0.18

14.2

14.4

6

14.3

85.8

0.09

0.54

14.4

14.6

2

14.5

29

0.25

0.5

50

700

2.34

Среднее значение : млн. руб.

Дисперсия: у2г= млн.руб. (46800 руб.)

Таблица 2.3 - расчет дисперсии (частные предприятия)

Хi (млн. руб)

mчi

Хср.i

Хср.i*mчi

(Хср.i-X?ч)^2

(Хср.i-X?o)^2*mчi

13.0

13.2

3

13.1

39.3

0.278784

0.836352

13.2

13.4

4

13.3

53.2

0.107584

0.430336

13.4

13.6

17

13.5

229.5

0.016384

0.278528

13.6

13.8

15

13.7

205.5

0.005184

0.07776

13.8

14.0

6

13.9

83.4

0.073984

0.443904

14.0

14.2

5

14.1

70.5

0.222784

1.11392

50

681.4

3.1808

Среднее значение : млн. руб.

Дисперсия: у2ч= млн.руб. (63616 руб.)

Средняя внутригрупповая дисперсия: у?в=

Общая дисперсия равна сумме межгрупповой и среднегрупповой дисперсий, следовательно межгрупповая дисперсия будет равна:

уІмг= уІо - у?в= 89804 - 55208 = 34596 руб.

Вычислим коэффициент детерминации:

Таким образом, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.

Задание 1.5

Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 3 - Исходные данные 1, 2, 3 - группа

Хi

1

2

8

mi

30

15

5

Хi

1

6

mi

10

15

Хi

3

8

mi

20

5

Для удобства расчета общей дисперсии составим таблицу 3.1, в которой будут представлены вычисления.

Таблица 3.1 - вычисление общей дисперсии.

Xi

mi

Расчет дисперсии

1

2

3

moi

Х*moi

(Х-Х?o)І

(Х-Х?o)І*moi

1

30

10

40

40

4

160

2

15

15

30

1

15

3

20

20

60

0

0

6

15

15

90

9

135

8

5

5

10

80

25

250

Сумма

100

300

560

Среднее общее значение : х?о=

Общая дисперсия:

Далее определим дисперсию для каждой группы в отдельности :

Таблица 3.2 - вычисление дисперсии для 1 группы.

Xi

m1i

X*m1i

(Х-Х?1)І

(Х-Х?1)І*m1i

1

30

30

1

30

2

15

30

0

0

8

5

40

36

180

Среднее значение : X?1=

Дисперсия: уІ1=

Таблица 3.2 - вычисление дисперсии для 2 группы.

Xi

m2i

X*m2i

(Х-Х?2)І

(Х-Х?2)І*m2i

1

10

10

9

90

6

15

90

4

60

Среднее значение : X?2=

Дисперсия: уІ2=

Таблица 3.3 - вычисление дисперсии для 3 группы.

Xi

m3i

X*m3i

(Х-Х?3)І

(Х-Х?3)І*m3i

3

20

60

1

20

8

5

40

16

80

Среднее значение : X?3=

Дисперсия: уІ3=

Вычислим среднюю внутригрупповую дисперсию: у?Ів=

И межгрупповую: уІмг=уІо-у?Ів= 5,6 - 4,73 = 0,87

2. Корреляционный анализ

Корреляция -- статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. [3]

Математической мерой корреляции двух случайных величин служит корреляционное отношение либо коэффициент корреляции . В случае если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.

Впервые ввел данный термин французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

На основе статистических данных корреляционный момент определяется:

Kxy = + X?) (Yi +), (2.1.1) где

n - объем выборки, число наблюдений;

, Yi - i-тое значение фактора и показателя;

X?,- средние значения фактора и показателя.

Безразмерному коэффициент корреляции:

rxy = , (2.1.2)

где - среднеквадратические отклонения фактора и показателя.

На практике чаще всего используют данное выражение

rxy = , (2.1.3)

где - среднее значения произведения фактора на показатель.

Коэффициент корреляции может изменяться в данном диапазоне -1 r +1[5]

t-критерий Стьюдента -- общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках. расчетное значение критерия Стьюдента определяется по формуле:

t = (2.1.4)

После этого необходимо найти табличное значение критерия Стьюдента. Для этого нам нужны уровень значимости и степень свободы . Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим.

Коэффициент корреляции Спирменамера линейной связи между случайными величинами. Он рассчитывается по формуле

(2.1.5)

Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Задание 2.1

Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ:28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Определим У, увеличим Х и У на номер журнала.

Таблица 4.1 - результаты вычислений.

У

20,1

21,4

23,3

18,9

21,7

Х

15,5

16,6

17,8

16,2

17,2

ХУ

311,55

355,24

414,74

306,18

373,24

(Хi-Х?)І

1,3456

0,0036

1,2996

0,2116

0,2916

(Уi-У?)І

0,9604

0,1024

4,9284

4,7524

0,3844

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Вычислим коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче: f= 5-2 =3.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента:

Таким образом, табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а следовательно коэффициент корреляции не значим

Задание 2.2

Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Это нулевой вариант. Каждое значение х и у было увеличено на свой номер классного журнала (12).

Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 4.2

Таблица 4.2 - результаты промежуточных вычислений.

Сумма

Х

30

34

25

32

27

26

174

У

29

32

23

30

26

22

162

ХУ

870

1088

575

960

702

572

4767

(Хi-Х?)І

1

25

16

9

4

9

64

(Уi-У?)І

4

25

16

9

1

25

80

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. В данной задаче значение степени свободы: f= 6-2 =4.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента: :

Таким образом, табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а следовательно коэффициент корреляции значим.

Задание 2.3

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.

Результаты:

1. Коэффициент ранговой корреляции.

2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Решение:

Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. Все эти вычисления представлены в таблице 4.3 (все значения баллов были увеличены на номер классного журнала - 12).

Таблица 4.3 - Расчет коэффициента ранговой корреляции Спирмена.

№ студента

1

2

3

4

5

6

7

Теория вероятностей

77

102

54

59

96

70

62

Статистика

63

97

48

75

84

92

52

Ранг (Rтв)

5

7

1

2

6

4

3

Ранг (Rст)

3

7

1

4

5

6

2

4

0

0

4

1

4

1

Значение степени свободы составляет f =5

Количество ранжируемых элементов: n = 7

Коэффициент корреляции Спирмена:

Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости б/2=0,025 (0,02): . Таким образом, расчетное значение критерия корреляции Спирмена меньше табличного значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент ранговой корреляции Спирмена не значим.

Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 4.4

Таблица 4.4 - Расчет коэффициента корреляции Стьюдента.

№ студента

1

2

3

4

5

6

7

Сумма

Теория вероятностей (x)

77

102

54

59

96

70

62

520

Статистика (y)

63

97

48

75

84

92

52

511

хi-x?

2,71

27,71

-20,29

-15,29

21,71

-4,29

-12,29

yi-y?

-10,00

24,00

-25,00

2,00

11,00

19,00

-21,00

(хi-x?)(yi-y?)

-27,14

665,14

507,14

-30,571

238,86

-81,43

258

1530

(хi-x?)І

7,36735

768,082

411,51

233,653

471,51

18,3673

150,939

2061,43

(yi-yЇ)І

100

576

625

4

121

361

441

2228

Среднее значение баллов по теории вероятности: х? = 74,29

Определим корреляционный момент: Кху =

Вычислим дисперсии:

уІх =

уІy =

Коэффициент корреляции:

Определим расчетное значение критерия Стьюдента: , соответственно табличное значение критерия

Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.

3. Регрессионный анализ

Регрессионный анализ -- метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ -- раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных. Рассмотрим порядок определения параметров линейной модели:

. (3.1)

Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.

Метод наименьших квадратов обеспечивает такой выбор коэффициентов а0 и а1 для прямой, при котором достигается минимум суммы квадратов отклонений, т.е.

(3.2)

Выражение (3.2) есть числитель остаточной дисперсии. Можно записать:

Минимум функции двух переменных достигается при значениях и , которые обращают в нуль производные:

С учетом выше указанного запишем:

С учетом деления на n имеем:

(3.3)

Имеем без учета деления на n:

(3.4)

и с учетом деления на n:

(3.5)

Теперь, исходя из минимума остаточной дисперсии, необходимо определить коэффициенты регрессии.

Мы имеем две системы нормальных уравнений:

Первая:

(3.6; 3.7)

Опускаем обозначение i=1 до n.

Из (3.6) находим , подставляем в (2.7) и находим :

(3.8)

Из (2.6) находим , подставляем в (2.7) и находим а1:

(3.9)

Вторая: (3.10; 3.11)

Из 2.10 находим а1:

Подставляем а1 в (3.11), имеем:

. (3.12)

Из 2.10 находим а0:

.

Подставляем а0 в (2.11), имеем:

. (3.13)

Коэффициент а1 можно определить по следующей формуле:

. (3.14)

Как перейти от формулы (3.13) к (3.14)?

.

Отсюда мы можем сделать вывод, что коэффициенты линейной регрессии можно определить различными способами.

В матричной форме коэффициенты регрессии определяются по следующей зависимости:

(3.15)

где - транспонированная матрица;

- обратная матрица.

(3.16)

Далее проверяем значимость коэффициента регрессии по критерии Стьюдента. Значимость коэффициентов регрессии:

Так как то расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:

.

Этот же критерий мы можем рассчитать через отклонения коэффициентов:

- критерий Стьюдента для коэффициента а0

- критерий Стьюдента для коэффициента а1 (3.17)

Значимость данной модели мы можем определить по критерию Фишера:

(3.18)

где - табличное значение критерия;

- степень свободы факторной дисперсии

- степень свободы остаточной дисперсии

Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле (3.18 - левая часть) и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной.

Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.

После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка [5,7,8].

Ошибка аппроксимации рассчитывается по формуле:

(3.19)

где - исходное значение показателя;

- расчетное (прогнозное) значение показателя.

Стандартная ошибка определяется по формуле:

. (3.20)

В практических исследованиях, если ошибка аппроксимации имеет величину до 5%, то модель можно использовать для решения поставленных задач; если Е до 10%, то применение модели зависит от исследователя и если Е>10%, то модель нецелесообразно применять в эконометрических исследованиях.

Любое исследование начинается со спецификации модели, т.е. выбора вида модели. Как правило, парная регрессия используется, если имеется доминирующий фактор.

Известно, что выбор вида модели осуществляется либо графически, либо экспериментально.

Различают несколько видов нелинейных функций .

Из них можно выделить два класса нелинейных регрессий:

а) регрессии, нелинейные относительно факторов, но линейные по параметрам.

Примеры:

парабола: ;

равносторонняя гипербола: и др.;

б) регрессии, нелинейные по параметрам.

Примеры:

степенная: ;

показательная: ;

экспоненциальная: и др.

Нелинейная регрессия по факторам не вызывает сложностей в оценке параметров. Обычно используется МНК.

Нелинейные модели по параметрам делятся на два типа:

нелинейная модель внутренне линейна, т.е. она с помощью преобразований приводится к линейному виду.

Например, .

Оценки параметров и могут быть найдены МНК;

нелинейная модель внутренне не линейна, т.е. невозможно привести к линейной функции.

Например, .

Рассмотрим логарифмическую модель. Преобразовав степенную модель в линейную, получаем логарифмическую модель:

. (3.24)

Как правило, эта функция отражает зависимость спроса на благо от его цены () рисунок 2.3 или от дохода () или предложения от цены ().

Широко известна двухфакторная нелинейная модель, так называемая производственная функция Кобба-Дугласа:

, (2.27)

где - объем выпуска;

- затраты капитала;

- затраты труда;

- параметры модели.

Путем преобразования получаем линейную модель:

.

Полулогарифмические модели бывают двух видов:

(3.28)

(3.29)

Для модели (2.29) система уравнений имеет вид:

(3.30)

Такие модели обычно используют в тех случаях, когда необходимо определять темп роста или прироста каких-либо экономических показателей.

Например, при анализе банковского вклада по первоначальному вкладу и процентной ставке, при исследовании зависимости прироста объема выпуска продукции от увеличения затрат ресурсов и др.

Задание 3.1

Построить нелинейную обратную модель связи себестоимости единицы продукции (y) со стоимостью основных фондов (x). Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Исходные данные:

x

1

2

3

4

5

6

7

8

9

10

y

21

16

15

14

13

12,5

11

11,5

10

8

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков)

3) стандартную ошибку (до 4-х знаков)

4) расчетное значение критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков)

Решение:

Прежде всего, увеличим все имеющиеся данные на номер моего классного журнала (12).

Для удобства вычисления построим таблицу с промежуточным вычислением. Введем замену: 1/х обозначим как Х

Таблица 5.1 - Промежуточные расчеты коэффициентов модели

Ср.знач.

y

x

Х

X2

1

33

1

1

33

1

33,82725

2

28

2

0,5

14

0,25

27,72681

3

27

3

0,333

8,991

0,110889

25,68926

4

26

4

0,25

6,5

0,0625

24,67658

5

25

5

0,2

5

0,04

24,06654

6

24,5

6

0,167

4,0915

0,027889

23,66391

7

23

7

0,143

3,289

0,020449

23,37109

8

23,5

8

0,125

2,9375

0,015625

23,15147

9

22

9

0,111

2,442

0,012321

22,98066

10

20

10

0,1

2

0,01

22,84645

Итого

252

55

2,929

82,251

1,549673

252

Ср.знач.

25,2

5,5

0,293

8,225

0,1549673

1) Зная данные значения, можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:

а1 = = = 12,1590

- показывает среднее изменение результативного показателя с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 12,1590.

а0 = а1 = 25,2 - 12,1590 0,293 = 21,6264

- формально показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.

Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

= 24,1562 +

Определим каждое значение .

Далее построим еще одну таблицу для нахождения следующих показателей:

Таблица 5.2 - Расчет показателей индекса детерминации, стандартной ошибки

y

Х

y?

(y-yЇ)І

(y-y^)І

(Х-Х?)І

1

33

1

33,82725

60,84

0,6843478

20,25

2

28

0,5

27,72681

7,84

0,0746353

12,25

3

27

0,333

25,68926

3,24

1,7180501

6,25

4

26

0,25

24,67658

0,64

1,7514363

2,25

5

25

0,2

24,06654

0,04

0,8713535

0,25

6

24,5

0,167

23,66391

0,49

0,6990511

0,25

7

23

0,143

23,37109

4,84

0,1377047

2,25

8

23,5

0,125

23,15147

2,89

0,1214734

6,25

9

22

0,111

22,98066

10,24

0,9616884

12,25

10

20

0,1

22,84645

27,04

8,1022621

20,25

Итого

252

2,929

252

118,1

15,122003

82,5

Ср.знач.

25,2

0,293

11,81

8,25

По данной таблице определим коэффициент детерминации: R 2 = 1- = 1- = 0,87 - показывает долю вариации результативного признака, объясненную вариацией факторного признака.

2) Следовательно, можно вычислить индекс детерминации (R), он равен:

R = = 0,93. - В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

3) Соответственно, стандартная ошибка : Sy= = 1,3749

4) Критерий Фишера (F) : = = 53,54

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f=8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.

5) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели: - среднеквадратическое отклонение Х. Далее определим случайные отклонения a0 и а1

Далее определим критерий Стьюдента для коэффициентов:

Фактические значения t - статистики для параметров , превышают табличные:

поэтому параметры и а1 статистически значимы, нулевая гипотеза отвергается.

6) Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:

Доверительные интервалы:

Таким образом, доверительный интервал:

Для а0:

21,6251- a0 <21,6251+ a0 ? (20,1246 ; 23,1256)

Для а1:

12,2009-12,2009+ а1 ? (8,3891;16,0127)

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью 95% параметры и будут находиться в указанных границах интервалов.

Задание 3.2

Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

x

1

2

3

4

5

6

y

10

13,4

15,4

16,5

18,6

19,1

Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Характеристики модели:

модель (коэффициенты до 2-х знаков)

индекс детерминации (до 2-х знаков)

стандартную ошибку ( до 4-х знаков);

расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Построим таблицу с промежуточными решениями, для того, чтобы облегчить нахождение необходимых коэффициентов, увеличив все значения y на номер классного журнала (12)

Таблица 5.3 - промежуточные решения

у,%

х, тыс. дол.

lnx

(lnx)І

ylnx

22

1

0

0

0

25,4

2

0,69

0,48

17,53

27,4

3

1,1

1,21

30,14

28,5

4

1,39

1.93

39,62

30,6

5

1,61

2,59

49,27

31,1

6

1.79

3,2

55,67

165

21

6,58

9,41

192,23

По данной таблице определим а0 и а1 , необходимые значения для построения нашей модели:

а1 = = = 5,14

а0 = = = 21,86

Далее, найдя коэффициенты, можем построить модель: = 21,86 + 5,14lnx

Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.

Таблица 5.1 - Расчет индекса детерминации

№ п/п

y

x

1

22

1

21,8615

30,25

0,0192

2

25,4

2

25,4091

4,41

0,0001

3

27,4

3

27,5171

0,01

0,0137

4

28,5

4

29,0082

1

0,2582

5

30,6

5

30,1393

9,61

0,2123

6

31,1

6

31,0647

12,96

0,0012

итого

165

21

165

58,24

0,5047

Ср. знач.

27,5

3,5

2) По найденным значениям определим индекс детерминации:

- связь между признаком Y и фактором X весьма высокая и прямая.

3) Определим стандартную ошибку:

4) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .

Так как наблюдаемое значение критерия больше табличного , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.

Задание 3.3

Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК

В таблице представлены промежуточные расчеты

Таблица - промежуточные расчеты.

Год

t

у

t-t?

(t-tЇ)І

у-у?

(t-t?)(y-y?)

ур

у-у?

(у-у?)І

(y-yЇ)І

2000

1

7,5

-8

64

-1,947

15,576

7,692

-0,192

0,03694

2,56

3,791

2001

2

7,5

-7

49

-1,947

13,629

7,912

-0,412

0,16933

5,49

3,791

2002

3

8

-6

36

-1,447

8,6824

8,131

-0,131

0,01713

1,64

2,094

2003

4

8,4

-5

25

-1,047

5,2353

8,350

0,050

0,00248

0,59

1,096

2004

5

8,6

-4

16

-0,847

3,3882

8,570

0,030

0,00092

0,35

0,718

2005

6

8,4

-3

9

-1,047

3,1412

8,789

-0,389

0,15132

4,63

1,096

2006

7

8,6

-2

4

-0,847

1,6941

9,008

-0,408

0,16671

4,75

0,718

2007

8

9,7

-1

1

0,2529

-0,253

9,228

0,472

0,22307

4,87

0,064

2008

9

10,2

0

0

0,7529

0

9,447

0,753

0,56686

7,38

0,567

2009

10

10,3

1

1

0,8529

0,8529

9,666

0,634

0,40145

6,15

0,728

2010

11

10,2

2

4

0,7529

1,5059

9,886

0,314

0,09872

3,08

0,567

2011

12

10,1

3

9

0,6529

1,9588

10,105

-0,005

0,00003

0,05

0,426

2012

13

10,8

4

16

1,3529

5,4118

10,325

0,476

0,22610

4,40

1,83

2013

14

10,6

5

25

1,1529

5,7647

10,544

0,056

0,00315

0,53

1,329

2014

15

10,8

6

36

1,3529

8,1176

10,763

0,037

0,00135

0,34

1,83

2015

16

10,7

7

49

1,2529

8,7706

10,983

-0,283

0,07986

2,64

1,57

2016

17

10,2

8

64

0,7529

6,0235

11,202

-1,002

1,00400

9,82

0,567

У

153

160,6

0

408

0

89,5

160,6

0

3,14943

59,281

22,78

Ср. знач.

9

9,4471

, соответственно

Следовательно уравнение линейного тренда принимает вид:

Мы можем увидеть, что имеется тенденция к росту, так как коэффициент t имеет положительное значение, ежегодная величина роста составляет в среднем 0,219 единиц.

2) Определим коэффициент детерминации: 0,8617 - т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3) Определим стандартную ошибку:

4) Оценим значимость модели с помощью критерия Фишера:

.

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

5) Определим ошибку аппроксимации: . В среднем, расчетные значения отклоняются от фактических на 3.49%. Данное уравнение можно использовать в качестве регрессии, так как ошибка меньше 7%.

6) Спрогнозируем коэффициент рождаемости в 2017 :

.

Задание 3.4

Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.2 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :

Все промежуточные расчеты представлены в таблице 3.4.1

Таблица 3.4.1 - промежуточные расчеты к линейной модели регрессии.

t

Цена (y)

t-t?

у-у?

(t-t?)(у-у?)

(t-tЇ)І

у?

у-у?

(у-у?)І

(у-у?)І

1

59,6

-3,5

1,2625

-4,41875

12,25

58,075

1,525

2,325625

2,5587

1,5939

2

58,5

-2,5

0,1625

-0,40625

6,25

58,15

0,35

0,1225

0,59829

0,0264

3

58

-1,5

-0,3375

0,50625

2,25

58,225

-0,225

0,050625

0,38793

0,1139

4

56,4

-0,5

-1,9375

0,96875

0,25

58,3

-1,9

3,61

3,36879

3,7539

5

57

0,5

-1,3375

-0,66875

0,25

58,375

-1,375

1,890625

2,41228

1,7889

6

57,9

1,5

-0,4375

-0,65625

2,25

58,45

-0,55

0,3025

0,94991

0,1914

7

59,7

2,5

1,3625

3,40625

6,25

58,525

1,175

1,380625

1,96817

1,8564

8

59,6

3,5

1,2625

4,41875

12,25

58,6

1

1

1,67785

1,5939

36

466,7

0

0

3,15

42

466,7

0

10,6825

13,92196

10,91875

Сред. знач 4,5

58,3375

58,3375

. тогда : a0= 58,3375 - 4,5?0,075 = 58

Таким образом, линейная модель будет выглядеть как:

1.1) Определим коэффициент детерминации:

.

1.2) Определим стандартную ошибку:

1.3) Определим значимость модели используя критерий Фишера:

.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

1.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь 2017 года:

2) Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.4.2. Для удобства расчета проведем замену: lny=У

Таблица 3.4.2 - Промежуточные расчеты для модели lnу = ао + а1t

t

Цена (y)

У

t*У

У?

У-У?

У-У?

(У-У?)І

(У-У?)І

1

59,6

4,0877

1

4,0877

4,061592

0,02611

0,02165

0,0006817

0,000468723

0,6387455

2

58,5

4,069

4

8,138

4,062865

0,00613

0,00295

0,00003758

0,0000087025

0,15065127

3

58

4,0604

9

12,1812

4,064139

-0,00374

-0,00565

0,00001399

0,0000319225

0,09210915

4

56,4

4,0325

16

16,13

4,065413

-0,03291

-0,03355

0,00108307

0,001125603

0,81611903

5

57

4,0431

25

20,2155

4,066687

-0,02359

-0,02295

0,000556488

0,000526703

0,58346318

6

57,9

4,0587

36

24,3522

4,067961

-0,00926

-0,00735

0,0000857

0,00005402

0,22815187

7

59,7

4,0893

49

28,6251

4,069235

0,02007

0,02325

0,000402805

0,000540563

0,49079305

8

59,6

4,0877

64

32,7016

4,070508

0,01719

0,02165

0,000295496

0,000468723

0,42052988

36

466,7

32,5284

204

146,4313

32,5284

0

0

0,003156901

0,00322496

3,42056294

Ср. знач4,5

58,3375

4,06605

25,5

18,3039

4,06605

. тогда: a0 = 4,06605 - 4,5?0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny

2.1) Определим коэффициент детерминации:

.

2.2) Определим стандартную ошибку:

2.3) Определим значимость модели используя критерий Фишера:

.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

2.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 0.43%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь:

3) Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.4.3. Для удобства расчета проведем замену : 1/у = У

Таблица 3.4.3 - Промежуточные расчеты для модели у = 1/(ао + а1t)

t

Цена (y)

У

У?

у-у?

(у-у?)І

(У-У?)І

1

59,6

0,0168

1

0,0168

58,11138

1,48862

2,21599

1,59391

2,49768

2

58,5

0,0171

4

0,0342

58,16772

0,33228

0,11041

0,02641

0,56801

3

58

0,0172

9

0,0516

58,22416

-0,22416

0,05025

0,11391

0,38649

4

56,4

0,0177

16

0,0708

58,28072

-1,88072

3,53710

3,75391

3,33461

5

57

0,0175

25

0,0875

58,33738

-1,33738

1,78860

1,78891

2,34629

6

57,9

0,0173

36

0,1038

58,39416

-0,49416

0,24419

0,19141

0,85347

7

59,7

0,0168

49

0,1176

58,45105

1,24895

1,55988

1,85641

2,09205

8

59,6

0,0168

64

0,1344

58,50804

1,09196

1,19237

1,59391

1,83214

466,7

0,1372

204

0,6167

466,4746

0,22538

10,69879

10,91875

13,9107

Сред

знач 4,5

58,3375

0,01715

25,5

0,0770875

58,30933

. тогда : a0 = 0,01715 + 4,5?0,0000167 = 0,017225.

Таким образом, модель будет иметь вид:

2.1) Определим коэффициент детерминации:

.

2.2) Определим стандартную ошибку:

2.3) Определим значимость модели используя критерий Фишера:

.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

2.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 1.73%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь:

Таким образом, лучшей моделью с наименьшей стандартной ошибкой является: lny

Задание 3.5

По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.

Таблица 3.3 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ1) (на конец года; рублей за единицу иностранной валюты)

Страна

Наименование валюты

2010

2011

2012

2013

2014

2015

Австралия

австралийский доллар

31,01

32,72

31,55

28,96

45,91

53,12

2.Австрия

евро

40,33

41,67

40,23

44,97

68,34

79,70

3.Азербайджан

азербайджанский манат

38,11

40,98

38,74

41,78

71,84

46,74

4.Армения

армянский драм

84,132)

83,742)

75,372)

80,712)

12,103)

15,053)

5.Беларусь

белорусский рубль

10,162)

38,564)

35,344)

34,314)

38,804)

38,954)

6.Бельгия

евро

40,33

41,67

40,23

44,97

68,34

79,70

7.Германия

евро

40,33

41,67

40,23

44,97

68,34

79,70

8.Дания

датская крона

54,105)

56,065)

53,955)

60,315)

92,025)

10,68

9.Испания

евро

40,33

41,67

40,23

44,97

68,34

79,70

10.Италия

евро

40,33

41,67

40,23

44,97

68,34

79,70

11.Казахстан3)

тенге

20,68

21,69

20,21

21,31

30,83

21,52

12.Канада

канадский доллар

30,49

31,57

30,54

30,55

48,40

52,57

13.Киргизия3)

сом

64,84

69,56

64,08

66,34

95,52

94,84

14. Нидерланды

евро

40,33

41,67

40,23

44,97

68,34

79,70

15.Норвегия5)

норвежская крона

51,61

53,64

54,53

53,21

75,79

83,38

16.Республика Молдова5)

молдавский лей

25,07

27,52

25,10

25,08

36,03

37,06

17. Соединенное

Королевство

(Великобритания)

фунт стерлингов

47,26

49,63

48,96

53,96

87,42

107,98

18.США

доллар США

30,48

32,20

30,37

32,73

56,26

72,88

19. Таджикистан

сомони

69,225)

67,665)

63,735)

69,095)

10,76

10,99

20.Туркмения

новый туркменский манат

10,70

11,29

10,65

11,48

19,74

21,44

21.Турция

турецкая лира

19,60

16,83

16,97

15,30

24,27

25,08

22.Узбекистан2)

узбекский сум

18,58

17,94

15,30

14,63

23,22

26,45

23.Украина5)

гривна

38,28

40,05

37,59

39,72

35,56

30,46

24.Финляндия

евро

40,33

41,67

40,23

44,97

68,34

79,70

25.Франция

евро

40,33

41,67

40,23

44,97

68,34

79,70

26.Швеция5)

шведская крона

44,81

46,61

46,69

50,15

72,02

87,26

27.Япония3)

иена

37,38

41,50

35,15

31,06

47,06

60,51

1) По данным Банка России.

2) За 1000 единиц национальной валюты.

3) За 100 единиц национальной валюты.

4) За 10 000 единиц национальной валюты.

5) За 10 единиц национальной валюты.

Решение:

Поскольку данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:

руб.

Мода - это значение признака, наиболее часто повторяющееся в совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.

Определим медиану. Ранжируем ряд данных:

30,49; 30,54; 30,55; 31,57; 48,40; 52,57

.

Рассчитаем дисперсию: 149,5130093333 руб.

Определим среднее квадратическое отклонение: 12,2275512403 руб.

Рассчитаем коэффициент вариации:

Таким образом, среднегодовой курс канадского доллара составил 36,518 руб. средним квадратическим отклонением12,2275512403. Дисперсия составила 149,5130093333. Медиана показывает, что курс половины лет не превышал руб., а другой половины - не менее . Коэффициент вариации, равный и превышающий 33,3%, указывает на неоднородность совокупности.

Построим линейную модель связи показателя со временем, которое будет выглядеть следующим образом: , где t - год.

Таблица 3.5 - расчеты данных уравнения тренда.

Год

t

y

t-t?

y-y?

(y-y?)*(t- t?)

(t-tЇ)І

(y-yЇ)І

2010

1

30.49

-2.5

-6.863333

17.158333

6.25

47.1053

2011

2

31.57

-1.5

-5.783333

8.675

2.25

33.4469

2012

3

30.54

-0.5

-6.813333

3.4066667

0.25

46.4215

2013

4

30.55

0.5

-6.803333

-3.4016667

0.25

46.2853

2014

5

48.4

1.5

11.046667

16.57

2.25

122.0288

2015

6

52.57

2.5

15.216667

38.041667

6.25

231.5469

Сумма

21

224.12

0

0

80.45

17.5

526.83493

Среднее значение

3.5

37.35333333

.

тогда : a0= 37.35333333- 3,5? = 21.2633

Таким образом, линейная модель имеет вид:

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса AMD, причем величина прироста ежегодно составляет в среднем руб.

Для анализа полученной модели постоим таблицу.

Таблица 3.5.1 - анализ модели, дополнительные вычисления

у?

y-y?

(y-y^)І

25,86047619

4,62952381

21,4324907

15,18374487

30,45761905

1,112380952

1,237391383

3,523538018

35,0547619

-4,514761905

20,38307506

14,78311036

39,65190476

-9,101904762

82,84467029

29,79346894

44,24904762

4,150952381

17,23040567

8,576347895

48,84619048

3,723809524

13,86675737

7,08352582

224,12

0

156,9947905

78,9437359

Определим коэффициент детерминации:

.

Таким образом на 29,79% вариация курса обусловлена зависимостью от времени, на 70.21% - влиянием прочих факторов, не включенных в данную модель.

Определим стандартную ошибку:

Определим значимость модели используя критерий Фишера:

.

При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически не значимым.

Далее вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 13.16%. Поскольку ошибка выше 10%, то данное уравнение некачественно описывает тенденцию курса национальной валюты.


Подобные документы

  • Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

    курсовая работа [230,6 K], добавлен 24.09.2012

  • Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.

    курсовая работа [91,7 K], добавлен 14.12.2008

  • Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

    учебное пособие [276,4 K], добавлен 23.11.2010

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Объект наблюдения, единица наблюдения, единица совокупности. Вычисление общей, внутригрупповой и межгрупповой дисперсии себестоимости единицы продукции, средней из внутригрупповых. Показатели динамики объема товарооборота. Определение индекса средних цен.

    контрольная работа [349,6 K], добавлен 11.12.2009

  • Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

    лекция [985,6 K], добавлен 13.02.2011

  • Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

    контрольная работа [59,3 K], добавлен 26.06.2009

  • Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.

    контрольная работа [438,8 K], добавлен 06.11.2010

  • Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.

    курсовая работа [177,4 K], добавлен 29.10.2015

  • Сводка и группировка. Абсолютные и относительные величины. Расчет соотношения потребленного и вывезенного сахара. Сущность и значение средних показателей. Исчисление средней из интервального ряда распределения по методу моментов. Показатели вариации.

    контрольная работа [75,7 K], добавлен 20.09.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.