Главная Коллекция "Otherreferats" Экономика и экономическая теория Общая теория статистики

Общая теория статистики

Рассмотрение основных теоретических положений по определению средних величин, структурных средних и показателей вариации. Расчет общей, межгрупповой и средней внутригрупповой дисперсии. Анализ основных положений корреляционного и регрессионного анализа.

Рубрика	Экономика и экономическая теория
Вид	курсовая работа
Язык	русский
Дата добавления	22.02.2019
Размер файла	1,6 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Страница:

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»

КУРСОВАЯ РАБОТА

по дисциплине:

«Общая теория статистики»

Автор работы Надеждин М.И.

Специальность: 38.03.01 Экономика. Финансы и кредит

Группа 16ЭЭ1

Руководитель работы В.Н. Деркаченко

Пенза 2017

Задание для выполнения курсовой работы

на тему:

«Построение нелинейных регрессионных моделей для прогнозирования курса валют»

Вариант 12

по дисциплине «Общая теория статистики»

студенту группы 16ЭЭ1

Надеждину Михаилу Игоревичу

Исходные данные к курсовой работе:

Исходные данные к курсовой работе приведены в пояснительной записке для каждой индивидуальной задаче.

Перечень подлежащих разработке вопросов:

рассмотреть основные теоретические положения по определению средних величин, структурных средних и показателей вариации;

определить среднее значение, моду, медиану, дисперсию, коэффициент вариации;

рассчитать общую, межгрупповую и среднюю внутригрупповую дисперсию;

рассмотреть теоретические положения корреляционного и регрессионного анализа;

определить коэффициенты корреляции и проанализировать их значимость;

Проанализировать применение нелинейных регрессионных моделей для прогнозирования курса валют;

Найти коэффициент корреляции и провести его статистический анализ;

построить линейную регрессионную модель, оценить ее качество и спрогнозировать курс валют страны в зависимости от индивидуального задания;

выполнить комплексный статистический анализ инвестиций в основной капитал регионов Приволжского ФО и построить регрессионную трендовую модель для региона, указанного в индивидуальном задании;

сделать выводы и дать рекомендации.

Дата выдачи задания «28» октября 2017г.

Научный руководитель Деркаченко В.Н.

Задание принял к исполнению Надеждин М.И.

Отзыв научного руководителя на курсовую работу

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Кафедра «Экономика и финансы»

ОТЗЫВ

на курсовую работу, выполненную на тему:

«Построение нелинейных регрессионных моделей для прогнозирования курса валют»

(вариант 12)

по дисциплине «Общая теория статистики»

студентом группы 16ЭЭ1

Надеждиным Михаилом Игоревичем

№ п/п	Основание оценки	Критерии оценивания	Шкала оценивания
			100-балльная	4-балльная
1	По результатам собеседования	Степень авторского вклада в формулировании выводов и рекомендаций по результатам проекта	35 баллов	5 баллов
2	По результатам собеседования	Степень достижения студентом учебных целей и выполнения учебных задач	35 баллов	5 баллов
3	По результатам собеседования	Показанный при защите проекта уровень освоения необходимых компетенций	35 баллов	5 баллов
4	По результатам оформления	Качество подготовки и оформления основных разделов пояснительной записки проекта	35 баллов	5 баллов
Суммарный балл текущего рейтинга	53 баллов	5 баллов
Средний балл по критериям оценивания курсовой работы	35 баллов

Оценка за курсовую работу 88 баллов по 100 балльной шкале, 5 баллов по 4 балльной шкале

Научный руководитель Деркаченко В.Н.

Дата составления отзыва «20» декабря 2017г.

Отчет о проверке курсовой работы на плагиат

ПРОТОКОЛ

проверки на оригинальность в системе «Антиплагиат.ВУЗ» курсовой работы по дисциплине «Общая теория статистики» на тему: «Построение нелинейных регрессионных моделей для прогнозирования курса валют» (вариант 12)» студента учебной группы 16ЭЭ1 Надеждина Михаила Игоревича направления подготовки бакалавриата 38.03.01 «Экономика», профиля подготовки бакалавриата «Финансы и кредит»

Руководитель курсовой работы к.т.н., профессор Деркаченко В.Н

«16» декабря 2017г. Деркаченко В.Н.

Содержание

Введение

1. Средние величины и показатели вариации

Задание 1.1

Задание 1.2

Задание 1.3

Задание 1.4

Задание 1.5

2. Корреляционный анализ

Задание 2.1

Задание 2.2

Задание 2.3

3. Регрессионный анализ

Задание 3.1

Задание 3.2

Задание 3.3

Задание 3.4

Задание 3.5

Задание 3.6

Вывод

Список использованных источников

Введение

Термин «статистика» происходит от латинского слова «status», что в средние века означало политическое состояние государства. В науку этот термин введен немецким ученым Готфридом Аванхелем, и означал он тогда «государствоведение».

Первые учетные операции проводились еще в глубокой древности. За 5 тыс. лет до н. э. проводился подсчет населения в Китае, велся учет имущества в Древнем Риме, в средние века проводились переписи населения, домашнего имущества, земель. Все эти эпизодические учеты носили примитивный характер и использовались в основном в военных целях и при налогообложении.

По мере развития производительных сил расширялся круг учитываемых явлений и собираемых о них сведений. Производство требовало информации об источниках сырья, рынках труда и сбыта продукции, международная торговля - информации об иностранных государствах, их городах, населения, ремеслах, торговле, ценах и т.д. Начиная с 16 века в Италии, Голландия и других странах создаются сборники, посвященные разным странам, их политическому устройству, населению, промышленности, с\х, торговле, путям сообщения. В странах начинают регулярно проводится статистические работы по рождаемости и смертности населения, по учету явлений хозяйственной жизни. Накапливается опыт, появляются рекомендации о том, как организовать учет и обработать собранные сведения, чтобы обобщить их, проанализировать и выявить различные закономерности. Так постепенно сформировалась отрасль знаний, названная в последствии «статистикой». Ее возникновение связано с потребностями общества в различного рода информации, без которой невозможно управлять государством, изучать отдельные явления и процессы, происходящие в различных областях жизни и сферах деятельности.

В процессе статистического наблюдения получают данные о значениях тех или иных признаков, характеризующих каждую единицу исследуемой совокупности. Для характеристики совокупности в целом или отдельных ее частей данные по отдельным единицам совокупности подвергают сводке и получают обобщающие показатели, в которых отражаются результаты познания количественной стороны изучаемых явлений. Обобщающие показатели могут быть представлены абсолютными, относительными и средними величинами.

Основная цель курсовой работы - развитие системного подхода при анализе статистических закономерностей в массовых социально-экономической явлениях, практическое применение классических методов статистической обработки данных, в целях эффективного информационного обеспечения управленческой деятельности.

Курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой части я рассмотрел теорию, привел все расчеты и сделал вывод.

Цель данной работы заключается в проведении корреляционно-регрессионного анализа и расчете средних величин. Главными задачами в работе являются: Теоретическое обоснование сущности, общих понятий и методов расчета средних величин, исследование системы показателей и информационной базы корреляционно-регрессионного анализа, выполнение расчетов. А также всестороннее изучение статистического наблюдения; умение идентифицировать данные задачи в реальной организационно-экономической среде; владение основными методами и алгоритмами, используемыми при статистической обработке данных.

вариация дисперсия корреляционный регрессионный

1. Средние величины и показатели вариации

Средняя величина представляет собой обобщенную характеристику уровня значений признака, которая получена в расчете на единицу совокупности. В отличие от относительной величины, которая является мерой соотношения показателей, средняя величина является мерой признака на единицу совокупности. Средние величины делятся на основные две категории: степенные средние; структурные средние.

Существуют разные виды средних величин. Среднее хронологическое :

. (1.1)

Среднее арифметическое простое:

(1.1.1),

где xi - i-тое значение случайной величины, n -число, вариант. Среднее арифметическое взвешенное:

= (1.1.2) ,

где mi - частота.[1]

Другие средние можно определить по общей формуле:

(1.1.3),

где k - степень, определяющая различные средние.

Средняя гармоническая высчитывается по формуле:

гм= (1.1.4),

где Vi - i-тый объем реализации. Ее используют в тех случаях, когда неизвестна частота, а известен только объем реализации.

Мода - значение признака, который встречается в совокупности наиболее часто.

М0 = хн + i (1.1.5),

где Хн - нижняя граница интервала, содержащего моду;

i - ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Для дискретных распределений модой считают любое значение ai, вероятность которого pi больше, чем вероятности соседних значений [1].

Медиана - значение признака, который приходится на середину ранжированной совокупности.

Ме = Xн + i ) (1.1.6),

где Хн - нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений)

- накопленная частота интервала, предшествующего медианному;

mме - частота медианного интервала;

Вариация - это изменение признака в пределах изучаемой совокупности. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

Размах колебаний (вариации) - разность между максимальным и минимальным значениями признака в изучаемой совокупности:

R = xmax - xmin, (1.1.7), где

xmax - наибольшее значение признака;

xmin - наименьшее значение признака

Среднее линейное отклонение:

= (1.1.8),

где - среднее значение показателя.

Взвешенное среднее линейное отклонение:

вз = (1.1.9)

Среднеквадратическое отклонение:

у = (1.2),

де - дисперсия.

Средняя дисперсия :

уІ(sІ) = (1.2.1).

Ее можно рассчитать еще таким образом:

уІ(sІ) = (1.2б)

Взвешенная дисперсия:

уІвз = (1.2.2).

Ее используют, когда все данные представлены в виде интервального ряда и вместо xi берем среднее значение интервала и соответственно частота i- ого интервала (mi).

Еще есть среднеквадратическое отклонение:

) = (1.2.3)

Взвешенное среднеквадратическое отклонение:

= (1.2.4)

Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квадратического отклонения к средней величине признака:

V = 100% (1.2.5)

Коэффициент вариации показывает, какую долю среднего значения этой величины составляет её средний разброс. Коэффициент вариации имеет смысл использовать при ненулевых средних значениях.

Коэффициент полезен в ситуациях, когда о размерах отклонения величины можно судить, зная ее среднее значение. Номер моего варианта 12.

Задание 1.1

По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение было увеличено на номер классного журнала (12). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Дано (х): 15; 17; 14; 16; 19; 15; 20; 15; 22;

Определим среднее значение:

(1.2)

Моду: - наиболее часто встречающееся значение ряда.

Медиана. Для ее расчета расположим ряд в порядке возрастания:

14, 15, 15, 15, 16, 17, 19, 20, 22.

Количество элементов 9, нечетное количество, медианой будет являться число 16, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.

Вычислим дисперсию:

= 6,7 (2)

Вычислим среднеквадратическое отклонение: (1.9)

И коэффициент вариации составит:

(2.5).

Задание 1.2

По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 33%, стоимость основных фондов увеличилась на 22%. Определить изменение фондоотдачи.

Фондоотдача - это финансовый коэффициент, характеризующий эффективность использования основных средств организации. Фондоотдача показывает, сколько выручки приходится на единицу стоимости основных средств.

, соответственно изменение фондоотдачи:

= 9,02%

Таким образом, фондоотдача увеличилась на 9,02%

Задание 1.3

Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

У	80-100	100-120	120-140	140-160	160-180	180-200
m	6	17	25	28	14	10

Определим среднее значение моду и медиану. Промежуточные вычисления приведены в таблице1.1

Таблица 1.1 - промежуточные вычисления.

У	80-100	100-120	120-140	140-160	160-180	180-200
m	6	17	25	28	14	10
У?	90	110	130	150	170	190
m*У?	540	1870	3250	4200	2380	1900
У?/2	45	55	65	75	85	95
Накопл. частота	6	23	48	76	90	100

Общее число работников составляет человек

Среднее значение

x?=(1)

Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение . (76>50). Вычислим моду:

(1.4)

Вычислим медиану:

(1.5)

Задание 1.4

По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi было увеличено на номер классного журнала (12).

Таблица 2 - Исходные данные по объему оборота предприятий

Хi	mгi	mчi	moi
13,0-13,2		3	3
13,2-13,4		4	4
13,4-13,6		17	17
13,6-13,8	11	15	26
13,8-13,0	13	6	19
14,0-14,2	18	5	23
14,2-14,4	6		6
14,4-14,6	2		2
	50	50	100

Для удобства расчета составим таблицу 2.1, в которой будут отражены промежуточные вычисления по нахождению общей дисперсии.

Таблица 2.1 - Расчет общей дисперсии

		Число предприятий	Расчет дисперсии
Хi (млн. руб)	mгi	mчi	moi	Хср.i	Хср.i*moi	(Хср.i-X?o)^2	(Хср.i-X?o)^2*moi
13.0	13.2		3	3	13.1	39.3	0.509796	1.529388
13.2	13.4		4	4	13.3	53.2	0.264196	1.056784
13.4	13.6		17	17	13.5	229.5	0.098596	1.676132
13.6	13.8	11	15	26	13.7	356.2	0.012996	0.337896
13.8	14.0	13	6	19	13.9	264.1	0.007396	0.140524
14.0	14.2	18	5	23	14.1	324.3	0.081796	1.881308
14.2	14.4	6		6	14.3	85.8	0.236196	1.417176
14.4	14.6	2		2	14.5	29	0.470596	0.941192
		50	50	100		1381.4		8.9804

Общее среднее: млн. руб.

Общая дисперсия: у2о= млн.руб. (89804 руб.)

Далее рассчитаем дисперсию по группам: для государственных и частных предприятий.

Таблица 2.2 - расчет дисперсии (гос. предприятия)

Хi (млн. руб)	mгi	Хср.i	Хср.i*mгi	(Хср.i-X?г)^2	(Хср.i-X?o)^2*mгi
13.6	13.8	11	13.7	150.7	0.09	0.99
13.8	14.0	13	13.9	180.7	0.01	0.13
14.0	14.2	18	14.1	253.8	0.01	0.18
14.2	14.4	6	14.3	85.8	0.09	0.54
14.4	14.6	2	14.5	29	0.25	0.5
		50		700		2.34

Среднее значение : млн. руб.

Дисперсия: у2г= млн.руб. (46800 руб.)

Таблица 2.3 - расчет дисперсии (частные предприятия)

Хi (млн. руб)	mчi	Хср.i	Хср.i*mчi	(Хср.i-X?ч)^2	(Хср.i-X?o)^2*mчi
13.0	13.2	3	13.1	39.3	0.278784	0.836352
13.2	13.4	4	13.3	53.2	0.107584	0.430336
13.4	13.6	17	13.5	229.5	0.016384	0.278528
13.6	13.8	15	13.7	205.5	0.005184	0.07776
13.8	14.0	6	13.9	83.4	0.073984	0.443904
14.0	14.2	5	14.1	70.5	0.222784	1.11392
		50		681.4		3.1808

Среднее значение : млн. руб.

Дисперсия: у2ч= млн.руб. (63616 руб.)

Средняя внутригрупповая дисперсия: у?в=

Общая дисперсия равна сумме межгрупповой и среднегрупповой дисперсий, следовательно межгрупповая дисперсия будет равна:

уІмг= уІо - у?в= 89804 - 55208 = 34596 руб.

Вычислим коэффициент детерминации:

Таким образом, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.

Задание 1.5

Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 3 - Исходные данные 1, 2, 3 - группа

Хi	1	2	8
mi	30	15	5
Хi	1	6
mi	10	15
Хi	3	8
mi	20	5

Для удобства расчета общей дисперсии составим таблицу 3.1, в которой будут представлены вычисления.

Таблица 3.1 - вычисление общей дисперсии.

Xi	mi	Расчет дисперсии
	1	2	3	moi	Х*moi	(Х-Х?o)І	(Х-Х?o)І*moi
1	30	10		40	40	4	160
2	15			15	30	1	15
3			20	20	60	0	0
6		15		15	90	9	135
8	5		5	10	80	25	250
Сумма	100	300		560

Среднее общее значение : х?о=

Общая дисперсия:

Далее определим дисперсию для каждой группы в отдельности :

Таблица 3.2 - вычисление дисперсии для 1 группы.

Xi	m1i	X*m1i	(Х-Х?1)І	(Х-Х?1)І*m1i
1	30	30	1	30
2	15	30	0	0
8	5	40	36	180

Среднее значение : X?1=

Дисперсия: уІ1=

Таблица 3.2 - вычисление дисперсии для 2 группы.

Xi	m2i	X*m2i	(Х-Х?2)І	(Х-Х?2)І*m2i
1	10	10	9	90
6	15	90	4	60

Среднее значение : X?2=

Дисперсия: уІ2=

Таблица 3.3 - вычисление дисперсии для 3 группы.

Xi	m3i	X*m3i	(Х-Х?3)І	(Х-Х?3)І*m3i
3	20	60	1	20
8	5	40	16	80

Среднее значение : X?3=

Дисперсия: уІ3=

Вычислим среднюю внутригрупповую дисперсию: у?Ів=

И межгрупповую: уІмг=уІо-у?Ів= 5,6 - 4,73 = 0,87

2. Корреляционный анализ

Корреляция -- статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. [3]

Математической мерой корреляции двух случайных величин служит корреляционное отношение либо коэффициент корреляции . В случае если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.

Впервые ввел данный термин французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

На основе статистических данных корреляционный момент определяется:

Kxy = + X?) (Yi +), (2.1.1) где

n - объем выборки, число наблюдений;

, Yi - i-тое значение фактора и показателя;

X?,- средние значения фактора и показателя.

Безразмерному коэффициент корреляции:

rxy = , (2.1.2)

где - среднеквадратические отклонения фактора и показателя.

На практике чаще всего используют данное выражение

rxy = , (2.1.3)

где - среднее значения произведения фактора на показатель.

Коэффициент корреляции может изменяться в данном диапазоне -1 r +1[5]

t-критерий Стьюдента -- общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках. расчетное значение критерия Стьюдента определяется по формуле:

t = (2.1.4)

После этого необходимо найти табличное значение критерия Стьюдента. Для этого нам нужны уровень значимости и степень свободы . Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим.

Коэффициент корреляции Спирменамера линейной связи между случайными величинами. Он рассчитывается по формуле

(2.1.5)

Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Задание 2.1

Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ:28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Определим У, увеличим Х и У на номер журнала.

Таблица 4.1 - результаты вычислений.

У	20,1	21,4	23,3	18,9	21,7
Х	15,5	16,6	17,8	16,2	17,2
ХУ	311,55	355,24	414,74	306,18	373,24
(Хi-Х?)І	1,3456	0,0036	1,2996	0,2116	0,2916
(Уi-У?)І	0,9604	0,1024	4,9284	4,7524	0,3844

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Вычислим коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче: f= 5-2 =3.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента:

Таким образом, табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а следовательно коэффициент корреляции не значим

Задание 2.2

Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Это нулевой вариант. Каждое значение х и у было увеличено на свой номер классного журнала (12).

Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 4.2

Таблица 4.2 - результаты промежуточных вычислений.

							Сумма
Х	30	34	25	32	27	26	174
У	29	32	23	30	26	22	162
ХУ	870	1088	575	960	702	572	4767
(Хi-Х?)І	1	25	16	9	4	9	64
(Уi-У?)І	4	25	16	9	1	25	80

Вычислим средние значения:

- для Х : X?=

- для У: У?=

- для ХУ:

Определим дисперсии.

уІХ =

уІУ=

Коэффициент корреляции: rxy =

Определим расчетное значение критерия Стьюдента. В данной задаче значение степени свободы: f= 6-2 =4.

Расчетное значение критерия Стьюдента:

Табличное значение критерия Стьюдента: :

Таким образом, табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а следовательно коэффициент корреляции значим.

Задание 2.3

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.

Результаты:

1. Коэффициент ранговой корреляции.

2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Решение:

Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. Все эти вычисления представлены в таблице 4.3 (все значения баллов были увеличены на номер классного журнала - 12).

Таблица 4.3 - Расчет коэффициента ранговой корреляции Спирмена.

№ студента	1	2	3	4	5	6	7
Теория вероятностей	77	102	54	59	96	70	62
Статистика	63	97	48	75	84	92	52
Ранг (Rтв)	5	7	1	2	6	4	3
Ранг (Rст)	3	7	1	4	5	6	2
dІ	4	0	0	4	1	4	1

Значение степени свободы составляет f =5

Количество ранжируемых элементов: n = 7

Коэффициент корреляции Спирмена:

Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости б/2=0,025 (0,02): . Таким образом, расчетное значение критерия корреляции Спирмена меньше табличного значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент ранговой корреляции Спирмена не значим.

Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 4.4

Таблица 4.4 - Расчет коэффициента корреляции Стьюдента.

№ студента	1	2	3	4	5	6	7	Сумма
Теория вероятностей (x)	77	102	54	59	96	70	62	520
Статистика (y)	63	97	48	75	84	92	52	511
хi-x?	2,71	27,71	-20,29	-15,29	21,71	-4,29	-12,29
yi-y?	-10,00	24,00	-25,00	2,00	11,00	19,00	-21,00
(хi-x?)(yi-y?)	-27,14	665,14	507,14	-30,571	238,86	-81,43	258	1530
(хi-x?)І	7,36735	768,082	411,51	233,653	471,51	18,3673	150,939	2061,43
(yi-yЇ)І	100	576	625	4	121	361	441	2228

Среднее значение баллов по теории вероятности: х? = 74,29

Определим корреляционный момент: Кху =

Вычислим дисперсии:

уІх =

уІy =

Коэффициент корреляции:

Определим расчетное значение критерия Стьюдента: , соответственно табличное значение критерия

Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.

3. Регрессионный анализ

Регрессионный анализ -- метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ -- раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных. Рассмотрим порядок определения параметров линейной модели:

. (3.1)

Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.

Метод наименьших квадратов обеспечивает такой выбор коэффициентов а0 и а1 для прямой, при котором достигается минимум суммы квадратов отклонений, т.е.

(3.2)

Выражение (3.2) есть числитель остаточной дисперсии. Можно записать:

Минимум функции двух переменных достигается при значениях и , которые обращают в нуль производные:

С учетом выше указанного запишем:

С учетом деления на n имеем:

(3.3)

Имеем без учета деления на n:

(3.4)

и с учетом деления на n:

(3.5)

Теперь, исходя из минимума остаточной дисперсии, необходимо определить коэффициенты регрессии.

Мы имеем две системы нормальных уравнений:

Первая:

(3.6; 3.7)

Опускаем обозначение i=1 до n.

Из (3.6) находим , подставляем в (2.7) и находим :

(3.8)

Из (2.6) находим , подставляем в (2.7) и находим а1:

(3.9)

Вторая: (3.10; 3.11)

Из 2.10 находим а1:

Подставляем а1 в (3.11), имеем:

. (3.12)

Из 2.10 находим а0:

Подставляем а0 в (2.11), имеем:

. (3.13)

Коэффициент а1 можно определить по следующей формуле:

. (3.14)

Как перейти от формулы (3.13) к (3.14)?

Отсюда мы можем сделать вывод, что коэффициенты линейной регрессии можно определить различными способами.

В матричной форме коэффициенты регрессии определяются по следующей зависимости:

(3.15)

где - транспонированная матрица;

- обратная матрица.

(3.16)

Далее проверяем значимость коэффициента регрессии по критерии Стьюдента. Значимость коэффициентов регрессии:

Так как то расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:

Этот же критерий мы можем рассчитать через отклонения коэффициентов:

- критерий Стьюдента для коэффициента а0

- критерий Стьюдента для коэффициента а1 (3.17)

Значимость данной модели мы можем определить по критерию Фишера:

(3.18)

где - табличное значение критерия;

- степень свободы факторной дисперсии

- степень свободы остаточной дисперсии

Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле (3.18 - левая часть) и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной.

Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.

После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка [5,7,8].

Ошибка аппроксимации рассчитывается по формуле:

(3.19)

где - исходное значение показателя;

- расчетное (прогнозное) значение показателя.

Стандартная ошибка определяется по формуле:

. (3.20)

В практических исследованиях, если ошибка аппроксимации имеет величину до 5%, то модель можно использовать для решения поставленных задач; если Е до 10%, то применение модели зависит от исследователя и если Е>10%, то модель нецелесообразно применять в эконометрических исследованиях.

Любое исследование начинается со спецификации модели, т.е. выбора вида модели. Как правило, парная регрессия используется, если имеется доминирующий фактор.

Известно, что выбор вида модели осуществляется либо графически, либо экспериментально.

Различают несколько видов нелинейных функций .

Из них можно выделить два класса нелинейных регрессий:

а) регрессии, нелинейные относительно факторов, но линейные по параметрам.

Примеры:

парабола: ;

равносторонняя гипербола: и др.;

б) регрессии, нелинейные по параметрам.

Примеры:

степенная: ;

показательная: ;

экспоненциальная: и др.

Нелинейная регрессия по факторам не вызывает сложностей в оценке параметров. Обычно используется МНК.

Нелинейные модели по параметрам делятся на два типа:

нелинейная модель внутренне линейна, т.е. она с помощью преобразований приводится к линейному виду.

Например, .

Оценки параметров и могут быть найдены МНК;

нелинейная модель внутренне не линейна, т.е. невозможно привести к линейной функции.

Например, .

Рассмотрим логарифмическую модель. Преобразовав степенную модель в линейную, получаем логарифмическую модель:

. (3.24)

Как правило, эта функция отражает зависимость спроса на благо от его цены () рисунок 2.3 или от дохода () или предложения от цены ().

Широко известна двухфакторная нелинейная модель, так называемая производственная функция Кобба-Дугласа:

, (2.27)

где - объем выпуска;

- затраты капитала;

- затраты труда;

- параметры модели.

Путем преобразования получаем линейную модель:

Полулогарифмические модели бывают двух видов:

(3.28)

(3.29)

Для модели (2.29) система уравнений имеет вид:

(3.30)

Такие модели обычно используют в тех случаях, когда необходимо определять темп роста или прироста каких-либо экономических показателей.

Например, при анализе банковского вклада по первоначальному вкладу и процентной ставке, при исследовании зависимости прироста объема выпуска продукции от увеличения затрат ресурсов и др.

Задание 3.1

Построить нелинейную обратную модель связи себестоимости единицы продукции (y) со стоимостью основных фондов (x). Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Исходные данные:

x	1	2	3	4	5	6	7	8	9	10
y	21	16	15	14	13	12,5	11	11,5	10	8

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков)

3) стандартную ошибку (до 4-х знаков)

4) расчетное значение критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков)

Решение:

Прежде всего, увеличим все имеющиеся данные на номер моего классного журнала (12).

Для удобства вычисления построим таблицу с промежуточным вычислением. Введем замену: 1/х обозначим как Х

Таблица 5.1 - Промежуточные расчеты коэффициентов модели

Ср.знач.	y	x	Х	yХ	X2
1	33	1	1	33	1	33,82725
2	28	2	0,5	14	0,25	27,72681
3	27	3	0,333	8,991	0,110889	25,68926
4	26	4	0,25	6,5	0,0625	24,67658
5	25	5	0,2	5	0,04	24,06654
6	24,5	6	0,167	4,0915	0,027889	23,66391
7	23	7	0,143	3,289	0,020449	23,37109
8	23,5	8	0,125	2,9375	0,015625	23,15147
9	22	9	0,111	2,442	0,012321	22,98066
10	20	10	0,1	2	0,01	22,84645
Итого	252	55	2,929	82,251	1,549673	252
Ср.знач.	25,2	5,5	0,293	8,225	0,1549673

1) Зная данные значения, можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:

а1 = = = 12,1590

- показывает среднее изменение результативного показателя с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 12,1590.

а0 = а1 = 25,2 - 12,1590 0,293 = 21,6264

- формально показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.

Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

= 24,1562 +

Определим каждое значение .

Далее построим еще одну таблицу для нахождения следующих показателей:

Таблица 5.2 - Расчет показателей индекса детерминации, стандартной ошибки

№	y	Х	y?	(y-yЇ)І	(y-y^)І	(Х-Х?)І
1	33	1	33,82725	60,84	0,6843478	20,25
2	28	0,5	27,72681	7,84	0,0746353	12,25
3	27	0,333	25,68926	3,24	1,7180501	6,25
4	26	0,25	24,67658	0,64	1,7514363	2,25
5	25	0,2	24,06654	0,04	0,8713535	0,25
6	24,5	0,167	23,66391	0,49	0,6990511	0,25
7	23	0,143	23,37109	4,84	0,1377047	2,25
8	23,5	0,125	23,15147	2,89	0,1214734	6,25
9	22	0,111	22,98066	10,24	0,9616884	12,25
10	20	0,1	22,84645	27,04	8,1022621	20,25
Итого	252	2,929	252	118,1	15,122003	82,5
Ср.знач.	25,2	0,293		11,81		8,25

По данной таблице определим коэффициент детерминации: R 2 = 1- = 1- = 0,87 - показывает долю вариации результативного признака, объясненную вариацией факторного признака.

2) Следовательно, можно вычислить индекс детерминации (R), он равен:

R = = 0,93. - В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

3) Соответственно, стандартная ошибка : Sy= = 1,3749

4) Критерий Фишера (F) : = = 53,54

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f=8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.

5) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели: - среднеквадратическое отклонение Х. Далее определим случайные отклонения a0 и а1

Далее определим критерий Стьюдента для коэффициентов:

Фактические значения t - статистики для параметров , превышают табличные:

поэтому параметры и а1 статистически значимы, нулевая гипотеза отвергается.

6) Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:

Доверительные интервалы:

Таким образом, доверительный интервал:

Для а0:

21,6251- a0 <21,6251+ a0 ? (20,1246 ; 23,1256)

Для а1:

12,2009-12,2009+ а1 ? (8,3891;16,0127)

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью 95% параметры и будут находиться в указанных границах интервалов.

Задание 3.2

Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

x	1	2	3	4	5	6
y	10	13,4	15,4	16,5	18,6	19,1

Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Характеристики модели:

модель (коэффициенты до 2-х знаков)

индекс детерминации (до 2-х знаков)

стандартную ошибку ( до 4-х знаков);

расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Построим таблицу с промежуточными решениями, для того, чтобы облегчить нахождение необходимых коэффициентов, увеличив все значения y на номер классного журнала (12)

Таблица 5.3 - промежуточные решения

у,%	х, тыс. дол.	lnx	(lnx)І	ylnx
22	1	0	0	0
25,4	2	0,69	0,48	17,53
27,4	3	1,1	1,21	30,14
28,5	4	1,39	1.93	39,62
30,6	5	1,61	2,59	49,27
31,1	6	1.79	3,2	55,67
165	21	6,58	9,41	192,23

По данной таблице определим а0 и а1 , необходимые значения для построения нашей модели:

а1 = = = 5,14

а0 = = = 21,86

Далее, найдя коэффициенты, можем построить модель: = 21,86 + 5,14lnx

Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.

Таблица 5.1 - Расчет индекса детерминации

№ п/п	y	x
1	22	1	21,8615	30,25	0,0192
2	25,4	2	25,4091	4,41	0,0001
3	27,4	3	27,5171	0,01	0,0137
4	28,5	4	29,0082	1	0,2582
5	30,6	5	30,1393	9,61	0,2123
6	31,1	6	31,0647	12,96	0,0012
итого	165	21	165	58,24	0,5047
Ср. знач.	27,5	3,5

2) По найденным значениям определим индекс детерминации:

- связь между признаком Y и фактором X весьма высокая и прямая.

3) Определим стандартную ошибку:

4) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .

Так как наблюдаемое значение критерия больше табличного , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.

Задание 3.3

Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области

Год	2000	2001	2002	2003	2004	2005
Коэффициент рождаемости	7,5	7,5	8,0	8,4	8,6	8,4
Год	2006	2007	2008	2009	2010	2011
Коэффициент рождаемости	8,6	9,7	10,2	10,3	10,2	10,1
Год	2012	2013	2014	2015	2016
Коэффициент рождаемости	10,8	10,6	10,8	10,7	10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК

В таблице представлены промежуточные расчеты

Таблица - промежуточные расчеты.

Год	t	у	t-t?	(t-tЇ)І	у-у?	(t-t?)(y-y?)	ур	у-у?	(у-у?)І		(y-yЇ)І
2000	1	7,5	-8	64	-1,947	15,576	7,692	-0,192	0,03694	2,56	3,791
2001	2	7,5	-7	49	-1,947	13,629	7,912	-0,412	0,16933	5,49	3,791
2002	3	8	-6	36	-1,447	8,6824	8,131	-0,131	0,01713	1,64	2,094
2003	4	8,4	-5	25	-1,047	5,2353	8,350	0,050	0,00248	0,59	1,096
2004	5	8,6	-4	16	-0,847	3,3882	8,570	0,030	0,00092	0,35	0,718
2005	6	8,4	-3	9	-1,047	3,1412	8,789	-0,389	0,15132	4,63	1,096
2006	7	8,6	-2	4	-0,847	1,6941	9,008	-0,408	0,16671	4,75	0,718
2007	8	9,7	-1	1	0,2529	-0,253	9,228	0,472	0,22307	4,87	0,064
2008	9	10,2	0	0	0,7529	0	9,447	0,753	0,56686	7,38	0,567
2009	10	10,3	1	1	0,8529	0,8529	9,666	0,634	0,40145	6,15	0,728
2010	11	10,2	2	4	0,7529	1,5059	9,886	0,314	0,09872	3,08	0,567
2011	12	10,1	3	9	0,6529	1,9588	10,105	-0,005	0,00003	0,05	0,426
2012	13	10,8	4	16	1,3529	5,4118	10,325	0,476	0,22610	4,40	1,83
2013	14	10,6	5	25	1,1529	5,7647	10,544	0,056	0,00315	0,53	1,329
2014	15	10,8	6	36	1,3529	8,1176	10,763	0,037	0,00135	0,34	1,83
2015	16	10,7	7	49	1,2529	8,7706	10,983	-0,283	0,07986	2,64	1,57
2016	17	10,2	8	64	0,7529	6,0235	11,202	-1,002	1,00400	9,82	0,567
У	153	160,6	0	408	0	89,5	160,6	0	3,14943	59,281	22,78
Ср. знач.	9	9,4471

, соответственно

Следовательно уравнение линейного тренда принимает вид:

Мы можем увидеть, что имеется тенденция к росту, так как коэффициент t имеет положительное значение, ежегодная величина роста составляет в среднем 0,219 единиц.

2) Определим коэффициент детерминации: 0,8617 - т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3) Определим стандартную ошибку:

4) Оценим значимость модели с помощью критерия Фишера:

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

5) Определим ошибку аппроксимации: . В среднем, расчетные значения отклоняются от фактических на 3.49%. Данное уравнение можно использовать в качестве регрессии, так как ошибка меньше 7%.

6) Спрогнозируем коэффициент рождаемости в 2017 :

Задание 3.4

Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.2 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :

Все промежуточные расчеты представлены в таблице 3.4.1

Таблица 3.4.1 - промежуточные расчеты к линейной модели регрессии.

t	Цена (y)	t-t?	у-у?	(t-t?)(у-у?)	(t-tЇ)І	у?	у-у?	(у-у?)І		(у-у?)І
1	59,6	-3,5	1,2625	-4,41875	12,25	58,075	1,525	2,325625	2,5587	1,5939
2	58,5	-2,5	0,1625	-0,40625	6,25	58,15	0,35	0,1225	0,59829	0,0264
3	58	-1,5	-0,3375	0,50625	2,25	58,225	-0,225	0,050625	0,38793	0,1139
4	56,4	-0,5	-1,9375	0,96875	0,25	58,3	-1,9	3,61	3,36879	3,7539
5	57	0,5	-1,3375	-0,66875	0,25	58,375	-1,375	1,890625	2,41228	1,7889
6	57,9	1,5	-0,4375	-0,65625	2,25	58,45	-0,55	0,3025	0,94991	0,1914
7	59,7	2,5	1,3625	3,40625	6,25	58,525	1,175	1,380625	1,96817	1,8564
8	59,6	3,5	1,2625	4,41875	12,25	58,6	1	1	1,67785	1,5939
36	466,7	0	0	3,15	42	466,7	0	10,6825	13,92196	10,91875
Сред. знач 4,5	58,3375					58,3375

. тогда : a0= 58,3375 - 4,5?0,075 = 58

Таким образом, линейная модель будет выглядеть как:

1.1) Определим коэффициент детерминации:

1.2) Определим стандартную ошибку:

1.3) Определим значимость модели используя критерий Фишера:

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

1.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь 2017 года:

2) Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.4.2. Для удобства расчета проведем замену: lny=У

Таблица 3.4.2 - Промежуточные расчеты для модели lnу = ао + а1t

t	Цена (y)	У	tІ	t*У	У?	У-У?	У-У?	(У-У?)І	(У-У?)І
1	59,6	4,0877	1	4,0877	4,061592	0,02611	0,02165	0,0006817	0,000468723	0,6387455
2	58,5	4,069	4	8,138	4,062865	0,00613	0,00295	0,00003758	0,0000087025	0,15065127
3	58	4,0604	9	12,1812	4,064139	-0,00374	-0,00565	0,00001399	0,0000319225	0,09210915
4	56,4	4,0325	16	16,13	4,065413	-0,03291	-0,03355	0,00108307	0,001125603	0,81611903
5	57	4,0431	25	20,2155	4,066687	-0,02359	-0,02295	0,000556488	0,000526703	0,58346318
6	57,9	4,0587	36	24,3522	4,067961	-0,00926	-0,00735	0,0000857	0,00005402	0,22815187
7	59,7	4,0893	49	28,6251	4,069235	0,02007	0,02325	0,000402805	0,000540563	0,49079305
8	59,6	4,0877	64	32,7016	4,070508	0,01719	0,02165	0,000295496	0,000468723	0,42052988
36	466,7	32,5284	204	146,4313	32,5284	0	0	0,003156901	0,00322496	3,42056294
Ср. знач4,5	58,3375	4,06605	25,5	18,3039	4,06605

. тогда: a0 = 4,06605 - 4,5?0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny

2.1) Определим коэффициент детерминации:

2.2) Определим стандартную ошибку:

2.3) Определим значимость модели используя критерий Фишера:

2.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 0.43%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь:

3) Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.4.3. Для удобства расчета проведем замену : 1/у = У

Таблица 3.4.3 - Промежуточные расчеты для модели у = 1/(ао + а1t)

t	Цена (y)	У	tІ	tУ	У?	у-у?	(у-у?)І	(У-У?)І
1	59,6	0,0168	1	0,0168	58,11138	1,48862	2,21599	1,59391	2,49768
2	58,5	0,0171	4	0,0342	58,16772	0,33228	0,11041	0,02641	0,56801
3	58	0,0172	9	0,0516	58,22416	-0,22416	0,05025	0,11391	0,38649
4	56,4	0,0177	16	0,0708	58,28072	-1,88072	3,53710	3,75391	3,33461
5	57	0,0175	25	0,0875	58,33738	-1,33738	1,78860	1,78891	2,34629
6	57,9	0,0173	36	0,1038	58,39416	-0,49416	0,24419	0,19141	0,85347
7	59,7	0,0168	49	0,1176	58,45105	1,24895	1,55988	1,85641	2,09205
8	59,6	0,0168	64	0,1344	58,50804	1,09196	1,19237	1,59391	1,83214
	466,7	0,1372	204	0,6167	466,4746	0,22538	10,69879	10,91875	13,9107
Сред знач 4,5	58,3375	0,01715	25,5	0,0770875	58,30933

. тогда : a0 = 0,01715 + 4,5?0,0000167 = 0,017225.

Таким образом, модель будет иметь вид:

2.1) Определим коэффициент детерминации:

2.2) Определим стандартную ошибку:

2.3) Определим значимость модели используя критерий Фишера:

2.4) Вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 1.73%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь:

Таким образом, лучшей моделью с наименьшей стандартной ошибкой является: lny

Задание 3.5

По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.

Таблица 3.3 - КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ1) (на конец года; рублей за единицу иностранной валюты)

Страна	Наименование валюты	2010	2011	2012	2013	2014	2015
Австралия	австралийский доллар	31,01	32,72	31,55	28,96	45,91	53,12
2.Австрия	евро	40,33	41,67	40,23	44,97	68,34	79,70
3.Азербайджан	азербайджанский манат	38,11	40,98	38,74	41,78	71,84	46,74
4.Армения	армянский драм	84,132)	83,742)	75,372)	80,712)	12,103)	15,053)
5.Беларусь	белорусский рубль	10,162)	38,564)	35,344)	34,314)	38,804)	38,954)
6.Бельгия	евро	40,33	41,67	40,23	44,97	68,34	79,70
7.Германия	евро	40,33	41,67	40,23	44,97	68,34	79,70
8.Дания	датская крона	54,105)	56,065)	53,955)	60,315)	92,025)	10,68
9.Испания	евро	40,33	41,67	40,23	44,97	68,34	79,70
10.Италия	евро	40,33	41,67	40,23	44,97	68,34	79,70
11.Казахстан3)	тенге	20,68	21,69	20,21	21,31	30,83	21,52
12.Канада	канадский доллар	30,49	31,57	30,54	30,55	48,40	52,57
13.Киргизия3)	сом	64,84	69,56	64,08	66,34	95,52	94,84
14. Нидерланды	евро	40,33	41,67	40,23	44,97	68,34	79,70
15.Норвегия5)	норвежская крона	51,61	53,64	54,53	53,21	75,79	83,38
16.Республика Молдова5)	молдавский лей	25,07	27,52	25,10	25,08	36,03	37,06
17. Соединенное Королевство (Великобритания)	фунт стерлингов	47,26	49,63	48,96	53,96	87,42	107,98
18.США	доллар США	30,48	32,20	30,37	32,73	56,26	72,88
19. Таджикистан	сомони	69,225)	67,665)	63,735)	69,095)	10,76	10,99
20.Туркмения	новый туркменский манат	10,70	11,29	10,65	11,48	19,74	21,44
21.Турция	турецкая лира	19,60	16,83	16,97	15,30	24,27	25,08
22.Узбекистан2)	узбекский сум	18,58	17,94	15,30	14,63	23,22	26,45
23.Украина5)	гривна	38,28	40,05	37,59	39,72	35,56	30,46
24.Финляндия	евро	40,33	41,67	40,23	44,97	68,34	79,70
25.Франция	евро	40,33	41,67	40,23	44,97	68,34	79,70
26.Швеция5)	шведская крона	44,81	46,61	46,69	50,15	72,02	87,26
27.Япония3)	иена	37,38	41,50	35,15	31,06	47,06	60,51

1) По данным Банка России.

2) За 1000 единиц национальной валюты.

3) За 100 единиц национальной валюты.

4) За 10 000 единиц национальной валюты.

5) За 10 единиц национальной валюты.

Решение:

Поскольку данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:

руб.

Мода - это значение признака, наиболее часто повторяющееся в совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.

Определим медиану. Ранжируем ряд данных:

30,49; 30,54; 30,55; 31,57; 48,40; 52,57

Рассчитаем дисперсию: 149,5130093333 руб.

Определим среднее квадратическое отклонение: 12,2275512403 руб.

Рассчитаем коэффициент вариации:

Таким образом, среднегодовой курс канадского доллара составил 36,518 руб. средним квадратическим отклонением12,2275512403. Дисперсия составила 149,5130093333. Медиана показывает, что курс половины лет не превышал руб., а другой половины - не менее . Коэффициент вариации, равный и превышающий 33,3%, указывает на неоднородность совокупности.

Построим линейную модель связи показателя со временем, которое будет выглядеть следующим образом: , где t - год.

Таблица 3.5 - расчеты данных уравнения тренда.

Год	t	y	t-t?	y-y?	(y-y?)*(t- t?)	(t-tЇ)І	(y-yЇ)І
2010	1	30.49	-2.5	-6.863333	17.158333	6.25	47.1053
2011	2	31.57	-1.5	-5.783333	8.675	2.25	33.4469
2012	3	30.54	-0.5	-6.813333	3.4066667	0.25	46.4215
2013	4	30.55	0.5	-6.803333	-3.4016667	0.25	46.2853
2014	5	48.4	1.5	11.046667	16.57	2.25	122.0288
2015	6	52.57	2.5	15.216667	38.041667	6.25	231.5469
Сумма	21	224.12	0	0	80.45	17.5	526.83493
Среднее значение	3.5	37.35333333

тогда : a0= 37.35333333- 3,5? = 21.2633

Таким образом, линейная модель имеет вид:

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса AMD, причем величина прироста ежегодно составляет в среднем руб.

Для анализа полученной модели постоим таблицу.

Таблица 3.5.1 - анализ модели, дополнительные вычисления

у?	y-y?	(y-y^)І
25,86047619	4,62952381	21,4324907	15,18374487
30,45761905	1,112380952	1,237391383	3,523538018
35,0547619	-4,514761905	20,38307506	14,78311036
39,65190476	-9,101904762	82,84467029	29,79346894
44,24904762	4,150952381	17,23040567	8,576347895
48,84619048	3,723809524	13,86675737	7,08352582
224,12	0	156,9947905	78,9437359

Определим коэффициент детерминации:

Таким образом на 29,79% вариация курса обусловлена зависимостью от времени, на 70.21% - влиянием прочих факторов, не включенных в данную модель.

Определим стандартную ошибку:

Определим значимость модели используя критерий Фишера:

При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически не значимым.

Далее вычислим ошибку аппроксимации:

- в среднем, расчетные значения отклоняются от фактических на 13.16%. Поскольку ошибка выше 10%, то данное уравнение некачественно описывает тенденцию курса национальной валюты.

Страница:

курсовая работа "Общая теория статистики" скачать

Подобные документы

Средние величины в статистике
Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

курсовая работа [230,6 K], добавлен 24.09.2012
Метод средних величин в статистике
Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.

курсовая работа [91,7 K], добавлен 14.12.2008
Основные понятия статистики
Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

учебное пособие [276,4 K], добавлен 23.11.2010
Расчет основных статистических величин
Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

контрольная работа [80,0 K], добавлен 05.06.2012
Экономическая статистика
Объект наблюдения, единица наблюдения, единица совокупности. Вычисление общей, внутригрупповой и межгрупповой дисперсии себестоимости единицы продукции, средней из внутригрупповых. Показатели динамики объема товарооборота. Определение индекса средних цен.

контрольная работа [349,6 K], добавлен 11.12.2009
Абсолютные и относительные величины. Средние величины и показатели вариации
Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

лекция [985,6 K], добавлен 13.02.2011
Общая теория статистики
Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

контрольная работа [59,3 K], добавлен 26.06.2009
Расчёт показателей вариации
Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.

контрольная работа [438,8 K], добавлен 06.11.2010
Сущность, виды и методы расчета средних величин и сфера их применения в анализе хозяйственной деятельности отрасли (на примере ОАО "Газпром")
Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.

курсовая работа [177,4 K], добавлен 29.10.2015
Основные категории статистики
Сводка и группировка. Абсолютные и относительные величины. Расчет соотношения потребленного и вывезенного сахара. Сущность и значение средних показателей. Исчисление средней из интервального ряда распределения по методу моментов. Показатели вариации.

контрольная работа [75,7 K], добавлен 20.09.2013

Другие документы, подобные "Общая теория статистики"

весь список подобных работ

скачать работу можно здесь

сколько стоит заказать работу?

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.