Обработка данных средствами приложения MS Excel

Построение и использование линии тренда для решения технических задач. Этапы решения задач, выбор класса функций тренда, расчёт формальных критериев аппроксимации, использование метода наименьших квадратов и его модификации для линейных моделей.

Рубрика Программирование, компьютеры и кибернетика
Вид лабораторная работа
Язык русский
Дата добавления 18.06.2009
Размер файла 148,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ЛАБОРАТОРНАЯ РАБОТА №3

ОБРАБОТКА ДАННЫХ СРЕДСТВАМИ ПРИЛОЖЕНИЯ MS EXCEL (ПОСТРОЕНИЕ ТРЕНДА И ПРОГНОЗИРОВАНИЕ)

1.1 Цель лабораторной работы

Научить студентов строить и использовать линии тренда для решения технических задач.

1.2 Порядок выполнения работы

1.2.1 Выполняется при самостоятельной работе:

Изучить теоретические сведения. Разобрать приведенный пример. На его основе разработать индивидуальную техническую задачу.

1.2.2 Выполняется на лабораторном занятии:

Решить индивидуальную задачу в соответствии с приведенным заданием. Показать результат работы преподавателю. Оформить отчет по лабораторной работе и защитить его у преподавателя.

1.3 Теоретические сведения

1.3.1 Линии тренда на диаграмме

Линия тренда - графическое представление тренда или направления изменения данных в ряде данных. Линии тренда обычно используются в задачах прогнозирования. Такие задачи решают с помощью методов регрессионного анализа. С помощью регрессионного анализа можно продолжить линию тренда вперед или назад, экстраполировать ее за пределы, в которых данные уже известны, и показать тенденцию их изменения. Можно также построить линию скользящего среднего, которая яснее демонстрирует модель производственной системы и прослеживает тенденцию изменения данных.

Линиями тренда можно дополнить ряды данных, представленные на ненормированных, плоских диаграммах с областями, линейчатых диаграммах, гистограммах, графиках, биржевых, точечных и пузырьковых диаграммах. Нельзя дополнить линиями тренда ряды данных на объемных диаграммах, нормированных диаграммах, лепестковых диаграммах, круговых и кольцевых диаграммах. При замене типа диаграммы на один из вышеперечисленных соответствующие данным линии тренда будут потеряны.

1.3.2 Добавление линии тренда к рядам данных

а) Выберите ряд данных, к которому нужно добавить линию тренда или скользящее среднее.

б) Выберите команду Добавить линию тренда в меню Диаграмма.

в) На вкладке Тип выберите нужный тип регрессионной линии тренда или линии скользящего среднего.

г) При выборе типа Полиномиальная введите в поле Степень наибольшую степень для независимой переменной.

1.3.3 Редактирование линий тренда

Данная процедура доступна только для регрессионных линий тренда.

а) Выберите изменяемую линию тренда.

б) Выберите команду Линия тренда в меню Формат.

в) На вкладке Параметры выберите нужные параметры.

1.3.4 Пример: По имеющемуся временному ряду (таблица 1.1) построим тренд пятого порядка в соответствии с рисунком 1.1.

Таблица 1.1 - Временной ряд изменения энергии излучения

Номер измерения x

1

2

3

4

5

6

7

Энергия излучения Y(x)

7

8

6

5

6

9

8

Рисунок 1.1

1.4 Задание на лабораторную работу

1.4.1 Разработать на основе примера собственный ряд зависимости физического показателя, например: температуры в канале разряда от мощности разряда.

1.4.2 По полученному ряду построить тренд, используя возможности Excel. На графике показать параметры линии тренда (в окне «Формат линии тренда» использовать вкладку Параметры).

1.4.3 Осуществить прогноз на 1 или 2 шага вперёд, используя ту же вкладку. Чтобы прогноз был более точным, необходимо выбрать такой тренд, R2 для которого больше 0.7.

§ 1. Постановка задачи

Любой объект (экономический, физический, производственный и др.), являясь системой взаимодействующих между собой элементов, связан с другими объектами и постоянно изменяется во времени, поэтому ни одна математическая модель не может описать его полностью. Модель объекта должна отражать самые существенные его свойства и связи, которые позволяют проводить исследования. С ее помощью можно принимать решения, достигающие определённой цели. Один и тот же объект может быть описан различными моделями.

§ 2. Моделирование прогноза

В исследованиях взаимосвязей реальных величин приходится иметь дело с переменными, имеющими стохастическую природу. Они могут быть представлены наборами входных параметров х1i2i,…,хin, i= 1,2,…,L, которые называют аргументами (факторами) и выходных- y1, y2,…,yn. Входные параметры являются управляемыми, выходные же параметры зависят от нас частично. Зависимость переменных, на которую накладываются воздействия случайных факторов, называется статистической зависимостью. Выбор формулы зависимости переменных называется спецификацией уравнения зависимости. Вопрос о нахождении формулы зависимости можно ставить после положительного ответа на вопрос о существовании такой зависимости. В качестве меры для степени линейной зависимости двух переменных используют коэффициент их корреляции. Выборочный коэффициент корреляции рассчитывается по формуле:

Величина коэффициента корреляции меняется от -1 до +1. Если его значение по модулю близко к единице, то между х и у существует линейная зависимость, иначе такой зависимости нет. Если же его значение по модулю близко или равно нулю, то между х и у вообще не существует зависимости. Таким образом, исследование зависимости надо начинать с вычисления значения коэффициента корреляции. Вопрос о существовании зависимости можно также решать с помощью графического представления начальных данных, называемого полем корреляции. При вытянутом облаке точек поля корреляции зависимость существует, но возможно не линейная. Параметры зависимости определяют методом наименьших квадратов или его модификацией. Нижней границей количества исходных данных, необходимых для метода наименьших квадратов является величина:

,

где m- число искомых параметров зависимости (для линейной зависимости m=2, k=8). Полученные аналитические зависимости называются уравнениями регрессии и в общем случае имеют вид:

у= f(x1, x2, x3, …,xn).

Регрессия называется парной, если она описывает зависимость между функцией и одной переменной и имеет вид: y= f(x). Регрессия называется множественной, если она описывает зависимость между функцией и несколькими переменными и имеет вид:

у= f(x1, x2, x3, …,xn).

Если зависимости являются линейными, то регрессия называется линейной, в противном случае называется нелинейной.

Если известна последовательность временных значений t1, t2, …,tn и соответсвующие им наборы исследуемой величины у1, у2,...уn то говорят о динамическом (временном) ряде. В составе динамического ряда можно выделить 4-е компоненты: 1) главную тенденцию, или тренд; 2) регулярные колебания относительно тренда; 3) сезонные колебания; 4) остаток, или случайную компоненту, отражающую влияние разнообразных факторов стохастического рахактера. Конкретный динамический ряд не обязательно включает все указанные компоненты. Уравнение регрессии, отражающее общие закономерности или тенденции развития динамического ряда, называется трендовой моделью или трендом. Так как важным свойством тренда является гладкость, при выборе трендовых моделей предпочтение отдаётся непрерывным и дифференцируемым функциям, отражающим главные особенности динамики исследуемого показателя и, прежде всего, тип его развития.

Решение задачи построения трендовой модели можно разбить на этапы.

Выбор класса функций тренда.

используем такие функции:

линейную yd=a0+a1t -;

показательную yd=a0*a1t;

дробно- рациональную yd=1/(a0+ a1t),

логарифмическую yd=a0+a1lnt;

степенную функцию yd=a0*ta1

гиперболическую yd=a0+a1/t;

дробно- рациональную общего вида yd=t/(a0t + a1).

параболическая yd=a0+a1t+а2t2

Оценивание параметров функций тренда.

Для линейных и линеаризируемых моделей широко используется метод наименьших квадратов или его модификации.

Расчёт формальных критериев аппроксимации. Предпочтительнее те функции тренда, которые имеют лучшие значения критериев (меньшую сумму квадратов уклонений, меньшую остаточную дисперсию, больший коэффициент детерминации, и т. д.).

Анализ остаточной компоненты динамического ряда. Остаточная компонента должна быть независимой, с потоянной дисперсией, подчинена нормальному закону распределения. Если эти требования не соблюдаются, то построенная модель не вполне адекватна динамическому ряду.

Выбор функции тренда. Выбор “лучшей” функции производится путём сопоставления значений формальных критериев аппроксимации, процедур оценивания параметров по их сложности, свойств остаточной компоненты а также возможностей экономической интерпретации и использования в прогнозировании.

Предполагая, что тенденция развития исследуемого экономического показателя сохраняется в ближайшем будущем и длина динамического ряда, для которого построен тренд, достаточна для выявления тенденций развития; кроме того полагая, что процесс является устойчиво динамическим (не скачкообразным или постоянным) и обладает инертностью (для значительных изменений характеристик процесса требуется продолжительный период); не ожидается сильных внешних воздействий. Только тогда на основе трендовых моделей делается точечный прогноз и вычисляется доверительный интервал. Расчёт доверительного интервала, позволяющего определить область, в которой с определённой вероятностью следует ожидать прогнозируемую величину, выполняется по схеме:

ytинт=ytd tS,

где ytd- трендовая модель, t-значение критерия Стьюдента, S- средняя квадратичная ошибка тренда.

Прогнозирование с помощью трендов - один из простейших методов статистического прогнозирования. Его использование оправдано при недостаточности знаний о природе изучаемого процесса или отсутствии статистических данных, необходимых для применения более совершенных методов прогнозирования.

Разобьём решение задачи прогнозирования на четыре части:

выбор наилучшей модели для прогнозирования из 7-ми, предложенных для yd:

построение трендовых моделей yd для производственного процесса методом наименьших квадратов;

определение аппроксимационных оценок построенных моделей:

построение точечного прогноза на 1,2 периода вперёд и определение доверительного интервала.

Рассмотрим пример.

Из опыта работы предприятия за 9 лет известны значения потребления электроэнергии yi (усл.ед.):

t

1

2

3

4

5

6

7

8

9

yi

5,8

9

13

16,5

20

21

25

30

32

Необходимо дать точечный прогноз работы предприятия на 1 и 2 года и определить доверительный интервал.

Часть 1. Построим график - поле корреляции по начальным данным:

По графику видим, что зависимость между данными существует, так как поле корреляции вытянуто.

Проанализируем развитие динамического ряда: Абсолютный прирост - характеризующий скорость изменения уровня: i=yi-yi-1, темп прироста - характеризующий относительную скорость изменения: = i / yi-1

Прирост i

3,20

4,00

3,50

3,50

1,00

4,00

5,00

2,00

3,28

темпприроста:

0,55

0,44

0,27

0,21

0,05

0,19

0,20

0,07

0,25

Будем подбирать типы трендовых моделей с постоянным и увеличивающимся приростом, с уменьшающимся темпом прироста. К таким типам трендовых моделей могут принадлежать все выше приведенные 8 функций.

Проанализируем несколько вариантов:

Полагаем, что зависимость между t и yi: линейная

yd=a0+a1*t

Используя метод наименьших квадратов строится система нормальных уравнений (используется первая таблица), затем определяются неизвестные параметры а1 и а0,например по методу Гаусса (или по методу Крамера), используется вторая таблица.

Таблица 2. Определение параметров а1 и а0, по методу Гаусса

t

y

t*y

t*t

a0

a1

своб.

1

5,8

5,8

1

9

45

172,3

2

9

18

4

45

285

1057,8

3

13

39

9

1

5

19,144

4

16,5

66

16

0

60

196,3

5

20

100

25

1

3,2716

1

6

21

126

36

1

2,7861

0

7

25

175

49

8

30

240

64

9

32

288

81

?

45

172,3

1057,8

285

По результатам строится график.

Для получения аппроксимационных оценок строим таблицу:

t

y

yd

?r

?S

1

5,8

6,057

178,0

0,066

2

9

9,329

102,9

0,108

3

13

12,60

37,75

0,159

4

16,5

15,87

6,993

0,393

5

20

19,14

0,731

0,731

6

21

22,41

3,443

2,005

7

25

25,68

34,28

0,473

8

30

28,95

117,8

1,082

9

32

32,23

165,2

0,053

45

172,3

150,01

647,3

5,074

?S=(y- yd)2 ?r =(y- yсредн)2 yсредн = (y1+y2+…+y9)/9

Коэффициент детерминации

R2= 1-(?S/7)/( ?r/8)=0,991

Полагаем, что зависимость между t и yid: гиперболическая

Yд=a0+a1*t-1

Согласно методу наименьших квадратов строится система нормальных уравнений, (используется первая таблица), затем определяются неизвестные параметры а1 и а0 по методу Гаусса (используется вторая таблица).

t

y

t-1

t-2

t-1*y

a0

a1

своб.чл.

1

5,8

1

1

5,8

9

2,8289

172,3

2

9

0,5

0,25

4,5

2,8289

1,5397

37,13531

3

13

0,3333

0,1111

4,3333

1

0,3143

19,14444

4

16,5

0,25

0,0625

4,125

0

0,6505

-17,0237

5

20

0,2

0,04

4

1

-26,16867

6

21

0,1666

0,0277

3,5

1

27,37002

7

25

0,1428

0,0204

3,5714

8

30

0,125

0,0156

3,75

9

32

0,1111

0,0123

3,5555

45

172,3

2,8289

1,5397

37,135

По результатам строится график.

Для получения аппроксимационных оценок используем таблицу:

t-1

y

Yдет

?r

?S

1

5,8

1,20

178,07

21,14

0,5

9

14,28

102,91

27,93

0,33

13

18,64

37,75

31,89

0,25

16,5

20,82

6,99

18,73

0,2

20

22,13

0,73

4,56

0,16

21

23,00

3,44

4,03

0,14

25

23,63

34,29

1,87

0,12

30

24,09

117,84

34,82

0,11

32

24,46

165,27

56,81

2,82

172,3

172,3

647,30

201,8

Коэффициент детерминации R2= 1-(?S/7)/( ?r/8)=0,644

Полагаем, что зависимость является пораболической.

Yд=a0+a1*t+а2*t2

По методу наименьших квадратов строится система нормальных уравнений, (используется первая таблица), затем определяются неизвестные параметры а1 и а0 по методу гаусса (используется вторая таблица).

По результатам строится график.

t

y

t*t

t3

t4

y*t

y*t2

1

5,8

1

1

1

5,8

5,8

2

9

4

8

16

18

36

3

13

9

27

81

39

117

4

16,5

16

64

256

66

264

5

20

25

125

625

100

500

6

21

36

216

1296

126

756

7

25

49

343

2401

175

1225

8

30

64

512

4096

240

1920

9

32

81

729

6561

288

2592

45

172,3

285

2025

15333

1057,8

7415,8

a0

a1

a2

своб

9

45

285

172,3

45

285

2025

1057,8

285

2025

15333

7415,8

1

5

31,666

19,144

0

60

600

196,3

0

600

6308

1959,6

1

10

3,2716

0

308

-3,366

1

-0,010

1

3,3804

1

3,1322

Для получения аппроксимационных оценок используем таблицу:

t

t*t

y

Yдет

?r

?S

1

1

5,8

6,50

1,00

0,49

2

4

9

9,85

16,00

0,72

3

9

13

13,17

81,00

0,03

4

16

16,5

16,48

256,00

0,0003

5

25

20

19,76

2,36

0,05

6

36

21

23,02

0,29

4,09

7

49

25

26,26

11,99

1,59

8

64

30

29,48

71,61

0,26

9

81

32

32,67

109,46

0,45

45

285

172,3

177,2

549,72

7,72

Коэффициен детерминации

R2= 1-(?S/7)/(?r/8)=0,984

Построение всех таблиц выполняется в Microsoft Exel.

Часть 2. Определение аппроксимационных оценок построеных моделей и выбор наилучей модели для прогнозирования

Сравнивая все построенные модели между собой по сумме квадратов уклонений от описываемого процесса ?S:

?Smin=МИН(5,074; 201,8; 7.72)= 5,074

видим, что наилучшей из всех является линейная модель.

Сравнивая все построенные модели между собой по величине коэффициента детерминации R2:

R2max=МАКС(0,991; 0,644; 0,984)= 0,991

видим, что наилучшей из всех является линейная модель.

Для выбора типа трендовой модели используют обычно критерий Демидовича:

Для заданной системы точек (ti ; yi)выбирают две точки, по возможности далеко отстоящие друг от друга. Пусть это точки Mi (t1 ; y1) и Mn (tn ; yn). Вычислим для них среднее арифметичаеское ta p, геометрическое t геом, гармоническое tгарм значений (t1 ; tn) и Mn (y1 ; yn):

; ; t геом = ; Y геом = ;

; ;

Для вычислений значений tар, tгеом, tгарм независимой переменной найдем из построненного графика или из таблицы по формуле линейной интерполяции соответствующие значения зависимой переменной y1*; I = 1,2,3.

t ар будет соответствовать y1*

t геом будет соответствовать y2*

t гарм будет соответствовать y3*

Сравним найденные значения y1*, y2*, y3* с вычисленными yар, yгеом, y гарм и оценим погрешности:

Е1 = (y1* -yар); Е2 = (y1* -yгеом); Е3 = (y1* -yгарм);

Е4 = (y2* -yар); Е5 = (y2* -yгеом); Е6 = (y3* -yар);

Е7 = (y3* -yар);

Выберем минимальную погрешность:

Еmin - min (Е1, Е2, …. Е7)

В соответствии с нумерацией списка формул таблицы 2.2, наиментьшей абсолютной погрешности Еi отвечает i - я формула i = 1; 2; 3…7 (функция).

Замечания:

1. Приведенный подход к отысканию вида эмпирической формулы является грубо ориентированным, так как не учитыается поведение всех промежуточных данных. (ti, yi).

2. В ряде случаев переменные t и y могут соответствовать некоторой закономерности, не вошедшей в список.

Все зависимости, приведенные в таблице легко преобразовываются в линейные мотодом выравнивания (см. последный столбец табл. 2.2).

Метод выравнивания состоит в вводе новых переменных:

t = (t; y) y = (t; y)

таким образом, что преобразованные точки (ti; yi) лежат на некоторой прямой линии плоскости toy.

Обязательным требованием при этом является взаимная однозначность преобразования.

Сравнивая линейную и параболическую модели по сложности оценивания параметров, видим, что лучшей надо считать линейную модель имеющую два параметра.

Этот же результат дает критерий Демидовича

Трендовая модель:

Yd=2,7861+3,2716*t

Проведём анализ остаточной компоненты

?s=y-yd.

Вычислим для неё матожидание

М[?s]=0,000

?s

-0,26

-0,33

0,399

0,627

0,856

-1,42

-0,69

1,041

-0,23

0,000

0,000

М[Уs]

Проверим её независимость, вычислив коэффициент автокорреляции:

Ri,i-1=У(yi-ydi)(yi-1-ydi-1) / [У(yi-ydi)2 ?(yi-1-ydi-1)2]1/2= -0,009017

Часть 3. Нахождение точечного прогноза на 1 и 2 периодов времени вперёд и построение доверительного интервала

Объём выборки равен n= 9<20.Для прогнозирования выбираем: коэффициент значимости равный 0.05, доверительная вероятность равна 1-0.05. Из таблицы распределения Стьюдента выбирается число стандартных отклонений t(а,K) для К= n-v = 9-2 = 7

К

1

2

3

5

6

7

8

9

10

18

22

30

t(a,K)

12,7

4,3

3,1

2,5

4

2,36

2,3

2,26

2,23

2,1

2,07

2,04

и вычисляем точечный прогноз на i периодов времени вперёд,учитывая доверительный интервал.

Yпрог=Yd(n+i)

Yпрог=Yd(n+i) = Yn+i* t(а,К)*Sост


Подобные документы

  • Построение эмпирических формул методом наименьших квадратов. Линеаризация экспоненциальной зависимости. Элементы теории корреляции. Расчет коэффициентов аппроксимации, детерминированности в Microsoft Excel. Построение графиков функций, линии тренда.

    курсовая работа [590,9 K], добавлен 10.04.2014

  • Построение и использование математических и алгоритмических моделей для решения линейных оптимизационных задач. Освоение основных приемов работы с инструментом "Поиск решения" среды Microsoft Excel. Ввод системы ограничений и условий оптимизации.

    лабораторная работа [354,7 K], добавлен 21.07.2012

  • Построение графика на основе табличных данных, их анализ с использованием математического метода наименьших квадратов. Зависимость электрического сопротивления медного стержня от температуры. Использование линий тренда в MS Excel для прогнозирования.

    контрольная работа [431,3 K], добавлен 24.04.2011

  • Использование информационных технологий для решения транспортных задач. Составление программ и решение задачи средствами Pascal10; алгоритм решения. Работа со средствами пакета Microsoft Excel18 и MathCad. Таблица исходных данных, построение диаграммы.

    курсовая работа [749,1 K], добавлен 13.08.2012

  • Расчеты с использованием финансовых функций. Оформление таблицы и построение диаграммы, отражающей динамику роста вклада по годам. Экономический анализ для заданных статистических данных. Порядок решения задач методом линейного программирования.

    контрольная работа [90,5 K], добавлен 15.06.2009

  • Разработка алгоритма аппроксимации данных методом наименьших квадратов. Средства реализации, среда программирования Delphi. Физическая модель. Алгоритм решения. Графическое представление результатов. Коэффициенты полинома (обратный ход метода Гаусса).

    курсовая работа [473,6 K], добавлен 09.02.2015

  • Развитие навыков работы с табличным процессором Microsoft Excel и программным продуктом MathCAD и применение их для решения задач с помощью электронно-вычислительных машин. Схема алгоритма. Назначение функции Линейн и метода наименьших квадратов.

    курсовая работа [340,4 K], добавлен 17.12.2014

  • Табличный процессор - прикладное программное обеспечение для обработки данных, представимых в табличной форме. Параметры форматирования ячейки, автоформат. Создание и использование стилей, мастер функций. Экономические расчеты средствами MS Excel.

    контрольная работа [1,2 M], добавлен 13.05.2012

  • Сущность и применение приложения Excel как базы данных: создание таблицы, фильтрация и структурирование данных, подведение итогов, консолидация, добавление диаграммы и гиперссылки. Применение приложения Access для решения задач в различных областях.

    курсовая работа [3,9 M], добавлен 11.05.2012

  • Использование пакета прикладных программ MS Office при решении экономических задач. Разработка баз данных при помощи Microsoft Access. Интернет-технологии и применение языка гипертекста HTML. Построение и вычисление финансовых функций с помощью MS Excel.

    курсовая работа [3,2 M], добавлен 19.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.