Основные статистические характеристики распределения случайных чисел

Гипотеза о подчинении равномерному закону ста одноразрядных чисел. Вычисление коэффициентов линейной зависимости и множественной детерминации. Отношение среднеквадратической ошибки к среднему значению. Среднеквадратическая ошибка прогнозирования.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 22.11.2021
Размер файла 171,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пример задания №1

Задание 1.1

Проверить гипотезу о подчинении равномерному закону десяти чисел двух левых столбцов таблицы 1.1 по критерию согласия (КС) Колмогорова.

Таблица 1.1

80

25

12

29

89

84

98

46

42

62

69

43

75

41

47

16

18

80

16

38

41

86

60

75

29

85

48

71

06

68

80

67

93

63

39

75

53

71

35

88

24

48

13

86

53

95

24

77

37

61

Запишем случайные числа по возрастанию: 24, 25, 41, 43, 48, 67, 69, 80, 80, 86.

Построим эмпирическую функцию распределения.

Вычислим основные статистические характеристики распределения случайных чисел.

1. Оценка первого начального момента вычисляется по формуле:

=(24+25+41+43+48+67+69+80+80+86)/10=56,3.

Оценка второго начального момента вычисляется по формуле:

=(242+252+· · · +862)/10=3648,1.

Оценка среднего квадратического отклонения (стандартного отклонения) вычисляется по формуле:

= =21,873.

=56,3-1,732·21,873=18,416.

=56,3+1,732·21,873=94,184.

По двум точкам с координатами (18,4;0) и (94,2;1) на рис.1 построим прямую, являющуюся гипотетической функцией распределения. Ввиду некоторой неточности рис.1.1 точно определить максимальную разницу между эмпирической и гипотетической функциями распределения не представляется возможным. Поэтому вычислим значения гипотетической функции распределения для всех аргументов по формуле:

Результаты вычислений представим в таблице 1.2.

Таблица 1. 2

i

xi

F*(xi)

F(xi)

F*(xi)- F(xi)

1

24

0,1

0,074

0,026

2

25

0,2

0,087

0,113

3

41

0,3

0,298

0,002

4

43

0,4

0,324

0,076

5

48

0,5

0,390

0,110

6

67

0,6

0,641

- 0,041

7

69

0,7

0,668

0,032

8

80

0,8

0,813

- 0,013

9

80

0,9

0,813

0,087

10

86

1,0

0,892

0,108

По результатам таблицы 2 определяем максимальную разницу в функциях распределения, равную 0,113, и вычислим КС Колмогорова.

По статистической таблице 1.3 находим коэффициент доверия высказанной гипотезе рк=0,9985 и так как он превышает рекомендуемое значение 0,2, то делаем заключение что. имеющиеся статистические данные не противоречат гипотезе об их подчинении равномерному закону по КС Колмогорова. В таблице 1.3 жирным цветом выделены значения К, при которых гипотеза о подчинении исходных случайных чисел равномерному закону не отвергается.

Таблица 1.3

рк

1.0000

1.0000

1.0000

1.0000

0.9970

0.9640

0.8640

К

0.0000

0.1000

0.2000

0.3000

0.4000

0.5000

0.6000

рк

0.7110

0.5440

0.3930

0.2700

0.2000

0.1120

0.0680

К

0.7000

0.8000

0.9000

1.0000

1.0500

1.2000

1.3000

рк

0.0400

0.0220

0.0121

0.0060

0.0030

0.0020

0.0010

К

1.4000

1.5000

1.6000

1.7000

1.8000

1.9000

2.0000

Задание 1.2

Проверить гипотезу о подчинении равномерному закону ста одноразрядных чисел всех столбцов таблицы 1.1 по критерию согласия ч2.

Подсчитаем количество символов каждого типа и построим гистограмму.

Вычислим значение критерия согласия Пирсона (КС 2 ) и по статистическим таблицам определим коэффициент доверия, выдвинутой гипотезе:

2 ={(5-10)2+(10-10)2+(8-10)2+(10-10)2+(11-10)2+(9-10)2+(13-10)2+(10-10)2+ +(16-10)2+(8-10)2}/10={25+0+4+0+1+1+9+0+36+4}/10=8,0 при R=7.

По статистической таблице 2.1 находим коэффициент доверия Рр=0,40. Ввиду того, что вычисленное значение КС укладывается в рекомендуемый десяти процентный доверительный интервал делаем заключение что имеющиеся статистические данные не противоречат гипотезе о их подчинении равномерному закону. В таблице 2.1 жирным цветом выделены значения, 2 при которых гипотеза о подчинении исходных случайных чисел равномерному закону не отвергается, т.е. соблюдается условие: 0.1?рр?0.9.

Таблица 2.1

рр

0.990

0.980

0.950

0.900

0.800

2

1.239

1.501

2.170

2.830

3.820

рр

0.700

0.500

0.300

0.200

0.100

2

4.670

6.350

8.380

9.800

12.02

рр

0.050

0.020

0.010

0.001

0.000

2

14.07

16.62

18.48

24.30

?

Задание 1.3

Провести аппроксимацию пяти пар случайных чисел, представленных в таблице 3.1, линейной зависимостью .

Таблица 3.1

х

у

1

1

2

2

3

4

4

7

5

9

Экспериментальные точки, координаты которых представлены в таблице 3.1, представим в системе координат на рис.3.1.

Для проведения аппроксимации проведём предварительные вычисления.

Вычислим коэффициент линейной корреляции.

По статистическим таблицам найдём критическое значение критерия Стьюдента tкрит=3,1814 при n-2=5-2=3 степенях свободы и рекомендуемому уровню значимости б=0,05.

Ввиду того, что делаем заключение, что корреляционная связь между переменными х и у является существенной и она может быть линейной.

Вычислим коэффициенты линейной зависимости по формулам:

Таким образом, получили линейное уравнение регрессии:

По уравнению регрессии по двум точкам построим функцию в системе координат на рис.3.1 и вычислим значения функции по экспериментальным значениям аргумента х и разницу между экспериментальными и вычисленными значениями функции, которые представим в таблице 3.2.

Таблица 3.2

хi

yi

1

1

0,4

0,6

0,36

2

2

2.5

-0,5

0,25

3

4

4,6

-0,6

0,36

4

7

6,7

0,3

0,09

5

9

8,8

0,2

0,04

Вычислим стандартную ошибку и отношение стандартной ошибки к среднему значению:

По отношению стандартной ошибки к среднему значению получен удовлетворительный результат, так как не превышено значение в 0.05.

Проведём оценку уровня значимости коэффициентов уравнения регрессии по критерию Стьюдента:

где

По статистической таблице находим критическое значение критерия Стьюдента tкрит=3,183 для3 степеней свободы и рекомендуемого уровня значимости =0,05. Отметим, что по уровню значимости для коэффици-ентов и получен удовлетворительный результат, так как они по асолютному значению превышают критическое значение.

Проведём оценку качества полученного уравнения регрессии по показателям, вычисляемым на основе дисперсионного анализа:

Проверка:

Результат проверки - положительный, что свидетельствует о корректности проведённых вычислений.

Вычислим критерий Фишера:

при двух степенях свободы:

По статистическим таблицам находим критическое значение критерия

Фишера для рекомендуемого уровня значимости б=0.05 Так как вычисленное значение критерия Фишера превосходит критическое, то будем считать уровень значимости по критерию Фишера удовлетворительным.

Вычислим коэффициент множественной детерминации:

для двух степеней свободы

По статистической таблице для уровня значимости 0,05 находим критическое значение коэффициента множественной детерминации:

Так как вычисленное значение коэффициента множественной детерминации превышает критическое значениe, то полученный результат по данному показателю будем считать удовлетворительным.

Таким образом, все полученные расчётные показатели по оценке качества уравнения регрессии являются удовлетворительными, поэтому будем считать результаты аппроксимации приемлемыми.

Задание 1.4

Пример 1.4.1

Провести оптимизацию графическим методом.

Размещено на http://www.allbest.ru/

Приравняем целевую функцию нулю, неравенства заменим равенствами и затем представим их функциями х2 от х1.

х2=-2х1;

х2= 1,5+0,5х1;

х2=13,5-1,5х1;

х2=-4+х1

и представим в системе координат на рис.4.1.

Область допустимых решений (ОДР) ограничивается осью координат х1, ограничением (2) и ограничением (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (4;0) а последняя - максимума (9;0). В точке минимума z =8,в точке максимума z=18. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-4+0<3 выполняется;

3·4+0<27 выполняется;

4-0=4 выполняется как равенство.

Для точки максимума

-9+0<3 выполняется;

3·9+0=27 выполняется как равенство;

9-0>4 выполняется.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что если какая-то проверяемая точка превращает неравенство в равенство, то данная точка принадлежит прямой линии, представляющей данное неравенство. В процессе оптимизации может оказаться, что какая-то точка лежит на пересечении двух, или большего количества прямых, то её координаты можно найти решением системы уравнений.

Пример 1.4.2

Если в условиях примера 1.4.1 изменить третье неравенство на х12?4 то постановка задачи примет следующий вид:

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.2.

Область допустимых решений (ОДР) ограничивается осью координат х1 и тремя ограничениями (1), (2) и (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (0;0) а последняя - точкой максимума (7;3). В точке минимума z =0,в точке максимума z=17. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-0+0<3 выполняется;

0+0<27 выполняется;

0-0<4 выполняется.

Для точки максимума

-7+2·3<3 выполняется;

7+2·3=27 выполняется как равенство;

7-3=4 выполняется как равенство.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что если какая-то проверяемая точка превращает неравенство в равенство, то данная точка принадлежит прямой линии, представляющей данное неравенство. В процессе оптимизации может оказаться, что какая-то точка лежит на пересечении двух, или большего количества прямых, то её координаты можно найти решением системы уравнений. В нашем случае точка максимума лежит на пересечении ограничений (2) и (3). Покажем, что в данном случае её координаты можно найти решением уравнения

х2=13,5-1,5·х1=-4+х1;

откуда 2,5·х1=17,5; х1=17,5/2,5=7;

х2=-4+7=3.

Пример 1.4.3

В условиях примера 1.4.2 произведём преобразование, изменив ограничение (2). Тогда постановка задачи оптимизации примет следующий вид:

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.3.

Целевая функция

Область допустимых решений (ОДР) определяется тремя ограничениями (1), (2) и (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (6;4,5) а последняя - точкой максимума (11;7). В точке минимума z =16,5,в точке максимума z=28. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-6+2·45=3 выполняется как равенство;

3·6+2·4,5=27 выполняется как равенство;

6-4.5<4 выполняется.

Для точки максимума

-11+2·7=3 выполняется как равенство;

3·11+2·7>27 выполняется;

11-7=4 выполняется как равенство.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Пример 1.4.4

Изменим постановку задачи примера 1.4.1, изменив ограничения (1) и (3).

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.4.

Область допустимых решений (ОДР) ограничивается осью координат у1, ограничением (1) и ограничением (2). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (0;1,5) а последняя - точкой максимума (6;4,5). В точке минимума z =3,в точке максимума z=16,5. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

0+2·1,5=3 выполняется как равенство;

3·0+2·1,5<27 выполняется;

0-1,5<4 выполняется.

Для точки максимума

-6+2·4,5=3 выполняется как равенство;

3·6+2·4,5=27 выполняется как равенство;

6-4,5<4 выполняется.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что решение четырёх примеров позволило найти минимумы и максимумы целевой функции в четырёх различных ОДР, определяемых задаваемыми ограничениями. В остальных областях координатного пространства могут быть найдены только точки минимумов целевой функции, то есть решение будет неполным, ввиду того что области для поиска точек максимума являются расходящимися.

Задание 1.5

Пример 1.5.1

Евклидово расстояние. Наиболее близкий сосед

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести вариантов информационной системы представлены в таблице 5.1.1.

Таблица 5.1.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

По таблице 5.1.1 построен график, представленный на рис.5.1.1.

По формуле Евклида вычислены расстояния между объектами. Приведём два примера вычисления расстояний между 1 и 5 объектами и 2 и 6 объектами.

Процесс вычисления расстояния между 1 и 5 объектами поясняется на рис. 5.1.2; между 2 и 6 объектами на рис. 5.1.3.

Аналогично по формуле Евклида вычислены расстояния между всеми остальными объектами по двум признакам. Результаты вычислений представлены в виде таблицы 5.1.2

Таблица 5.1.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.1.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «ближайшего соседа». На рис. 5.1.4 поясним этот принцип для определения расстояния между 1 объектом и формируемой совокупностью, состоящей из 4 и 5 объектов.

Аналогично предыдущему определены расстояния других объектов с

формируемой совокупностью, состоящей из 4 и 5 объектов, и составлена таблица расстояний, представленная в таблице 5.1.3.

Таблица 5.1.3

1

2

3

4,5

6

1

0

2,83

3,16

10,19

13,60

2

0

3,16

8,94

12,53

3

0

7,07

10,44

4,5

0

2,24

6

0

Жирным шрифтом в таблице 5.1.3 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и исходными объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.4.

Таблица 5.1.4

1

2

3

4,5,6

1

0

2,83

3,16

10,19

2

0

3,16

8,94

3

0

7,07

4,5,6

0

Жирным шрифтом в таблице 5.1.4 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и другими объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.5

Таблица 5.1.5

1,2

3

4,5,6

1,2

0

3,16

8,94

3

0

7,07

4,5,6

0

Жирным шрифтом в таблице 5.1.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектами. Их объединяем в один объект 1,2,3. Расстояния между укрупнёнными объектами опреде-лены по правилу «ближайшего соседа» и представлены в таблице 5.1.6.

Таблица 5.1.6

1,2,3

4,5,6

1,2,3

0

7,07

4,5,6

0

Таким образом процесс кластерного анализа закончен . Выделено два кластера. Расстояние между кластерами равно 7,07.

Представим результаты кластерного анализа в виде совокуп-ности двух матриц: расстояний между объектами (таблица 5.1.7) и символов Кронекера (таблица 5.1.8).

Таблица 5.1.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.1.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.2

Евклидово расстояние. Наиболее удалённый сосед

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для объектов представлены в таблице 5.2.1.

Таблица 5.2.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по всем признакам, которые представлены в таблице 5.2.2.

Таблица 5.2.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.2.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «наиболее удалённого соседа», применение которого для вычисления расстояния между 1 объектом и формируемым объектом, который состоит из 4 и 5 объектов поясняет рис.5.2.1 .

Аналогично определены расстояния между другими объектами и объектом, состоящим из 4 и 5 объектов, и составлена таблица расстояний 5.2.3

Таблица 5.2.3

1

2

3

4,5

6

1

0

2,83

3,16

12,17

13,60

2

0

3,16

10,77

12,53

3

0

9,06

10,44

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.3 выделено наименьшее расстояние между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « наиболее удалённого соседа» и представлены в таблице 5.2.4.

Таблица 5.2.4

1,2

3

4,5

6

1,2

0

3,16

12,17

13,60

3

0

9,06

10,44

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.4 выделено наименьшее расстояние между объектом 1.2 и третьим объектами. Их объединяем в один объект

1,2,3. Расстояния между этим укрупнённым и другими объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.5.

Таблица 5.2.5

1,2,3

4,5

6

1,2,3

0

12,17

13,60

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектами. Их объединяем в один объект 4,5.6. Расстояния между укрупнёнными объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.6.

Таблица 5.2.6

1,2,3

4,5,6

1,2,3

0

13.60

4,5,6

0

Таким образом процесс кластерного анализа закончен . Выделено два кластера. Расстояние между кластерами равно 13,6. Дендрограмма результатов кластерного анализа представлена на рис. 5.2.2.

Дендрограмма, представленная на рис 5.2.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.2 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.2.7) и символов Кронекера (таблица 5.2.8).

Таблица 5.2.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.2.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.3

Евклидово расстояние. По среднему значению

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.3.1.

Таблица 5.3.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.3.2.

Таблица 5.3.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.3.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.3. Вычисление среднего расстояния пояснено на рис. 5.3.1.

Таблица 5.3.3

1

2

3

4,5

6

1

0

2,83

3,16

11,18

13,60

2

0

3,16

9,855

12,53

3

0

8,065

10,44

4,5

0

2,925

6

0

Жирным шрифтом в таблице 5.3.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по принципу « среднего значения» и представлены в таблице 5.3.4.

Таблица 5.3.4

1,2

3

4,5

6

1,2

0

3,16

10,5175

13,065

3

0

8,0650

10,44

4,5

0

2,925

6

0

Жирным шрифтом в таблице 5.3.4 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и другими объектами определены по правилу «среднего значения» и представлены в таблице 5.3.5.

Таблица 5.3.5

1,2

3

4,5,6

1,2

0

3,16

11,79125

3

0

9,25250

4,5.6

0

Жирным шрифтом в таблице 5.3.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2,3. Расстояния между укрупнёнными объектами определены по правилу «среднего значения» и представлены в таблице 5.3.6.

Таблица 5.3.6

1,2,3

4,5,6

1,2,3

0

10,521875

4,5,6

0

Таким образом процесс кластерного анализа закончен. Выделено два кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2.

Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8).

Таблица 5.3.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.3.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.4

Евклидово расстояние. По медиане

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.4.1.

Таблица 5.4.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.4.2.

Таблица 5.4.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.4.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «медианы» и представлены в таблице 5.4.3. Применение принципа по вычислению расстояния между первым объектом и формирующимся объектом, состоящим из 4 и 5 объектов поясняется рис.5.4.1.

Таблица 5.4.3

1

2

3

4,5

6

1

0

2,83

3,16

7,8692705

13,60

2

0

3,16

6,9266965

12,53

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 5.4.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « медианы» и представлены в таблице 5.4.4.

Таблица 5.4.4

1,2

3

4,5

6

1,2

0

2,8254866

7,2767125

12.999162

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 5.4.4 выделено наименьшее расстояние между объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2.3. Расстояния между этим укрупнённым и другими объектами определены по принципу «медианы» и представлены в таблице 5.4.5.

Таблица 5.4.5

1,2,3

4,5

6

1,2,3

0

6,363017

11,704275

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 5.4.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между укрупнёнными объектами определены по принципу «медианы» и представлены в таблице 5.4.6.

Таблица 5.4.6

1,2,3

4,5,6

1,2,3

0

9,4201385

4,5,6

0

Таким образом, процесс кластерного анализа закончен. Выделено два

кластера. Расстояние между кластерами равно 9,42. Дендрограмма результа-тов кластерного анализа представлена на рис. 5.4.2

Дендрограмма, представленная на рис 5.4.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.4 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.4.7) и символов Кронекера (таблица 5.4.8).

Таблица 5.4.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.4.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.5

Евклидово расстояние. По типовым представителям

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.5.1.

Таблица 5.5.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.5.2.

Таблица 5.5.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.5.2 выделено наибольшее расстояние между первым и шестым объектами. Их выбираем в качестве типовых и составим матрицу расстояний между выбранными типовыми и остальными объектами и подсчитаем разницу расстояний каждого объекта от типовых. Результаты вычислений представим в таблице 5.5.3.

Таблица 5.5.3

1

6

1-6

6-1

2

2,83

12,53

-9,70

9,70

3

3,16

10,44

-7,28

7,28

4

10,19

3,61

6.51

-6,51

5

12,87

2,24

10,63

-10,63

Жирным шрифтом в таблице 5.5.3 выделены наименьшие расстояния между первым и вторым объектами и шестым и пятым объектами. Их объединяем в объекты 1,2 и 5,6. Определим расстояния от укрупнённых объектов до третьего и четвёртого объектов, не вошедших в формируемые кластеры по правилу «ближайшего соседа». Аналогично таблице 5.5.3 составим следующую таблицу 5.5.4.

Таблица 5.5.4

1,2

5,6

1,2-5,6

5,6-1,2

3

3,16

9,06

-5,90

5,90

4

8,94

2,00

6,94

-6,94

По наименьшему расстоянию формируем два кластера 1,2,3 и 4,5,6.Таким образом, процесс кластерного анализа закончен. Выделено два кластера. Дендрограмма результатов кластерного анализа изображена на

Дендрограмма, представленная на рис 5.5.1, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.5 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.5.5) и символов Кронекера (таблица 5.5.6).

Таблица 5.5.5

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.5.6

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.6

Расстояние Хемминга. Ближайший сосед

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.6.1.

Таблица 5.6.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Хемминга по двум признакам. Проведение вычислений для второго и пятого объектов пояснено рис.5.6.1 и для второго и шестого объектов рис 5.6.2. Результаты вычислений расстояний по Хеммингу представлены в таблице 5.6.2.

Таблица 5.6.2

1

2

3

4

5

6

1

0

4

4

12

14

17

2

0

4

12

14

17

3

0

8

10

13

4

0

2,00

5

5

0

3

6

0

Жирным шрифтом в таблице 5.6.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.6.3.

Таблица 5.6.3

1

2

3

4,5

6

1

0

4

4

12

17

2

0

4

12

17

3

0

8

13

4,5

0

3

6

0

Далее процесс выделения объектов в кластеры производится аналогично ранее рассмотренным методам. По таблице 5.6.3 находим минимальное расстояние между объектом, включающим в себя 4 и 5 объекты, и 6 объектом, которые объединяем в объект 4,5,6 и составляем таблицу 5.6.4.

Таблица 5.6.4

1

2

3

4,5,6

1

0

4

4

12

2

0

4

12

3

0

8

4,5,6

0

Ввиду того, что расстояния между 1,2 и 3 объектами одинаковые и минимальные, то вначале объединяем 1 и 2 объекты и результаты такого объединения помещаем в таблицу 5.6.5. Затем к ним присоединяем 3 объект и результаты объединения помещаем в таблицу 5.6.7.

Таблица 5.6.6

1,2

3

4,5,6

1,2

0

4

12

3

0

8

4,5,6

0

Таблица 5.6.7

1,2,3

4,5,6

1,2,3

0

8

4,5,6

0

На рис.5.6.3 представлена дендрограмма результатов кластерного анализа.

Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.6.8) и символов Кронекера (таблица 5.6.9).

Таблица 5.6.8

1

2

3

4

5

6

1

0

4

4

12

14

17

2

0

4

12

14

17

3

0

8

10

13

4

0

2,00

5

5

0

3

6

0

Таблица 5.6.9

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+ 4+ 4+ 12+ 14+ 17+

0+ 0+ 4+ 12+ 14+ 17+

0+ 0+ 0+ 8+ 10+ 13+

0+ 0+ 0+ 0+ 2+ 5+

0+ 0+ 0+ 0+ 0+ 3 =139.

Среднее расстояние = 139/15=9,27.

Сумма расстояний между объектами, вошедшими в кластеры:

1•4+1•4+1•4+1•2+1•5+1•3=22.

Среднее расстояние между объектами в кластерах = 22/6=3,67.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•12+(1-0)•14+(1-0)•17+

+(1-0)•12+(1-0)•14+(1-0)•17+

+(1-0)•8+(1-0)•10+(1-0)•13= 117.

Среднее расстояние между объектами, находящимися в разных кластерах

=117/9=13.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 9,27/3,67=2,52; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 13/9,27=1,4.

Рассмотренные шесть примеров наглядно продемонстрировли методику применения основных методов кластерного анализа. Получение одинаковых результатов по всем рассмотренным методам объясняется сравнительной несложностью рассматриваемого примера. При усложнении примера следует ожидать различий в результатах кластерного анализа.

Задание 1.6

Пример 6.1

Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах методом скользящего среднего с шагом m=3 числа. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Вычислим сглаженные значения числа ПК:

Вычислим цепной годовой прирост:

Вычислим спрогнозированные значения числа ПК для оценки качества:

Вычислим среднее значение для трёх спрогнозированных лет:

Вычислим среднеквадратическую ошибку прогнозирования:

Вычислим отношение ошибки к среднему значению:

Так как отношение среднеквадратической ошибки к среднему значению превышает рекомендуемое значение 0.05 сравнительно на немного, то резуль-тат признаем допустимым.

Полученные результаты сглаживания и прогнозирования.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Число ПК:

сглаженное,

спрогнозир.

4026.6

4806.1

5650.6

6640.7

7485.1

7436.6

8032.0

8495.7

Спрогнозируем количество ПК в 2011, 2012, 2013 годах.

Вычислим спрогнозированные значения числа ПК для оценки качества:

Полученные результаты сглаживания и прогнозирования.

Год

2008

2009

2010

2011

2012

2013

Число ПК

8267,3

8743,7

9288,1

-

-

-

Число ПК:

спрогнозированное

7436.6

8032.0

8495.7

8832.6

9297.9

9719.9

На рис.6.1 результаты сглаживания и прогнозирования представлены в графическом виде.

Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах методом взвешенного скользящего среднего с шагом m=3 числа. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Вычислим сглаженные значения числа ПК:

Вычислим цепной годовой прирост:

Вычислим спрогнозированные значения числа ПК для оценки качества:

Вычислим среднее значение для трёх спрогнозированных лет:

Вычислим среднеквадратическую ошибку прогнозирования:

Вычислим отношение ошибки к среднему значению:

Так как отношение среднеквадратической ошибки к среднему значению меньше рекомендуемого значения 0.05 примерно в два раза, то результат прогнозирования признаем удовлетворительным.

Полученные результаты сглаживания и прогнозирования.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Число ПК:

сглаженное,

спрогнозир.

4026.6

4806.1

5585.7

6713.5

7550.1

8302,3

9020,1

9729,6

Спрогнозируем количество ПК в 2011, 2012, 2013 годах.

Вычислим спрогнозированные значения числа ПК для оценки качества:

Полученные результаты сглаживания и прогнозирования.

Год

2008

2009

2010

2011

2012

2013

Число ПК

8267,3

8743,7

9288,1

-

-

-

Число ПК:

спрогнозированное

8302,3

9020,1

9729,6

10434,7

11139,2

11843,0

Пример 6.3

Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах экспоненциальным методом с б=0,3. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Вычислим сглаженные значения числа ПК:

Вычислим цепной годовой прирост:

Вычислим спрогнозированные значения числа ПК для оценки качества:

Вычислим среднее значение для трёх спрогнозированных лет:

Вычислим среднеквадратическую ошибку прогнозирования:

Вычислим отношение ошибки к среднему значению:

Так как отношение среднеквадратической ошибки к среднему значению превышает рекомендуемое значение 0.05 более чем в четыре раза результат признаем неудовлетворительным.

Полученные результаты сглаживания и прогнозирования.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Число ПК:

сглаженное,

спрогнозир.

4150,5

4272,8

4703,9

5298.0

5967,1

5752,0

6155,9

6126,5

Спрогнозируем количество ПК в 2011, 2012, 2013 годах.

Полученные результаты прогнозирования.

Год

2008

2009

2010

2011

2012

2013

Число ПК

8267,3

8743,7

9288,1

-

-

-

Число ПК:

спрогнозированное

5752,0

6155,9

6126,5

6400,4

6462,0

6672,2

На рис.6.3 результаты сглаживания и прогнозирования представлены в графическом виде. среднеквадратическая ошибка одноразрядный число

Пример 6.4

Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах экспоненциальным методом с б=0,9. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Вычислим сглаженные значения числа ПК:

Вычислим цепной годовой прирост:

Вычислим спрогнозированные значения числа ПК для оценки качества:

Вычислим среднее значение для трёх спрогнозированных лет:

Вычислим среднеквадратическую ошибку прогнозирования:

Вычислим отношение ошибки к среднему значению:

Так как отношение среднеквадратической ошибки к среднему значению меньше рекомендуемого значения 0.05 более чем в четыре раза, то результат признаем вполне приемлемым.

Полученные результаты сглаживания и прогнозирования.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Число ПК:

сглаженное,

спрогнозир.

4150,5

4517,5

5590,4

6574,6

7433,0

8107.2

8799.8

9490.6

Спрогнозируем количество ПК в 2011, 2012, 2013 годах.

Полученные результаты прогнозирования.

Год

2008

2009

2010

2011

2012

2013

Число ПК

8267,3

8743,7

9288,1

-

-

-

Число ПК:

спрогнозированное

8107.2

8799.8

9490.6

10181.5

10872.5

11563.4

На рис.6.4 результаты сглаживания и прогнозирования представлены в графическом виде.

Пример 6.5

Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах методом наименьших квадратов с линейной функцией у=b0+b1·x. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.

Год

2003

2004

2005

2006

2007

2008

2009

2010

х

3

4

5

6

7

8

9

10

Число ПК=у

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Вычислим вспомогательные переменные:

Вычислим коэффициенты аппроксимирующего уравнения регрессии:

Таким образом получили аппроксимирующее уравнение:

y=1285.41+888.15·x.

Вычислим сглаженные значения числа ПК:

Вычислим спрогнозированные значения числа ПК для оценки качества:

Вычислим среднее значение для трёх спрогнозированных лет:

Вычислим среднеквадратическую ошибку прогнозирования:

Вычислим отношение ошибки к среднему значению:

Так как отношение среднеквадратической ошибки к среднему значению меньше рекомендуемого значения 0.05, то результат признаем удовлетвори-тельным.

Полученные результаты сглаживания и прогнозирования.

Год

2003

2004

2005

2006

2007

2008

2009

2010

Число ПК

4150,5

4558,3

5709,6

6684,0

7528,4

8267,3

8743,7

9288,1

Число ПК:

сглаженное,

спрогнозир.

3949.9

4838.0

5726.2

6614.3

7502.5

8390.6

9278.8

10166.9

Спрогнозируем количество ПК в 2011, 2012, 2013 годах.

Вычислим спрогнозированные значения числа ПК для оценки качества:

Год

2008

2009

2010

2011

2012

2013

Число ПК

8267,3

8743,7

9288,1

-

-

-

Число ПК:

спрогнозированное

8390.6

9278.8

10166.9

11055.1

11943.2

12831.4

Результаты сглаживания и прогнозирования в графическом виде представлены на рис. 6.5.

Размещено на Allbest.ru


Подобные документы

  • Важная роль простых чисел (ПЧ) в криптографии, генерации случайных чисел, навигации, имитационном моделировании. Необходимость закономерности распределения ПЧ в ряду натуральных чисел. Цель: найти закономерность среди ПЧ + СЧ, а потом закономерность среди

    доклад [217,0 K], добавлен 21.01.2009

  • Закон сохранения количества чисел Джойнт ряда в натуральном ряду чисел как принцип обратной связи чисел в математике. Структура натурального ряда чисел. Изоморфные свойства рядов четных и нечетных чисел. Фрактальная природа распределения простых чисел.

    монография [575,3 K], добавлен 28.03.2012

  • Понятие случайной величины, а также ее основные числовые характеристики. Случайная величина, подчиняющаяся нормальному закону распределения. Кривые плотности вероятности. Использование генератора случайных чисел. Изображение векторов в виде графика.

    лабораторная работа [301,4 K], добавлен 27.05.2015

  • Свойства чисел натурального ряда. Периодическая зависимость от порядковых номеров чисел. Шестеричная периодизация чисел. Область отрицательных чисел. Расположение простых чисел в соответствии с шестеричной периодизацией.

    научная работа [20,2 K], добавлен 29.12.2006

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Исторические факты исследования простых чисел в древности, настоящее состояние проблемы. Распределение простых чисел в натуральном ряде чисел, характер и причина их поведения. Анализ распределения простых чисел-близнецов на основе закона обратной связи.

    статья [406,8 K], добавлен 28.03.2012

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Сумма n первых чисел натурального ряда. Вычисление площади параболического сегмента. Доказательство формулы Штерна. Выражение суммы k-х степеней натуральных чисел через детерминант и с помощью бернуллиевых чисел. Сумма степеней и нечетных чисел.

    курсовая работа [8,2 M], добавлен 14.09.2015

  • Понятие математического моделирования: выбор чисел случайным образом и их применение. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов. Метод середины квадратов. Линейный конгруэнтный метод. Проверка случайных чисел.

    контрольная работа [55,5 K], добавлен 16.02.2015

  • Гипотеза Биля как неопределенное уравнение, не имеющее решения в целых положительных числах. Использование метода замены переменных. Запись уравнения в соответствии с известной зависимостью для разности квадратов двух чисел. Наличие дробных чисел.

    творческая работа [35,4 K], добавлен 25.06.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.