Информационная система исследования влияния экономических, социальных и экологических факторов на условия жизни в городе Елабуга

Исследование степени влияния экономических, экологических и социальных факторов на показатели комфортности проживания людей в городе. Вычисление парных коэффициентов корреляции, его программная реализация и создание данной информационной системы.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 21.02.2016
Размер файла 1,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Информационная система исследования влияния экономических, социальных и экологических факторов на условия жизни в городе Елабуга

1. Объект исследования

Объектом исследования в соответствии с заданием является город Елабуга.

Елабуга - город республиканского подчинения, центр Елабужского района.

Город Елабуга - небольшой и тихий, имеющий богатую, более чем двухсотлетнюю историю, известный в царской России и за ее пределами как торгово-купеческий - переживает свое новое рождение.

Город расположен на правом берегу реки Кама, в 210 км на восток от г. Казани и находится в географическом центре промышленно развитого региона. В радиусе 300-350 км размещены предприятия:

· металлургии - г. Ижевск;

· автомобилестроения - гг. Набережные Челны, Ижевск, Ульяновск, Тольятти;

· нефтехимии в гг. Нижнекамск, Уфа, Пермь, Казань;

· приборостроения - гг. Казань, Чистополь;

· электростанции - Кармановская, Заинская, Нижнекамская.

2. Цели и задачи, подлежащие решению

Целью проведения данного исследования является повышение эффективности исследования влияния экономических, социальных и экологических факторов на условия проживания жителей в городе Елабуга.

В данной работе поставлены и решены следующие задачи.

Исследование степени влияния экономических, экологических и социальных факторов на показатели комфортности проживания людей в городе. Для решения данной задачи требуется обеспечить:

· Ввод исходных статистических данных (ИСД).

· Вычисление основных статистических характеристик ИСД.

· Проверку исходных данных на нормальность.

· Представление результатов в графическом виде.

· Регрессионный анализ.

3. Исследование экономических, социальных и экологических показателей города Елабуга

a. Предварительный анализ комфортности проживания людей в городе Елабуга и постановка задачи

Для исследования влияния экономических, социальных и экологических факторов комфортности проживания жителей в г. Елабуга, далее называемым городом, использованы годовые значения статистических данных за 1995-2005 гг., приведенные в Таблице 1. В качестве откликов выбраны 27 показателей комфортности проживания жителей в городе, такие как рождаемость, смертность, естественный прирост, количество зарегистрированных браков, разводов и разность между ними - yj, j=. В качестве влияющих на них факторов выбраны экономические, социальные и экологические факторы, характеризующие среду обитания населения - xi, i=. Эти отклики и факторы представляют собой совокупность переменных - vj, . Перечень переменных приведен в Таблице 1.

Таблица 1. Перечень переменных

Факторы:

X1

Численность населения (чел.)

X2

Численность населения трудоспособного возраста (чел.)

X3

Численность работающих на крупных предприятиях (чел.)

X4

Уровень безработицы (%)

X5

Объем промышленной продукции (млн. руб., до 1997 г. - млрд. руб.)

X6

Среднемесячная заработная плата (руб., до 1997 г. - тыс. руб.)

X7

Прожиточный минимум на члена семьи (руб., до 1997 г. - тыс. руб.)

X8

Стоимость набора из 25 основных продуктов питания (руб., до 1997 г. - тыс. руб.)

X9

Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.)

X10

Ввод жилых домов (кв. м. общ. пл.)

X11

Объем реализации платных услуг в расчете на 1 жителя (руб., до 1997 г. - тыс. руб.)

X12

Объем реализации бытовых услуг в расчете на 1 жителя (руб., до 1997 г. - тыс. руб.)

X13

Оборот розничной торговли на душу населения (руб., до 1997 г. - тыс. руб.)

X14

Оборот общественного питания на душу населения (руб., до 1997 г. - тыс. руб.)

X15

Обеспеченность населения больничными койками (на 1000 чел.)

X16

Обеспеченность населения врачами (на 1000 чел.)

X17

Обеспеченность населения средним медицинским персоналом (на 1000 чел.)

X18

Общая раскрываемость преступлений (%)

X19

Потребление чистой воды (млн. куб. л.)

X20

Выброс вредных веществ в атмосферу (кг)

X21

Выброс вредных веществ в водоемы

Отклики:

Y1

Средняя продолжительность жизни (лет)

Y2

Рождаемость (чел.)

Y3

Количество умерших (чел.)

Y4

Естественный прирост (чел.)

Y5

Количество зарегистрированных браков (шт.)

Y6

Количество расторгнутых браков (шт.)

Y7

Разница между заключенными и расторгнутыми браками (шт.)

Y8

Число умерших людей в возрасте до 1 года (на 1000 чел.)

Y9

Заболеваемость туберкулезом (на 100 тыс. чел.)

Y10

Заболеваемость онкологическими заболеваниями (на 100 тыс. чел.)

Y11

Заболевания органов дыхания (на 1000 чел.)

Y12

Заболеваемость системы кровообращения (на 1000 чел.)

Y13

Общее количество преступлений (шт.)

Y14

Количество особо тяжких преступлений (шт.)

Y15

Количество тяжких преступлений (шт.)

Y16

Количество преступлений средней тяжести (шт.)

Y17

Количество преступлений небольшой тяжести (шт.)

Y18

Количество умышленных убийств (шт.)

Y19

Количество причинений вреда здоровью (шт.)

Y20

Количество умышленных причинений тяжкого вреда здоровью (шт.)

Y21

Количество краж (шт.)

Y22

Количество мошенничеств (шт.)

Y23

Количество грабежей (шт.)

Y24

Количество разбоев (шт.)

Y25

Количество вымогательств (шт.)

Y26

Количество неправомерных завладений АМТ (шт.)

Y27

Количество хулиганств (шт.)

Квартальные значения статистических данных за 1995-2005 годы по переменным Таблицы 1. приведены в Таблице 2.

В Таблице 2 количество строк равно количеству квартальных значений по экономических, социальным и экологическим факторам, а также рождаемости, смертности, естественному приросту, количеству зарегистрированных браков, разводов, их разности (по всем рассматриваемым переменным). По столбцам Таблицы 2 записаны значения, принимаемые переменными в квартальных отчетах.

Таблица 2. Квартальные статистические данные

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

1995 (1)

65876

38272

28900

1,8

144,7

205,1

238,4

135,3

16

9083

50

8,1

568,1

23,1

125,8

37

162,6

1995 (2)

65911

38415

28100

2

150,1

280,7

238,4

142,4

16,1

10015

54

7,6

570,2

22,7

125,6

36,9

162,6

1995 (3)

66053

38574

27410

2,3

155,2

342,6

238,4

145,7

16,25

9865

54

9,2

579,3

22,4

125,3

36,3

162,6

1995 (4)

66271

38732

26800

2,8

128,8

473,6

238,4

149,8

16,4

7372

56

8

597,8

22,7

124,8

36,2

162,6

1996 (1)

66394

38911

26935

3,1

200

548,9

292,6

152,3

16,4

7515

140,2

17,5

798,9

38,5

124,7

36,3

162,6

1996 (2)

66875

39241

27027

3,4

199,95

611,3

292,6

154,5

16,3

7800

141,1

18,3

850,6

41,1

124,5

36,7

162,6

1996 (3)

67012

39610

27120

3,5

202,6

717,1

292,6

159,4

16,3

7950

150,1

16,6

897

40,7

124,3

36,7

162,6

1996 (4)

67356

39942

27300

3,7

197,25

779,2

292,6

164,5

16,3

8601

158,4

21,5

1006,1

43,2

123,9

37,1

162,6

1997 (1)

67403

40105

27421

4

220,6

812,5

350,1

170,2

16,5

9980

180,9

22,3

911,1

40,5

120,1

37

164,5

1997 (2)

67584

40318

27243

4,2

245,7

867,6

350,1

176,4

16,8

11500

165,7

22,1

862,1

39,9

118,2

36,8

167,8

1997 (3)

67666

40513

27130

4,4

253,7

897,4

350,1

180,3

16,9

12200

191,9

24,9

812,6

42,3

115,3

36,8

169,5

1997 (4)

67851

40684

27041

4,55

240,5

938,8

350,1

184,6

17

12155

235,4

27,5

870,3

38,5

114,8

36,7

170,7

1998 (1)

67925

40876

27010

5,1

50,1

950,1

539,9

200,8

17

6805

200,3

32,2

690,3

40,2

100,3

36,4

170,5

1998 (2)

67997

40917

26815

5,7

55,2

960,7

539,9

250,7

17

6570

235,4

35,7

711,6

42,8

90,2

36,2

169

1998 (3)

68139

41324

26300

5,9

46,3

970,3

539,9

287,7

17

6800

226,8

32,2

710,8

41,9

85,8

35,5

169

1998 (4)

68350

41655

25742

6,27

50,5

1045

539,9

318,56

17

7045

195,2

39,1

697

41,5

84,3

35

168,9

1999 (1)

68627

41819

25786

6,1

99,8

1070

757,6

348,1

17,2

5550

315,2

50,3

805,8

45,7

84,3

34,9

167

1999 (2)

68211

41943

26304

5,4

102,3

1124,5

757,6

370,5

17,3

4970

310,1

57,8

875,1

49,1

84,3

34,5

166,5

1999 (3)

67789

42058

26258

5,1

104,6

1198,2

757,6

398,1

17,4

5160

320,7

52,1

887,6

47,5

84,2

34,45

165,4

1999 (4)

68426

42258

26207

4,8

96,7

1301

757,6

435,39

17,5

5448

307,4

53,9

934,2

51,4

84,2

34,4

163

2000 (1)

68401

42347

26118

4,1

116

1500,6

881,4

457,3

17,8

7970

425,6

71,2

1187,5

125,6

88,6

34,7

163

2000 (2)

68334

42416

25987

3,2

152

1640

881,4

488,8

17,9

8245

431,8

74,9

1207,1

173,5

89

34,8

163

2000 (3)

68225

42552

25756

2,5

140

1780

881,4

512,3

18

8543

455,8

66,8

1224,3

190,1

92,5

34,9

162,8

2000 (4)

68101

42684

25698

1,87

151,8

2098

881,4

528,68

18,2

8225

489,1

72,8

1198,1

205,55

96,7

35,1

162,8

2001 (1)

68006

42847

25711

1,8

200

2169

981,62

550,4

18,3

4900

638,9

96,2

1650,8

285,3

96,7

35,2

163

2001 (2)

67986

42916

25689

1,7

208,6

2570

981,62

586

18,5

5045

651,3

99,3

1589,3

290,4

97

35,4

163,9

2001 (3)

67982

43081

25986

1,6

246,2

2768,5

981,62

621,3

18,6

5005

654,9

100,9

1668,1

292,5

97,1

35,7

164,5

2001 (4)

67969

43180

26095

1,55

203,3

3098,3

981,62

662,93

18,7

5377

647

98,7

1488,8

292,8

97,71

34,9

165,8

2002 (1)

68015

43281

26541

1,6

232,8

3302,6

1548,75

712,4

18,8

6045

1350,17

131

1847,5

356,1

95,3

35,2

164,9

2002 (2)

67987

43458

26582

1,7

312,5

3458,8

1548,75

745,6

18,8

5990

1401,2

129,4

1925

374,5

94,1

35,3

165,7

2002 (3)

67972

43513

36645

1,7

359,8

3684

1548,75

778,9

18,9

6103

1357,8

135,2

1715,4

380,3

93,4

35,8

166,2

2002 (4)

67647

43601

26903

1,85

252,7

3983,5

1548,75

801,43

19

6045

1246,2

132

1857,1

387,1

91,28

36

166,8

2003 (1)

67996

43874

26315

1,85

467,2

3999,1

1768,25

824,6

19

6700

1368,1

149

2487,3

420,8

90,5

36

166,8

2003 (2)

68100

44521

26046

1,9

538,1

4102

1768,25

864,1

19

6200

1423,5

156,5

2214,8

427,1

89,8

36,1

165,4

2003 (3)

68547

44986

25936

1,9

528,5

4184

1768,25

879,5

19

5970

1411,1

164,2

2187,5

431,5

89,8

36,1

165

2003 (4)

69145

45352

25280

1,92

480

4529,3

1768,25

895,21

19

7915

1584

156,7

2683,9

428,6

88,1

36,6

165

X18

X19

X20

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

Y11

Y12

Y13

Y14

1995 (1)

74,1

1,7

18,7

61,5

121

110

-11

110

103

7

14,3

50

201,2

329,7

20,5

316

0

1995 (2)

76,5

2,7

21,5

62,1

197

211

14

81

74

7

11,5

50,1

202,2

329,8

21

573

0

1995 (3)

77,1

2,87

24,3

62,2

211

235

24

96

70

26

10,2

50,2

204

330

21

812

0

1995 (4)

79

1,9

15,44

62,1

135

209

74

75

48

27

7,2

50,5

204,5

330,3

21,6

1059

0

1996 (1)

79,6

1,6

15,6

63,1

86

123

37

89

86

3

10,6

65,6

204

320,1

21

235

0

1996 (2)

80,7

2,8

20,7

63,1

218

214

-4

48

111

-63

15,8

70,1

203,3

315

21,8

514

0

1996 (3)

80,6

2,5

20,2

63,2

173

219

46

108

68

40

17,4

78,7

202,1

312,6

21,8

759

0

1996 (4)

81,3

1,66

18,42

63,2

202

214

12

87

55

32

19,3

83,8

201

306,1

22,6

1040

0

1997 (1)

77,8

1,9

16,1

64,8

64

98

34

67

94

-27

18,9

77,4

199

310,1

20,7

236

9

1997 (2)

78,4

2,7

19,5

64,8

214

189

-25

101

86

15

19,1

70,5

195,6

318,7

19

461

16

1997 (3)

80

3,06

18,7

65

220

231

11

111

79

32

19,3

66,4

194

321,5

18

677

26

1997 (4)

81,7

2,7

19,1

65,4

148

217

69

54

58

-4

19,4

60,3

192,5

339,4

16,7

869

36

1998 (1)

76,9

1,8

16,4

65,3

132

74

-58

74

75

-1

20,6

70,1

183,4

305,1

14,2

248

11

1998 (2)

73,8

2,8

17,25

64,2

144

211

67

78

66

12

21,8

75,9

178,8

250,1

13,1

478

20

1998 (3)

73,5

3,1

18,1

64

158

115

-43

98

57

41

23,2

77,7

164

241,8

12,2

814

37

1998 (4)

69,7

2,5

17,15

63,7

184

274

90

68

53

15

24,8

80,4

156,9

231,2

9,7

1288

49

1999 (1)

53,1

2,3

18,4

63,5

49

84

35

88

93

-5

24,2

78,7

198

230,3

14,5

424

14

1999 (2)

60,7

3,64

21,5

63,1

217

159

-58

70

72

-2

23,7

75,21

210,3

235,1

15,1

854

31

1999 (3)

68,7

3,65

22,3

63,1

238

260

22

101

46

55

23,1

73,8

225,5

240,1

16,4

1381

42

1999 (4)

73

2,4

19,95

63,1

106

209

103

91

49

42

22,3

72,2

247,1

242,1

17

1802

67

2000 (1)

76,1

1,85

18,7

62

57

112

55

80

102

-22

18,8

73,8

237

250,6

19,4

402

15

2000 (2)

78,8

3,5

20,8

62

128

201

73

67

81

-14

15,1

75,5

230,5

261,1

20

857

32

2000 (3)

79,6

3,55

22

62

243

172

-71

107

59

48

14,3

77,4

224,4

260,8

22,5

1293

56

2000 (4)

79,8

1,69

21,53

62,1

214

219

5

90

77

13

13,9

78,5

221,5

277,7

25,4

1754

73

2001 (1)

70,7

2,1

19,5

61,5

98

215

117

186

166

20

14,6

78

225,4

260,1

23,1

418

29

2001 (2)

66,6

3,8

20,5

62,6

157

158

1

158

153

5

15,1

77,8

230,1

250,4

20,7

932

108

2001 (3)

67,1

4

22,8

62,7

218

223

5

82

41

41

16,8

77,7

232,4

237,7

18,1

1369

116

2001 (4)

68,9

2,4

21,7

62,4

206

234

28

35

24

11

18

77,6

234,1

235,7

17,4

1844

142

2002 (1)

60,4

1,99

20,2

61,5

96

203

107

187

211

-24

18,3

75,1

240,1

240,1

17

414

23

2002 (2)

57,7

3,6

25,4

61,4

183

217

34

86

81

5

16,4

73

241,1

254

16,5

738

34

2002 (3)

56,4

3,7

22,2

60,5

269

228

-41

113

116

-3

10,8

70,5

246,7

274,1

16,4

1052

54

2002 (4)

55,9

2,41

18,4

60,6

254

202

-52

127

84

43

11

68,9

251,2

295,5

16

1444

67

2003 (1)

47,4

2,2

19,1

60,6

126

125

-1

215

184

31

10,8

60,8

248,7

270,1

16

374

19

2003 (2)

52,4

3,7

24,4

60,5

216

234

18

79

111

-32

9,7

59

245,1

248

16

776

37

2003 (3)

53,4

3,58

22,1

60,5

220

238

18

153

90

63

9,7

57,4

245

241,3

15,9

1160

60

2003 (4)

54,6

2,62

20,3

60,6

229

219

-10

90

82

8

9,3

56,4

244,9

238,8

15,9

1499

84

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

Y24

Y25

Y26

Y27

1995 (1)

0

0

0

2

0

5

123

15

12

2

2

2

49

1995 (2)

0

0

0

4

0

13

327

216

35

21

7

6

7

1995 (3)

0

0

0

7

0

17

460

302

39

25

11

7

18

1995 (4)

0

0

0

15

0

22

595

399

39

33

15

12

24

1996 (1)

117

0

0

3

18

8

74

2

10

1

4

3

26

1996 (2)

245

0

0

11

22

7

281

178

15

22

2

4

14

1996 (3)

332

0

0

14

39

9

404

263

28

26

6

4

23

1996 (4)

432

0

0

18

45

13

530

342

29

33

8

4

30

1997 (1)

121

52

64

6

20

7

130

77

8

5

1

1

11

1997 (2)

229

103

113

9

22

11

264

163

14

15

3

2

15

1997 (3)

347

128

176

12

46

15

385

245

21

19

6

2

20

1997 (4)

465

160

208

17

62

21

508

319

36

28

8

5

20

1998 (1)

135

40

62

3

20

8

146

94

17

5

6

2

0

1998 (2)

266

85

107

9

54

23

271

193

29

19

7

1

1

1998 (3)

428

137

212

15

72

29

452

330

43

24

11

7

11

1998 (4)

691

224

324

17

94

33

778

622

41

36

15

10

13

1999 (1)

256

62

92

1

26

11

294

243

8

17

7

4

2

1999 (2)

476

147

200

7

47

16

567

436

19

37

13

8

8

1999 (3)

713

259

367

11

83

21

885

648

35

46

13

15

10

1999 (4)

897

366

472

12

113

35

1095

802

62

56

20

22

14

2000 (1)

191

87

109

4

22

10

246

188

16

8

2

5

2

2000 (2)

407

195

223

7

49

6

520

401

26

25

7

9

2

2000 (3)

597

287

353

14

77

12

777

581

59

27

13

13

5

2000 (4)

816

374

491

16

95

17

1049

790

68

45

19

18

6

2001 (1)

229

63

97

5

33

9

260

194

14

23

4

9

1

2001 (2)

457

162

205

14

62

18

505

364

33

44

9

10

5

2001 (3)

672

241

340

17

83

22

752

518

38

64

14

20

6

2001 (4)

904

309

489

22

108

33

1010

710

50

85

22

26

9

2002 (1)

200

78

113

7

23

11

231

165

8

28

4

8

5

2002 (2)

375

125

204

9

45

18

397

273

25

60

5

13

9

2002 (3)

517

206

275

14

77

27

567

382

29

85

16

14

23

2002 (4)

662

323

392

16

97

32

809

570

37

109

23

18

30

2003 (1)

102

144

109

1

16

7

228

158

7

30

10

4

12

2003 (2)

197

266

276

6

36

12

443

326

10

53

20

8

15

2003 (3)

304

373

423

9

51

18

686

494

30

72

25

13

31

2003 (4)

412

479

524

14

70

27

915

656

41

112

30

15

37

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

2004 (1)

69158

45541

25320

1,95

494,9

4790,1

1962,25

917,5

19

4152

1811,3

161,5

2956,8

450

85,6

36,6

164,7

2004 (2)

69203

46125

25450

1,95

602,7

4830

1962,25

967

19,1

3871

1915,6

169,8

3005,8

461

84,4

36,8

166,1

2004 (3)

69341

46274

25480

2

589,5

4952,6

1962,25

988,4

19,1

4213

1907,1

167,8

3001,7

455,2

83,5

36,8

165

2004 (4)

69400

46511

25658

2,01

594

5264,6

1962,25

1044,81

19,2

4607

1906

166,1

3120,7

471,8

83

37

165,3

2005 (1)

69546

46712

25782

2,1

541,2

5345,1

2155,8

1102

19,2

4273

1917,5

172,5

3115,1

478,2

83,5

37

165,7

2005 (2)

69687

46874

25751

2,1

617,3

5387,2

2155,8

1245

19,2

4545

1958,7

177,4

3250,2

481,5

84,2

37,5

165,8

2005 (3)

69875

47022

25731

2,2

601,1

5406,7

2155,8

1322

19,4

4680

2015

176,7

3114,3

485,6

84,2

37,7

166,1

X18

X19

X20

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

Y11

Y12

Y13

Y14

2004 (1)

1,85

20,2

61,2

118

126

8

113

78

35

8,8

52,8

241,5

282,1

16,7

376

29

2004 (2)

3,4

25,1

61,8

226

268

42

94

76

18

8,5

50,1

238,4

274

17,1

865

41

2004 (3)

3,45

25,6

61,8

273

187

-86

208

73

135

7,3

44,4

236

278,1

17,5

1293

51

2004 (4)

2,17

16,2

62

228

280

52

162

64

98

6,7

41,3

235,4

280,6

18,8

1691

58

2005 (1)

2,01

17,8

62,4

180

152

-28

145

84

61

6,8

42,1

215

278,4

20,1

426

28

2005 (2)

3,5

25,8

62,4

215

214

-1

79

52

27

7,05

46,7

200,4

279,6

25,4

798

40

2005 (3)

3,4

23,5

62,5

314

165

-149

197

77

120

7,3

48,6

174

276,5

29,1

1428

52

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

Y24

Y25

Y26

Y27

2004 (1)

89

133

125

4

19

15

246

178

15

22

7

5

10

2004 (2)

208

355

261

6

44

26

573

406

28

58

15

12

29

2004 (3)

279

519

444

8

72

37

837

586

50

85

18

20

46

2004 (4)

390

681

562

10

95

46

1111

777

64

133

22

27

49

2005 (1)

129

158

111

7

24

11

275

180

16

47

8

8

3

2005 (2)

214

288

256

9

49

21

484

316

34

79

13

8

20

2005 (3)

325

577

474

11

96

34

910

621

70

130

17

12

28

Для наглядности исходные статистические данные (ИСД) представлены в виде временных графиков на рис. 1-12.

Рис. 1. График изменения численности населения за 1995-2005 годы

Рис. 2. График изменения объема промышленной продукции за 1995-2005 годы

Рис. 3. График изменения средней заработной платы за 1995-2005 годы

Рис. 4. График изменения уровня безработицы за 1995-2005 годы

Рис. 5. График изменения общей раскрываемости преступлений за 1995-2005 годы

Рис. 6. График изменения средней продолжительности жизни за 1995-2005 годы

Рис. 7. График изменения рождаемости за 1995-2005 годы

Рис. 8. График изменения смертности за 1995-2005 годы

Рис. 9. График изменения количества зарегистрированных браков за 1995-2005 годы

Рис. 10. График изменения заболеваемости онкологическими заболеваниями за 1995-2005 годы

информационный корреляция программный

Рис. 11. График изменения общего количества преступлений за 1995-2005 годы

Рис. 12. График изменения количества краж за 1995-2005 годы

Характер изменения переменных во времени (рис. 1. - 12.) убедительно показывает наличие в них случайности. Так как все отобранные для исследования переменные (таблица 1) непрерывные и количественные, то для исследования целесообразно применять регрессионный анализ. Поскольку имеется сравнительно большое количество факторов (М = 20) то целесообразно проведение факторного анализа, который позволяет значительно уменьшить количество факторов, используемых при исследовании.

Ставится задача разработки модели комфортности проживания жителей в городе, состоящего из совокупности регрессионных моделей, функционально представляемых в следующем виде:

; (1)

,

где yj - j-й показатель комфортности проживания жителей в городе;

K - количество показателей комфортности проживания жителей в городе;

xi - i-й фактор, влияющий на комфортность проживания жителей в городе;

M - общее количество экономических, экологических и социальных факторов.

По зависимостям (2.1.1) можно произвести оценку степени влияния факторов на показатели комфортности жизни жителей в городе по коэффициентам эластичности и бета-коэффициентам.

Для временного прогнозирования найдем зависимости переменных от времени, функционально представляемых в следующем виде:

; (2)

,

где M - количество факторов;

K - количество откликов.

Задача факторного анализа заключается в сокращении в исследовании количества факторов, которых у нас сорок два, и выделении из них общих скрытых факторов Fz, , которые далее будем называть просто общими факторами, и характерных факторов Ui, . Если у фактора только одна нагрузка, значительно отличающаяся от нуля, то он называется характерным фактором. Требуется найти зависимости:

; (3)

.

При условии, что R много меньше M и все Fz ортогональны по отношению друг к другу и требуется оценить степень влияния общих факторов Fz, и характерных факторов Ui, , на экономические показатели деятельности предприятия (yj) [8].

Для получения математических зависимостей (1) - (3) в аналитическом виде и обеспечения корректности получаемых результатов предлагается методика, которая должна включать в себя следующие этапы:

1) Выбор совокупности основных статистических показателей, описывающих условия проживания жителей в городе и сбор ИСД по ним за двенадцать лет.

2) Вычисление основных статистических характеристик ИСД: оценок математического ожидания (среднего); среднего квадратического (стандартного) отклонения; ошибки вычисления среднего значения; асимметрии, эксцесса и их ошибок; построение доверительных интервалов.

3) Оценка нормальности распределения ИСД (их подчинения нормальному закону);

4) Факторный анализ.

5) Вычисление парных коэффициентов линейной корреляции.

6) Получение уравнений регрессии, представляющих собой зависимость комфортности проживания жителей в городе от влияющих на факторов.

b. Основные статистические характеристики исходных данных. Вычисление основных статистических характеристик ИСД. Проверка «нормальности»

Важным способом «описания» переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Нас интересует, насколько точно распределение можно аппроксимировать нормальным распределением. Простые описательные статистики дают об этом некоторую информацию. Первоначальное самое общее представление о распределении случайных величин может быть получено на основе анализа их основных статистических характеристик. Будем обозначать и называть их так, как это принято в пакете Statistica 6.0.

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы. Точная форма нормального распределения (характерная «колоколообразная кривая») определяется только двумя параметрами: средним и стандартным отклонением.

Характерное свойство нормального распределения состоит в том, что 68% всех его наблюдений лежат в диапазоне ±1 стандартное отклонение от среднего, а диапазон ±2 стандартных отклонения содержит 95% значений. Другими словами, при нормальном распределении, стандартизованные наблюдения, меньшие -2 или большие +2, имеют относительную частоту менее 5%. (Стандартизованное наблюдение означает, что из исходного значения вычтено среднее и результат поделен на стандартное отклонение (корень из дисперсии)) [22].

Итак, первоначально дадим определение основным статистическим характеристикам и попытаемся найти их оценки. А далее, оценим насколько распределение выбранных нами переменных близко к нормальному распределению.

Среднее - среднее арифметическое значение (оценка математического ожидания):

; (4)

,

где n - количество учитываемых временных интервалов;

M - количество факторов;

К - количество откликов;

vij - значение j-й переменной на i-ом временном интервале;

- среднее арифметическое значение j-той переменной по n экспериментальным значениям;

i - номер строки, в таблицах исходных данных;

j - номер столбца, в таблицах исходных данных.

Далее во всех формулах данного раздела используются одни и те же обозначения переменных, что применялись выше, поэтому нет необходимости их дальнейшего пояснения.

Стандартное отклонение (оценка среднего квадратического отклонения) - это мера того, насколько широко распределены экспериментальные данные относительно их среднего значения:

; (5)

.

Дисперсия.

Квадрат среднего квадратичного отклонения даёт величину дисперсии :

; (6)

.

Стандартная ошибка среднего - отношение стандартного отклонения к корню квадратному из количества учитываемых временных интервалов:

; (7)

,

где - стандартное отклонение, вычисленное по формуле (6).

Медиана - это число, которое является серединой совокупности случайных чисел, то есть половина случайных чисел имеют значения, меньшие, чем медиана, а другая половина чисел имеют значения, большие, чем медиана.

Асимметрия характеризует степень несимметричности распределения относительно его среднего. Для нормального закона асимметрия равна нулю. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение в сторону отрицательных значений. Оценка асимметрии вычисляется по формуле:

; (8)

.

Стандартная ошибка асимметрии:

, (9)

где n - количество учитываемых временных интервалов.

Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Для нормального распределения эксцесс равен нулю. Положительный эксцесс соответствует относительно остроконечному распределению. Отрицательный эксцесс соответствует относительно сглаженному распределению:

; (10)

.

Средняя ошибка эсцесса:

, (11)

где n - количество учитываемых временных интервалов.

Минимум - минимальное значение.

Максимум - максимальное значение.

Счет - количество экспериментальных данных.

Вычисленные по формулам 4-11 статистические характеристики приведены в таблице 3.

Закон распределения. Наиболее существенной характеристикой распределения случайных величин является закон распределения, который наиболее полно показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называются интервалами группировки.

Таблица 3. Основные статистические характеристики ИСД

Описательная статистика

Счет

Среднее

Медиана

Сумма

Минимум

Максимум

Дисперсия выборки

Стандартное отклонение

x1

43

68007,88

67997,00

2924339

65876,00

69875,00

946234

972,746

x2

43

42461,28

42416,00

1825835

38272,00

47022,00

6280301

2506,053

x3

43

26635,09

26258,00

1145309

25280,00

36645,00

3049195

1746,195

x4

43

3,05

2,20

131

1,55

6,27

2

1,483

x5

43

269,18

203,30

11575

46,30

617,30

32898

181,379

x6

43

2347,41

1640,00

100939

205,10

5406,70

3033068

1741,570

x7

43

1017,46

881,40

43751

238,40

2155,80

438434

662,144

x8

43

535,38

488,80

23021

135,30

1322,00

119297

345,395

x9

43

17,82

17,90

766

16,00

19,40

1

1,121

X10

43

6907,05

6570,00

297003

3871,00

12200,00

4727123

2174,195

x11

43

759,45

431,80

32656

50,00

2015,00

473748

688,293

x12

43

83,34

71,20

3584

7,60

177,40

3623

60,188

x13

43

1519,39

1198,10

65334

568,10

3250,20

772109

878,698

x14

43

212,11

173,50

9121

22,40

485,60

33103

181,942

x15

43

98,63

92,50

4241

83,00

125,80

246

15,693

x16

43

36,02

36,20

1549

34,40

37,70

1

0,908

x17

43

165,25

165,00

7106

162,60

170,70

5

2,330

x18

43

66,80

69,70

2872

47,30

81,70

146

12,075

x19

43

2,72

2,70

117

1,60

4,00

1

0,730

x20

43

20,31

20,20

873

15,44

25,80

8

2,785

y1

43

62,51

62,40

2688

60,50

65,40

2

1,334

y2

43

178,72

197,00

7685

49,00

314,00

3888

62,355

y3

43

191,81

211,00

8248

74,00

280,00

2744

52,383

y4

43

13,09

14,00

563

-149,00

117,00

2937

54,196

y5

43

105,77

91,00

4548

35,00

215,00

1884

43,409

y6

43

83,93

77,00

3609

24,00

211,00

1361

36,886

y7

43

21,84

15,00

939

-63,00

135,00

1394

37,336

y8

43

14,92

15,10

642

6,70

24,80

31

5,586

y9

43

66,07

70,50

2841

41,30

83,80

158

12,560

y10

43

216,43

221,50

9306

156,90

251,20

613

24,764

y11

43

276,38

274,10

11884

230,30

339,40

1144

33,830

y12

43

18,58

18,00

799

9,70

29,10

14

3,729

y13

43

884,72

814,00

38043

235,00

1844,00

218299

467,225

y14

43

37,35

32,00

1606

0,00

142,00

1069

32,703

y15

43

344,79

304,00

14826

0,00

904,00

57580

239,958

y16

43

190,37

147,00

8186

0,00

681,00

28547

168,960

y17

43

215,19

204,00

9253

0,00

562,00

29264

171,067

y18

43

9,84

9,00

423

1,00

22,00

27

5,177

y19

43

49,44

46,00

2126

0,00

113,00

1022

31,972

y20

43

18,44

17,00

793

5,00

46,00

100

10,003

y21

43

520,93

484,00

22400

74,00

1111,00

82924

287,964

y22

43

365,65

326,00

15723

2,00

802,00

46535

215,720

y23

43

30,42

29,00

1308

7,00

70,00

298

17,277

y24

43

44,05

33,00

1894

1,00

133,00

1138

33,741

y25

43

11,35

10,00

488

1,00

30,00

51

7,111

y26

43

9,67

8,00

416

1,00

27,00

45

6,718

y27

43

16,26

13,00

699

0,00

49,00

171

13,081

x1

148,3423

-0,370816

0,361358

0,20546

0,709035

x2

382,1695

0,159959

0,361358

-0,79825

0,709035

x3

266,2922

4,702195

0,361358

26,58146

0,709035

x4

0,2262

0,837132

0,361358

-0,69592

0,709035

x5

27,6600

0,792158

0,361358

-0,76510

0,709035

x6

265,5870

0,514599

0,361358

-1,28102

0,709035

x7

100,9760

0,427622

0,361358

-1,31017

0,709035

x8

52,6722

0,511764

0,361358

-0,84256

0,709035

x9

0,1710

-0,146950

0,361358

-1,55993

0,709035

X10

331,5616

0,809377

0,361358

0,09733

0,709035

x11

104,9637

0,685823

0,361358

-1,17096

0,709035

x12

9,1786

0,288999

0,361358

-1,50186

0,709035

x13

134,0001

0,783642

0,361358

-0,79451

0,709035

x14

27,7459

0,302610

0,361358

-1,70022

0,709035

x15

2,3932

0,812490

0,361358

-0,99516

0,709035

x16

0,1384

-0,237886

0,361358

-1,10816

0,709035

x17

0,3554

0,673924

0,361358

-0,26805

0,709035

x18

1,8414

-0,325754

0,361358

-1,53445

0,709035

x19

0,1113

0,107436

0,361358

-1,36638

0,709035

x20

0,4246

0,259291

0,361358

-0,56386

0,709035

y1

0,2035

0,456552

0,361358

-0,30285

0,709035

y2

9,5091

-0,294371

0,361358

-0,50524

0,709035

y3

7,9884

-0,636641

0,361358

-0,39261

0,709035

y4

8,2648

-0,498234

0,361358

0,84165

0,709035

y5

6,6199

1,090615

0,361358

0,54642

0,709035

y6

5,6250

1,701841

0,361358

3,56164

0,709035

y7

5,6937

0,886719

0,361358

2,09139

0,709035

y8

0,8519

0,098642

0,361358

-1,22610

0,709035

y9

1,9154

-0,578830

0,361358

-1,11316

0,709035

y10

3,7765

-0,483950

0,361358

-0,58495

0,709035

y11

5,1590

0,360644

0,361358

-1,22705

0,709035

y12

0,5687

0,347621

0,361358

0,73213

0,709035

y13

71,2511

0,456941

0,361358

-0,82229

0,709035

y14

4,9871

1,223421

0,361358

1,80437

0,709035

y15

36,5932

0,681457

0,361358

-0,10805

0,709035

y16

25,7662

1,001447

0,361358

0,68341

0,709035

y17

26,0875

0,425861

0,361358

-0,97691

0,709035

y18

0,7896

0,192700

0,361358

-0,72543

0,709035

y19

4,8757

0,265400

0,361358

-0,95536

0,709035

y20

1,5255

0,782571

0,361358

-0,07017

0,709035

y21

43,9142

0,494795

0,361358

-0,76096

0,709035

y22

32,8970

0,448414

0,361358

-0,71240

0,709035

y23

2,6347

0,641488

0,361358

-0,24552

0,709035

y24

5,1455

1,123610

0,361358

0,66943

0,709035

y25

1,0844

0,621171

0,361358

-0,29549

0,709035

y26

1,0245

0,870505

0,361358

0,18668

0,709035

y27

1,9948

0,979832

0,361358

0,40829

0,709035

Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по (4) и (5).

Функция плотности нормального закона имеет вид:

, (12)

Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимают критерий Колмогорова - Смирнова [9], используемый в пакете прикладных программ (ППП) Statistica 6.0 [4].

; (13)

где: F*(vij) - эмпирическая функция распределения j-ой переменной для i-го значения;

F(vij) - гипотетическая функция распределения j-ой переменной для i-го значения;

dj - абсолютная величина разности между эмпирической и гипотетической функциями распределения.

Значения гипотетической функции распределения находятся по статистическим таблицам.

; (14)

Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, например, в [9] превосходит 0,20, то предположение о нормальности не отвергается. Если Рк <0,20, то предположение о нормальности рекомендуется отвергнуть.

Если количество реализаций переменной представляется достаточным для построения гистограммы (не менее семи интервалов и не менее семи попаданий случайной величины в любой из интервалов), то используют критерий согласия Пирсона, более известной как . Он является двухпараметрическим. Один параметр оценивает степень расхождения эмпирических и гипотетических данных, а второй - количество степеней свободы.

, (15)

(16)

где: - мера расхождения эмпирического и гипотетического распределения j-й случайной переменной;

- количество интервалов гистограммы для j-й случайной переменной;

n - количество реализаций случайной величины в эмпирическом распределении;

- частота (количество попаданий) в i-й интервал гистограммы эмпирического распределения j-й случайной величины;

- вероятность попадания j-й случайной величины в i-й интервал гистограммы гипотетического распределения;

- количество степеней свободы j-й случайной величины;

- количество параметров гипотетического распределения для j-й случайной величины (для нормального закона два: и ).

Вероятность попадания в i-ый интервал гистограммы гипотетического распределения вычисляется по формуле:

(17)

где: - левая и правая граница i-го интервала гистограммы;

f(x) - функция плотности гипотетического распределения.

По вычисленным значениям (13) и (16) по статистическим таблицам находится коэффициент доверия . Если укладывается в рекомендуемый десятипроцентный доверительный интервал 0,1??0,9, то предположение о подчинении эмпирического распределения нормальному закону не отвергается, если же наблюдаемое значение выходит за границы десятипроцентного доверительного интервала, то предположение рекомендуется отвергнуть.

Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения, при использовании критерия согласия предпочтительнее использовать функции плотности. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.0 и Excel 2002, на которые производится ориентация вычислений по излагаемому математическому аппарату.

Графики определения нормальности ИСД для распределений случайных величин представлены на рис. 13 - 25.

Рис. 13. Эмпирическая и гипотетическая функция плотности распределения X1

Рис. 14. Эмпирическая и гипотетическая функция плотности распределения X5

Рис. 15. Эмпирическая и гипотетическая функция плотности распределения X10

Рис. 16. Эмпирическая и гипотетическая функция плотности распределения X12

Рис. 17. Эмпирическая и гипотетическая функция плотности распределения X15

Рис. 18. Эмпирическая и гипотетическая функция плотности распределения X20

Рис. 19. Эмпирическая и гипотетическая функция плотности распределенияY1

Рис. 20. Эмпирическая и гипотетическая функция плотности распределенияY7

Рис. 21. Эмпирическая и гипотетическая функция плотности распределенияY15

Рис. 22. Эмпирическая и гипотетическая функция плотности распределенияY19

Рис. 23. Эмпирическая и гипотетическая функция плотности распределенияY23

Рис. 24. Эмпирическая и гипотетическая функция плотности распределенияY27

Для анализа «нормальности» исходных статистических данных применен метод Колмогорова - Смирнова. Результаты представлены в виде таблицы 4. Коэффициент доверия найден по статистическим таблицам [9].

Таблица 4. Проверка ИСД на «нормальность»

ПЕРЕМЕННЫЕ

d

Коэффициент доверия

1

2

3

4

X1

0,14047

0,92112

X2

0,06882

0,45128

X3

0,25656

1,68238

X4

0,22846

1,49811

X5

0,23168

1,51923

X6

0,19144

1,25536

X7

0,17275

1,13280

X8

0,13598

0,89168

X9

0,15726

1,03122

X10

0,11586

0,75974

X11

0,21153

1,38709

X12

0,14092

0,92407

X13

0,18964

1,24355

X14

0,27658

1,81366

X15

0,22093

1,44873

X16

0,13231

0,86761

X17

0,1588

1,04132

X18

0,16144

1,05863

X19

0,15156

0,99385

X20

0,06673

0,43758

Y1

0,09429

0,61830

Y2

0,13951

0,91483

Y3

0,19751

1,29516

Y4

0,09716

0,63712

Y5

0,20128

1,31988

Y6

0,19856

1,30204

Y7

0,12263

0,80414

Y8

0,13092

0,85850

Y9

0,18398

1,20644

Y10

0,12819

0,84060

Y11

0,12584

0,82519

Y12

0,10222

0,67030

Y13

0,11807

0,77424

Y14

0,12671

0,83089

Y15

0,0964

0,63214

Y16

0,14807

0,97096

Y17

0,14347

0,94080

Y18

0,11489

0,75338

Y19

0,11712

0,76801

Y20

0,12539

0,82224

Y21

0,11025

0,72296

Y22

0,10179

0,66748

Y23

0,10691

0,70106

Y24

0,16411

1,07614

Y25

0,14627

0,95916

Y26

0,1333

0,87411

Y27

0,14289

0,93699

c. Вычисление парных коэффициентов корреляции

Тесноту связи между переменными принято характеризовать парными коэффициентами линейной корреляции, вычисляемыми по формуле:

(18)

;

где: n - количество экспериментальных данных;

M - количество факторов ;

K - количество откликов yi (yj);

- значение i-той (j-той) переменной в g-ой точке плана.

Парные коэффициенты линейной корреляции принимают значения от -1 до +1. Значение, близкое к +1, указывает на наличие сильной положительной линейной зависимости между переменными. Значение, близкое к -1, указывает на наличие сильной отрицательной зависимости между переменными. Значение, близкое к 0, указывает на независимость переменных друг от друга. Для более достоверной оценки гипотезы о линейности можно использовать математический аппарат, изложенный в [22], при допущении о нормальности распределения коэффициентов линейной корреляции.

Вычисляется стандартная ошибка оценки коэффициента корреляции:

; (19)

где:

n - количество случайных чисел в ИСД;

rij - коэффициент линейной корреляции между I - ой и j - ой переменными.

По статистическим таблицам, например, для рекомендуемого уровня значимости 0,05 [9] и количеству степеней свободы n-2 находим критическое значение tкрит=2,25. Вычисляется критерий Стьюдента:

; (20)

Если вычисленное значение tij>tкрит, то считается, что имеющиеся статистические данные не противоречат предположению о наличии существенной связи между i-ой и j-ой переменными, i= , в противном случае предположение о существенности зависимости между переменными следует отвергнуть.

Путем несложных преобразований (19) и (20) можно получить формулу для непосредственного вычисления критического значения коэффициента линейной корреляции, начиная с которого и выше его по абсолютной величине связь между переменными можно считать существенной.

, ; (21)

где - критическое значение критерия Стьюдента для рекомендуемого уровня значимости , определяемого по статистическим таблицам при n - 2 = 43 - 2 = 41 степенях свободы [9].

n = 43 - количество значений в ИСД.

По (21) находим

= (22)

Таблица 5. Парные коэффициенты линейной корреляции

Переменные

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

X18

X19

X20

X1

1,00

X2

0,91

1,00

X3

-0,38

-0,30

1,00

X4

-0,06

-0,42

-0,06

1,00

X5

0,61

0,79

-0,13

-0,60

1,00

X6

0,77

0,96

-0,19

-0,60

0,89

1,00

X7

0,79

0,96

-0,19

-0,55

0,85

0,98

1,00

X8

0,80

0,97

-0,21

-0,57

0,84

0,98

0,98

1,00

X9

0,78

0,95

-0,20

-0,57

0,74

0,95

0,95

0,95

1,00

X10

-0,60

-0,70

0,24

0,25

-0,41

-0,65

-0,69

-0,69

-0,67

1,00

X11

0,75

0,93

-0,15

-0,58

0,91

0,99

0,98

0,97

0,91

-0,63

1,00

X12

0,78

0,96

-0,19

-0,59

0,85

0,99

0,99

0,98

0,97

-0,68

0,97

1,00

X13

0,77

0,93

-0,26

-0,60

0,93

0,98

0,96

0,96

0,89

-0,62

0,98

0,96

1,00

X14

0,69

0,92

-0,16

-0,71

0,86

0,98

0,97

0,96

0,96

-0,63

0,97

0,98

0,96

1,00

X15

-0,85

-0,81

0,32

-0,02

-0,35

-0,65

-0,72

-0,71

-0,76

0,72

-0,62

-0,71

-0,59

-0,60

1,00

X16

0,01

0,08

0,10

-0,27

0,56

0,25

0,16

0,16

-0,04

0,19

0,30

0,13

0,34

0,20

0,38

1,00

X17

0,33

0,17

0,02

0,47

0,03

0,09

0,09

0,06

0,11

0,05

0,09

0,07

0,03

0,01

-0,31

0,08

1,00

X18

-0,69

-0,85

0,14

0,40

-0,77

-0,88

-0,91

-0,87

-0,82

0,72

-0,89

-0,89

-0,85

-0,85

0,69

-0,14

-0,19

1,00

X19

0,27

0,32

0,05

-0,09

0,24

0,26

0,27

0,31

0,34

-0,22

0,25

0,31

0,21

0,27

-0,35

-0,14

0,16

-0,27

1,00

X20

0,27

0,43

-0,04

-0,44

0,44

0,43

0,45

0,48

0,45

-0,29

0,44

0,47

0,42

0,46

-0,27

-0,02

-0,15

-0,38

0,70

1,00

Рассмотрим корреляционную матрицу (см. Таблицу 5.)

Проанализируем силу связи показателей комфортности жизни жителей исследуемого города Елабуга между собой. Положительная, близкая к линейной, связь существует между y13 и y17, y13 и y19, y13 и y21, y13 и y22, y13 и y23, y13 и y25, y13 и y26, y14 и y17, y15 и y19, y16 и y17, y16 и y21, y16 и y22, y16 и y24, y17 и y19, y17 и y21, y17 и y22, y17 и y24, y17 и y25, y17 и y26, y19 и y21, y19 и y22, y21 и y22, y21 и y23, y21 и y25, y21 и y26, y22 и y23, y22 и y25, y22 и y26, y24 и y25. Наименее связанными с другими показателями комфортности жизни жителей являются y1, y4, y12 и y5, где

Таблица 6. Показатели комфортности жизни людей

Y1

Средняя продолжительность жизни (лет)

Y4

Естественный прирост (чел.)

Y5

Количество зарегистрированных браков (шт.)

Y12

Заболеваемость системы кровообращения (на 1000 чел.)

Y13

Общее количество преступлений (шт.)

Y14

Количество особо тяжких преступлений (шт.)

Y15

Количество тяжких преступлений (шт.)

Y16

Количество преступлений средней тяжести (шт.)

Y17

Количество преступлений небольшой тяжести (шт.)

Y19

Количество причинений вреда здоровью (шт.)

Y21

Количество краж (шт.)

Y22

Количество мошенничеств (шт.)

Y23

Количество грабежей (шт.)

Y24

Количество разбоев (шт.)

Y25

Количество вымогательств (шт.)

Y26

Количество неправомерных завладений АМТ (шт.)

Проанализируем силу связи показателей комфортности жизни жителей с их средой обитания между собой в исследуемом городе Елабуга по абсолютным значениям

Наиболее сильная положительная, близкая к линейной, связь обнаруживается между откликами Yj, j=1, k и факторами Xi, i=1, n:

Y1 - Средняя продолжительность жизни (лет) связан со следующими факторами:

X4 - Уровень безработицы (%);

Y16 - Обеспеченность населения врачами (на 1000 чел.):

X1 - Численность населения (чел.);

X2 - Численность населения трудоспособного возраста (чел.);

X6 - Среднемесячная заработная плата (руб., до 1997 г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 1997 г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

Y24 - Естественный прирост (чел.):

X2 - Численность населения трудоспособного возраста (чел.);

X6 - Среднемесячная заработная плата (руб., до 1997 г. - тыс. руб.);

X7 - Прожиточный минимум на члена семьи (руб., до 1997 г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 1997 г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

X10 - Ввод жилых домов (кв. м. общ. пл.);

X11 - Объем реализации платных услуг в расчете на 1 жителя (руб., до 1997 г. - тыс. руб.);

X13 - Оборот розничной торговли на душу населения (руб., до 1997 г. - тыс. руб.);

Наиболее сильную отрицательную связь, близкую к линейной, можно выделить между откликами (Y) и факторами (X):

Y1 - Средняя продолжительность жизни (лет) связан со следующими факторами:

X7 - Прожиточный минимум на члена семьи (руб., до 1997 г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 1997 г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

X11 - Объем реализации платных услуг в расчете на 1 жителя (руб., до 1997 г. - тыс. руб.);

Y9 - Заболеваемость туберкулезом (на 100 тыс. чел.):

X16 - Обеспеченность населения врачами (на 1000 чел.);

Y10 - Заболеваемость онкологическими заболеваниями (на 100 тыс. чел.):

X4 - Уровень безработицы (%);

Y16 - Количество преступлений средней тяжести (шт.):

X15 - Обеспеченность населения больничными койками (на 1000 чел.);

Y17 - Количество преступлений небольшой тяжести (шт.):

X15 - Обеспеченность населения больничными койками (на 1000 чел.);

Рассмотрим взаимосвязь факторов между собой. Положительная близкая к линейной связь имеется между следующими факторами:

Х1: х2, х6, х7, х, 8, х9, х11, х12, х13;

X2: x5, х6, x7, х8, x9, x11, x12, x13, x14;

X5: x2, x6, x7, x8, x9, х11, x12, x13, x14;

X6: x1, x2, x5, x7, x8, x9, x11, x12, x13, x14;

X7: x1, x2, x5, x6, x8, x9, x11, x12, x13, х14;

X8: x1, x2, x5, x6, x7, х9, x11, x12, x13, x14;

X9: х1, x2, х6, x7, x8, x11, x12, x13, x14;

X10: x2, x5, x6, x7, x8, x9;

Отрицательная близкая к линейной связь имеется между следующими факторами:

X1: x15, х18;

X2: x10, x15, x18;

Х4: х14;

Х5: х18;

Х6: х18;

Х7: х15, х18;

Х8: х15, х18;

Х8: х15, х18;

Вычисленные значение (22) и результаты анализа таблицы 5 позволяют сделать следующие обобщенные выводы:

Во-первых, коэффициенты линейной корреляции между откликами и факторами примерно в половине случаев по абсолютной величине превышают критическое значение. Поэтому уравнения регрессии могут содержать в себе факторы в первой и второй степени, а также в виде функций от факторов.

Во-вторых, коэффициенты линейной корреляции между факторами в некоторых случаях превышают по абсолютной величине найденное критическое значение и достигают значения более 0,8. В таких случаях можно ожидать, что некоторые факторы могут не входить в уравнения регрессии и оказывать влияние на отклики через другие факторы с сильной корреляционной связью между ними.

В третьих, сила связи между показателями эффективности и факторами варьируется в весьма широких пределах. Абсолютная величина коэффициента линейной корреляции, меняющаяся в диапазоне от 0,01 до 0,99, показывает, что для сохранения всех переменных в уравнениях регрессии целесообразно использовать нелинейную регрессию.

Для коэффициентов линейной корреляции можно построить доверительные интервалы для принятой доверительной вероятности

; ; (23)

d. Регрессионный анализ

Так как все переменные, используемые для исследования являются количественными и непрерывными величинами, то в этом случае наиболее целесообразно применение регрессионного анализа [21], основанного на методе наименьших квадратов (МНК), который требует, чтобы сумма квадратов отклонений экспериментальных значений от вычисленных по аппроксимирующей зависимости была минимальной:

(24)

где yij - экспериментальное значение j-го отклика в i-ом варианте;

fj (xi1, xi2, …, xiM) - значение j-го отклика в i-ом варианте, вычисленное по аппроксимирующей зависимости;

n - количество вариантов;

M - количество факторов.

В последнее время наряду с требованием (24) для оценки качества аппроксимации начали использовать и другие показатели, как правило, основанные на дисперсионном анализе [13]. Следует отметить, что если МНК не накладывает на исходные данные каких-либо ограничений [9], то дисперсионный анализ требует «нормальности» анализируемых статистических данных.

Поставлена задача минимизации количества переменных, входящих в уравнения регрессии из совокупности заданных переменных.

(25)

где: L - общее количество переменных, представленных для отбора в уравнения регрессии;

Qj - число переменных в j - ом уравнении регрессии;

Uij - коэффициент, принимающий значение «1», если i - ая переменная входит в j - ое уравнение регрессии и «0», если не входит;

K - количество откликов (уравнений регрессий).

На получаемые уравнения регрессии наложены следующие ограничения:

1. Количество степеней свободы:

(26)

2. Отношение стандартной ошибки к среднему значению должно быть не более 0,05:

(27)

3. Уровень значимости множественного коэффициента детерминации, показывающий в долях от единицы насколько изменение переменных, вошедших в уравнение регрессии, определяет изменение показателя эффективности, не должен превышать 0,05:

(28)

4. Уровень значимости уравнения регрессии по критерию Фишера должен быть не более 0,05:

Pfj <0,05; (29)

5. Все коэффициенты уравнения регрессии должны иметь уровень значимости по критерию Стьюдента не более 0,05.

PSt ij<0,05 , (30)

Кроме того, желательно чтобы в уравнения регрессии входило как можно большее количество факторов, хотя бы в виде каких-либо математических функций. Желательно, чтобы в уравнения регрессии не входили произведения факторов между собой. Если это условие удается выполнить, то облегчается анализ степени влияния факторов на показатели эффективности, который можно производить в этом случае для каждого фактора независимо от других факторов.

Для решения поставленной задачи с удовлетворением условия (4.2.1) требуется вычислять коэффициенты аппроксимирующих зависимостей по формуле:

Bj=(XTX) - 1 (XTYj) (31)

где: Bj - матрица - столбец коэффициентов аппроксимирующей зависимости j - го отклика;

Х - матрица планов (вариантов) переменных х;

ХТ - транспонированная матрица планов;

ХТХ - информационная матрица;

(ХTХ) - 1 = А - матрица, обратная информационной;

Yj - матрица - столбец j - го отклика.

Параметры, перечисленные в постановке задачи (25-30) вычисляются по следующим формулам:

Коэффициент множественной корреляции j-го уравнения регрессии:

(32)

где: SSjобъясн - объясненная сумма квадратов j - го уравнения регрессии,

SSjост - остаточная сумма квадратов j - го уравнения регрессии.

- коэффициент множественной детерминации j - го уравнения регрессии:

(33)

Скорректированный коэффициент множественной детерминации j - го уравнения регрессии:

(34)

где: n - количество вариантов экспериментальных данных (точек плана);

Qj - количество переменных в j - ом уравнении регрессии;

Критерий Фишера j - го уравнения регрессии.

(4.2.12)

Стандартная ошибка вычисления, показывающая дисперсию экспериментальных значений относительно уравнения регрессии:

(35)

где: - вычисленное значение j-го отклика для i-ых значений факторов;

n - количество вариантов экспериментальных данных (точек плана);

M - количество факторов;

yij - экспериментальное значение j - го отклика в i-ом варианте.


Подобные документы

  • Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.

    дипломная работа [5,4 M], добавлен 08.02.2016

  • Создание информационной системы для фирмы "Удача", которая является посредником при перепродаже недвижимости. Обоснование состава вычислительной техники и программного обеспечения для функционирования данной автоматизированной информационной системы.

    курсовая работа [1,8 M], добавлен 17.02.2014

  • Базовые принципы правового регулирования трудовых отношений. Проектирование автоматизированной информационной системы "Отдел кадров", программная реализация, тестирование. Состав базы данных, методы анализа надежности системы, руководство пользователя.

    дипломная работа [3,6 M], добавлен 11.03.2010

  • Проблемы внедрения информационной системы. Процесс разработки и внедрения автоматизированной информационной системы на примере музея "Галерея изящных искусств". Рекомендации по устранению основных рисков или снижению степени их влияния на проект.

    курсовая работа [3,0 M], добавлен 07.05.2015

  • Разработка информационной системы ВУЗа с использованием методики объектно-ориентированного моделирования UML. Анализ требований к системе. Концептуальная (содержательная) модель. Диаграмма компонентов и классов. Программная реализация приложения.

    курсовая работа [797,7 K], добавлен 16.04.2014

  • Понятие социальной сети, определение основных целей и задач ее создания, распространенность и значение в современном обществе. Модели влияния в социальных сетях. Выбор средств проектирования и программная реализация, разработка и реализация интерфейса.

    дипломная работа [1,5 M], добавлен 11.09.2012

  • Описание особенностей функционирования магазина. Проектирование системы: инфологическое моделирование и построение диаграммы потоков данных. Моделирование и программная реализация информационной системы. Проектирование пользовательского интерфейса.

    курсовая работа [1,6 M], добавлен 18.02.2013

  • Использование социальных сетей и медиа компаниями. Программа исследования факторов подписки на официальные аккаунты брендов в Twitter и Instagram. Применение мобильного Интернета целевыми группами российских потребителей. Тестируемые гипотезы и модель.

    дипломная работа [2,9 M], добавлен 30.12.2015

  • Анализ предметной области разрабатываемой информационной системы "Библиотека". Проектирование базы данных в среде MS Access. Физическая реализация данной информационной системы средствами Delphi 7 и MS Access 2003. Области применения технологии BDE.

    курсовая работа [2,4 M], добавлен 12.01.2016

  • Разработка информационной системы, предназначенной для гостиницы. Создание базы данных информационной системы, содержащей сведения о номерах: категория, количество мест, стоимость проживания за сутки. Основные требования, инструментальные средства.

    курсовая работа [2,1 M], добавлен 04.02.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.