Парная и множественная регрессия

Вычисление коэффициентов регрессии и выявление тенденции развития процессов. Обработка табличных данных. Отчет кредитной организации о прибыли, убытка. Корреляционный анализ. Парная и множественная регрессии. Решение математических задач средствами Excel.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 05.06.2022
Размер файла 91,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контрольная работа

Парная и множественная регрессия

Введение

Статистический анализ позволяет выявлять связи между различными процессами, определять, насколько закономерны или случайны наблюдаемые зависимости, а также прогнозировать развитие процессов во времени, или при неких значениях влияющих факторов.

В данной работе, на примере отчёта коммерческого банка, выполнен корреляционный анализ, выявлены связи между различными доходами и расходами, а также вычислены коэффициенты регрессии для парной и множественной регрессии.

1. Вычисление коэффициентов регрессии и выявление тенденции развития процессов

Одна из важных функций статистики - на основании собранных данных делать прогноз на будущие периоды. Для того, чтобы иметь возможность сделать прогноз, нужно построить аппроксимирующую функцию. В данной работе рассматривается построение парной и множественной регрессии

При вычислении коэффициентов регрессии используется метод наименьших квадратов. Его принцип заключается в том, что если аппроксимирующую функцию изобразить на графике вместе с измеренными значениями параметров, то должна быть минимальной сумма квадратов расстояний от точек, соответствующих измеренным значениям, до линии тренда.

В методе наименьших квадратов использовано свойство экстремума функции: в точке экстремума производная функции равна нулю. Записав формулу суммы квадратов расстояний и найдя её производную, а потом приравняв производную нулю, получаем уравнение относительно коэффициентов аппроксимирующей функции. Решение этого уравнения даёт возможность вычислить коэффициенты и составить аппроксимирующую функцию. Все эти математические преобразования сделаны при разработке методики, и вычисление аппроксимирующей функции сводится в выбору её вида, к заполнению вспомогательной таблицы результатами элементарных вычислений и к расчёту коэффициентов.

Ошибки аппроксимации вычисляются как квадратный корень из среднего значения суммы квадратов.

Построение линии тренда можно выполнить вручную, а можно воспользоваться возможностями программного пакета Excel.

2. Обработка табличных данных

Исходные данные для статистического анализа содержатся в таблице 1.

Таблица 1 Фрагмент отчёта кредитной организации о прибыли и убытках, ОАО Севзапинвестбанк, форма 102, квартальная (с нарастающими итогами в течение года)

Квартал года

1

2

3

4

5

6

7

8

9

10

11

3/2007

361

52179

2466

9513

1187

2192

16321

13796

22

4531

43488

4/2007

498

78021

2967

11705

1388

2898

19552

21545

22

9198

53962

1/2008

134

32634

737

2087

887

762

3493

4782

97

3750

6122

2/2008

1411

66850

1487

4818

1503

1283

6552

7459

141

7297

10954

3/2008

2285

98965

2317

7212

1995

1717

9098

9914

185

10586

16679

4/2008

3129

129879

3246

8713

2837

2172

12577

16130

185

13382

13698

1/2009

738

28481

922

2981

886

433

1860

21342

7

3439

21304

2/2009

1356

55781

1761

5399

1285

870

3513

24608

8

6427

4274

3/2009

1828

82492

2538

10848

2012

13071

5344

29140

8

8932

7096

4/2009

2195

104791

3168

15148

2718

1726

7558

37114

9

10478

7123

1/2010

261

18472

613

4256

641

400

1697

3588

0

1898

6954

2/2010

465

34060

1293

6818

1174

770

3556

8936

0

4044

7969

3/2010

608

46650

1979

10591

2229

1130

5555

2588

0

5989

3497

4/2010

677

61650

2567

19137

4366

1448

8013

30949

0

7786

16836

1/2011

22

17056

363

8775

4515

310

1572

2212

0

1985

1874

2/2011

28

32741

870

49442

5758

624

3558

5620

0

3853

-3420

1 - процентные доходы по предоставленным кредитам негосударственным финансовым организациям

2 - процентные доходы по предоставленным кредитам негосударственным коммерческим организациям

3 - процентные доходы по предоставленным кредитам физическим лицам

4 - процентные доходы по предоставленным кредитам кредитным организациям

5 - доходы по вложениям в долговые обязательства РФ

6 - доходы по вложениям в долговые обязательства РФ

7 - доходы от ведения счетов, расчётного и кассового обслуживания

8 - доходы от продажи валюты

9 - расходы по процентам за привлечённые кредиты

10 - расходы по процентам, выплаченным физическим лицам

11 - прибыль банка после налогообложения

Преобразуем таблицу, заменив возрастающий результат в течение года конкретными значениями по кварталам.

Вычислим средние значения, средние линейные отклонения, дисперсию,

Таблица 2

Квартал года

1

2

3

4

5

6

7

8

9

10

11

3/2007

361

52179

2466

9513

1187

2192

16321

13796

22

4531

43488

4/2007

137

25842

501

2192

201

706

3231

7749

0

4667

10474

1/2008

134

32634

737

2087

887

762

3493

4782

97

3750

6122

2/2008

1277

34216

750

2731

616

521

3059

2677

44

3547

4832

3/2008

874

32115

830

2394

492

434

2546

2455

44

3289

5725

4/2008

844

30914

929

1501

842

455

3479

6216

0

2796

-2981

1/2009

738

28481

922

2981

886

433

1860

21342

7

3439

21304

2/2009

618

27300

839

2418

399

437

1653

3266

1

2988

-17030

3/2009

472

26711

777

5449

727

12201

1831

4532

0

2505

2822

4/2009

367

22299

630

4300

706

-11345

2214

7974

1

1546

27

1/2010

261

18472

613

4256

641

400

1697

3588

0

1898

6954

2/2010

204

15588

680

2562

533

370

1859

5348

0

2146

1015

3/2010

143

12590

686

3773

1055

360

1999

-6348

0

1945

-4472

4/2010

69

15000

588

8546

2137

318

2458

28361

0

1797

13339

1/2011

22

17056

363

8775

4515

310

1572

2212

0

1985

1874

2/2011

6

15685

507

40667

1243

314

1986

3408

0

1868

-5294

Ср .зн.

408

25443

801

6509

1067

554

3204

6960

14

2794

5512

Лин.откл

297

7676

248

5183

602

1706

1714

5553

19

832

8602

Дисп.

211087560

206088578

51833691

51466914

9614461

16982118

42122358

44805271

2472139

87801362

176527235

Ср.кв. откл.

14529

14356

7200

7174

3101

4121

6490

6694

1572

9370

13286

Построим графики:

Рис.1. Графики доходов и расходов банка, построенные на основании данных

По графику можно проследить тенденцию изменения параметров, примерно определить наличие связи между теми или иными процессами. Для того, чтобы

3. Корреляционный анализ

Рассчитаем коэффициенты корреляции между доходами, расходами, прибылью банка, а также тесноту связи между влияющими факторами.

Линейный коэффициент корреляции может быть рассчитан по формуле:

Существует методика ручного расчета, при котором требуется составление вспомогательной таблицы.

Построим вспомогательную таблицу для расчета.

Таблица 3. Вспомогательная таблица для расчёта коэффициента корреляции между показателями 1 и 2

Квартал года

1

2

3/2007

361

52179

-47

26736

2209

7,15E+08

-1256592

4/2007

137

25842

-271

399

73441

159201

-108129

1/2008

134

32634

-274

7191

75076

51710481

-1970334

2/2008

1277

34216

869

8773

755161

76965529

7623737

3/2008

874

32115

466

6672

217156

44515584

3109152

4/2008

844

30914

436

5471

190096

29931841

2385356

1/2009

738

28481

330

3038

108900

9229444

1002540

2/2009

618

27300

210

1857

44100

3448449

389970

3/2009

472

26711

64

1268

4096

1607824

81152

4/2009

367

22299

-41

-3144

1681

9884736

128904

1/2010

261

18472

-147

-6971

21609

48594841

1024737

2/2010

204

15588

-204

-9855

41616

97121025

2010420

3/2010

143

12590

-265

-12853

70225

1,65E+08

3406045

4/2010

69

15000

-339

-10443

114921

1,09E+08

3540177

1/2011

22

17056

-386

-8387

148996

70341769

3237382

2/2011

6

15685

-402

-9758

161604

95218564

3922716

Средние значения показателей:

= 408; = 25443

Вычисление коэффициента корреляции с использованием аппарата Excel дают такой же результат. Применим функцию КОРРЕЛ(), занесём в открывшееся окно сравниваемые массивы данных, получаем значение 0,904.

Коэффициент корреляции от 0,3 до 0,5 определяется как слабая связь, от 0,5 до 0,7 - средняя, от 0,7 до 1 - сильная. В данном случае коэффициент корреляции 0,904, это соответствует сильной связи.

Для того, чтобы проверить, является ли полученное значение статистически значимым, сравним его с критическим значением распределения Стьюдента.

Воспользуемся формулой:

Вычислим t для значения rxy 0.904

Полученные значения сравним с критическими значениями распределения Стьюлента. Воспользуемся аппаратом Excel.

Для уровня значимости 0,01 и количества степеней свободы 16 вычисляем функцию СТЬЮДРАСПОБР(0,01; 16)=2,9.

Если выбрать понизить требования и выбрать уровень значимости 0,05, то СТЬЮДРАСПОБР(0,01; 16)=2,1.

Оба значения меньше вычисленного значения t.

Это свидетельствует о том, что корреляция в данном случае является статистически значимой.

Современные компьютерные программы позволяют сделать эти вычисления быстро.

Вычислим коэффициент корреляции с помощью аппарата Excel. Для вычисления корреляции между парами значений можно применять функцию КОРРЕЛ(), Занесём в диалоговое окно ряды данных 1 и 2,, получаем значение корреляции 0,904

Для того, чтобы определить корреляцию между несколькими выборками, воспользуемся надстройкой Excel. Выберем в меню Сервис > Анализ данных > Корреляция. Введём диапазон значений, приведенных в таблице 2, и получим результат, приведенный в Таблице 4.

Таблица 4. Коэффициенты корреляции

1

2

3

4

5

6

7

8

9

10

Столбец 1

1,000

Столбец 2

0,907

1,000

Столбец 3

0,680

0,885

1,000

Столбец 4

-0,189

-0,030

0,016

1,000

Столбец 5

-0,060

0,032

-0,002

0,794

1,000

Столбец 6

0,338

0,369

0,404

-0,009

-0,059

1,000

Столбец 7

0,260

0,590

0,760

0,012

-0,101

0,161

1,00

Столбец 8

0,459

0,530

0,668

0,027

0,013

0,424

0,27

1,000

Столбец 9

0,628

0,589

0,252

-0,263

-0,136

-0,046

0,28

-0,194

1,00

Столбец 10

0,879

0,986

0,887

-0,010

0,062

0,369

0,57

0,543

0,56

1,00

Столбец 11

-0,044

0,227

0,466

-0,201

-0,356

0,070

0,84

0,247

0,05

0,22

В результате расчёта получена корреляционная матрица, по которой можно оценить наличие и тесноту связи между различными выборками данных. На таблице цветом выделены значения сильной и средней корреляции. Можно отметить, что не все последовательности коррелируют друг с другом; например, выборка под номером 6 (доходы по вложениям в долговые обязательства РФ) не обнаруживает значимой связи с другими данными, выборка 11 (прибыль после налогообложения) имеет достаточно тесную связь с выборкой 7 (доходы от ведения счетов, расчётного и кассового обслуживания). Наиболее тесная связь существует между выборками 2 и 10 (процентные доходы по предоставленным кредитам негосударственным коммерческим организациям и расходы по процентам, выплаченным физическим лицам). Также сильная связь наблюдается между выборками 1 и 2, 2 и 3, 4 и 5.

Для того, чтобы проверить, являются ли полученные значения статистически значимыми, сравним их с критическим значением распределения Стьюдента.

Воспользуемся формулой:

Для уровня значимости 0,05 и количества степеней свободы 11 вычисляем функцию СТЬЮДРАСПОБР(0,05; 11)=2,2.

Вычислим t для значений rxy =0.9, 0.52, 0.5

Полученные значения сравним с критическими значениями распределения Стьюдента (2,2). Коэффициент корреляции меньше 0,52 не является значимым для выборки из 11 значений.

4. Парная регрессия

Парная регрессия показывает связь между факторным и результативным признаком в виде: y=ax+b

Выберем в качестве факторного признака выборку 1, а в качестве результативного - выборку 2. Между этими рядами данных существует

Составим уравнение регрессии с помощью программы Excel. Выберем опции Сервис - Анализ данных - Регрессия. В открывшемся окне укажем диапазоны данных. Получаем результаты:

Таблица 5

Множественный R

0,907196806

R-квадрат

0,823006045

Нормированный R-квадрат

0,81036362

Стандартная ошибка

406,39437

Наблюдения

16

Дисперсионный анализ

df

SS

Регрессия

1

10751473,62

Остаток

14

2312189,376

Итого

15

13063663

Таблица 6

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-512,609

213,207

-2,404

0,031

-969,892

-55,327

-969,892

-55,327

Переменная X 1

0,026

0,003

8,068

0,000

0,019

0,033

0,019

0,033

Оценим значимость и точность регрессии. Значение F из таблицы Дисперсионный анализ сравним с критической границей критерия - Значимость F. Поскольку F> Значимость F, регрессия является значимой.

5. Множественная регрессия

Рассмотрим уравнение регрессии, в котором значение 10 записывается как функция от значений выборок 2 и 3.

Уравнение регрессии ищем в следующем виде:

Z=Ax+By+C

Применим метод наименьших квадратов. Уравнение запишем в виде:

Коэффициенты A, B вычисляются по формулам:

- коэффициенты корреляции, соответственно между элементами x и z, y и z, x и y,

- средние квадратические отклонения.

Выборочный совокупный коэффициент корреляции:

То есть

Используем функции из библиотеки Excel для нахождения средних и среднеквадратичных значений по трём столбцам.

Подставляя значения в формулы, получаем коэффициенты регрессии:

А=;

0.23

Подставив коэффициенты в уравнение и преобразовав его, найдём С: С= 0

Получается уравнение: z=-0,093x+0.23y

Подставим значения x, y и вычислим z в диапазоне значений. Соответствие аппроксимации и исходных данных хорошее, на графике присутствуют реальная выборка и аппроксимирующая функция.

Рисунок 2

Заключение

Выполнен корреляционный анализ данных, относящихся к деятельности коммерческого банка. На основании таблицы, включающей различные доходы и расходы банка, построена корреляционная матрица. Использование программы Excel позволило оперативно коэффициенты корреляции между 11 выборками значений.

Определены статьи доходов и расходов, между которыми существует значимая связь. Критерием значимости корреляции является сравнение с критическим значением распределения Стьюдента, также вычисленного в рамках программы Excel. В частности, отмечена слабая связь прибыли после налогообложения со статьями дохода и расхода, но при этом имеется сильная связь между некоторыми статьями дохода.

Для построения линий тренда парной и множественной регрессии взяты выборки, между которыми наблюдается значимая связь.

Параметры парной регрессии определены с помощью надстройки Excel Регрессия.

Параметры множественной регрессии вычислены по формулам, с использованием коэффициентов корреляции, полученных на этапе корреляционного анализа. Составлено уравнение множественной регрессии. Результаты, вычисленные при подстановке значений влияющих факторов в уравнение регрессии, достаточно точно соответствуют реальным значениям зависимого параметра.

регрессия прибыль математический корреляционный

Литература

1. Шмойлова Р.А. и др. Теория статистики. М. Финансы и статистика 2007

2. Поллард Дж. Справочник по вычислительным методам в статистике. - М. Финансы и статистика 1982.

3. Гельман В.Я. Решение математических задач средствами Excel. -СПб: Питер, 2001

4. Макарова Н.В., Трофимец В.Я., Статистика в Excel -М. Финансы и статистика, 2003.

5. Чёрный В.В. Практикум по дисциплине «Теория статистики» - СПб: БАТиП, 2008.

Размещено на Allbest.ru


Подобные документы

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.

    контрольная работа [68,7 K], добавлен 21.09.2009

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.

    курсовая работа [352,9 K], добавлен 26.01.2010

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.

    контрольная работа [99,4 K], добавлен 22.07.2009

  • Показатели тесноты связи. Смысл коэффициентов регрессии и эластичности. Выявление наличия или отсутствия корреляционной связи между изучаемыми признаками. Расчет цепных абсолютных приростов, темпов роста абсолютного числа зарегистрированных преступлений.

    контрольная работа [1,5 M], добавлен 02.02.2014

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.