Корреляционно-регрессионный анализ

Установление корреляционной зависимости показателей 30 российских банков. Нахождение зависимости размера прибыли банков от размера их активов. Регрессионная модель данной взаимосвязи показателей. Проверка этой модели на адекватность по критерию Стьюдента.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 17.05.2010
Размер файла 759,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

филиал ГОУ ВПО «ЮЖНО ­ УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» в г. Снежинске

Кафедра «Экономики и инвестиций»

КУРСОВАЯ РАБОТА

По курсу: «Статистика»

На тему: «Корреляционно-регрессионный анализ»

Содержание

Введение

1. Виды зависимостей, изучаемых в статистике

2. Основные методы изучения взаимосвязей

3. Проверка на адекватность регрессионной модели

4. Экономическая интерпретация параметров уравнения регрессии

Заключение

Список использованной литературы

Введение

Статистика (немец. Statistik, от латинского status ? состояние) рассматривается как наука о методах изучения массовых явлений. Некоторые процессы, наблюдаемые в массовом количестве, обнаруживают определенные закономерности, которые, однако, невозможно заметить в отдельном случае или же при небольшом числе наблюдений.

Явления, которые в случае событий массового характера отличаются определенной закономерностью, однако не обнаруживаются на основе единичного наблюдения, называются массовыми явлениями. Сама такая закономерность называется статистической закономерностью.

Статистическая закономерность наблюдается в тех случаях, когда а) в исследуемом процессе действует один общий комплекс причин и когда б) наряду с этим в каждом отдельном случае действуют особые дополнительные причины, всякий раз иные.

Статистика оказывается полезной в тех случаях, когда приходится анализировать процессы, которые при массовом наблюдении способны проявлять очевидную закономерность. Если бы действовали только главные причины, без наложения второстепенных, то все отдельные случаи были бы совершенно одинаковы, и не возникло бы нужды анализировать всю их массу. Достаточно было бы исследовать один из случаев и на его основе сделать выводы, относящиеся уже ко всей исследуемой совокупности.

Знание статистики помогает нам принять оптимальные решения. При этом статистика отнюдь не отвергает опыт и интуицию исследователя. Ее можно рассматривать как один из компонентов процесса принятия решения, но отнюдь не как весь процесс. Поэтому есть основания считать, что статистика дополняет, но не заменяет деловой опыт, здравый смысл и интуицию человека.

Одной из задач статистики является исследование зависимостей и взаимосвязей между объективно-существующими явлениями и процессами. Оно играет в развитии экономики значительную роль, позволяет глубже понять сложный механизм причинно-следственных отношений. В настоящее время важно уметь количественно измерить тесноту причинно-следственных связей и выявить форму связи между экономическими процессами. Происходящие явления и процессы органически связаны между собой, зависят друг от друга и обуславливают друг друга. Взаимосвязь и взаимообусловленность проявляются в работе любой фирмы, компании, предприятия и т.д.

Для исследования интенсивности, вида и формы причинных связей широко применяется корреляционный и регрессионный анализ. Выявление количественных соотношений дает возможность лучше понять природу исследуемого явления. Это, в свою очередь, позволяет воздействовать на изученные факторы, вмешиваться в соответствующий процесс с целью получения нужных результатов.

Чтобы глубоко и основательно проникнуть в суть явления, необходимо исследовать и раскрыть его причинные связи, его отношения с другими явлениями. Под причинной связью понимают такую связь, когда изменение одних процессов есть следствие изменения других.

В данной работе мы рассмотрим исследование связей между явлениями, а так же на примере данных российских банков установим направление и характер взаимосвязи между активами и прибылью банков и проверим полученную корреляционно-регрессивную модель на адекватность.

1. Виды зависимостей, изучаемых в статистике

Зависимость одной случайной величины от значений, которые принимает другая случайная величина (физическая характеристика), в статистике называется регрессией. Если этой зависимости придан аналитический вид, то такую форму представления изображают уравнением регрессии.

Процедура поиска предполагаемой зависимости между различными числовыми совокупностями обычно включает следующие этапы:

? установление значимости связи между ними;

? возможность представления этой зависимости в форме математического выражения (уравнения регрессии).

Рассматривая зависимости между признаками, необходимо выделить прежде всего две категории связи:

1. Функциональные - характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Примером функциональной связи может служить любая математическая формула.

2. Корреляционные (статистические) - рассматриваются как признак, указывающий на взаимосвязь ряда числовых последовательностей. Иначе говоря, корреляция характеризует силу взаимосвязи в данных. Если это касается взаимосвязи двух числовых массивов xi и yi, то такую корреляцию называют парной. При поиске корреляционной зависимости обычно выявляется вероятная связь одной измеренной величины x (для какого-то ограниченного диапазона ее изменения, например от x1 до xn) с другой измеренной величиной y (также изменяющейся в каком-то интервале y1 … yn). В таком случае мы будем иметь дело с двумя числовыми последовательностями, между которыми и надлежит установить наличие статистической (корреляционной) связи. На этом этапе пока не ставится задача определить, является ли одна из этих случайных величин функцией, а другая - аргументом. Отыскание количественной зависимости между ними в форме конкретного аналитического выражения y = f(x) ? это задача уже другого анализа, регрессионного.

Таким образом, корреляционный анализ позволяет сделать вывод о силе взаимосвязи между парами данных х и у, а регрессионный анализ используется для прогнозирования одной переменной (у) на основании другой (х).

Иными словами, в этом случае пытаются выявить причинно-следственную связь между анализируемыми совокупностями.

Рисунок 1. Функциональная (а) и статистическая (б) зависимости

Аналитически функциональная зависимость представляется в следующем виде: y = f(x). В случае статистической связи значению одного фактора соответствует какое-то приближенное значение исследуемого параметра, его точная величина является непредсказуемой, непрогнозируемой, поэтому получаемые показатели оказываются случайными величинами. Это значит, что изменение результативного признака у обусловлено влиянием факторного признака х лишь частично, т.к. возможно воздействие и иных факторов, вклад которых обозначен как е: y = ?(x) + е.

По своему характеру корреляционные связи - это соотносительные связи. Примером корреляционной связи показателей коммерческой деятельности является, например, зависимость сумм издержек обращения от объема товарооборота. В этой связи помимо факторного признака х (объема товарооборота) на результативный признак у (сумму издержек обращения) влияют и другие факторы, в том числе и неучтенные, порождающие вклад е.

Статистическая зависимость может быть выявлена лишь по результатам достаточно большого числа наблюдений. Графически статистическая зависимость двух признаков может быть представлена с помощью поля корреляции, при построении которого на оси абсцисс откладывается значение факторного признака X, а по оси ординат - результирующего Y.

Корреляционные связи могут иметь различную степень обусловленности. Если значению факторного признака Х соответствуют близкие друг другу, расположенные рядом со средней величиной, значения результативного признака Y, то говорят о тесной корреляционной зависимости. Если значения результативного признака Y различаются значительно, то связь менее тесная.

При наличии корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака. По направлению связи могут быть прямые (а) и обратные (б).

Рисунок 2. Поле корреляции

Прямые связи - с увеличением факторного признака Х результативный признак Y - увеличивается. При обратных связях с увеличением Х значение Y - уменьшается.

Связи могут быть прямолинейными и криволинейными. Прямолинейные описываются уравнением прямой, а криволинейные - описываются любой другой формулой (гиперболой, параболой и т.д.).

При исследовании корреляционных зависимостей между признаками решаются следующие задачи:

1. Предварительный анализ свойств моделируемой совокупности единиц.

2. Установление наличия связи в фактическом материале, определение ее направления и формы.

3. Измерение степени тесноты связи между признаками, т.е. степени приближения ее к функциональной зависимости.

4. Построение регрессионной модели, ее экономическая интерпретация и практическое использование.

Для того, чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования в отношении отбора объекта исследования и признаков-факторов.

Одним из важнейших условий правильного применения методов корреляционного анализа является требование однородности тех единиц, которые подвергаются изучению методами корреляционного анализа. Например, при корреляционном анализе зависимостей тех или иных технико-экономических показателей работы предприятий от определенных факторов должны быть отобраны предприятия, выпускающие однотипную продукцию, имеющие одинаковый характер технологического процесса и тип используемого оборудования, для предприятий добывающей промышленности определенную роль играет и географическое размещение предприятий.

Другим важным требованием, обеспечивающим надежность выводов корреляционного анализа, является требование достаточного числа наблюдений.

Определенные требования существуют и в отношении факторов, вводимых в исследование.

2. Основные методы изучения взаимосвязей

Корреляцию и регрессию принято рассматривать как совокупный процесс статистического исследования, поэтому их использование в статистике часто именуют корреляционно-регрессионным анализом.

Для изучения, измерения и количественного выражения взаимосвязей между явлениями статистикой применяются различные методы, важнейшим из которых являются: метод сопоставления, метод параллельных рядов, балансовый, графический, методы аналитических группировок, дисперсионного и корреляционного анализа.

В данной работе при решении задачи мы используем несколько методов.

Задача: По группе акционерных коммерческих банков региона имеются следующие данные:

№ банка

Активы банка, млн.руб

Прибыль, млн.руб

1

80

3,4

2

80

4,2

3

80

3,8

4

82

5,9

5

82

6,0

6

88

5,8

7

88

5,6

8

88

6,3

9

88

6,9

10

90

6,9

11

90

8,2

12

92

7,7

13

92

8,5

14

92

8,0

15

92

9,6

16

92

10,1

17

95

12,0

18

95

11,6

19

99

13,4

20

99

15,8

21

99

16,2

22

105

17,4

23

105

16,5

24

108

19,0

25

108

23,4

26

110

22,6

27

110

20,7

28

110

26,3

29

115

32,0

30

115

31,5

Установить направление и характер взаимосвязи между суммой прибыли банка и размером его активов. Полученную корреляционно-регрессионную модель проверить на адекватность.

Решение:

1. В исходных данных задачи таблица представлена в виде метода сопоставления параллельных рядов.

Метод параллельных рядов - ряд значений факторного признака и соответствующих ему значений результативного признака (значение признака Х располагается в возрастающем порядке, затем прослеживают направление изменения величины результативного признака Y). Чтобы установить связь между явлениями, достаточно расположить полученные в результате сводки и обработки материалы в виде параллельных рядов и сопоставить их между собой. Такое сопоставление, проведенное после теоретического анализа, показавшего возможность связи между изучаемыми явлениями, позволяет проследить числовые соотношения сопоставляемых признаков и направление их изменений, т.е. позволяет установить наличие связи и получить представление о ее характере.

2. Применим метод построения групповой таблицы.

Метод аналитических группировок. Сущность этого метода заключается в том, что единицы статистической совокупности группируются, как правило, по факторному признаку и для каждой группы исчисляется средняя или относительная величина по результативному признаку.

Все наблюдения разбиваются на группы в зависимости от величины факторного признака и по каждой группе вычисляется среднее значение результативного признака.

Группа банков по активам, млн.руб

Число банков в группе

Средняя прибыль в данных группах банков, млн.руб

80

3

3,8

82

2

5,95

88

4

6,15

90

2

7,55

92

5

8,78

95

2

11,8

99

3

15,13

105

2

16,95

108

2

21,2

110

3

23,2

115

2

31,75

-

30

-

С увеличением активов банков увеличивается прибыль, т.е. предполагается наличие прямой связи.

3. Балансовый метод. Сущность метода заключается в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными частями были равны, т.е. чтобы был баланс. Этот метод используется для характеристики взаимосвязи между производством и реализацией продукции, денежными доходами и расходами населения и т.д.

Составим корреляционную таблицу. Построение начинается с группировки значений факторного и результативного признаков.

Для группировки значений результативного признака определим величину интервала группировки

(млн.руб)

Середина интервала, y

5,785

10,565

15,345

20,125

24,905

29,685

Гр по y

Гр по x

3,4-8,17

8,18-12,95

12,96-17,73

17,74-22,51

22,52-27,29

27,3-32,07

80

3

3

5,785

82

2

2

5,785

88

4

4

5,785

90

1

1

2

8,175

92

2

3

5

8,653

95

2

2

10,565

99

3

3

15,345

105

2

2

15,345

108

1

1

2

22,515

110

1

2

3

23,312

115

2

2

29,685

fy

12

6

5

2

3

2

30

-

частота повторения значений факторного и результативного признаков соответственно, по всей совокупности.

среднее значение результативного признака для «j» группы значения факторного признака.

Числа, расположенные на пересечении строк и столбцов таблицы означают частоту повторения данного сочетания значений х и у.

Если частоты в корреляционной таблице располагаются по диагонали из левого верхнего угла в правый нижний угол, то предполагают наличие прямой связи.

В данной задаче мы видим наличие прямой связи.

Увеличение среднего значения у с увеличением факторного свидетельствует о возможном наличии прямой корреляционной зависимости прибыли от суммы активов банка.

Построим графики полученных результатов с использованием трех методов. Мы видим, что характер функции близок к прямолинейной.

4. Аналитический метод

Изучение корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значение одной переменной можно принять за зависимую переменную, которая «в среднем» изменяется в зависимости от того, какие значения принимает другая переменная, рассматриваемая как причина изменения зависимой переменной. Действие данной причины осуществляется в условиях сложного взаимодействия различных факторов, вследствие чего проявление закономерности затемняется влиянием случайностей. Вычисляя средние значения результативного признака для данной группы значений признака-фактора, мы отчасти исключаем влияние случайностей. Вычисляя параметры теоретической линии связи, мы производим дальнейшее их исключение и получаем однозначное (по форме) изменение переменной у с изменением фактора х.

Теоретической линией регрессии - называется линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи.

Теоретическая линия регрессии должна отображать изменение средних величин результативного признака у по мере изменения величин факторного признака х при условии полного взаимопогашения всех прочих случайных по отношению к фактору х причин. Следовательно, эта линия должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии регрессии равнялась нулю, а сумма квадратов этих отклонений была бы минимальной величиной.

Важным этапом регрессионного анализа является определение типа функции, с помощью которой характеризуется зависимость между признаками. Главным основанием для выбора вида уравнения должен служить содержательный анализ природы изучаемой зависимости, ее механизма. На основе теоретического анализа нередко могут быть сделаны самые общие выводы относительно направления связи, возможности его изменения в исследуемой совокупности, правомерности использования линейной зависимости, возможного наличия экстремальных значений и т.п. Необходимым дополнением такого рода предположений должен быть анализ конкретных фактических данных.

Тип уравнения выбирается на основе теоретического анализа и исследования фактических данных. В большинстве случаев связи в общественных явлениях изучают по уравнению прямой, вида , где a и b - параметры искомой прямой.

Данное уравнение - уравнение регрессии, а сама прямая называется линией регрессии. Параметры уравнения a и b находятся выравниванием по способу наименьших квадратов, которые приводят к системе двух нормальных уравнений:

Для измерения тесноты линейной зависимости рассчитывают линейный коэффициент корреляции ().

или

При расчете этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сама величина таких отклонений, т.е. соответственно для факторного и результативного признаков определяют величины и .

При пользовании формулой расчета линейного коэффициента корреляции отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи: прямой зависимости соответствует знак «+», а обратной зависимости - знак «-».

Если с увеличением значений факторного признака результативный признак имеет тенденцию к увеличению, то величина коэффициента корреляции будет находиться между 0 и 1.

Зная коэффициент корреляции, можно дать качественно-количественную оценку тесноты связи. Используются, например, специальные табличные соотношения (так называемая шкала Чеддока).

Для удобства расчетов составим таблицу и занесем в нее данные.

Подставив все значения в формулу линейного коэффициента корреляции, получаем что r = 0,959.

|r|>0,9, следовательно - связь между признаками прямая и очень сильная.

3. Проверка на адекватность регрессионной модели

Для практического использования моделей регрессии очень важна их адекватность, т.е. соответствие фактическим данным. Поскольку корреляционно-регрессионный анализ обычно проводится для ограниченной по объему совокупности, то параметры уравнения регрессии, коэффициента корреляции могут быть искажены действием случайных факторов.

Чтобы проверить на сколько эти показатели характерны для всей генеральной совокупности, необходимо проверить адекватность построенных статистических моделей. Проверка значимости (существенности) осуществляется с помощью t-критерия Стьюдента. При этом рассчитываются значения t-критерия:

- для параметра a:

- для параметра b:

Параметры a и b могут быть как положительные, так и отрицательные, берутся по модулю.

Средняя квадратическая ошибка уравнения дает нам возможность в каждом отдельном случае с определенной вероятностью указать, что величина результативного признака расположена в определенном интервале относительно значения, вычисленного по уравнению регрессии.

- остаточное среднее квадратическое отклонение результативного признака у от выровненных значений

Вычисленные значения сравниваем с критическим t, которое определяется по таблице распределения Стьюдента, с учетом принятого уровня значимости и числа степеней свободы , что соответствует = 2,048.

Параметр признается значимым при условии

В нашем случае и значит параметры уравнения регрессии признаются значимыми.

Для линейной однофакторной связи используется формула

, что свидетельствует о значимости линейного коэффициента корреляции и существенности связи между активами банка и прибылью.

Таким образом, построенная модель в целом адекватна.

Данные, полученные по результатам малой выборки можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность.

4. Экономическая интерпретация параметров уравнения регрессии

После проверки адекватности, установления точности и надежности построенной модели (уравнения регрессии), ее необходимо проанализировать. Прежде всего нужно проверить, согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).

В рассмотренном уравнении , характеризующем зависимость размера прибыли банков (у) от активов банков (х).

Параметр b>0, следовательно, с возрастанием активов банков размер прибыли увеличивается.

Из уравнения следует, что возрастание активов банков на 1 млн рублей приводит к увеличению прибыли банков в среднем на 0,73 млн рублей

Для оценки влияния факторного признака на результативный рассчитывается коэффициент эластичности в целом для всей совокупности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле:

,

%

Коэффициент рассчитывается в процентах.

По полученным результатам можно сделать вывод, что при увеличении активов банка на 1% увеличивается прибыль на 5,44%.

Заключение

Таким образом, в данной работе установлена корреляционная зависимость показателей 30 российских банков, проведен регрессионный анализ и найдена регрессионная модель данной взаимосвязи показателей.

Полученное уравнение позволяет проиллюстрировать зависимость размера прибыли банков от размера их активов.

А также проведена проверка данной модели на адекватность по критерию Стьюдента, результат оказался положительным (модель адекватна, т.е. ее можно применять), а затем дана экономическая оценка этой модели - при увеличении активов банка увеличивается и прибыль.

Список использованной литературы

1. А.М. Годин, «Статистика»учебник, Москва, 2006 г.

2. В.С. Мхитарян, «Статистика» 4-е издание учебник, Москва, 2006 г.

3. М.Р. Ефимова, «Статистика», учебное пособие, Москва, 2004 г.

4. Курс лекций.

5. В.Р. Бараз, «Корреляционно-регрессионный анализ связи показателей коммерческой деятельности», Екатеринбург, 2005 г.

6. http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-008.htm

7. http://cityref.ru/prosmotr/13653-4810.htm


Подобные документы

  • Показатели финансовых результатов. Анализ зависимости прибыли гостиничного комплекса от объема номерного фонда и его загрузки. Построение классической регрессионной модели, определение ее классности и точности. Анализ развития и прогнозирование прибыли.

    курсовая работа [586,4 K], добавлен 03.06.2014

  • Направление деятельности ОАО "Татнефть", его место на рынке. Система управления компанией. Исследование зависимости прибыли от совокупных активов компании методом корреляционно-регрессионного анализа. Анализ и прогнозирование деятельности предприятия.

    курсовая работа [600,9 K], добавлен 30.10.2011

  • Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

    лекция [38,1 K], добавлен 13.02.2011

  • Методика построения графика зависимости между величиной капитала и чистыми активами банков, определение уравнения регрессии зависимости чистых активов и капитала коммерческих банков. Вычисление показателей тесноты связи между изучаемыми признаками.

    контрольная работа [89,5 K], добавлен 04.02.2009

  • Сущность и виды производственных показателей предприятия. Основные производственные показатели и примеры их расчета. Статистические методы изучения производственных показателей предприятия. Корреляционно-регрессионный метод. Компьютерная статистика.

    курсовая работа [1,2 M], добавлен 11.05.2008

  • Корреляционно-регрессионный анализ как объект статистического изучения, система статистических показателей, его характеризующих. Особенности и принципы применения метода корреляционно-регрессионного анализа. Построение статистического ряда распределения.

    курсовая работа [453,1 K], добавлен 28.01.2014

  • Расчет зависимости выпуска продукции и производительности труда от численности работающих. Определение среднего размера товарооборота. Вычисление показателей вариации и средней заработной платы работников. Расчет эмпирического корреляционного отношения.

    контрольная работа [91,8 K], добавлен 26.02.2010

  • Организационно-экономическая характеристика ОАО "Новгородхлеб". Статистический анализ прибыли и рентабельности предприятия: выявление их зависимости с помощью корреляционно-регресионного расчета. Прогнозные значения; обоснование результатов анализа.

    дипломная работа [1,4 M], добавлен 09.12.2012

  • Экстраполяция и прогнозирование, средние показатели в рядах динамики. Корреляционно-регрессионный анализ. Выявление основной тенденции изменения урожайности зерновых. Анализ влияния урожайности зерновых и размера посевной площади на валовой сбор зерна.

    курсовая работа [715,8 K], добавлен 28.08.2012

  • Закономерности математической модели прибыли производителя-монополиста, определение его зависимости от устанавливаемой цены на товары или услуги. Аналитический обзор измерения прибыли железной дороги в зависимости от тарифов на пассажирские перевозки.

    контрольная работа [597,3 K], добавлен 10.04.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.