Статистическое изучение взаимосвязи социально-экономических явлений

Основные подходы к описанию факторов неопределенности, лежащие в основе соответствующих методов построения недетерминированных моделей. Методы проведения однофакторного корреляционно-регрессионного анализа взаимосвязи социально-экономических явлений.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 24.09.2017
Размер файла 56,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

1. Характер социально-экономических явлений и связи между ними

Важнейшей задачей науки является исследование объективно существующих связей между явлениями. Знание их характера и величины может помочь управлять социально-экономическими процессами и предсказывать их развитие. Изучение механизма рыночных связей, взаимодействия спроса и предложения, влияние объема и структуры товарооборота на объем и состав производства, формирование товарных запасов, прибыли, издержек и других показателей имеет первостепенное значение для прогнозирования конъюнктуры рынка, управления производственными и торговыми процессами, успешного ведения бизнеса.

При исследовании причин и следствий для различных явлений можно выделить два вида связей: детерминированную функциональную связь и недетерминированную связь.

Если каждому значению независимой переменной (или нескольких независимых переменных) соответствует одно строго определенное значение другой переменной (однозначное соответствие), то связь называют функциональной. Независимые признаки, характеризующие причины, при этом называют факторными признаками, а признак, характеризующий следствие - результативным. Чаще всего функциональные связи наблюдаются в явлениях, изучаемых естественными науками, а также в различных областях техники.

В социально-экономических явлениях функциональная связь скорее исключение, чем правило. В экономике примером функциональной связи может служить связь между оплатой труда и количеством изготовленных деталей при простой сдельной оплате труда.

Обычно социально-экономические явления представляют собой результат одновременного воздействия большого числа факторов. При этом большая часть этих факторов является факторами неопределенности: в их число можно включить и погрешности наблюдения, и неизвестные либо изменяющиеся по неизвестному закону факторы, входящие в структуру модели изучаемого явления. Любая из этих причин обусловливает наличие неопределенности, вследствие чего эта система должна рассматриваться как недетерминированная. Например, результаты производственной деятельности фирмы зависят от собственных действий, от действий конкурентов, от государственной политики (стратегии борьбы с преступностью, налоговая политика, свободные экономические зоны и пр.), от международного положения.

Если связь между признаками недетерминирована, то в различных наблюдениях при одном и том же значении факторного признака результативный признак может принимать различные значения, т.е. имеет место неоднозначное соответствие между указанными признаками. Например, производительность труда рабочих связана с целым рядом факторов: квалификацией, стажем работы, состоянием оборудования, атмосферным давлением, днем недели и т.д. К тому же каждый фактор может по-разному влиять на производительность различных рабочих. В результате, при одинаковых значениях факторных признаков имеет место множество различных значений дневной выработки рабочих.

2. Виды связей

Связи между явлениями различаются по направлению, характеру и аналитическому выражению зависимости.

Если направление изменения результативного признака совпадает с направлением изменения факторного признака, то есть с увеличением факторного признака увеличивается и результативный, то зависимость между ними называют прямой. При обратной зависимости увеличение факторного признака приводит к уменьшению результативного. Например, связь между квалификацией рабочего и производительностью труда, как правило, прямая, а между производительностью труда и себестоимостью продукции - обратная.

Исходя из аналитического выражения зависимости, описывающей связь, выделяют связи линейные (если связь между явлениями описана уравнением прямой) и нелинейные (парабола, гипербола, степенная, показательная и др. функции). Определить тип зависимости можно, исследуя ее графически. Однако можно в первом приближении выявить уравнение связи, не прибегая к графическому изображению. Если результативный признак с возрастанием факторного равномерно возрастает или убывает, то это свидетельствует о наличии линейной связи между ними. Если результативный признак с возрастанием факторного признака возрастает (или убывает), стремясь к конечному пределу, то возможно использование уравнения гиперболы. Если результативный признак увеличивается гораздо быстрее факторного, то используется параболическая или степенная функции.

По количеству факторов, действие которых на результативный признак рассматривается, различаются однофакторные и многофакторные связи. Однофакторные (простые) связи обычно называются парными (так как рассматривается пара признаков). Например, связь между прибылью и производительностью труда.

3. Методы анализа взаимосвязи

Первым и обязательным этапом изучения взаимосвязи социально-экономических явлений является качественный анализ природы явления методами экономической теории, социологии, психологии, конкретных разделов экономики и т.п. Второй этап - сбор и анализ исходных данных. Третий этап - построение модели связи. Он включает в себя исследование направления и тесноты связи, выбор вида модели, нахождение ее параметров (при использовании параметрических методов) и проверку ее адекватности. Последний этап - интерпретация результатов, позволяющая использовать результаты исследования для практических целей.

Выбор вида модели связи и метода ее построения требует, во-первых, понимания характера изучаемого явления и, во-вторых, осознания целей исследования.

Существуют различные подходы к описанию факторов неопределенности, лежащие в основе соответствующих методов построения недетерминированных моделей.

Наиболее широкое распространение в задачах построения моделей взаимосвязи социально-экономических процессов получили вероятностные методы, которые основаны на трактовке факторов неопределенности как случайных величин. Несмотря на свою исключительно широкую распространенность вероятностные методы не могут рассматриваться как универсальные и единственно возможные. Их обоснованная применимость ограничена рамками ситуации, при которых имеет место множество однотипных явлений (ансамбль событий), которые, несмотря на неоднозначность наблюдаемых результатов, характеризуются некоторым внутренним детерминизмом, определяющим близость усредненных характеристик (статистическая однородность). Вероятностные модели и методы имеет смысл применять только при изучении массовых явлений, когда результативные признаки носят характер усредненных величин:

вероятности тех или иных событий (вероятность разорения наугад взятой фирмы из множества однотипных);

средних значений показателей (средний товарооборот, средний объем выпуска, средняя зарплата и пр.);

характеристик разброса значений показателей (дисперсия времени доставки товара, дисперсия времени обслуживания или времени ожидания и т.д.).

Вероятностные методы неприменимы в тех случаях, когда речь идет о единичном событии (разорение конкретной фирмы, трудоустройство конкретного человека), или когда усредненные показатели бессмысленны (средняя температура по больнице).

Возможной альтернативой при построении моделей недетерминированных связей между явлениями явлений является использование так называемых игровых методов, или методов гарантированного результата, ведущих свое начало с классических работ Джона фон Неймана. При этом ситуация неопределенности описывается моделью игры, в которой факторы неопределенности выбираются реальным или условным противником таким образом, чтобы максимально ухудшить рассматриваемую ситуацию с точки зрения решения исходной задачи. Примером могут служить задачи моделирования конкурентного взаимодействия, задачи планирования производства или инвестиций в условиях риска. Достоинством игровых моделей является меньшие требования к объему исходных данных. Однако зачастую данные методы приводят к слишком пессимистическим выводам и результатам, особенно в тех случаях, когда противник реально не существует, а вводится лишь для моделирования неопределенной ситуации. ("Господь Бог изощрен, но не злонамерен" А. Эйнштейн).

В последние годы для описания факторов неопределенности все чаще используются методы теории нечетких систем, созданные в середине 20-го века выдающимся математиком Лотфи Заде. Они предполагают использование лингвистических переменных, которые в отличие от количественных переменных описывают изучаемые явления на качественном уровне (больше, меньше, хуже, лучше). Моделирование неопределенных ситуаций в этом случае осуществляется с помощью так называемых функций принадлежности, с помощью которых формализуется степень уверенности или достоверности тех или иных исходов в различных ситуациях.

На начальном этапе исследования взаимосвязи зачастую используют достаточно простые эвристические методы: метод сопоставления двух рядов, графический метод и метод аналитических группировок. Они позволяют установить наличие связи и судить о ее характере.

Метод сопоставления двух рядов основан на сопоставлении двух или нескольких рядов статистических данных. Графический метод состоит в построении графика зависимости результативного признака от факторного.

Метод аналитических группировок включает в себя группировку единиц совокупности по факторному признаку и вычисление для каждой полученной группы среднего или относительного значения результативного признака. Сопоставляя затем изменения затем изменения результативного признака по мере по мере изменения факторного, можно предварительно оценить направление, характер и тесноту связи между ними.

Кроме того, для установления наличия и мощности связи между признаками используются некоторые непараметрические методы, среди которых можно выделить метод, основанный на анализе таблиц взаимосопряженности и метод ранговой корреляции.

4. Моделирование связи методом корреляционного и регрессионного анализа

Частным случаем недетерминированной связи является связь случайная - стохастическая (вероятностная).

Реализация вероятностного подхода к описанию недетерминированных связей между явлениями включает в себя два этапа:

выбор вероятностной (стохастической) модели взаимосвязи (например, условная плотность распределения, уравнение регрессии и пр.);

определение параметром модели по реальным наблюдениям. В рамках вероятностного подхода нахождение параметров реализуется статистическими методами. Полученные значения параметров называются оценками.

При стохастической связи каждому конкретному значению факторного признака соответствует не одно единственное значение результативного признака , а условное распределение его значений. Появляющиеся различные значения результативного признака - реализации случайной величины. Стохастическая связь наблюдается только на большом массиве данных и проявляется неоднозначно, а только как тенденция. Стохастический характер связи проявляется только при исследовании массовых явлений, причем во всей совокупности, а не в каждой ее единице. Это означает, что существует множество однотипных объектов или явлений и наблюдение за ними происходило в сходных условиях. Поэтому наиболее эффективно использование статистических методов при исследованиях на макроэкономическом уровне. Разновидностью стохастической связи является регрессионная зависимость, которая подразумевает изменение среднего значения результативного признака при изменении факторного признака .

Различают парную, частную и множественную регрессию.

Парная связь - зависимость результативного признака от одного факторного или зависимость двух факторов-причин между собой.

Частная связь - зависимость результативного фактора от изменений одного факторного признака при фиксированных значениях остальных.

Множественная связь - зависимость результирующего признака от набора факторных признаков.

Исследование взаимосвязи признаков является предметом корреляционно-регрессионного анализа.

Регрессионный анализ включает в себя подбор вида математической модели (уравнения регрессии), отыскание параметров этого уравнения и оценку адекватности выбранной модели. Уравнение регрессии представляет собой зависимость математического ожидания результирующего признака от факторных признаков. Значения результирующего фактора, рассчитанные для каждого сочетания значений факторных признаков по найденному уравнению регрессии, называются выровненными и обозначаются (, выровненный по ).

Корреляционный анализ устанавливает тесноту зависимости между результативным и факторными признаками. Применение корреляционного анализа правомерно в том случае, когда результативный и все факторные признаки распределены по нормальному закону.

Этапы корреляционно-регрессионного анализа:

теоретическое обоснование взаимосвязей между признаками в объекте исследования;

сбор и анализ исходных данных;

оценка тесноты связи между признаками;

подбор формы аналитического уравнения связи;

оценка адекватности полученной модели;

интерпретация полученных результатов и использование регрессионной модели для целей прогнозирования и нормирования.

Следует отметить, что вне зависимости от сложности уравнения регрессии, оно не вскрывает причинно-следственные связи.

5. Однофакторный корреляционно-регрессионный анализ

экономический корреляционный регрессионный

Парная линейная регрессия.

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Важным и нетривиальным этапом построения регрессионной модели является выбор уравнения регрессии. Этот выбор основывается на теоретических данных об изучаемом явлении и предварительном анализе имеющихся статистических данных.

Уравнение парной линейной регрессии имеет вид:

,

где - теоретические значения результативного признака, полученные по уравнению регрессии; - коэффициенты (параметры) уравнения регрессии.

Модель регрессии строится на основании статистических данных, причем могут использоваться как индивидуальные значения признака, так и сгруппированные данные. Для выявления связи между признаками по достаточно большому числу наблюдений статистические данные предварительно группируют по обоим признакам и строят корреляционную таблицу. При помощи корреляционной таблицы отображается только парная корреляционная связь, т.е. связь результативного признака с одним фактором. Оценка параметров уравнения регрессии осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и требование минимальности суммы квадратов отклонений эмпирических данных от выровненных значений результативного фактора:

.

Для линейного уравнения регрессии имеем:

Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

где - объем исследуемой совокупности (число единиц наблюдения).

Решение системы нормальных уравнений позволяет найти параметры уравнения регрессии .

Коэффициент парной линейной регрессии является средним значением в точке , поэтому его экономическая интерпретация затруднена. Смысл этого коэффициента можно трактовать как усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов. Коэффициент показывает, на сколько в среднем изменяется значение результативного признака при изменении факторного признака на единицу.

После получения уравнения регрессии необходимо проверить его адекватность, то есть соответствие фактическим статистическим данным. С этой целью производится проверка значимости коэффициентов регрессии: выясняется, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом случайного стечения обстоятельств.

Для проверки значимости коэффициентов простой линейной регрессии при объеме совокупности меньше 30 единиц используется критерий Стьюдента. Сопоставляя значение параметра с его средней ошибкой, определяют величину критерия:

,

где - средняя ошибка параметра .

Средняя ошибка параметров и рассчитываются по следующим формулам:

; ,

Где:

- объем выборки;

- среднеквадратическое отклонение результативного признака от выровненных значений ;

- среднеквадратическое отклонение факторного признака от общей средней :

или

Тогда расчетные (фактические) значения критерия соответственно равны:

- для параметра ;

- для параметра .

Вычисленные значения критерия сравниваются с критическими значениями , которые определяют по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы , где - объем выборки, -1 ( - число факторных признаков). В социально-экономических исследованиях уровень значимости обычно принимают 0.05 или 0.01. Параметр признается значимым, если (отклоняется гипотеза о том, что параметр лишь в силу случайных обстоятельств оказался равным полученной величине, а в действительности равен нулю).

Адекватность регрессионной модели может быть оценена при помощи -критерия Фишера. Расчетное значение критерия определяется по формуле:

,

где - число параметров модели;

- объем выборки.

По таблице определяется критическое значение -критерия Фишера для принятого уровня значимости и числа степеней свободы , . Если , то модель регрессии признается адекватной по этому критерию ( отвергается гипотеза о несоответствии заложенных в уравнении и реально существующих связей ).

Вторая задача корреляционно-регрессионного анализа - измерение тесноты зависимости результативного и факторного признака.

Для всех видов связи задача измерения тесноты зависимости может быть решена с помощью исчисления теоретического корреляционного отношения:

,

где - дисперсия в ряду выровненных значений результативного признака , обусловленная факторным признаком ;

- дисперсия в ряду фактических значений . Это общая дисперсия, которая слагается из дисперсии, обусловленной фактором (т.е. факторной дисперсии), и дисперсии остатка (отклонение эмпирических значений признака от выровненных теоретических).

На основании правила сложения дисперсий теоретическое корреляционное отношение может быть выражено через остаточную дисперсию :

.

Так как дисперсия отражает вариацию в ряду только за счет вариации фактора , а дисперсия отражает вариацию за счет всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации , показывает, какой удельный вес в общей дисперсии ряда занимает дисперсия, вызываемая вариацией фактора . Квадратный корень из отношения этих дисперсий дает теоретическое корреляционное отношение. При нелинейных связях теоретическое корреляционное отношение называют индексом корреляции и обозначают .

Если , то это означает, что роль других факторов в вариации отсутствует, остаточная дисперсия равна нулю и отношение означает полную зависимость вариации от . Если , то это означает, что вариация никак не влияет на вариацию , и в этом случае . Следовательно, корреляционное отношение принимает значения от 0 до 1. Чем ближе корреляционное отношение к 1, тем теснее связь между признаками.

Кроме того, при линейной форме уравнения связи применяется другой показатель тесноты связи - линейный коэффициент корреляции:

.

Линейный коэффициент корреляции принимает значения от -1 до 1. Отрицательные значения указывают на обратную зависимость, положительные - на прямую. Чем ближе модуль коэффициента корреляции к единице, тем теснее связь между признаками.

Приняты следующие граничные оценки линейного коэффициента корреляции:

- связи нет;

- связь слабая;

- связь посредственная;

- связь сильная;

- связь очень сильная.

Квадрат линейного коэффициента корреляции называют линейным коэффициентом детерминации.

Факт совпадения или несовпадения теоретического корреляционного отношения и линейного коэффициента корреляции используется для оценки формы зависимости. Их значения совпадают только при наличии линейной связи. Несовпадение этих величин свидетельствует о нелинейности связи между признаками. Принято считать, что если , то гипотезу о линейности связи можно считать подтвержденной.

Показатели тесноты связи, особенно исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость проверки их надежности (значимости), дающей возможность распространять выводы, полученные по выборочным данным, на генеральную совокупность.

Для этого рассчитывается средняя ошибка коэффициента корреляции:

,

где - число степеней свободы при линейной зависимости.

Затем находится отношение коэффициента корреляции к его средней ошибке, то есть , которое сравнивается с табличным значением критерия Стьюдента.

Если фактическое (расчетное) значение больше табличного (критического, порогового), то линейный коэффициент корреляции считается значимым, а связь между и - реальной.

После проверки адекватности построенной модели (уравнения регрессии) ее необходимо проанализировать. Для удобства интерпретации параметра используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле:

, %

Точность полученной модели может быть оценена на основании значения средней ошибки аппроксимации:

Кроме того, в некоторых информативными являются данные об остатках, характеризующих отклонение -х наблюдений от расчетных значений . Особый экономический интерес представляют значения, остатки которых имеют наибольшие положительные или отрицательные отклонения от ожидаемого уровня анализируемого показателя.

Парная нелинейная регрессия.

Наиболее часто при описании взаимосвязи социально-экономических явлений, кроме линейной модели, используют следующие виды зависимостей:

гиперболическая ;

уравнение Торнквиста (процесс с насыщением);

парабола второго порядка (в практике регрессионного анализа редко применяют полиномы выше третьей степени);

степенная ;

показательная (экспоненциальная) ;

логарифмическая ;

логистическая кривая (кривая Перла) ();

кривая Гомперца .

Кривая Гомперца и логистическая кривая применяются для описания экономических процессов, которые имеют три ярко выраженные фазы развития: первая стадия - формирование базы и стадия медленного роста, вторая фаза - стадия бурного роста, третья - фаза насыщения и замедления роста. Кривые имеет точку перегиба, а при стремятся к асимптоте.

Параметры уравнений регрессии, как и в случае линейной регрессии, находят на основании метода наименьших квадратов. Число уравнений в системе нормальных уравнений при этом равно числу искомых параметров.

Нелинейные уравнения регрессии могут быть разбиты на две группы: уравнения нелинейные по переменным (например, полиномы, логарифмическая зависимость и др.) и уравнения, нелинейные по параметрам (например, уравнение Торнквиста, логистическое уравнение и др.). В первом случае уравнение называется квазилинейным, так как может быть приведено к линейному виду путем замены переменных или логарифмирования (для экспоненциальной зависимости). При этом вычисления параметром может быть осуществлено таким же образом, как и для линейных уравнений. Если уравнение регрессии нелинейно по параметрам, то значения параметров могут быть определены только с использованием численных методов.

В некоторых случаях нелинейность связей являются следствием неоднородности совокупности, к которой применяется регрессионный анализ (например, объединение в одной совокупности предприятий разных специализаций или разной величины). В этом случае регрессионный анализ не может быть эффективным. Поэтому перед применением регрессионного анализа любая нелинейность должна критически анализироваться.

По расположению точек корреляционного поля не всегда можно принять окончательное решение о виде уравнения регрессии. Если теоретические соображения и предшествующий опыт не могут помочь, то следует построить несколько наиболее подходящих уравнений регрессии. Предпочтение отдают уравнению, у которого значение остаточной дисперсии или средней ошибки аппроксимации является минимальным. Если же эти показатели отличаются незначительно, то выбирают наиболее простое уравнение.

Необходимо понимать, что практическое использование полученной модели имеет ряд ограничений:

- хорошие аппроксимационные свойства наблюдаются только в середине ряда, где ошибка составляет 1-2 %; на концах ряда ошибка может достигать 20%;

- на основании регрессионной зависимости нельзя получить оптимальные значения факторов;

- модель обладает слабыми экстраполяционными свойствами, не отражает тенденции развития и позволяет сделать только кратковременный прогноз.

6. Многофакторный корреляционно-регрессионный анализ

Явления общественной жизни складываются под воздействием целого ряда факторов, то есть являются многофакторными. Между факторами существуют сложные взаимосвязи, поэтому их нельзя рассматривать как простую сумму изолированных влияний. Изучение связи между тремя и более связанными между собой признаками носит название многофакторного корреляционно-регрессионного анализа.

Впервые это понятие было введено Пирсоном в 1908 году.

Многофакторный корреляционно-регрессионный анализ включает в себя следующие этапы:

- теоретический анализ, направленный на выбор факторных признаков, существенных для поставленной задачи;

- выбор формы связи (уравнения регрессии);

- отбор существенных факторных признаков, удаление из модели несущественных, объединение нескольких факторных признаков в один (этот признак не всегда имеет содержательную интерпретацию);

- вычисление параметров уравнения регрессии и коэффициентов корреляции;

- проверка адекватности полученной модели;

- интерпретация полученных результатов.

На этапе отбора факторных признаков необходимо учитывать, что даже если числовые данные свидетельствуют о наличии связи между двумя величинами, это может быть лишь отражением того факта, что они обе зависят от одной или нескольких величин (например, длина волос - рост - пол; синдром пингвина).

Для любой формы зависимости, особенно в условиях малого объема исследуемой совокупности можно выбрать целый ряд уравнений, которые в той или иной степени будут описывать эти связи. Практика построения многофакторных моделей взаимосвязи показывает, что обычно для описания зависимостей между социально-экономическими явлениями используют линейные, полиномиальные, степенные, гиперболические функции. При выборе модели пользуются опытом предшествующих исследований или исследований в смежных областях.

Преимуществом линейных моделей является простота расчета параметров и экономической интерпретации. Зависимости, нелинейные по переменным (квазилинейные) могут быть приведены к линейной форме путем замены переменных. Параметры уравнения множественной регрессии находятся по методу наименьших квадратов из системы нормальных уравнений. В условиях использования ЭВМ определение параметров, как для линейных, так и для нелинейных зависимостей может быть осуществлено численными методами.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор факторных признаков. Для адекватного отражения моделируемого процесса в модель необходимо включить максимальное количество факторов, но, с другой стороны, избыточное количество параметров затрудняет работу с моделью. Кроме того, для того, чтобы полученные результаты были достаточно надежными и воспроизводимыми на каждый факторный признак должно приходиться 10-20 наблюдений. Поэтому необходим отбор факторов на основе анализа их значимости.

Отбор факторов может быть проведен на основании:

метода пошагового исключения;

метода пошаговой регрессии.

Сущность метода пошагового исключения заключается в последовательном исключении из уравнения регрессии тех факторов, чьи параметры оказались незначимыми при проверке по критерию Стьюдента.

Использование метода пошаговой регрессии заключается в том, что факторы вводятся в уравнение регрессии поочередно, и при этом оценивается изменение суммы квадратов остатков и множественного коэффициента корреляции. Фактор считается незначимым и исключается из рассмотрения, если при его включении в уравнение регрессии не изменилась сумма квадратов остатков , даже если при этом изменились коэффициенты регрессии. Фактор считается значимым и включается в модель, если при этом увеличился коэффициент множественной корреляции и уменьшилась сумма квадратов остатков, даже если при этом коэффициенты регрессии изменились несущественно.

При построении моделей регрессии может возникнуть проблема, связанная с мультиколлинеарностью. Сущность этой проблемы заключается в том, что между факторными признаками существует значительная линейная связь. Мультиколлинеарность возникает в том случае, когда факторы выражают одну и ту же сторону явления или один является составным элементом другого. Это приводит к искажению рассчитываемых параметров регрессии, осложняет выделение существенных факторов и изменяет смысл экономической интерпретации коэффициентов регрессии. Индикатором мультиколлинеарности служат выборочные коэффициенты корреляции () характеризующие тесноту связи между факторами и :

.

Устранение мультиколлинеарности может реализовываться путем исключения из корреляционной модели одного или нескольких линейно-связанных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

После построения уравнения регрессии проводится проверка адекватности модели, включающая в себя проверку значимости уравнения регрессии и коэффициентов регрессии.

Вклад каждого фактора в изменение результативного признака оценивают по коэффициентам регрессии, по частным коэффициентам эластичности каждого фактора и по стандартизированным частным - коэффициентам регрессии.

Коэффициент регрессии показывает абсолютный уровень влияния фактора на результативный показатель при среднем уровне всех прочих входящих в модель факторов. Однако тот факт, что коэффициенты измеряются (в общем случае) в разных единицах измерения, не позволяет сравнить степени влияния признаков. Пример. Сменная добыча угля (т) зависит от мощности пласта (м) и уровня механизации (%):

.

Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с изменением на 1% каждого фактора при фиксированном положении других:

,

где - коэффициент регрессии при - том факторе, - среднее значение -того фактора, - среднее значение результативного признака.

· коэффициенты показывают, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением - того факторного признака на величину его среднего квадратического отклонения .

,

где - среднее квадратическое отклонение -того фактора, - среднее квадратическое отклонение результативного признака.

Таким образом, по перечисленным показателям выявляют факторы, в которых заложены наибольшие резервы изменения результативного признака .

Кроме того, для выявления экстремальных наблюдений может быть проведен анализ остатков.

В рамках многомерного корреляционного анализа рассматривают две типовые задачи:

- оценка тесноты связи двух переменных при фиксировании или исключении влияния всех остальных;

- оценка тесноты связи одной переменной со всеми остальными.

В рамках решения первой задачи определяются частные коэффициенты корреляции - показатели, характеризующие тесноту связи между тым и тым признаками при элиминации всех остальных признаков.

В многомерном корреляционном анализе рассматриваются две типовые задачи:

Определение тесноты связи одной переменной (результативного признака) с совокупностью всех остальных переменных (факторных признаков), включенных в анализ.

Определение тесноты связи между двумя переменными при фиксировании или исключении влияния остальных переменных.

Эти задачи решаются при помощи множественных и частных коэффициентов корреляции.

Для их определения может быть использована матрица выборочных коэффициентов корреляции:

,

где - количество признаков, - выборочный парный коэффициент корреляции.

Тогда теснота взаимосвязи результативного признака с совокупностью факторных признаков в целом может быть измерена при помощи множественного (совокупного) коэффициента корреляции. Оценкой этого показателя является выборочный множественный коэффициент корреляции:

,

где - определитель матрицы

С помощью множественного коэффициента корреляции может быть сделан вывод о тесноте взаимосвязи, но не о ее направлении.

Если факторные признаки коррелируют друг с другом, то на величине парного коэффициента корреляции частично сказывается влияние других переменных. В связи с этим возникает задача исследовать частную корреляцию между переменными при исключении (элиминировании) влияния одной или нескольких других переменных. Выборочный частный коэффициент корреляции между переменными может быть рассчитан по формуле:

,

где - алгебраическое дополнение соответствующего элемента корреляционной матрицы

Частный коэффициент корреляции может принимать значения от -1 до 1.

7. Непараметрические методы изучения связи

Важной задачей статистики является разработка методики статистической оценки социально-экономических явлений, которая осложняется тем, что многие характеристики могут быть оценены только по номинальной шкале (качественные показатели) или по порядковой шкале. Для установления наличия и тесноты связи в таких случаях используются непараметрические методы изучения связи.

Метод ранговой корреляции.

Для оценки тесноты связи между признаками, оцененными при помощи порядковой (ранговой) шкалы используется метод ранговой корреляции. Естественно, что этот метод применим также для признаков, оцененных по интервальной или относительной шкале.

Для оценки тесноты связи используется коэффициент ранговой корреляции, который по смыслу идентичен линейному коэффициенту корреляции.

Чаще всего при использовании этого метода вычисляется ранговый коэффициент Спирмена либо ранговый коэффициент Кендэла . Расчет коэффициента Спирмена основан на фиксации разности рангов двух параллельных рядов наблюдений - ряда признака и рада признака :

,

где , то есть разность рангов каждой пары значений и;

- число наблюдений.

Коэффициент корреляции рангов Кендэла определяется по формуле:

,

где .

Порядок расчета коэффициента Кендэла следующий:

значения факторного признака записываются в порядке возрастания, и каждому значению факторного признака ставится в соответствие значение результативного признака;

значения результативного признака ранжируются;

для каждого значения результативного признака подсчитывается число следующих за ним рангов более высокого порядка (со знаком "+") и число следующих за ним меньших по значению рангов (со знаком "-").

Если отдельные значения и повторяются, то присваиваемый им ранг рассчитывается как средняя арифметическая из суммы мест, которые они занимают по возрастанию.

Коэффициент Кендэла всегда меньше по значению, чем коэффициент Спирмена и для достаточно больших совокупностей . Чем ближе коэффициенты к единице (по модулю), тем теснее зависимость, а близость к нулю означает отсутствие связи или весьма малую зависимость.

Критическое значение коэффициента Спирмена определяется по таблице в зависимости от уровня значимости и числа наблюдений . Если , то существенность связи доказана с вероятностью .

Коэффициент корреляции считается значимым на уровне , если расчетное значения критерия превышает критическое.

При ранжировании иногда значения признаков двух или большего числа объектов равны между собой. Такие объекты называются связанными и им приписываются одинаковые средние ранги. Средние ранги равны среднему арифметическому номеров этих объектов в общем списке проранжированных объектов. Дл расчета коэффициента Спирмена в случае наличия связанных рангов существует специальная формула, но приблизительная оценка может быть получена и по общей формуле.

Коэффициент конкордации (согласованности).

Для определения тесноты связи при числе показателей, большем двух используется коэффициент конкордации:

,

где - количество факторов (показателей);

- число наблюдений.

,

где - ранг - того фактора для - той единицы наблюдения.

Значимость коэффициента конкордации проверяется (для на основе критерия Пирсона:

.

Если , то коэффициент конкордации считается значимым и наличие связи подтверждается.

Коэффициент конкордации часто используется для определения согласованности мнения экспертов в распределении мест (рангов) между исследуемыми факторами или объектами по их приоритетности.

Метод таблицы сопряженности.

Одной из задач статистики является анализ связи двух качественных признаков, каждый из которых представлен в виде альтернативных признаков. По характеру распределения можно судить случайно оно или нет, т.е. есть ли зависимость между изучаемыми признаками или нет. Анализ взаимосвязи между атрибутивными (качественными) признаками проводится на основе таблиц взаимной сопряженности, которые описывают комбинационные распределения совокупностей по двум признакам - факторному и результативному .

Оценка существенности связи может быть проведена при помощи критерия .

,

где - частота в конкретной ячейке, - суммы частот в соответствующей строке и столбце.

Чтобы сделать вывод о случайности или неслучайности распределения, определяется табличное (пороговое) значение для выбранного уровня значимости и числа степеней свободы , где , - число групп по строкам и столбцам в таблице сопряженности. Если , то можно сделать вывод о том, что распределение неслучайно и можно говорить о зависимости между признаками, положенными в основу группировки.

Размещено на Allbest.ru


Подобные документы

  • Степень тесноты и характера направления зависимости между признаками. Парная линейная корреляционная зависимость, ее корреляционно-регрессионный анализ. Исследование связи между одним признаком-фактором и одним признаком-результатом, шкала Чеддока.

    методичка [75,0 K], добавлен 15.11.2010

  • Понятие и типы моделей. Этапы построения математической модели. Основы математического моделирования взаимосвязи экономических переменных. Определение параметров линейного однофакторного уравнения регрессии. Оптимизационные методы математики в экономике.

    реферат [431,4 K], добавлен 11.02.2011

  • Особенности корреляционно-регрессионного анализа, его основные этапы. Характеристика показателей социально-экономического развития стран Африки. Этапы построения уравнения регрессии. Анализ средней продолжительности жизни населения в странах Африки.

    контрольная работа [47,2 K], добавлен 17.04.2012

  • Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.

    курсовая работа [151,0 K], добавлен 27.03.2009

  • Современная экономическая теория. Экономические процессы. Использование моделирования и количественного анализа. Выражение взаимосвязи экономических явлений и процессов. Определение, объект исследования, основные принципы, цели и задачи эконометрики.

    реферат [19,3 K], добавлен 04.12.2008

  • Сущность и содержание метода моделирования, понятие модели. Применение математических методов для прогноза и анализа экономических явлений, создания теоретических моделей. Принципиальные черты, характерные для построения экономико-математической модели.

    контрольная работа [141,5 K], добавлен 02.02.2013

  • Математические методы как инструмент анализа экономических явлений и процессов, построения теоретических моделей. Числовые функции и их свойства, практические примеры их использования в экономике. Производственные функции, функция спроса и предложения.

    курсовая работа [974,5 K], добавлен 11.10.2014

  • Обзор основных инструментов, применяемых в прогнозировании. Характеристика базовых методов построения прогнозов социально-экономических систем при помощи программного обеспечения MS EXCEL. Особенности разработки прогнозных моделей на 2004, 2006 и 2009 гг.

    лабораторная работа [218,4 K], добавлен 04.12.2012

  • Анализ основных способов построения математической модели. Математическое моделирование социально-экономических процессов как неотъемлемая часть методов экономики, особенности. Общая характеристика примеров построения линейных математических моделей.

    курсовая работа [1,3 M], добавлен 23.06.2013

  • Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.

    шпаргалка [142,4 K], добавлен 22.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.