Статистические методы выявления взаимосвязей общественных явлений

Причинно-следственные отношения между общественными явлениями. Простейшие методы изучения стохастических связей. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Непараметрические методы и сфера их применения.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 23.05.2010
Размер файла 90,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

32

Оглавление

Введение

1. «Причинно-следственные отношения между общественными явлениями и виды связей»

2. «Простейшие методы изучения стохастических связей»

3. «Статистическое моделирование связи методом корреляционного и регрессионного анализа»

4. «Непараметрические методы»

Расчетная часть

Аналитическая часть

Заключение

Литература

Введение

Наука исходит из объективной закономерной взаимосвязи и причинной обусловленности всех явлений.

Изучение статистических закономерностей - важнейшая познавательная задача статистики, которую она решает с помощью особых методов, видоизменяющихся в зависимости от характера исходной информации и целей познания. Знание характера и силы связей позволяет управлять социально-экономическими процессами и предсказать их развитие. Особую актуальность это приобретает в условиях развивающейся рыночной экономики. Изучение механизма рыночных связей, взаимодействия спроса и предложения, влияния объема и структуры товарооборота на объем и состав производства продукции, формирования товарных запасов, издержек производства, прибыли и других качественных показателей имеет первостепенное значение для прогнозирования конъюнктуры рынка, региональной организации производственных и торговых процессов, успешного ведения бизнеса.

Далее будут рассматриваться причинно-следственные отношения между общественными явлениями, виды существующих связей и различные методы статистического моделирования связи.

В расчетной части решена задача из варианта расчетного задания методом параллельных рядов, методом группировок и графическим методом, а также измерена теснота связи между указанными явлениями.

В аналитической части проведены статистические расчеты по методам, описанным в теоретической части.

Для статистического анализа данных в работе используется пакет MS Excel.

1. Причинно-следственные отношения между общественными явлениями и виды связей

Исследование объективно существующих связей между явлениями - важнейшая задача общей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения - это связь явлений и процессов, при которой изменение одного их них - причины - ведет к изменению другого - следствия.

Причина - это совокупность условий, обстоятельств, действие которых приводит к появлению следствия. Если между явлениями действительно существуют причинно-следственные отношения, то эти условия должны обязательно реализовываться вместе с действием причин. Причинные связи носят всеобщий и многообразный характер, и для обнаружения причинно-следственных связей необходимо отбирать отдельные явления и изучать их изолированно.

Особое значение при исследовании причинно-следственных связей имеет выявление временной последовательности: причина всегда должна предшествовать следствию, однако не каждое предшествующее событие следует считать причиной, а последующее - следствием.

В реальной социально-экономической действительности причину и следствие следует рассматривать как смежные явления, появление которых обусловлено комплексом сопутствующих более простых причин и следствий. Между сложными группами причин и следствий возможны многозначные связи, в которых за одной причиной будет следовать то одно, то другое действие или одно действие будет иметь несколько различных причин. Чтобы установить однозначную причинную связь между явлениями или предсказать возможные следствия конкретной причины, необходима полная абстракция от всех прочих явлений в исследуемой временной или пространственной среде. Теоретически такая абстракция воспроизводится. Приемы абстракции часто применяются при изучении взаимосвязей между двумя признаками (парная корреляция). Но чем сложнее изучаемые явления, тем труднее выявить причинно-следственные связи между ними. Взаимное переплетение различных внутренних и внешних факторов неизбежно приводит к некоторым ошибкам в определении причины и следствия.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо, абстрагируясь от второстепенных, выявлять главные, основные причины.

На первом этапе статистического изучения связи осуществляется качественный анализ изучаемого явления методами экономической теории, социологии, конкретной экономики.

На втором этапе строится модель связи на основе методов статистики: группировок, средних величин, таблиц и т.д.

На третьем, последнем этапе интерпретируются результаты; анализ вновь связан с качественными особенностями изучаемого явления.

Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия классифицируются по ряду оснований. Признаки по значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.

В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По степени тесноты связи различают количественные критерии оценки тесноты связи (табл.1).

Таблица 1 Количественные критерии оценки тесноты связи

Величина коэффициента корреляции

Характер связи

До |±0,3|

Практически отсутствует

|±0,3| - |±0,5|

Слабая

|±0,5| - |±0,7|

Умеренная

|±0,7| - |±1,0|

Сильная

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности способствует увеличению уровня рентабельности производства. В случае обратной связи значения результативного признака изменяются под действием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

По аналитическому выражению выделяют прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной, экспоненциальной и т.д.), то такую связь называют нелинейной, или криволинейной.

В статистике не всегда требуются количественные оценки связи, часто важно просто определить лишь ее направление и характер, выявить форму воздействия одних факторов на другие.

Для выявления наличия связи, ее характера и направления в статистике используются методы приведения параллельных данных (сопоставления двух параллельных рядов); аналитических группировок; графический; корреляционный, регрессионный и некоторые непараметрические методы.

2. Простейшие методы изучения стохастических связей

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Для этого факторы, характеризующие результативны признак, располагают в возрастающем или убывающем порядке (в зависимости от эволюции процесса и целей исследования), а затем прослеживают изменение величины результативного признака. Сопоставление и анализ расположенных таким образом рядов значений изучаемых величин позволяют установить наличие связи и ее направление. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды).

До исследования методом параллельных рядов (априори) необходимо провести анализ сопоставляемых явлений и установить наличие между ними причинных связей (а не простого соответствия). Например, только потому, что между урожайностью и себестоимостью продукции сельского хозяйства имеется причинная связь, становится возможным построение, а затем сопоставление параллельных рядов этих показателей.

К недостатку метода взаимозависимых рядов следует отнести невозможность определения количественной меры связи между изучаемыми признаками. Однако он удобен и эффективен, когда речь идет о необходимости установления связей между показателями и факторами, характеризующими экономический процесс.

Взаимосвязь двух признаков изображается графически с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точкой. При отсутствии тесных связей наблюдается беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Метод аналитических группировок. Стохастическая связь будет проявляться отчетливее, если применить для ее изучения аналитические группировки. Чтобы выявить зависимость с помощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного, можно выявить направление, характер и тесноту связи между ними с помощью эмпирического корреляционного отношения. Однако метод группировок не позволяет определить форму (аналитическое выражение) влияния факторных признаков на результативный.

3. Статистическое моделирование связи методом корреляционного и регрессионного анализа

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида ух=f(х).

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи), определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Корреляция - это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

В статистике различаются следующие варианты зависимостей:

Ш Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными);

Ш Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков;

Ш Множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

Теснота связи количественно выражается величиной коэффициента корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнении множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Первоначально исследовании корреляции проводились в биологии, а позднее распространились и на другие области, в том числе на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (тесноту) статистической связи, регрессия исследует ее форму. Та и другая служит для установления соотношения между явлениями, для определения наличия или отсутствия связи.

Корреляционный и регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).

Задачи регрессионного анализа - выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).

Регрессия может быть однофакторной (парной) и многофакторной (множественной).

По форме зависимости различают:

Ш Линейную регрессию, которая выражается уравнением прямой (линейной функцией) вида:

Ух01х;

Ш Нелинейную регрессию, которая выражается уравнениями вида:

Ух01х+а2х2 - парабола;

Ух01/х - гипербола и т.д.

По направлению связи различают:

Ш Прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются.

Ш Обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.

Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически - перебором и оценкой функций разных типов и т.п.

При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) корреляционной связи имеет вид:

у=а01х,

параметры которого определяются по формулам

а1=?(Xi-X)(Yj-Y)/?(X-X)2; a0=Y-a1X.

Если а1>0, имеется положительная или прямая связь, а1<0 - отрицательная или обратная связь.

Для практического использования моделей регрессии очень важна их адекватность, т.е. соответствие фактическим статистическим данным.

Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. Поэтому показатели регрессии и корреляции - параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.

Значимость параметров а0 и а1 оценивается с помощью критерия Стьюдента (для n<30), расчетные значения которого определяются по формулам

S0=(vn-2) а0У0;

S1=v?X2/n-(?X/n)2 а1vn-2/ДУ0

Образование уравнения регрессии позволяет рассчитать также индекс корреляционной связи как отношение аналитического и фактического среднеквадратического отклонения зависимой переменной У, т.е. этот индекс определяется по формуле

iк.с.=vДУаУф=v1-ДУоУф,

где ДУа, ДУф, ДУо - соответственно аналитическая, фактическая и остаточная дисперсии функции:

У(ДУоУф- ДУа).

Индекс корреляционной связи изменяется от 0 до 1, и чем ближе его значение к 1, тем теснее связь между факторами. При его значении <0,3 можно говорить об отсутствии связи.

Этот индекс универсальный, т.к. может использоваться во всех формах связи. В целом он представляет собой коэффициент множественной корреляции.

При линейной однофакторной связи используется другой показатель тесноты связи - линейный коэффициент корреляции, определяемый по формуле:

r=(?ху-(?х?у/n))/v[?x2-(?x)2/n][?y2-(?y)2/n]

Значения коэффициента корреляции лежат в пределах от -1 до +1 отрицательные значения указывают на обратную связь, положительные - на прямую, причем обратная или прямая связь считается слабой при |r|<0,3, заметной при |r|=0,3-0,5, умеренной при |r|=0,5-0,7 и сильной при |r|>0,7. При |r|=1 связь функциональная, а при |r|=0 линейной связи нет, но может быть нелинейная связь, что требует дополнительной проверки.

В дополнение к найденной величине коэффициента корреляции рекомендуется проверять ее значимость с помощью критерия Стьюдента, расчетное значение которого определяется по формуле:

Sр=rv(n-2)/(1+r2).

Полученное значение сравнивается с табличным значение SТ распределения Стьюдента при уровне значимости 0,05 или 0,01 и числе степеней свободы (n-2). При выполнении условия Sр>SТ найденный коэффициент корреляции признается достаточно значимым.

После проверки адекватности, установления точности и надежности построенной модели (уравнения регрессии) ее необходимо проанализировать. Прежде всего нужно проверить согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).

Для удобства интерпретации параметра а1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:

Э=а1х/у.

Если данная совокупность и условия работы типичны, то коэффициент регрессии может быть использован для нормирования и планирования производительности труда рабочих этой профессии.

Имеет смысл вычислить остатки еi=у-у, характеризующие отклонение i-х наблюдений от значений, которые следует ожидать в среднем.

Как известно, явления общественной жизни складываются под воздействием не одного, а целого ряда факторов, т.е. эти явления многофакторны. Между факторами существуют сложные взаимосвязи, поэтому их влияние комплексное и его нельзя рассматривать как простую сумму изолированных влияний.

Многофакторный корреляционный и регрессионный анализ позволяет оценить меру влияния на исследуемый результативный показатель каждого из включенных в модель (уравнение) факторов при фиксированном положении (на среднем уровне) остальных факторов, а также при любых возможных сочетаниях факторов с определенной степенью точности найти теоретическое значение этого показателя (важным условием является отсутствие между факторами функциональной связи).

Парная корреляция и регрессия могут рассматриваться как частный случай множественной, когда требуется оценить связь всего множества независимых факторов с зависимой переменной У. прежде всего следует установить набор независимых факторов Х, включаемых в уравнение регрессии, что делается на основе теоретических положений. На практике они подкрепляются коэффициентами парной корреляции, отобрать наиболее значимые из которых можно с помощью ЭВМ, решая попутно и вопрос о форме уравнения регрессии.

Этот традиционный прием, называемый пошаговой регрессией, позволяет достичь приемлемых результатов, если не противоречит теоретическим предпосылкам. Вначале принимается линейная модель множественной регрессии в форме уравнения

У=а01Х12Х2+…+аkХk,

где Х1, Х2, …, Хk - фиксированные значения выбранных независимых переменных; а1, а2, …, аk - параметры уравнения регрессии, показывающие на сколько единиц изменится У с изменением соответствующего фактора Х на единицу при условии, что остальные факторы останутся на прежнем уровне.

Параметры уравнения множественной регрессии, как правило, находятся методом наименьших квадратов, причем в матричной записи система уравнений имеет вид

ТХ)А=ХТУ,

где ХТ=(Х11Х1k), (Х21…Х2k), (Хn1…Хnk); У=У1, У2,…, Уn; А=а0, а1,…, аk.

Таким образом, А=(ХТХ)-1ХТУ=У/Х.

Оценка параметров множественной регрессии вручную затруднительна и приводит к потере точности, а на ЭВМ проблем не возникает. Гораздо важнее, насколько линейная форма связи соответствует реальной зависимости У от множества факторов Х.

Многофакторный корреляционный и регрессионный анализ может быть использован в экономико-статистических исследованиях:

Ш Для приближенной оценки фактического и заданного уровней;

Ш В качестве укрупненного норматива (для этого достаточно в уравнение регрессии подставить вместо фактических значений факторов их средние значения);

Ш Для выявления резервов производства;

Ш Для проведения межзаводского сравнительного анализа и выявления на его основе скрытых возможностей предприятий;

Ш Для краткосрочного прогнозирования развития производства и др.

Представление связи линейной функцией там, где фактически имеются нелинейные соотношения, вызовет ошибки аппроксимации и в конечном счете упрощенные или даже ложные представления о сущности изучаемого явления.

Вопрос о нелинейности формы уравнения надо решать на стадии теоретического анализа, формально подкрепленного различными статистическими критериями. Но практически допускается и другое решение: нелинейность выдвигается как гипотеза о возможных видах уравнений, а конкретное из них выбирается на ЭВМ. Из нелинейных уравнений регрессии можно выделить два класса.

К первому относятся нелинейные относительно включенных в уравнение факторов, но линейные по коэффициентам.

Возможно применение гиперболы и других функций с помощью стандартных программ для ЭВМ. Теснота связей оценивается методом наименьших квадратов.

Второй класс нелинейных функций отличается нелинейностью по коэффициентам уравнения.

Вместе с тем некоторые нелинейные функции можно преобразовать к линейному виду. Например, степенную функцию можно прологарифмировать, но при этом оценивается уже не сама функция, а ее линейное преобразование, что может вызвать искажение оценок.

Если в линейном уравнении параметры регрессии представляются как угловые коэффициенты, то для линейной зависимости это не годится.

Проследить изменение У при изменении Х на единицу можно с помощью простой или частной производной, взятой по соответствующему фактору Х.

Чаще всего для характеристики влияния Х на У используется так называемый коэффициент эластичности kэ, показывающий, насколько изменится У при изменении Х на 1%, т.е.

kэ=dУ/dХ*Х/У.

Если параметры регрессии - абсолютные величины, имеющие размерность, то коэффициент эластичности получается безразмерным, что расширяет качественные возможности анализа.

В социально-экономических исследованиях нередки ситуации, когда признак не выражается количественно, но статистические величины можно упорядочить, т.е. ранжировать, располагая на основе предпочтения. Примером может служить распределение студентов по способностям, любой совокупности людей по уровню образованности, профессиям и т.д.

При ранжировке каждой единице совокупности присваивается порядковый номер (ранг), причем при совпадении признака у нескольких единиц им дается средний ранг. Так, если у пятой и шестой единицы совокупности значения признаков одинаковы, обе получают ранг равный (5+6)/2=5,5. Такие ранги называются связными.

Измерение тесноты связи явлений с ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмэна с и Кендалла ф, которые применяются не только для словесных, но и для количественных признаков, особенно при малых совокупностях.

Сущность метода Спирмэна состоит в том, что сначала ранжируют варианты признака явления Х по возрастанию, а затем указывают ранги вариантов признаков с точки зрения явления У. этот метод применяется в основном для случаев отсутствия связных рангов, причем коэффициент корреляции Спирмэна определяется по формуле

с=1-(6?d2/n(n2-1)),

где d2 - квадраты разностей рангов; n - число пар рангов.

Расчет рангового коэффициента Кендалла ведется по формуле:

ф=(?Q-?P)/(?Q+?P),

где ?Q - число случаев, когда у следующих значений признака У ранг больше, чем у данного; ?P - число случаев, когда у следующих значений признака У ранг меньше, чем у данного.

Для определения параметров коэффициента Кендалла необходимо ранжировать значения Х по возрастанию или убыванию, а значения У располагать в порядке, соответствующем значениям Х. облегчает поиск параметров составление ранговой таблицы, в подлежащем которой проставляются ранги Х по возрастанию, а в сказуемом аналогично проставляются ранги У. Присвоенные ранги Х и У отмечают любым значком в клетках, образованных пересечениями соответствующих строк и столбцов, и тогда относительно анализируемой клетки все параметры Q расположатся ниже и правее ее, а параметры Р - ниже и левее ее. Правильность определения параметров контролируется выполнением условия:

?Q+?P=(n-1)n/2.

Ранговые коэффициенты Спирмэна и Кэндалла изменяются от -1 до +1; положительные их значения свидетельствуют о прямой связи Х и У, а отрицательные - об обратной связи. Их нулевое значение говорит об отсутствии связи. Значимость этих коэффициентов может быть проверена с помощью критерия Стъюдента.

Формулы Спирмэна и Кендалла применяются для случаев отсутствия связных рангов, а при их наличии в любом из явлений Х и У расчет значительно усложняется.

Сначала для каждого явления, где проставлены связные ранги, определяется ранговая поправка Т по формуле

Т=[?(t3l-tl)/12.

Затем определяются ранговые коэффициенты корреляции по формулам

с=((n3-2)/6-?d2-TX-TY)/v[(n3-n)/6-2TX][(n3-n)/6-2TY]

ф=(?Q-?P)/ v (?Q+?P-2TX) (?Q+?P-2TY ).

У коэффициента Кендалла есть важное преимущество, состоящее в возможности его использования в многофакторном анализе.

Статистическая практика показывает, что вычисление ф сводится к подсчету баллов и проще коэффициента Спирмэна. Поскольку при расчете коэффициента Кендалла величины рангов нужны только для сравнения, то при наличии количественных признаков можно вести подсчет Q и Р прямо по значениям признаков, что избавляет от дополнительной работы по присвоению рангов.

Для оценки тесноты взаимосвязи между более чем двумя ранжированными явлениями применяется множественный коэффициент ранговой корреляции, или коэффициент конкордации, который при отсутствии связных рангов определяется по формуле

щ=12S/m2(n3-n),

где m - количество изучаемых явлений; n - количество признаков явлений; S - разность суммы квадратов рангов и средней квадратов рангов.

При наличии связных рангов коэффициент конкордации определяется по формуле

щ=12S/(m2(n3-n)-m?T.

Значимость коэффициента конкордации проверяется с помощью критерия Пирсона, расчетное значение которого определяется по формуле

ч2=12S/mn(n-1).

При условии, что расчетный критерий Пирсона больше табличной величины при значимости 0,05 и числе степеней свободы n-1, найденный коэффициент конкордации считается значимым.

4. Непараметрические методы

Важной задачей является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие из них не имеют количественной оценки, а изложенные выше методы применимы только к количественным признакам, так как требуют вычисления таких параметров распределения, как средние величины, дисперсии, отклонения. Потому они и называются параметрическими.

Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными признаками). Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет только об установлении наличия связи и измерении ее тесноты.

В практике статистических исследований приходится иногда анализировать связи между альтернативными признаками, представленными только группами с противоположными (взаимоисключающими) характеристиками. Тесноту связи в этом случае можно оценить, вычислив коэффициенты ассоциации или контингенции.

Для расчета коэффициента ассоциации или контингенции строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d

Применительно к таблице «четырех полей»с частотами a, b, c и d коэффициент взаимосвязей явлений определяются по формулам:

коэффициент ассоциации

ka=(ad-bc) / (ad+bc);

коэффициент контингенции

kk=(ad-bc) / v(a+b)(c+d)(a+c)(b+d).

Коэффициент контингенции всегда меньше коэффициента ассоциации. Коэффициент ассоциации изменяется от -1 до +1; чем ближе к +1 или -1, тем сильнее связаны между собой изучаемые признаки.

Если kk не менее 0,3, или ka не менее 0,5, то это свидетельствует о наличии связи между качественными признаками.

Когда изучаемые явления выражены более чем двумя атрибутивными признаками, для установления связи явлений возможно применение коэффициентов взаимной сопряженности, вычисляемых по формулам Пирсона или Чупрова.

Для их определения необходимо построить таблицу взаимной сопряженности. По данным таблицы сначала определяется показатель взаимной сопряженности явлений по формуле:

ц2=?(n2ХУ/nХnУ)-1,

а затем коэффициенты взаимной сопряженности по формулам

Пирсона

kП=vц/(1+ц2);

Чупрова

kЧ=vц2/v(К1-1)(К2-1),

где К1, К2 - количество словесных признаков Х и У.

Чем ближе коэффициенты Пирсона и Чупрова к 1, тем связь теснее. При этом коэффициент Чупрова обычно меньше коэффициента Пирсона, т.е. дает более осторожную оценку тесноты взаимосвязи.

Расчетная часть

Задание 30

Для изучения капитальных вложений в производство из собственных средств предприятий в регионе проведена 5% механическая выборка, в результате которой получены следующие данные:

Таблица 2

А

В

С

1

Исходные данные

2

№п/п

Нераспределенная прибыль, млн руб

Инвестиции в основные фонды, млн руб.

3

1

2,20

0,06

4

2

2,00

0,04

5

3

4,30

0,44

6

4

5,00

0,60

7

5

6,00

0,90

8

6

2,30

0,12

9

7

3,60

0,20

10

8

4,20

0,36

11

9

5,80

0,80

12

10

4,70

0,60

13

11

2,50

0,18

14

12

3,80

0,40

15

13

4,50

0,53

16

14

4,80

0,65

17

15

4,40

0,42

18

16

5,40

0,70

19

17

5,20

0,50

20

18

4,10

0,35

21

19

3,30

0,20

22

20

5,60

0,70

23

21

3,90

0,40

24

22

4,80

0,73

25

23

4,50

0,62

26

24

4,70

0,70

27

25

3,40

0,30

По первичным данным, представленным в таблице 2:

1. Выявите зависимость между нераспределенной прибылью и инвестициями в основные фонды, применяя:

а) метод параллельных рядов;

б) метод группировок;

в) графический метод.

2. Измерьте тесноту связи между указанными признаками.

Решение:

1. а) Метод параллельных рядов

Между нераспределенной прибылью и инвестициями в основные фонды имеется причинная связь, именно поэтому становится возможным построение, а затем сопоставление параллельных рядов этих показателей.

Для того, чтобы установить наличие стохастической прямой связи расположим факторы, характеризующие факторный признак, в возрастающем порядке и проследим изменение величины результативного признака. Нераспределенная прибыль - факторный признак, инвестиции в основные фонды - результативный.

Таблица 3

А

В

С

1

Исходные данные

2

№п/п

Нераспределенная прибыль, млн руб

Инвестиции в основные фонды, млн руб.

3

2

2,00

0,04

4

1

2,20

0,06

5

6

2,30

0,12

6

11

2,50

0,18

7

19

3,30

0,20

8

25

3,40

0,30

9

7

3,60

0,20

10

12

3,80

0,40

11

21

3,90

0,40

12

18

4,10

0,35

13

8

4,20

0,36

14

3

4,30

0,44

15

15

4,40

0,42

16

13

4,50

0,53

17

23

4,50

0,62

18

10

4,70

0,60

19

24

4,70

0,70

20

14

4,80

0,65

21

22

4,80

0,73

22

4

5,00

0,60

23

17

5,20

0,50

24

16

5,40

0,70

25

20

5,60

0,70

26

9

5,80

0,80

27

5

6,00

0,90

Сопоставление данных параллельных рядов признаков х и у показывает, что с возрастанием признака х (нераспределенной прибыли), растет, хотя и не всегда, результативный признак у (инвестиции в основные фонды). Следовательно, между признаками существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.

б) Метод группировок.

В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного признака.

Сгруппируем данные Таблицы 3 в 4 группы: распределим капитальные вложения

а) по размеру инвестиций с интервалом (0,9-0,04)/4=0,215:

Таблица 4.1

А

В

1

Инвестиции в основные фонды, млн руб

Кол-во инвестиций

2

0,04-0,255

6

3

0,255-0,47

7

4

0,47-0,685

6

5

0,685-0,90

6

Итого: 25

б) по размеру нераспределенной прибыли с интервалом (6-2)/4=1

Таблица 4.2

А

В

1

Нераспределенная прибыль, млн руб

Кол-во инвестиций

2

2,00-3,00

4

3

3,00-4,00

5

4

4,00-5,00

11

5

5,00-6,00

5

Итого: 25

Таблица 4.3

A

B

C

D

E

1

Размер инвестиций

Нераспр. прибыль

0,4-0,255

0,255-0,47

0,47-0,685

0,685-0,90

2

2,00-3,00

4

3

3,00-4,00

2

3

4

4,00-5,00

4

5

2

5

5,00-6,00

1

4

Вывод: Распределение произошло по диагонали из верхнего левого угла в правый нижний угол, т.е при увеличении нераспределенной прибыли размер инвестиций тоже увеличивается. Таким образом, обнаруживается тесная прямая связь между факторным и результативным признаками.

в) Графический метод.

В системе координат на оси абсцисс откладываются значения факторного признака х, а на оси ординат - результативного у. Каждое пересечение линий, проводимых через эти оси, обозначается точкой. Получим корреляционное поле, а соединив точки отрезками - ломаную регрессии. При отсутствии тесных связей наблюдается беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Анализируя ломаную линию, можно предположить, что вложение инвестиций в основные фонды идет более или менее равномерно, пропорционально росту нераспределенной прибыли. В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь.

2. Для количественной оценки тесноты взаимосвязи между указанными признаками используем линейный коэффициент корреляции, определяемый по формуле

r=(?ху-(?х?у/n))/v[?x2-(?x)2/n][?y2-(?y)2/n]

Для этого добавим в Таблицу 3 дополнительные столбцы, где произведем необходимые вычисления.

Таблица 5.1

А

В

С

D

E

F

1

Исходные данные

Расчетные значения

2

№п/п

Нераспределенная прибыль, млн руб

Инвестиции в основные фонды, млн руб.

х2

у2

ху

3

2

2,00

0,04

=B3*B3

=C3*C3

=B3*C3

4

1

2,20

0,06

=B4*B4

=C4*C4

=B4*C4

5

6

2,30

0,12

=B5*B5

=C5*C5

=B5*C5

6

11

2,50

0,18

=B6*B6

=C6*C6

=B6*C6

7

19

3,30

0,20

=B7*B7

=C7*C7

=B7*C7

8

25

3,40

0,30

=B8*B8

=C8*C8

=B8*C8

9

7

3,60

0,20

=B9*B9

=C9*C9

=B9*C9

10

12

3,80

0,40

=B10*B10

=C10*C10

=B10*C10

11

21

3,90

0,40

=B11*B11

=C11*C11

=B11*C11

12

18

4,10

0,35

=B12*B12

=C12*C12

=B12*C12

13

8

4,20

0,36

=B13*B13

=C13*C13

=B13*C13

14

3

4,30

0,44

=B14*B14

=C14*C14

=B14*C14

15

15

4,40

0,42

=B15*B15

=C15*C15

=B15*C15

16

13

4,50

0,53

=B16*B16

=C16*C16

=B16*C16

17

23

4,50

0,62

=B17*B17

=C17*C17

=B17*C17

18

10

4,70

0,60

=B18*B18

=C18*C18

=B18*C18

19

24

4,70

0,70

=B19*B19

=C19*C19

=B19*C19

20

14

4,80

0,65

=B20*B20

=C20*C20

=B20*C20

21

22

4,80

0,73

=B21*B21

=C21*C21

=B21*C21

22

4

5,00

0,60

=B22*B22

=C22*C22

=B22*C22

23

17

5,20

0,50

=B23*B23

=C23*C23

=B23*C23

24

16

5,40

0,70

=B24*B24

=C24*C24

=B24*C24

25

20

5,60

0,70

=B25*B25

=C25*C25

=B25*C25

26

9

5,80

0,80

=B26*B26

=C26*C26

=B26*C26

27

5

6,00

0,90

=B27*B27

=C27*C27

=B27*C27

28

Итого

=СУММ(B3:B27)

=СУММ(C3:C27)

=СУММ(D3:D27)

=СУММ(E3:E27)

=СУММ(F3:F27)

Получаем таблицу со следующими результатами:

Таблица 5.2

А

В

С

D

E

F

1

Исходные данные

Расчетные значения

2

№п/п

Нераспределенная прибыль, млн руб

Инвестиции в основные фонды, млн руб.

х2

у2

ху

3

2

2,00

0,04

4,00

0,0016

0,0800

4

1

2,20

0,06

4,84

0,0036

0,1320

5

6

2,30

0,12

5,29

0,0144

0,2760

6

11

2,50

0,18

6,25

0,0324

0,4500

7

19

3,30

0,20

10,89

0,0400

0,6600

8

25

3,40

0,30

11,56

0,0900

1,0200

9

7

3,60

0,20

12,96

0,0400

0,7200

10

12

3,80

0,40

14,44

0,1600

1,5200

11

21

3,90

0,40

15,21

0,1600

1,5600

12

18

4,10

0,35

16,81

0,1225

1,4350

13

8

4,20

0,36

17,64

0,1296

1,5120

14

3

4,30

0,44

18,49

0,1936

1,8920

15

15

4,40

0,42

19,36

0,1764

1,8480

16

13

4,50

0,53

20,25

0,2809

2,3850

17

23

4,50

0,62

20,25

0,3856

2,7945

18

10

4,70

0,60

22,09

0,3600

2,8200

19

24

4,70

0,70

22,09

0,4900

3,2900

20

14

4,80

0,65

23,04

0,4225

3,1200

21

22

4,80

0,73

23,04

0,5329

3,5040

22

4

5,00

0,60

25,00

0,3600

3,0000

23

17

5,20

0,50

27,04

0,2500

2,6000

24

16

5,40

0,70

29,16

0,4900

3,7800

25

20

5,60

0,70

31,36

0,4900

3,9200

26

9

5,80

0,80

33,64

0,6400

4,6400

27

5

6,00

0,90

36,00

0,8100

5,4000

28

Итого

105,00

11,50

470,70

6,6760

54,3585

Подставляя итоговые значения в формулу

r=(?ху-(?х?у/n))/v[?x2-(?x)2/n][?y2-(?y)2/n],

получим

r=(F28-B28*C28/25)/КОРЕНЬ((D28-B28*B28/25)*(E28-C28*C28/25))

r= 0,94

Связь между данными признаками является очень сильной т.к. r= 0,94>0,7

Аналитическая часть

В этой части работы рассмотрим практическое применение вышеизложенных методов на следующем примере:

Оценить тесноту взаимосвязи и построить линейное уравнение регрессии по следующим данным о выручке магазинов Х и их издержках обращения У, млн. руб.:

Таблица 6.1

А

В

С

1

Исходные данные

2

№п/п

Выручка магазинов, млн руб

Издержки обращения, млн руб.

3

1

7,00

0,70

4

2

10,00

0,90

5

3

15,00

1,10

6

4

20,00

1,20

7

5

30,00

1,90

8

6

45,00

2,60

9

7

60,00

3,20

10

8

80,00

4,00

Выручка магазинов - факторный признак, издержки обращения - результативный. Факторы, характеризующие результативный признак, расположены в возрастающем порядке, проследим изменение величины результативного признака. Сопоставление данных параллельных рядов признаков показывает, что с возрастанием выручки магазинов, растут и издержки обращения. Следовательно, между данными признаками существует прямая зависимость.

Для уточнения формы связи между рассматриваемыми признаками используем графический метод. Нанесем на график точки, соответствующие значениям х, у, получим корреляционное поле, а соединив их отрезками - ломаную регрессии.

Анализируя ломаную линию, можно предположить, что возрастание издержек обращения у идет равномерно, пропорционально росту выручки магазинов х. в основе это зависимости в данных конкретных условиях лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:

у=а01х,

где у - теоретические расчетные значения результативного признака (издержки обращения), полученные по уравнению регрессии;

а0, а1 - неизвестные параметры уравнения регрессии;

х - выручка магазинов, млн. руб.

В таблицу 6.1 добавим столбцы с расчетными значениями

Таблица 6.2

А

В

С

D

E

F

G

1

Исходные данные

Расчетные значения

2

№п/п

Выручка магазинов, млн руб

Издержки обращения, млн руб.

х2

у2

ху

у

3

1

7,00

0,70

=B3*B3

=C3*C3

=B3*C3

=0,4182+0,0459*B3

4

2

10,00

0,90

=B4*B4

=C4*C4

=B4*C4

=0,4182+0,0459*B4

5

3

15,00

1,10

=B5*B5

=C5*C5

=B5*C5

=0,4182+0,0459*B5

6

4

20,00

1,20

=B6*B6

=C6*C6

=B6*C6

=0,4182+0,0459*B6

7

5

30,00

1,90

=B7*B7

=C7*C7

=B7*C7

=0,4182+0,0459*B7

8

6

45,00

2,60

=B8*B8

=C8*C8

=B8*C8

=0,4182+0,0459*B8

9

7

60,00

3,20

=B9*B9

=C9*C9

=B9*C9

=0,4182+0,0459*B9

10

8

80,00

4,00

=B10*B10

=C10*C10

=B10*C10

=0,4182+0,0459*B10

11

Итого

=СУММ(B3:B27)

=СУММ(C3:C27)

=СУММ(D3:D27)

=СУММ(E3:E27)

=СУММ(F3:F27)

=СУММ(H3:H10)

12

Средн

=B11/8

=C11/8

=D11/8

=E11/8

=F11/8

Таблицу со следующими значениями:

Таблица 6.3

А

В

С

D

E

F

G

1

Исходные данные

Расчетные значения

2

№п/п

Выручка магазинов, млн руб

Издержки обращения, млн руб.

х2

у2

ху

у

3

1

7,00

0,70

49,00

0,4900

4,9000

0,7395

4

2

10,00

0,90

100,00

0,8100

9,0000

0,8772

5

3

15,00

1,10

225,00

1,2100

16,5000

1,1067

6

4

20,00

1,20

400,00

1,4400

24,0000

1,3362

7

5

30,00

1,90

900,00

3,6100

57,0000

1,7952

8

6

45,00

2,60

2 025,00

6,7600

117,0000

2,4837

9

7

60,00

3,20

3 600,00

10,2400

192,0000

3,1722

10

8

80,00

4,00

6 400,00

16,0000

320,0000

4,0902

11

Итого

267,00

15,60

13 699,00

40,5600

740,4000

15,6009

12

средн

33,38

1,95

1 712,38

5,0700

92,5500

Пользуясь расчетными значениями таблицы 6.3, вычислим параметры для данного уравнения регрессии:

а1=(ху-х*у)/(х22)=(F12-B12*C12)/(D12-B12*B12)=0,0459,

т.к. а1 больше 0 - связь положительная

а0=у-а1х=C12-G4*0,0459=0,4182

Следовательно, регрессионная модель зависимости издержек обращения от выручки магазинов для данного примера может быть записана в виде конкретного простого уравнения регрессии:

у=0,4182+0,0459х.

Это уравнение характеризует зависимость среднего уровня издержек обращения от выручки магазинов. Расчетные значения у, найденные по данному уравнению, приведены в таблице 6.3.

Расчеты параметров уравнения регрессии правильны, т.к. ?у=?у.

Для оценки тесноты связи находим линейный коэффициент корреляции

r=(?ху-(?х?у/n))/v[?x2-(?x)2/n][?y2-(?y)2/n],

r=(F11-(B11*C11)/8)/КОРЕНЬ((D11-B11*B11/8)*(E11-C11*C11/8))

r=0,997>0,7, это указывает на очень сильную прямую связь, а т.к. r=0,997 близка к 1, связь практически функциональная.

Для проверки значимости этого коэффициента определяем расчетное значение критерия Стьюдента по формуле

Sр=rv(n-2)/(1+r2).

Sр=0,997v(8-2)/(1+0,9972)=1,73.

Табличное значение критерия Стьюдента при расчетном числе степеней свободы 6 с вероятностью 0,05 меньше расчетного значения, поэтому найденный коэффициент корреляции следует считать значимым.

Таким образом, построенная регрессионная модель у=0,4182+0,0459х в целом адекватна, и выводы, полученные по результатам малой выборки, можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность.

В рассмотренном уравнении у=0,4182+0,0459х, характеризующем зависимость издержек обращения от выручки а1 больше 0. следовательно, с возрастанием выручки издержки, как и ожидалось, также увеличиваются. Рассчитаем коэффициент эластичности:

Э=а1х/у

Э=0,0459*33,38/1,95=0,79.

Следовательно, с возрастанием выручки магазинов на 1% следует ожидать повышения издержек обращения в среднем на 0,79%.

Этот вывод справедлив только для изучаемой совокупности магазинов при конкретных условиях работы.

Заключение

Изучив данную тему, в заключении можно сделать следующие выводы:

1. Исследование объективно существующих связей между явлениями - важнейшая задача общей теории статистики. Формы проявления взаимосвязей явлений и процессов весьма разнообразны. Из них в самом общем виде выделяют функциональную (полную) и стохастическую (неполную) связи, корреляционная связь является частным случаем стохастической связи. По направлению связи бывают прямыми (положительными) и обратными (отрицательными). По своей аналитической форме связи могут быть линейными и нелинейными. По количеству взаимодействующих факторов различают связи однофакторные (их обычно называют парными) и многофакторные. По силе различаются слабые и сильные связи.

2. Для исследования стохастических связей широко используется метод сопоставления двух параллельных прямых, метод аналитических группировок, графический метод, корреляционный анализ, регрессионный анализ и некоторые непараметрические методы.

3. Знание характера и силы связей позволяет управлять социально-экономическими процессами и предсказать их развитие, что очень важно в условиях развивающейся рыночной экономики.

Литература

1. Воронин В.Ф., Жильцова Ю.В. Статистика: Учеб. пособие для вузов. - М.: Экономистъ, 2004. - 301 с.

2. Голуб Л.А. Социально-экономическая статистика: Учеб. пособие. - М.: Владос, 2001. - 272 с.

3. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ-ДАНА, 2001. - 463 с.

4. Гусаров В.М. Теория статистики: Учебн. пособие для вузов. - М.: Аудит, ЮНИТИ, 1998. - 247 с.

5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учеб для вузов. - М.: Финансы и статистика, 1995.

6. Статистика: Курс лекций для вузов / под ред. В.Г. Ионина. - 2-е изд., перераб. и доп. - М.: ИНФРА-М, 2001. - 384 с.

7. Теория статистики: Учебник /под ред. Р.А. Шмойловой. - 4-е изд., перераб. и доп. - М.: Финансы и статистика, 2004. - 656 с.: ил.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.