Основные методы дискрептивной статистики и принципы статистического исследования

Предмет, задачи и статистической науки. Сводка и группировка данных статистического наблюдения. Метод абсолютных, относительных и средних величин. Измерение вариации, динамика общественных явлений, индексов. Статистическое изучение связи между явлениями.

Рубрика Экономика и экономическая теория
Вид курс лекций
Язык русский
Дата добавления 11.12.2014
Размер файла 395,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Пример 6.8. Рассчитаем скользящую среднюю по данным об урожайности зерновых культур.

Таблица 6.14 Исходные данные и результаты расчета скользящей средней, ц/га

Год

Фактический уровень урожайности

Скользящая средняя

Трехлетняя

Пятилетняя

1986

15,4

-

-

1987

14,0

(15,4+14,0+17,6)/3=15,7

-

1988

17,6

(14,0+17,6+15,4)/3=15,7

(15,4+14,0+17,6+15,4+10,9)/5=14,7

1989

15,4

(17,6+15,4+10,9)/3=14,6

(14,0+17,6+15,4+10,9+17,5)/5=15,1

1990

10,9

14,6

15,2

1991

17,5

14,5

17,1

1992

15,0

17,0

16,8

1993

18,5

15,9

17,6

1994

14,2

15,9

-

1995

14,9

-

-

y=153,4

Пример 6.9. Имеются данные о количестве пластиковых карт VISA, эмитированных коммерческим банком «Дельта», тыс. шт.

Таблица 6.15.

Год

Количество эмитированных карт, тыс. шт.

Скользящая средняя

Трехлетняя

Пятилетняя

1995

1,2

-

-

1996

2,3

-

1997

2,2

1998

4,5

1999

5,9

2000

2,5

2001

3,6

2002

6,2

-

2003

7,6

-

-

Метод аналитического выравнивания основывается на том, что общая тенденция рассчитывается как функция времени: . Определение теоретических уровней производится на основе адекватной математической модели, в качестве которой могут выступать линейная, показательная, экспоненциальная и другие функции, представленные в таблице 6.16.

Таблица 6.16.

Вид уравнения

Отражаемая уравнением тенденция развития

Уравнение прямой

Равномерный рост при а1>0 или равномерное падение при а1<0

Показательная функция

Ускоряющийся рост при а1>0 или ускоряющееся падение при а1<0

Гипербола

Замедляющееся падение при а1>0 или замедляющийся рост при а1<0

Парабола

Рост, переходящий в падение, или падение, переходящее в рост в точке

Рассмотрим технику выравнивания ряда динамики по прямой

.

Параметры уравнения тренда могут быть найдены по следующим формулам:

Если периоды или моменты времени пронумеровать так, чтобы = 0, то

.

Методика нумерации моментов времени в этом случае различна для рядов имеющих четное и нечетное число наблюдений. Так, если число наблюдений нечетное, то нумерация проводится так:

Год

1997

1998

1999

2000

2001

2002

2003

t

-3

-2

-1

0

1

2

3

Если же число наблюдений четное, то нумерация соответственно:

Год

1997

1998

1999

2000

2001

2002

t

-3

-2

-1

1

2

3

Пример 6.10. Имеются данные о расходах населения на медицинские услуги:

Таблица 6.17.

Год

Уровень расходов на медицинские услуги, тыс.у.е.

t

t2

yt

А

Б

1

2

3

4

5

6

7

8

1995

2,1

-4

16

-8,4

1,93

0,17

0,0289

-2,07

4,2849

1996

2,3

-3

9

-6,9

2,45

-0,15

0,0225

-1,55

2,4025

1997

2,9

-2

4

-5,8

2,96

-0,06

0,0036

-1,04

1,0816

1998

3,6

-1

1

-3,6

3,48

0,12

0,0144

-0,52

0,2704

1999

3,9

0

0

0

4

-0,10

0,0100

0

0

2000

4,5

1

1

4,5

4,52

-0,02

0,0004

0,52

0,2704

2001

5

2

4

10

5,04

-0,04

0,0016

1,04

1,0816

2002

5,5

3

9

16,5

5,56

-0,06

0,0036

1,56

2,4336

2003

6,2

4

16

24,8

6,07

0,13

0,0169

2,07

4,2849

Итого

36

0

60

31,1

36

-

0,1019

-

16,1099

Таким образом, уравнение тренда может быть записано как , т.е. с каждым годом расходы на медицинские услуги возрастали на 0,5183 тыс. у.е.

Рассчитаем среднюю (стандартную) ошибку уравнения:

Здесь n - число наблюдений; m - число параметров в уравнении (а0 и а1).

Для оценки качества модели применяют F-критерий Фишера:

где y - фактические уровни ряда;

- выровненные уровни ряда;

- средний уровень ряда.

В нашем примере

Модель считается удовлетворительной, если

,

где .

Распределение F-критерия подчиняется закону распределения Фишера, фрагмент которой приводится ниже.

Таблица 6.18 Процентные точки F - распределения ()

1

2

3

4

5

7

10

20

30

1

161,4

18,5

10,13

7,71

6,61

5,59

4,96

4,35

4,17

7,88

2

199,5

19,0

9,55

6,94

5,79

4,74

4,10

3,49

3,32

5,30

В нашем примере , т.е. полученное уравнение считается значимым.

Анализ сезонных колебаний. Под сезонными колебаниями понимается периодически повторяющееся из года в год повышение и снижение уровней в отдельные месяцы или кварталы.

Пример 6.11. Имеются следующие данные:

Таблица 6.19 Производство растительного масла в России в 1992-1993 гг. по месяцам, тыс. т.

Год

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

1992

109,5

102,7

86,6

82,3

76,6

70,0

57,6

24,5

36,3

70,7

95,2

104,5

1993

97,6

95,5

114,2

101,3

105,6

94,6

75,2

38,6

38,9

78,7

96,5

111,0

Если выявленные колебания не случайны, то они сохранятся и на укрупненных интервалах, например, квартальных.

Таблица 6.20 Производство растительного масла в России в 1992-1993 гг. по кварталам

Год

1992

1993

Квартал

I

II

III

VI

I

II

III

IV

Произведено

298,8

228,9

118,4

270,4

307,4

301,5

152,7

286,2

При изучении рядов динамики, содержащих «сезонную волну», её выделяют из общей колеблемости уровней и измеряют. Существует ряд методов решения этой задачи. Для измерения «сезонной волны» рассчитывают либо абсолютные разности (отклонения) фактических уровней от среднего уровня, либо отношения месячных уровней к среднему уровню за год, так называемые индексы сезонности:

Пример 6.12. Произведем расчет индексов сезонности и абсолютных отклонений уровней от среднего на примере данных о производстве растительного масла в России в 1992 году.

Таблица 6.21 Сезонные колебания производства растительного масла в России в 1992 г.

Месяц

Производство масла, тыс.т.

Индекс сезонности, % к среднемесячному уровню

Абсолютное отклонение от среднемесячного уровня

Абсолютное отклонение, % к среднемесячному уровню

(Iсез -100%)2

1

2

3

4

5

6

7

Январь

109,5

143,4

33,125

43,4

1883,56

1097,266

Февраль

102,7

134,5

26,325

34,5

1190,25

693,006

Март

86,6

113,4

10,225

13,4

179,56

104,551

Апрель

82,3

107,8

5,925

7,8

60,84

35,106

Май

76,6

100,3

0,225

0,3

0,09

0,051

Июнь

70,0

91,7

-6,375

-8,4

68,89

40,641

Июль

57,6

75,4

-18,775

-24,6

605,16

352,501

Август

24,5

32,1

-51,875

-67,9

4610,41

2691,017

Сентябрь

36,3

47,5

-40,075

-52,5

2756,25

1606,006

Октябрь

70,7

92,6

-5,675

-7,4

54,76

32,206

Ноябрь

95,2

124,6

18,825

24,6

605,16

354,381

Декабрь

104,5

136,8

28,125

36,8

1354,24

791,016

Итого

916,5

1200,1

0

0

12270,84

7797,747

Средний месячный уровень за год:

Графическое изображение индекса сезонности наглядно показывает форму, характер сезонной волны, относительно среднемесячного уровня за год, принимаемого за 100%.

Для характеристики силы колеблемости уровней ряда динамики из-за сезонной неравномерности используется среднее квадратическое отклонение индексов сезонности (в процентах) от 100%

Для примера 6.12:

Этот же результат можно получить и по-другому, как коэффициент вариации (колеблемости):

,

где - среднее квадратическое отклонение.

Для примера 6.12 сумма квадратов отклонений рассчитана в графе 7 таблицы 6.21, среднее значение уровня , отсюда:

,

т.е. результаты двух показателей и V - идентичны.

Расчет индексов сезонности за ряд лет можно осуществить двумя способами.

Первый способ состоит в определении простой средней за одни и те же месяцы изучаемого периода и сопоставлении их со средней за весь изучаемый период.

%

Второй способ заключается в том, что в начале вычисляют по каждому году индексы сезонности, а затем из индексов одноименных месяцев находится средняя арифметическая, которая и является индексом сезонности.

Пример 6.13. По данным о производстве растительного масла в 1992 и 1993 году рассчитаем индекс сезонности первым (табл. 6.22) и вторым (табл. 6.23) способами.

Таблица 6.22 Расчет индекса сезонности за ряд лет первым способом

Месяц

Производство масла, тыс.т. в 1992 г.

Производство масла, тыс.т. в 1993 г.

Среднее значение за два года

Индексы сезонности

Январь

109,5

97,6

103,55

126,5184

Февраль

102,7

95,5

99,1

121,0813

Март

86,6

114,2

100,4

122,6697

Апрель

82,3

101,3

91,8

112,1621

Май

76,6

105,6

91,1

111,3068

Июнь

70,0

94,6

82,3

100,5549

Июль

57,6

75,2

66,4

81,12814

Август

24,5

38,6

31,55

38,54808

Сентябрь

36,3

38,9

37,6

45,94003

Октябрь

70,7

78,7

74,7

91,26916

Ноябрь

95,2

96,5

95,85

117,1104

Декабрь

104,5

111,1

107,8

131,711

Итого

916,5

1047,8

982,15

Средний уровень за два года тыс. т.

Таблица 6.23 Расчет индекса сезонности за ряд лет вторым способом

Месяц

Производство масла, тыс.т. в 1992 году

Производство масла, тыс.т. в 1993 году

Индекс сезонности в 1992 году

Индекс сезонности в 1993 году

Общий индекс сезонности

Январь

109,5

97,6

143,4

111,7771

127,5743

Февраль

102,7

95,5

134,5

109,372

121,9201

Март

86,6

114,2

113,4

130,7883

122,0881

Апрель

82,3

101,3

107,8

116,0145

111,8861

Май

76,6

105,6

100,3

120,9391

110,6169

Июнь

70,0

94,6

91,6

108,3413

99,99716

Июль

57,6

75,2

75,4

86,12331

80,77033

Август

24,5

38,6

32,1

44,20691

38,14273

Сентябрь

36,3

38,9

47,5

44,55049

46,03956

Октябрь

70,7

78,7

92,6

90,1317

91,35063

Ноябрь

95,2

96,5

124,6

110,5173

117,5827

Декабрь

104,5

111,1

136,8

127,238

132,0314

Автокорреляция в рядах динамики. Под автокорреляцией понимается зависимость последующих уровней ряда от предыдущих. Для определения, насколько вариация признаков динамического ряда обусловлена автокорреляцией, применяется коэффициент автокорреляции. Для его расчета параллельно исходным уровням ряда yi записываются уровни, сдвинутые на один период, т.е. yi-1 или yi+1.

1 ряд: у1 у2 у3 у4 у5

2 ряд: у2 у3 у4 у5 у6 - сдвинутый ряд

3ряд: у3 у4 у5 у6 у7 - сдвинутый ряд

Между сдвинутыми рядами находят коэффициенты корреляции по формуле:

Часто проводится одновременный анализ нескольких динамических рядов, колебания уровней которых взаимообусловлены. Проверка рядов на автокорреляцию осуществляется по критерию Дарбина-Уотсона:

,

где - отклонение фактического уровня ряда в точке t от теоретического (выровненного) значения.

При К=0 имеется полная положительная автокорреляция, при К=2 автокорреляция отсутствует, при К=4 полная отрицательная автокорреляция.

ТЕМА 7. ИНДЕКСЫ

Индекс (лат. INDEX - указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. Различие условий может проявляться во времени, в пространстве или в сравнении с любым эталоном (нормативом, планом, прогнозом и т.д.).

Основным элементом индексного отношения является индексируемая величина, т.е. значение признака статистической совокупности, изменение которой является предметом изучения. Индексируемая величина содержится в названии индекса, например, индекс цен, индекс себестоимости, индекс товарооборота и др.

Приняты следующие обозначения индексируемой величины:

q

-

количество (объем) какого-либо продукта в натуральном выражении (от латинского слова quantitas);

p

-

цена единицы товара (от латинского слова pretium);

z

-

себестоимость единицы продукции;

t

-

затраты времени на производство единицы продукции (трудоемкость);

w

-

выработка продукции в стоимостном выражении на одного работника или единицу времени;

v

-

выработка продукции в натуральном выражении на одного работника или единицу времени;

Т

-

общие затраты времени (T = tq) или численность работников;

рq

-

общая стоимость произведенной продукции данного вида или общая стоимость проданных товаров данного вида (товарооборот, выручка);

zq

-

затраты на производство продукции;

Схема построения индексов может быть представлена в виде следующей классификации (схема 7.1).

Индивидуальные индексы служат для характеристики изменения отдельных элементов сложного явления, обозначаются буквой “i”

Индивидуальный индекс цен

(7.1)

Индивидуальный индекс физического объема продукции

(7.2)

Индивидуальный индекс товарооборота

(7.3)

Знак внизу справа означает период: 0 - базисный; 1 - отчетный

Взаимосвязь индексов

(7.4)

Схема 7.1. Классификация индексов

Особенность сводных (общих) индексов состоит в том, что они выражают относительное изменение сложных (разнотоварных) явлений, отдельные части или элементы которых непосредственно несоизмеримы. Они отражают изменение обобщенных величин во всей совокупности и обозначаются символом “I”.

Агрегатные индексы наряду с индексируемым признаком содержат и признак-вес, позволяющий обобщить (соизмерить) разнородные элементы совокупности.

Индексируемый признак при построении агрегатного индекса меняется: отчетный период сравнивается с базисным, признак-вес берется на неизменном фиксированном уровне либо базисного периода (формула Ласпейреса), либо отчетного периода (формула Пааше).

В следующей таблице представлены основные формулы агрегатных индексов:

Формулы индексов

Название индексов

Индекс физического объема (количественный)

Индекс цен (качественный)

Формула Ласпейреса (с базисными весами)

(7.5)

(7.8)

Формула Пааше (с отчетными весами)

(7.6)

(7.9)

Индекс Фишера

(7.7)

(7.10)

Сводный индекс товарооборота рассчитывается по формуле:

(7.11)

Мультипликативная модель индексов:

(7.12)

Прирост в абсолютном выражении может быть представлен в виде разности числителя и знаменателя соответствующих индексов.

Прирост продукции в ценах соответствующих лет:

(7.13)

Прирост стоимости продукции в неизменных ценах:

(7.14)

Прирост стоимости продукции вследствие изменения цен:

(7.15)

Пример 7.1. Рассчитать индивидуальные и общие индексы физического объема продаж, цен, товарооборота по нижеследующим данным о продаже товаров магазином оптовой торговли:

Товар

Базисный период

Отчетный период

Цена за единицу, руб.

Объем продаж, тыс. шт.

Цена за единицу, руб.

Объем продаж, тыс. шт.

p0

q0

p1

q1

А

986,5

80,316

998,0

31,008

Б

895,0

193,151

899,0

154,525

В

341,6

5,420

343,5

3,306

Решение: 1. Индивидуальные индексы цен исчислим по каждому товару:

;

В отчетном периоде по сравнению с базисным цена товара А возросла в 1,012 раза, т.е. на 1,2% или на 11,5 руб.; товара Б - в 1,005 раза, на 0,5% или на 4 руб.; товара В - в 1,006 раза, на 0,6% или на 1,9 руб.

Общий индекс цен Пааше:

В отчетном периоде по сравнению с базисным цена трех товаров возросла в среднем в 1,006 раз или на 0,6%. В результате роста цен стоимость товаров, проданных в отчетном периоде, увеличилась на 1005,7798 тыс. руб.:

().

Общий индекс цен Ласпейреса:

Если бы объем товаров А, Б и В остался на уровне базисного периода, то увеличение цен привело к росту стоимости продаж на 1948,3588 тыс. руб.:

().

Формула Фишера даст среднее значение из индексов Пааше и Ласпейреса:

2. Индивидуальные индексы физического объема продаж:

;

В отчетном периоде по сравнению с базисным объем продаж товара А снизился на 61,4% или на 49,308 тыс. шт.; товара Б - на 20% или на 38,626 тыс. шт.; товара В - на 39% или на 2,114 тыс. шт.

Общий индекс физического объема продаж Ласпейреса:

В отчетном периоде по сравнению с базисным объем продаж трех товаров снизился в среднем на 33%. В результате уменьшения количества проданных товаров стоимость товаров, проданных в отчетном периоде, увеличилась на 83757,1844 тыс. руб.:

()

Общий индекс физического объема продаж Пааше:

Если при расчете индекса взять цены отчетного периода, то получится большее сокращение среднего объема продаж и стоимости товаров, на 84699,7634 тыс. руб.:

()

Среднее значение общего индекса физического объема по формуле Фишера:

3. Индивидуальные индексы товарооборота в фактических ценах:

;

В отчетном периоде по сравнению с базисным товарооборот в фактических ценах по товару А снизился на 60,9% или на 48285,75 тыс. руб. Это снижение обусловлено сокращением объема продаж на 61,4% при росте цен на 1,2%.

В отчетном периоде по сравнению с базисным товарооборот в фактических ценах по товару Б снизился на 19,6% или на 33952,17 тыс. руб. Уменьшение вызвано сокращением объема продаж на 20% при росте цен на 0,5%.

В отчетном периоде по сравнению с базисным товарооборот в фактических ценах по товару В снизился на 38,7% или на 715,861 тыс. руб. Это снижение обусловлено сокращением объема продаж на 39% при росте цен на 0,6%.

Общий индекс товарооборота в фактических ценах по трем товарам вместе:

В отчетном периоде по сравнению с базисным товарооборот в фактических ценах по трем товарам снизился на 32,7% или на 751,4046 тыс. руб. () в результате сокращения объема продаж по трем товарам в среднем на 33% при росте цен в среднем на 0,6%.

4. Покажем взаимосвязь индексов:

Взаимосвязь абсолютных стоимостных показателей:

;

.

Данное равенство показывает влияние двух факторов на изменение стоимости проданных товаров: изменения цен и объема продаж.

- 82751,4046 тыс. руб. = 1005,7798 - 83757,1844

- 82751,4046 тыс. руб. = 1948,3588 - 84699,7634

Сводные индексы в среднеарифметической и среднегармонической формах. Средний арифметический индекс физического объема, тождественный агрегатному индексу Ласпейреса, можно выразить:

Тогда

(7.13)

Средний гармонический индекс цен, тождественный агрегатному индексу Пааше, можно выразить:

Тогда

(7.14)

Средний арифметический индекс цен, тождественный агрегатному индексу Ласпейреса, можно выразить:

Тогда

(7.15)

Индексный анализ изменения взвешенной средней: индексы переменного и постоянного состава и структурных сдвигов.

Индекс переменного состава представляет собой соотношение средних величин какого-либо признака в отчетном и базисном периодах:

(7.16)

Индекс постоянного (фиксированного) состава устраняет влияние структурного фактора:

(7.17)

Индекс структурных сдвигов характеризует влияние изменения структуры изучаемой совокупности на динамику среднего уровня признака:

(7.18)

Индексы переменного, постоянного состава и структурных сдвигов увязываются в следующую систему:

(7.19)

Ряды индексов с постоянной и переменной базой сравнения (цепные и базисные).

Цепными индексами называются индексы, которые имеют переменную базу сравнения.

Базисные индексы это индексы, имеющие постоянную базу сравнения.

Схема построения цепных индексов

Цепные индексы:

(7.20)

Базисные индексы:

(7.21)

Между цепными и базисными индексами имеется взаимосвязь, которая заключается в следующем: произведение всех цепных индексов равно общему базисному индексу:

..= (7.22)

Отсюда следует: отношение каждого последующего базисного индекса к предыдущему базисному дает промежуточный цепной индекс:

: = ; : = (7.23)

Взаимосвязь в сводных (общих) индексах только при условии постоянства весов (или соизмерителей).

Возьмем ряд цепных индексов с постоянными весами (р1):

Iq = ; Iq = ; Iq = (7.24)

Если перемножить эти индексы, то получим общий базисный индекс:

..= (7.25)

Этому требованию не отвечают индексы с переменными весами:

Iq = ; Iq = ; Iq = (7.26)

Ряды индексов с постоянными и переменными весами

Два и более индексов с одинаковыми по содержанию и во времени весами образуют ряд индексов с постоянными весами или соизмерителями:

Iq = ; Iq = ; Iq = (7.27)

Два и более индексов с одинаковыми по содержанию, но различными во времени весами или соизмерителями называются рядом индексов с переменными весами или соизмерителями:

Iq = ; Iq = ; Iq = (7.28)

Многие связанные между собой экономические показатели образуют индексные системы. Выше были рассмотрены примеры построения двухфакторных систем взаимосвязанных индексов. Общие индексы могут быть разложены также на три, четыре и более факторных индекса, объясняющих изменение результативного признака за счет влияния каждого фактора в отдельности. Обозначим факторные признаки a, b, c, тогда система взаимосвязанных индексов будет иметь вид:

(7.29)

Аналогично строится система взаимосвязанных индексов при большем количестве факторов.

ТЕМА 8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ

Виды и формы связей, различаемые в статистике. При исследовании социально-экономических явлений часто приходится иметь дело с взаимосвязанными показателями.

Типы взаимосвязей по характеру зависимости, различаемые в статистике, представлены на схеме 8.1.

Схема 8.1.Типы взаимосвязей по характеру зависимости

Взаимосвязи можно классифицировать также следующим образом (схема 8.2):

Схема 8.2. Классификация связей

Для анализа статистических зависимостей на начальной стадии применяются методы, представленные на схеме 8.3.

Схема 8.3. Начальная стадия анализа статистических зависимостей

Пример 8. 1. Имеются данные о выпуске продукции на 6 однотипных предприятиях (х) и потреблении на них электричества (у) (таблица 8.1.):

Таблица 8.1 Зависимость потребления электричества от объема выпуска продукции

Выпуск продукции

5

7

10

12

15

17

Потребление электричества

17

22

26

24

30

42

Сделать вывод о наличии, характере и форме связи.

Решение: Поле корреляции построено на рис. 8.1.

Рисунок 8.1. Зависимость потребления электричества от выпуска продукции

Таблица и рисунок демонстрируют, что с увеличением факторного признака х увеличивается результативный признак у, следовательно связь между ними можно считать прямой.

Пример 8. 2. Метод аналитических группировок продемонстрируем на примере таблицы 8.2.:

Таблица 8.2 Характеристика зависимости прибыли малых предприятий от оборачиваемости оборотных средств за 2003 год

Продолжительность оборота средств, дней (х)

Число малых предприятий

Средняя прибыль, у.е. (y)

40 - 50

6

14,57

51 - 70

8

12,95

71 - 100

6

7,40

Итого

20

11,77

Графический метод демонстрируется на рисунке 8.2. Построив график, можно судить о форме связи, ее направлении, а по разбросу точек - о тесноте связи (отсутствие связи будет характеризоваться разбросанностью точек по всему графику).

а) прямая линейная зависимость

б) обратная линейная зависимость

в) зависимость отсутствует

Рис. 8.2. Графики поля корреляции

Измерение тесноты связи в случае корреляционной зависимости. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (при изучении множественных зависимостей) факторных признаков.

Простейший показатель тесноты связи - показатель Фехнера.

, (8.1)

где C - совпадения знаков отклонений и ;

Н - несовпадения знаков отклонений и ;

- общее количество парных отклонений.

Мера совместной вариации признаков - коэффициент ковариации.

(8.2)

Показатель интенсивности линейной связи - линейный коэффициент парной корреляции Пирсона (коэффициент корреляции).

(8.3)

Путем ряда преобразований можно получить следующие аналитические выражения для расчета линейного коэффициента корреляции.

, (8.4)

где

(8.5)

(8.6)

(8.7)

Показатель Фехнера и коэффициент корреляции Пирсона изменяются в пределах [-1;+1].

Пример 8.3. Измерим тесноту связи с использованием формул (8.1) - (8.3) по данным примера 8.1.

Решение: 1) Расчет показателя Фехнера

Рассчитаем средние значения для х и у:

.

Выпуск продукции

5

7

10

12

15

17

Потребление электричества

17

22

26

24

30

42

-6

-5

-1

1

4

6

-9,83

-4,83

-0,83

-2,83

3,17

15,17

Совпадения/несовпадения

С

С

С

Н

С

С

Показатель Фехнера

2) Расчет коэффициента ковариации

3) Расчет линейного коэффициента корреляции:

С учетом того, что ,

Полученные значения показателя Фехнера и коэффициента корреляции свидетельствуют о достаточно сильной прямой связи.

Таблица 8.3 Критерии оценки тесноты связи (шкала Чеддока)

Значения коэффициента корреляции

до

Характеристика тесноты связи

слабая

умеренная

заметная

высокая

достаточно высокая

На прямую или обратную связь указывает знак коэффициента («+» или «-» соответственно). О тесноте связи свидетельствует абсолютная величина коэффициента. Для качественной оценки тесноты связи используется таблица Чэддока (табл. 8.3.)

Оценка достоверности коэффициента корреляции. Для более наглядного представления об оценке достоверности (значимости) коэффициента корреляции построена таблица 8.4.

Доверительные границы коэффициента корреляции рассчитываются как:

, (8.8)

где с - генеральное значение коэффициента корреляции;

tp - заданный уровень вероятности.

Таблица 8.4 Оценка достоверности (значимости) коэффициента корреляции

Характеристики коэффициента корреляции

Средняя квадратическая ошибка

Вывод о значимости коэффициента корреляции делается, если:

Большое число наблюдений, распределение приближенно нормальное, r < 0,9

Малое число наблюдений (n < 30), распределение далеко от нормального, r < 0,9

, где

находится по таблице распределения Стьюдента с параметрами

Малое число наблюдений (n < 30), распределение далеко от нормального, r > 0,9

, где

z - преобразование Фишера

Пример 8.4. Проверить значимость коэффициента корреляции, рассчитанного по данным примера 8.1.

Решение: , , тогда , что указывает на значимость коэффициента корреляции.

Ранговая корреляция. В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения X и Y, а их ранги, т.е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирмена и Кендэлла.

Коэффициент ранговой корреляции Спирмена:

(8.9)

Значимость коэффициента ранговой корреляции Спирмена:

(8.10)

Коэффициент корреляции Спирмена считается статистически значимым, если , где находится по таблице распределения Стьюдента с параметрами .

Пример 8.5. Имеются данные о затратах на рекламу продукции и объеме выручки от реализации продукции (табл. 8.5.; графы А и Б).

Таблица 8.5 Зависимость затрат на рекламу продукции и объема выручки от реализации продукции

Затраты на рекламу продукции, тыс. руб., Х

Объем выручки от реализации продукции, млн. руб., У

А

Б

1

2

3

4

1,5

26

2

1

1

1

2,4

71

3

3

0

0

8,6

45

10

2

8

64

1,3

95

1

4

-3

9

3,3

112

4

5

-1

1

4,0

130

6

6

0

0

5,1

145

7

7

0

0

6,1

190

8

8

0

0

3,5

220

5

9

-4

16

7,1

231

9

10

-1

1

Итого

-

-

-

-

92

Вычислить коэффициент Спирмена.

Решение: Определив ранги значений X и Y и их разность (табл. 8.5.; графы 1, 2, 3, 4), получаем .

При условии, что ранги не повторяются, коэффициент ранговой корреляции Кендэлла рассчитывается как:

, (8.11)

где S - фактическая сумма рангов

При этом соблюдаем следующую последовательность действий:

1. Значения Х ранжируются в порядке возрастания или убывания.

2. Значения У располагаются в порядке соответствующем значениям Х.

3. Для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+», суммируется и обозначается Р.

4. Для каждого ранга У определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «-», суммируется и обозначается Q.

5. Определяется общая сумма

S = P+Q.

Интерпретация коэффициентов Спирмена и Кендэлла аналогична интерпретации коэффициента корреляции Пирсона.

Пример 8.6. Рассчитаем значение коэффициента Кендэлла на основании данных примера 8.5

Решение:

Х

У

1-й шаг

2-й шаг

3-й шаг «+»

4-й шаг «-»

1,5

26

1,3

95

6

3

2,4

71

1,5

26

8

0

8,6

45

2,4

71

6

1

1,3

95

3,3

112

5

1

3,3

112

3,5

220

1

4

4,0

130

4,0

130

3

1

5,1

145

5,1

145

2

1

6,1

190

6,1

190

1

1

3,5

220

7,1

231

0

1

7,1

231

8,6

45

-

-

Итого

-

-

P=32

Q=-13

5-й шаг:

S=P+Q=32+(-13)=19,

тогда

Существенность коэффициента корреляции рангов Кэндэлла проверяется по формуле:

, (8.12)

где - коэффициент, определяемый по таблице нормальгого распределения для выбранного уровня значимости при больших п.

Коэффициент Кендэлла всегда меньше по значению, чем коэффициент Спирмена, точнее . Это соотношение выполняется при большом числе наблюдений, т.е п>30, и слабых либо умеренно тесных связях.

Если отдельные значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяются. Данные ранги называются связанными (или повторяющимися). Для случая связанных рангов есть особые скорректированные формулы для коэффициентов Спирмена и Кендэлла, однако на практике часто пользуются формулами приведенными выше.

Корреляция альтернативных признаков

Для исследования степени тесноты связи между качественными признаками могут быть использованы коэффициенты контингенции Пирсона, ассоциации Юла и взаимной сопряженности Пирсона.

В том случае, когда качественные признаки представлены в виде альтернативных (дихотомических), рассчитываются коэффициенты контингенции и ассоциации на основе четырехклеточных таблиц следующего вида:

a

b

c

d

Коэффициент контингенции:

(8.13)

Коэффициент ассоциации:

(8.14)

Значимость коэффициента ассоциации проверяется следующим образом:

, где (8.15)

(8.16)

Коэффициент ассоциации считается статистически значимым, если , где находится по таблице функции Лапласа при уровне значимости Ь (обычно берется на уровне 5%).

Пример 8.7. В результате обследования работников предприятия получены следующие данные (чел.)

Образование

Удовлетворены работой

Не удовлетворены работой

Итого

Высшее и среднее

300

50

350

Незаконченное среднее

200

250

450

Итого

500

300

800

Требуется оценить тесноту взаимосвязи между уровнем образования и удовлетворенностью работой с помощью коэффициентов контингенции и ассоциации.

Решение:

.

Коэффициенты контингенции и ассоциации изменяются в пределах [-1;+1], но величина коэффициента контингенции для тех же данных по абсолютной величине меньше величины коэффициента ассоциации, т.е .

В случае если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи используют коэффициент взаимной сопряженности Пирсона.

Информация для оценки этой связи группируется в виде таблицы (mij - частоты взаимного сочетания двух качественных признаков).

Признаки

A

B

C

Итого

D

m11

m12

m13

У m1j

E

m21

m22

m22

У m2j

F

m31

m32

m33

У m3j

Итого

У mi1

У mi2

У mi3

У mij

Коэффициент взаимной сопряженности Пирсона определяется по формуле:

(8.17)

где - показатель средней квадратической сопряженности, рассчитываемый как

(8.18)

Интерпретация коэффициентов контингенции, ассоциации и взаимной сопряженности Пирсона аналогична интерпретации коэффициента корреляции Пирсона.

Пример 8.8. Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились следующим образом:

Условия труда

Взаимоотношения в коллективе

Итого

Хорошие

Удовлетворительные

Неудовлетворительные

Соответствуют требованиям

30

20

10

60

Не полностью соответствуют

25

50

15

90

Не соответствуют

10

40

50

100

Итого

65

110

75

250

Рассчитать коэффициент взаимной сопряженности Пирсона.

Решение:

.

Множественная корреляция. Изменение экономических явлений происходит под влиянием не одного, а большого числа различных факторов. Для измерения тесноты корреляционной связи между результативным признаком и несколькими факторными признаками при линейной форме связи рассчитывается коэффициент множественной корреляции.

Коэффициент множественной корреляции, для случая двух факторных признаков x1 и x2 рассчитывается по формуле:

(8.19)

Множественный коэффициент корреляции изменяется в пределах [0;1] и численно не может быть меньше, чем любой из образующих его парных коэффициентов. Приближение R к единице свидетельствует о сильной зависимости между признаками.

Средняя квадратическая ошибка коэффициента множественной корреляции определяется по формуле:

(8.20)

Тогда, если , то с вероятностью близкой к 0,99 можно считать коэффициент множественной корреляции значимым.

Проверка значимости коэффициента множественной корреляции осуществляется так же по F-критерию Фишера. Для случая двух факторных признаков х1 и х2 он имеет вид:

(8.21)

Коэффициент множественной корреляции считается статистически значимым, если , где находится по таблице распределения Фишера с параметрами (а; 2; n - 3).

В ходе изучения множественной корреляции рассчитывают также частные коэффициенты корреляции. Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками при фиксированном значении всех остальных. Для случая двух факторных признаков x1 и x2 формулы будут иметь вид:

(8.22)

(8.23)

В первом случае исключено влияние факторного признака х2, а во втором х1. Значения парного и частного коэффициентов корреляции отличаются друг от друга, т.к. парный коэффициент характеризует связь между двумя признаками без учета влияния других признаков, а частный учитывает наличие и влияние других факторов.

Проверка значимости и расчет доверительных интервалов для частных коэффициентов корреляции аналогичны, как и для парных коэффициентов корреляции, с тем лишь отличием. Что число степеней свободы определяется так: = n - k., где k - порядок коэффициента частной корреляции.

дескриптивный статистический наблюдение

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

1. Ивченко Ю.С. Статистика: Учебное пособие. - М.: РИОР, 2011.

2. Ковалева Т.Ю. Практикум по теории статистики. Уч.-метод. пособие., М.: КноРус, 2012.

3. Кожухарь Л.И. Основы общей теории статистки. - М.: Финансы и статистика, 1999.

4. Ниворожкина Л.И., Рудяга А.А., Федосова О.Н. Теория статистики: Справочные материалы, контрольные вопросы и задания. Учебно-метод. пособие/ Рост. гос. эконом. универ. «РИНХ» - Ростов-н/Д., 2005. - 186 с.

5. Ниворожкина Л.И., Чернова Т.В. Теория статистики (с задачами и примерами по региональной экономике).- Ростов н/Д: «Мини Тайп», «Феникс», 2005.

6. Общая теория статистики. Статистическая методология в изучении коммерческой деятельности/Под ред. А.А. Спирина, О.Э. Башиной. - М.: Финансы и статистика, 2001.

7. Октябрьский П.Л. Статистика: Учебное пособие. - СПб.: 2001.

8. Практикум по статистике: Учебное пособие/Под ред. проф. В.М. Симчеры. - М.: ЗАО «Финстатинформ», 1999.

9. Практикум по теории статистики: Учебное пособие/Под ред. проф. Р.А. Шмойловой. - М.: Финансы и статистика, 2008.

10. Статистика: учебник / Под ред.И.И. Сергеевой. - М.: ИНФРА-М, 201.

11. Статистика: Учебник для бакалавров/Под ред. В.С. Мхитаряна. - М. Экономистъ, 2012.

12. Статистика: Учебник для бакалавров/Под ред. И.И. Елисеевой. - М.: ЮРАЙТ, 2012.

13. Статистика: Учебное пособие (серия «Вопрос-ответ»)/Под ред. проф. М.Р. Ефимовой. - М.: ИНФРА-М, 2004.

14. Теория статистики: Учебник/Под ред. проф. Г.Л. Громыко. - М.: ИНФРА-М, 2011.

15. Теория статистики: Учебник/Р.А. Шмойлова. - М.: Финансы и статистика, 2008.

16. Тостик Н.В. Статистика: Учебник. - Ростов-на-Дону: Феникс, 2010

17. Эвирит Б.С. Большой словарь по статистике. - М.: Проспект, 2012.

18. Экономическая статистика. Учебник./Под ред. Ю.Н. Иванова. М.: ИНФРА-М, 1998.

Размещено на Allbest.ru


Подобные документы

  • Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.

    реферат [33,9 K], добавлен 20.01.2010

  • Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.

    реферат [24,7 K], добавлен 29.03.2013

  • Статистическое наблюдение как первый этап статистического исследования. Формы организации статистического наблюдения. Виды и способы статистического наблюдения. Организация сбора данных, план статистического наблюдения, ошибки и меры борьбы с ними.

    реферат [19,6 K], добавлен 04.06.2010

  • Изучение с количественной стороны массовых явлении и их закономерностей (статистика). Понятия статистической совокупности, наблюдения, группировки, абсолютных и относительных величин, средней арифметической, отклонения, индексов, тренда рядов динамики.

    шпаргалка [36,8 K], добавлен 15.12.2009

  • Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.

    реферат [192,6 K], добавлен 15.05.2009

  • Проведение статистического наблюдения: принципы, основные этапы и закономерности, теоретическая база. Группировка статистических данных. Расчет характеристик вариационного ряда. Анализ связи между признаками по аналитической группировке, рядов динамики.

    курсовая работа [202,5 K], добавлен 08.03.2011

  • Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.

    курс лекций [475,4 K], добавлен 11.02.2010

  • Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.

    реферат [196,8 K], добавлен 04.10.2016

  • Индексы в статистике, их применение при анализе динамики, выполнении плановых заданий и территориальных сравнений, сравниваемый и базисный уровни. Формирование информационной базы статистического исследования, сводка и группировка результатов наблюдения.

    контрольная работа [86,2 K], добавлен 19.10.2010

  • Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.

    курсовая работа [172,8 K], добавлен 22.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.