Статистика, предмет и задачи

Предмет и задачи статистики, основные понятия. Основные организационные формы, виды, способы статистического наблюдения, сводка, группировка. Изучение динамики социально-экономических процессов и явлений. Статистические методы прогнозирования и анализа.

Рубрика Экономика и экономическая теория
Вид курс лекций
Язык русский
Дата добавления 19.02.2010
Размер файла 563,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Таблицы сопряженности могут использоваться не только для оценки степени тесноты взаимосвязи между количественно измеримыми признаками, но и между качественными (альтернативными) признаками, которые условно принимают только два значения (0 и 1). Число 1 означает, что данная статистическая единица обладает этим признаком, а 0 - не обладает.

К специальным аналитическим показателям, измеряющим тесноту статистических взаимосвязей, относятся:

а) линейный коэффициент корреляции;

б) ранговый коэффициент корреляции Cпирмена;

в) корреляционное отношение и другие Более подробный перечень таких показателей изучается в курсе эконометрики..

Формулы для расчета перечисленных показателей приведены в таблице 8.1.

Все эти показатели выражены числами, абсолютная величина которых изменяется в пределах от 0 до 1. Чем ближе модуль данного числа к 1, тем связь считается более тесной. Линейный и ранговый коэффициенты корреляции могут принимать как положительные, так и отрицательные значения (положительная величина этих коэффициентов характеризует наличие прямой связи, а отрицательная - обратной). Корреляционное отношение не может быть отрицательным, так как выражено в виде арифметического корня некоторой величины.

Кроме того, существуют специальные коэффициенты (коэффициент ассоциации, контингенции и другие), рассчитываемые на основе таблиц сопряженности и измеряющие взаимосвязи между качественными признаками.

Формула для расчета рангового коэффициента корреляции Спирмена выводится из обычной формулы линейного коэффициента корреляции в предположении, что он рассчитывается не для значений признаков, а для соответствующих рангов.

Таблица 8.1

Аналитические показатели оценки тесноты взаимосвязей между количественными признаками и способы их расчета

Виды аналитических показателей

Формулы для их расчета

Линейный коэффициент корреляции

Ранговый коэффициент корреляции

Корреляционное отношение

Все эти показатели выражены числами, абсолютная величина которых изменяется в пределах от 0 до 1. Чем ближе модуль данного числа к 1, тем связь считается более тесной. Линейный и ранговый коэффициенты корреляции могут принимать как положительные, так и отрицательные значения (положительная величина этих коэффициентов характеризует наличие прямой связи, а отрицательная - обратной). Корреляционное отношение не может быть отрицательным, так как выражено в виде арифметического корня некоторой величины.

3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками

В статистике разработано много различных показателей, выражающих тесноту связей между явлениями и процессами, но каждый из них обладает своими преимуществами и недостатками. Наиболее распространенным из них является линейный коэффициент корреляции, но он показывает наличие тесноты связи только в случае, если зависимость между значениями показателей носит линейный характер. Если это не так, лучше пользоваться другими показателями. Показатель так называемого «корреляционного отношения» можно использовать в довольно широкой области, но предварительно необходимо построить уравнение регрессии, описывающее статистическую взаимосвязь между признаками X и Y, т.е. расчет этого показателя довольно сложен Более подробно расчет корреляционного отношения расчет рассматривается на следующей лекции..

Ранговый коэффициент корреляции может использоваться даже в том случае, если признаки нельзя выразить количественно, но можно проранжировать, то есть расположить по порядку. Существуют также особые способы измерения взаимосвязей между количественно не измеримыми признаками, которые мы рассмотрим ниже.

Линейный коэффициент корреляции рассчитывается по формуле:

В этой формуле и - средние значения признаков x и y, а и - соответственно средние квадратические отклонения. Из этой формулы легко выводятся другие формулы для расчета линейного коэффициента корреляции, например:

Или

Все эти формулы тождественны и дают один и тот же результат, но в разных случаях бывает удобнее пользоваться той или иной формулой. Первая и вторая формула наиболее удобны для запоминания, но расчет по последней формуле более прост.

Для расчета линейного коэффициента корреляции по последней из приведенных формул обычно строится вспомогательная таблица следующего вида (табл. 8.2).

Таблица 8.2

Вспомогательная таблица для расчета линейного коэффициента корреляции

x

y

У

В последней строке таблицы 7.4.2. рассчитываются суммы по столбцам.

Линейный коэффициент корреляции равен отношению суммы в последнем столбце таблицы к корню из произведения сумм в двух предшествующих столбцах.

Подчеркнем, что линейный коэффициент корреляции обладает следующим свойством: он всегда находится между -1 и 1, т.е. всегда -1 r 1.

Если при вычислениях вдруг обнаруживается, что коэффициент корреляции находится за пределами этих границ, значит, это просто ошибка в расчетах!

Чем ближе коэффициент корреляции к 1, тем более тесной является связь! При этом если r > 0, то связь прямая, а если r < 0, то связь обратная.

Если r ? 0,7, то связь считается более тесной, если r < 0,3, то связь отсутствует. Если 0,3 ? r ? 0,7, то наличие связи целесообразно проверить дополнительными методами.

Линейный коэффициент корреляции может не всегда показать наличие связи. В случае, если значения признаков нельзя измерить количественно, удобнее использовать ранговый коэффициент корреляции или специальные коэффициенты, используемые для оценки тесноты связи между качественными признаками. Если связь не является линейной, то в качестве критерия оценки тесноты связи удобнее всего использовать так называемое корреляционное отношение. Но для его расчета вначале необходимо построить так называемое уравнение регрессии Слово regression по-английски означает «связь». Подробнее построение уравнений регрессии рассматривается в лекции №10. (т.е. связи между признаками).

Линейный коэффициент корреляции и корреляционное отношение не являются универсальными показателями оценки тесноты связи. Их можно применять только в том случае, если изучаемые признаки можно измерить количественно.

При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий). Поэтому методы, основанные на их использовании, получили название параметрических методов оценки тесноты статистической связи.

Между тем в статистической практике приходится сталкиваться с задачами измерения взаимосвязей между качественными признаками, к которым параметрические методы анализа в их обычном виде не применимы. Статистической наукой разработаны методы, которые позволяют оценить тесноту взаимосвязи между явлениями, не используя при этом количественные значения признака, а значит, не рассчитывая и параметры распределения. Такие методы получили название непараметрических.

Одним из таких методов является расчет так называемого рангового коэффициента корреляции. Он может использоваться как в тех случаях, когда признаки измеримы количественно, так и в тех случаях, когда их нельзя измерить количественно, но можно проранжировать, то есть расположить их значения в порядке возрастания. Например, предположим, что при оценке тесноты связи между ростом и весом некоторой группы людей мы по каким-то причинам не смогли достать измерительные приборы (весы, ростомер и т.п.). Но мы можем выстроить этих людей по росту, определив, кто из них выше, а кто ниже, и одновременно определить, кто из них больше весит, усадив их на качели. Таким образом, мы можем проранжировать их рост и вес. Ранг - это порядковый номер значений признака, расположенных по их возрастанию. Если нам известны количественные значения соответствующих признаков, то в расчетах рангового коэффициента корреляции они все равно не понадобятся - нужно только определить ранг соответствующего значения.

Предположим, что мы расположили значения признаков x и y порядку и перенумеровали их, то есть присвоили каждому соответствующий порядковый номер или ранг. (Необходимо отметить, что одинаковым значениям присваивается одинаковый ранг!)

Обозначим ранг значения признака как R(x), а ранг значения признака y как R(y).

Формула для расчета рангового коэффициента корреляции имеет вид:

В этой формуле di - это разность рангов значений признаков x и y.

Для расчета рангового коэффициента корреляции строится вспомогательная таблица (табл. 8.3).

Таблица 8.3

Вспомогательная таблица для расчета рангового коэффициента корреляции

№п/п

x

y

R(x)(ранг x)

R(y)(ранг y)

di =R(xi) - R(yi)

di2

У

-

-

-

-

-

-

Значения рангового коэффициента корреляции также расположены между «-1» и 1, как и линейного коэффициента корреляции, но обычно ранговый коэффициент измеряет тесноту связи более «грубо» (приближенно), чем линейный.

4. Способы оценки тесноты взаимосвязей между качественными признаками

Для оценки тесноты связи между двумя признаками, которые нельзя даже проранжировать, используют другие методы. Пусть имеется два качественных признака x и y, которые нельзя измерить количественно, но можно определить, обладает ли данная статистическая единица данным признаком или нет. Условно можно считать, что каждый признак принимает только два возможных значения: 0 - если статистическая единица не обладает данным признаком; 1 - если статистическая единица обладает данным признаком.

Для измерения связи между такими признаками вначале строится так называемая таблица сопряженности, которая имеет форму, приведенную ниже:

Таблица 8.4

Таблица сопряженности между двумя альтернативными признаками

Y x

0

1

У

0

S(0,0)

S(0,1)

S(0,0)+ S(0,1)

1

S(1,0)

S(1,1)

S(1,0)+ S(1,1)

У

S(0,0)+ S(1,0)

S(0,1)+ S(1,1)

S

S = S(0,0) + S(0,1) + S(1,0) + S(1,1).

В этой таблице S - это общее число статистических единиц; S(0,0) - это число статистических единиц, для которых х=0 ; у = 0;S(0,1) - это число статистических единиц, для которых х=0; у = 1;S(1,0) - это число статистических единиц, для которых х=1; у = 0;S(1,1) - это число статистических единиц, для которых х=1; у = 1.

Обозначим S(0,0) = a; S(0,1) = b; S(1,0); S(1,1).

Среди различных показателей оценки тесноты связей качественных признаков наиболее известны:

Коэффициент ассоциации:

Коэффициент контингенции:

Кроме того, в статистике разработаны и другие непараметрические методы оценки тесноты статистических взаимосвязей, например, коэффициент корреляции рангов Кендэла

Где S - сумма баллов, рассчитываемая на основе ранжированных рядов показателей x и y. Более подробно с порядком расчета этого показателя студентам предлагается ознакомиться по учебному пособию (электронному конспекту лекций) или по другой учебно-методической литературе.

Может быть рассчитан также так называемый коэффициент конкордации, который используется для оценки взаимосвязей не только между двумя признаками (или факторами), но и между большим числом факторов. Формула для расчета этого коэффициента имеет вид:

где m - количество факторов, n - число наблюдений (то есть известных значений каждого фактора), а S - сумма квадратов отклонений суммы рангов по m факторам от их средней арифметической.

ЛЕКЦИЯ 9

ТЕМА «Статистическое изучение динамики социально -экономических процессов и явлений»

Введение

Изучение процессов развития или динамики занимает не менее важное место в любом статистическом исследовании, чем анализ статистических взаимосвязей, так как статистика - это, прежде всего, наука о количественных закономерностях и взаимосвязях экономических явлений и процессов. Анализ динамических рядов в статистике позволяет выявить основные тенденции развития социально-экономических процессов и выполнить прогноз на будущее, чтобы своевременно принять те или иные меры по регулированию этих процессов. Прежде, чем изучать разнообразные методы анализа динамики, необходимо разобраться в том, что такое «динамика», и строго определить понятие «динамический ряд».

1. Понятия «динамика» и «динамический ряд

Процесс развития, то есть движения во времени, называется в статистике динамикой, а система показателей, характеризующих этот процесс, динамическим или хронологическим рядом.

Динамический ряд (или ряд динамики) - это последовательность значений некоторого показателя, расположенных в хронологическом порядке. Обычно любой ряд динамики характеризуется двумя показателями:

t - показатель времени;

yt - уровень ряда (непосредственное значение измеряемой величины).

Ряды динамики удобно изображать графически (см., например, диаграмму, приведенную на рис. 9.1).

Рис. 9.1 Графическое изображение динамического ряда

Графический анализ динамических рядов позволяет делать определенные выводы об основных тенденциях развития изучаемых явлений, но более точным методом анализа динамики является расчет специальных аналитических показателей, которые мы рассмотрим далее.

2. Аналитические показатели динамики

Для анализа динамических рядов используют различные показатели, названия и формулы для расчета которых приведены в табл. 9.1.

Аналитические показатели динамики обычно делят на цепные и базисные, а также абсолютные и относительные.

Цепные показатели рассчитываются «по цепочке», то есть по отношению к предшествующему периоду времени.

Базисные показатели рассчитываются по отношению к некоторому базисному периоду t0, принятому за базу для сравнения. В дореформенной период в СССР было принято рассчитывать уровень экономического развития страны по отношению к 1913 году (этот год считался годом, когда экономическое развитие России в дореволюционный период достигло наивысшего уровня). В послереформенный период за базу для сравнения чаще всего выбирают 1991 г.

В табл. 9.1 представлены различные виды аналитических показателей динамики и формулы для их расчета:

Таблица 9.1

Аналитические показатели динамики

Наименование показателей

Формулы для расчета

Цепные показатели

Базисные показатели

1

2

3

Абсолютные показатели

Абсолютный прирост

Средний абсолютный прирост

Относительные показатели

Коэффициент роста

Коэффициент прироста

Темп роста

Темп прироста

Средние абсолютные показатели динамики (средние уровни ряда или средние абсолютные приросты) рассчитывают по формуле средней арифметической.

Средние относительные показатели динамики (средние темпы или коэффициенты роста или прироста) рассчитываются по формуле средней геометрической.

Например,

3. Сглаживание (выравнивание) динамических рядов: механическое и аналитическое сглаживание

Сглаживание (выравнивание) ряда - это построение нового ряда данных, значения которого максимально приближены к значениям последнего ряда, но на графике изображаются более гладкой, ровной линией.

Эта процедура обычно выполняется для того, чтобы выявить основную тенденцию развития явления и продолжить ее на будущее, то есть сделать прогноз. Продолжение тенденции на будущее называется экстраполяцией. Направление, выявленное тенденцией, называется трендом.

Экстраполяция тренда - это простейший из статистических методов прогнозирования. Однако его можно использовать только при условии, что имеется достаточно длинный ряд накопленных статистических данных и если есть уверенность, в том что выявленная тенденция сохранится на будущее.

Методы сглаживания рядов

Обычно для сглаживания динамических рядов используется два основных метода:

1. Механическое сглаживание способом «скользящей средней»;

2. Аналитическое сглаживание путем построения так называемого уравнения тренда.

Первый способ заключается в том, что каждые несколько последовательных значений ряда (чаще всего три) поочередно заменяются их средней арифметической, т.е. строится новый ряд:

-

Второй способ - аналитическое сглаживание или построение уравнения тренда - заключается в том, что строится уравнение некоторой математической функции, которая приблизительно описывает выявленную тенденцию развития. Эта функция подбирается таким способом, чтобы ее график был максимально приближен к графику исходного ряда данных.

Преимущество такого способа сглаживания рядов заключается в том, что по уравнению тренда легко сделать прогноз: достаточно подставить в это уравнение значение t для будущего периода. Однако при построении уравнении тренда основной проблемой является выбор вида функции для сглаживания ряда.

Чаще всего для сглаживания динамических рядов используются следующие функции:

1. Линейная

2. Квадратичная парабола

3. Кубическая парабола

4. Показательная функция

5. Степенная функция

6. Полулогарифмическая

Также используются некоторые специфические функции: так называемые функции с пределом насыщения или S-образные кривые: например, логистическая функция

y = ;

логистическая кривая Перла-Рида

y = ;

кривая Гомперца

y =

и некоторые другие)11 Более подробно эти виды функций и методы расчета их параметров обычно изучают в курсе эконометрики..

Подбор вида функций осуществляется либо графически, либо экспертным путем, а иногда способом автоматического перебора всех возможных функций, и выбора такой функции, график которой наиболее приближен к графику исходного ряда.

Степень близости оценивается по критерию, который называется ошибка аппроксимации1.

где - исходные значения уровня ряда;

- расчетные значения уровня ряда;

f(t), где f(t) - уравнение соответствующей функции.

Кроме того, используются и другие специальные критерии, которые более подробно изучаются в дисциплине «эконометрика».

Для расчета параметров соответствующей функции (уравнения тренда) используют так называемый «метод наименьших квадратов» (сокращенно МНК). Суть этого метода подробнее рассматривается на следующей лекции.

ЛЕКЦИЯ 10

ТЕМА «Построение уравнений тренда и уравнений регрессии с помощью метода наименьших квадратов»

Введение

На предыдущей лекции мы говорили о сглаживании динамических рядов и о том, что аналитическое сглаживание осуществляется на основе так называемых уравнений тренда. А перед этим, изучая методы анализа статистических взаимосвязей, мы говорили о построении так называемых уравнений регрессии. На самом деле между уравнениями тренда и уравнениями регрессии имеется немало общего и для расчета их параметров используется один и тот же метод наименьших квадратов (МНК).

Разница лишь в том, что уравнения тренда выражают зависимость некоторого показателя от времени, т.е. y=f(x), а уравнения регрессии - статистическую зависимость между двумя и более показателями, т.е. y=f(x) или y=f(x1,x2…xm).

На данной лекции мы будем более подробно изучать построение этих уравнений с помощью разработанного в математической статистике метода наименьших квадратов. И прежде всего, кратко рассмотрим сущность этого метода.

1. Сущность метода наименьших квадратов

Метод наименьших квадратов подробно изучается в математической статистике. Его сущность заключается в том, что параметры аналитической функции, используемой для сглаживания ряда, подбираются таким образом, чтобы минимизировать сумму квадратов отклонений расчетных (теоретических) значений динамического ряда от фактических (исходных) значений. То есть находится:

,

где - фактические значения показателя (исходные статистические данные), а - расчетные значения (полученные на основе построенного уравнения тренда или регрессии). Например, для уравнения линейного тренда такая сумма квадратов имеет вид:

Так как значения и нам известны, то сумма квадратов в действительности является функцией многих переменных, в качестве которых выступают неизвестные значения параметров уравнений тренда (или регрессии).

= Q (a0, a1, a2,… an)

Таким образом, задача поиска параметров функций, сглаживающих исходный ряд, преобразуется в задачу поиска min Q (a0, a1, a2,… an).

Как известно из высшей математики, задача поиска экстремума (минимума или максимума) некоторой функции обычно решается путем ее дифференцирования и приравнивания производных к нулю.

Точно так же данная задача решается и в этом случае. Находятся частные производные функции Q (a0, a1, a2,… an) по каждой из переменных a0, a1, a2,… an и приравниваются к нулю. В результате получается система уравнений, где число неизвестных и уравнений совпадает с числом параметров, которые необходимо найти.

Эта система в статистике называется системой «нормальных уравнений» (от слова «нормаль», т.е. перпендикуляр), так как вектор, составленный из частных производных (градиент), будет перпендикулярен к поверхности графика функции нескольких переменных в m-мерном пространстве.

В зависимости от математической формы конкретного уравнения регрессии (или тренда) такие системы имеют разный вид.

Ниже мы рассмотрим, какой вид имеют такие системы для простейшего уравнения парной линейной регрессии (или так называемой «простой регрессии»), а также для уравнения квадратической регрессии и двухфакторной линейной регрессии.

2. Построение уравнений регрессии

Уравнение регрессии - это уравнение, выражающее статистическую зависимость между различными показателями.

В зависимости от того, сколько различных факторов (показателей) связаны этой зависимостью, разделяют уравнения парной и множественной регрессии.

Уравнение парной регрессии выражает связь между двумя признаками (или показателями), один из которых (независимый) называется факторным, а второй (зависимый) - результативным.

Уравнение множественной регрессии выражает зависимость между более чем двумя показателями, один из которых называется результативным (обозначается обычно через y, а остальные факторными: обозначаются x1, x2, x3,…).

Уравнения парной регрессии могут иметь различный вид, в зависимости от того, какой функцией эта зависимость выражается (линейной, параболой и т.п.).

Чаще всего используются следующие функции:

линейнаяyx = a0 + a1x;

полулогарифмическаяyx = a0 + a1lgx;

показательнаяyx = a0 + a1x;

степеннаяyx = a0 xa1;

гиперболическаяyx = a0 + a1.

Для расчета параметров уравнений регрессии используется рассмотренный выше метод наименьших квадратов.

Параметры уравнения регрессии находятся путем решения так называемых систем «нормальных уравнений», которые имеют разную форму для уравнений регрессии различного вида (в зависимости от числа переменных и вида функциональной зависимости между показателями).

Остановимся вначале более детально на расчете параметров уравнения парной линейной регрессии, так как для расчета его параметров непосредственно выведены формулы, которые нетрудно использовать на практике.

Предположим, что имеется два ряда значений исходных показателей x и y (факторного и результативного признаков). Требуется построить уравнение парной линейной регрессии между признаками:

y = a0 + a1x.

Для определения его параметров составляется система нормальных уравнений:

na0 + a1Уx = Уy;

a0Уx + a1Уx2 = Уxy. (10.1)

Для решения системы обычно используется метод определителей. В результате получаем следующие формулы для расчета параметров уравнения регрессии:

(10.2)

Чтобы воспользоваться приведенными выше формулами, обычно строится вспомогательная таблица (табл. 10.1), в последней строке которой находятся величины , , , , которые необходимо подставить в формулы (10.2).

Таблица 10.1

Расчет параметров парной линейной регрессии

Исходные данные

Вспомогательные расчеты

x

y

x2

x Чy

y = f(x)

У

Система нормальных уравнений для поиска параметров двухфакторной линейной регрессии (y = a0 + a1x1 + a2x2) имеет более сложный вид, чем система (10.1):

Уy = na0 + a1 Уx1 + a2Уx2;

Уyx1= a0 Уx1 + a1 Уx12 + a2 Уx1 x2; (10.3)

Уyx2= a0 Уx2 + a1 Уx1 + a2 Уx22;

Очень похожий вид имеет система нормальных уравнений для расчета параметров квадратической регрессии (y = a0 + a1x + a2x2):

Уy = na0 + a1 Уx + a2Уx2;

Уyx1 = a0 Уx + a1 Уx2 + a2 Уx3; (10.4)

Уyx2 = a0 Уx2 + a1 Уx3 + a2 Уx4;

Система (10.4) получается из системы (10.3) и наоборот путем простейшей замены переменных x1 = x; x2 = x2.

Эти системы также решаются методом определителей.

Вначале находится определитель Д матрицы коэффициентов при неизвестных, затем столбцы этой матрицы поочередно заменяются столбцом свободных членов системы нормальных уравнений, и рассчитываются еще три соответствующих определителя: Д0, Д1, Д2.

Параметры a0 , a1, a2 рассчитываются по формулам:

a0= Д0/ Д; a1 = Д1/ Д; a2 = Д2/ Д

3. Построение уравнений тренда

Для расчета параметров уравнений тренда также используется метод наименьших квадратов (МНК), но при этом используется особый прием - введение условного обозначения времени. За счет введения условного обозначения времени существенно упрощаются формулы для расчетов параметров уравнений тренда. В теории статистики доказывается, что результат расчета параметров не зависит от изменения начала координат на оси отсчета периодов времени. Это связано с тем, что время изменяется равномерно и в одном направлении. Расчет параметров уравнений регрессии значительно сложнее именно из-за того, что ввести условное обозначение переменной x в данном случае не удается.

При расчете параметров уравнений тренда обычно строится вспомогательная таблица, в которой специально вводят условное обозначение времени.

Условное время вводят таким образом, чтобы Уt = 0. Если число реальных периодов (моментов) времени нечетное, в середине ставится 0, а затем отсчет ведется вправо и влево от нуля (как считают в истории «годы до нашей эры»). Если число периодов четное, то 0 пропускается; при этом отсчет вправо ведется от 1, отсчет влево - от -1.

Пример условного обозначения времени показан в табл. 10.1. Если заменить в ранее приведенных системах нормальных уравнений (10.1) и (10.4) переменную x на переменную t и заменить в полученных системах и на ноль, получим следующие, более простые системы:

na0 = Уy;

a1Уx2 = Уxy. (10.5)

Уy = na0 + a2Уt2;

Уyt = a1 Уt2; (10.6)

Уyt2 = a0 Уt2 + a2 Уt4;

Решая системы (10.5) и (10.6), получаем простейшие формулы для расчета параметров соответственно линейного (10.7) и квадратического тренда (10.8).

Таблица 10.2

Вспомогательная таблица для расчета параметровуравнений линейного и квадратического тренда

Период реального времени

Условное обозначение времени

yxt

y xt2

y xt4

Условное t

Условное t2

Условное t4

2001

-2

4

16

2002

-1

1

1

2003

0

0

0

2004

1

1

1

2005

2

4

16

Сумма:

0

10

34

Формулы для расчета параметров тренда будут иметь следующий вид:

а) для линейного тренда (y = a0 + a1t):

(10.7)

б) для уравнения квадратического тренда, т.е. параболы

(y = a0 + a1t + a2t2):

(10.8)

Необходимо обратить внимание, что параметр a1 рассчитывается по такой же формуле, как и для линейного тренда.

Обычно при построении уравнений тренда или регрессии возникает проблема выбора такой математической формы зависимости, которая лучше сглаживает исходный ряд данных или, иначе говоря, более адекватно отражает имеющуюся тенденцию развития (т.е. статистическую зависимость результативного показателя y от времени t). Для этого, как уже отмечалось, рассчитывается ошибка аппроксимации и выбирается то из уравнений, для которого эта ошибка меньше.

Существуют и более сложные статистические критерии отбора наилучших уравнений, но более подробно они изучаются в дисциплине «эконометрика»

4. Расчет корреляционного отношения на основе уравнения регрессии

Одним из показателей тесноты связи, которая рассчитывается в тех случаях, если зависимость между двумя показателями не является линейной (и линейный коэффициент корреляции не показывает наличие связи), является корреляционное отношение.

Для расчета корреляционного отношения необходимо вначале построить уравнение парной регрессии, выражающее зависимость между показателями x и y .

Пусть y = f(х) - уравнение парной регрессии.

Если уже рассчитаны его параметры, необходимо рассчитать все теоретические (или расчетные) значения показателя y - так же, как это делается при расчете ошибки аппроксимации. Затем корреляционное отношение рассчитывается по формуле:

где - дисперсия теоретических (или расчетных) значений y;

а - дисперсия фактических значений y.

Эти дисперсии рассчитываются по формулам:

- это расчетные значения y, то есть:

где f(х) - построенное уравнение регрессии.

Для расчета корреляционного отношения з обычно строится вспомогательная таблица следующего вида (табл.10.3):

Таблица 10.3

Вспомогательная таблица для расчета корреляционного отношения

y

yх

yх - ух

( yх - yх)2

х1

y1

f(х)

х2

y2

f(x)

х3

y3

f(x)

.

хn

yn

f(x)

У

У

У

У

Корреляционное отношение обладает свойством: 0 ? з ? 1, т.е. в отличие от коэффициента корреляции не может принимать отрицательные значения.

Чем ближе з к 1, тем связь более тесная. Для оценки степени тесноты связи с помощью корреляционного отношения используется специальная шкала, которую называют шкалой Чеддока (по имени автора, предложившего данную шкалу).

Шкала Чеддока

Значение з

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,999

Теснота связи

Слабая

Умеренная

Заметная

Высокая

Очень высокая

Рекомендуется рассчитывать корреляционное отношение в тех случаях, если линейный коэффициент корреляции не показывает наличия тесной связи между признаками, однако есть основание считать, что связь все же имеется, но не является линейной.

Таким образом, на данной лекции был изучен метод наименьших квадратов (МНК), с помощью которого рассчитываются параметры уравнений тренда и уравнений регрессии. Рассмотрено построение так называемых систем нормальных уравнений, позволяющих рассчитывать параметры различных типов уравнений регрессии и тренда. Необходимо обратить внимание на то, что этот метод и его применение будет в дальнейшем более глубоко изучаться в такой дисциплине как эконометрика. Поэтому необходимо очень хорошо усвоить сущность данного метода и особенности различных систем нормальных уравнений. Необходимо также разобраться в том, чем именно уравнения регрессии отличаются от уравнений тренда, и почему расчет параметров уравнений тренда можно упростить, вводя условное обозначение времени.

ЛЕКЦИЯ 11

ТЕМА «Индексный метод в статистических исследованиях социально-экономических явлений и процессов»

Введение

На предыдущих лекциях мы изучали различные аналитические показатели: средние величины, показатели вариации, показатели корреляции, показатели динамики. На данной лекции мы изучим особый вид аналитических показателей - статистические индексы, о которых иногда говорят, что эти показатели предназначены для анализа изменений структуры сложных статистических совокупностей. Мы рассмотрим сущность понятия «статистический индекс» и роль индексного метода в статистике.

1. Понятие «статистический индекс

Статистические индексы - это особый вид аналитических показателей, которые используются для анализа динамики структуры сложных статистических совокупностей.

Сложная статистическая совокупность - эта такая совокупность статистических единиц, у которых отдельные признаки непосредственно не соизмеримы и не подлежат суммированию. Наиболее ярким примером сложных статистических совокупностей является ассортимент товаров, имеющихся в продаже. Цены этих товаров назначены за единицу количества (физического объема) товаров в натуральном выражении. Но сами эти единицы - разные для различных видов товаров, например, штуки, килограммы, литры, метры и т.д. Поэтому рост цен на все товары нельзя определить путем суммирования цен на отдельные товары. Необходимо учитывать степень потребности в этих товаров, например, объем ежесуточного или еженедельного потребления (приобретения) соответствующих товаров.

Обычные показатели динамики, т.е. коэффициенты роста или прироста используются для анализа развития некоторого процесса в целом без учета изменений в его структуре.

Индексы позволяют анализировать изменения в структуре явлений, т.е. изменение в соответствии отдельных частей.

Впервые статистические индексы были использованы при анализе динамики цен. Самый простой вид статистических индексов был предложен в XIX в. французским экономистом (шотландского происхождения) Дж. Лоу, который предложил рассчитывать среднюю цену продуктов, входящих в «потребительскую корзину».

Под «потребительской корзиной» Дж. Лоу понимал тот минимальный набор продуктов, который ежедневно закупает хозяйка. Он предложил отслеживать изменения среднего уровня цен на основе следующего показателя, который Дж. Лоу назвал индексом цен:

,

где - средняя цена продуктов, входящих в потребительскую корзину в базисном периоде;

- средняя цена продуктов, входящих в потребительскую корзину в отчетном периоде.

Однако в XX веке в связи с ускорением научно-технического прогресса и постоянным обновлением ассортимента товаров изменилось понятие «потребительской корзины» и измерять изменение цен с помощью индекса Лоу стало неудобно.

Другие экономисты предложили другие формулы для расчета индексов цен. Понятие индекса расширилось, а индексный метод стал использоваться не только в статистике цен, но и в других областях экономической статистике. Не только индекс потребительских цен, но и так называемые фондовые индексы (индексы рынка ценных бумаг) стали одним из важнейших экономических показателей конъюнктуры рынка и характеристикой деловой активности предпринимателей.

2. Различные виды статистических индексов и способы их расчета

В настоящее время статистические индексы делят на:

P индивидуальные;

P общие (агрегатные)

Формулы для расчета индивидуальных индексов похожи на формулы для расчета коэффициентов роста.

Как известно, коэффициенты роста, так же как индексы, делят на цепные и базисные:

Цепной коэффициент роста имеет вид:

Базисный коэффициент роста:

Формулы для расчета индивидуальных индексов имеют тот же смысл - отличаются только обозначения:

Базисный (индивидуальный) индекс цен:

,

где - цена товара в базисном периоде;

- цена товара в отчетном периоде.

Цепной (индивидуальный) индекс цен:

,

где - цена товара в предшествующем периоде;

- цена товара в отчетном периоде.

Индивидуальные индексы показывают изменение отдельных частей изучаемого явления во времени.

Общие (или агрегатные) индексы показывают изменение структуры (то есть соотношения частей) изучаемого явления.

Таким образом, индексный метод наиболее часто используются для изучения динамики сложных статистических совокупностей. Под сложной совокупностью понимают такую совокупность, отдельные единицы которой обладают признаками, измеряемыми в несопоставимых единицах измерения, поэтому значения признаков нельзя суммировать.

Наиболее распространенные виды агрегатных индексов - это агрегатные индексы цен. Они используются, в частности, для расчета индекса потребительских цен, который служит одним из важнейших показателей инфляции.

Различные виды агрегатных индексов и формулы для их расчетов приведены в табл. 11.1.

Таблица 11.1

Различные виды агрегатных индексов

Виды индексов

Формулы расчета

Индексы цен

Индексы физических объемов продукции

1. Индекс Ласпейреса

2. Индекс Пааше

3. Индекс Фишера

Для расчета различных индексов цен обычно строится вспомогательная таблица (табл. 11.2):

Таблица 11.2

Вспомогательная таблица для расчета индексов цен

Товары

Базисный период

Отчетныйпериод

Вспомогательные расчеты

P0

Q0

P1

Q1

P0 ЧQ0

P0 Ч Q1

P1 Ч Q0

P1 ЧQ1

A

B

C

У

3. Сущность индексного метода в статистике

Сущность индексного метода в статистике проще всего изложить на примере индексного анализа изменения взвешенной средней величины.

Индексный метод чаще всего применяют в статистике для изучения динамики средних величин и выявления факторов, влияющих на динамику средних. Эти задачи решаются с помощью системы взаимосвязанных индексов переменного состава, постоянного состава и структурных сдвигов.

Индекс переменного состава представляет собой соотношение средних величин какого-либо признака в отчетном и базисном периодах:

I пер.сост. = = (11.1)

Как видно из формулы (1), индекс переменного состава характеризует изменение среднего уровня признака за счет влияния двух факторов:

1) изменения индивидуальных значений признака x у отдельных единиц статистической совокупности;

2) структурных изменений, то есть изменений доли статистических единиц с одинаковым значением признака x в общей их численности.

Индекс постоянного (фиксированного) состава отражает изолированное влияние первого фактора, т.е. показывает средний размер изменения изучаемого признака x у отдельных статистических единиц и рассчитывается как отношение средних взвешенных величин постоянного состава, т.е. с одними и теми же удельными весами:

Iпост.сост. = (11.2)

Формула (2) легко преобразуется в агрегатную форму обобщающего индекса (так как знаменатель каждой дроби сокращается):

Iпост.сост. = (11. 3)

Индекс структурных сдвигов характеризует влияние изменения структуры изучаемой совокупности на динамику среднего уровня признака и рассчитывается по формуле:

Iстр.сдв. = (11.4)

В формуле (4) в отличие от формул (2) и (3), наоборот, изменяются только удельные веса отдельных значений признака в предположении, что сами значения сохраняются на прежнем (базисном) уровне.

Индексы переменного и постоянного состава, а также структурных сдвигов увязываются в следующую систему:

I пер.сост. = I пост.сост Ч I стр.сдв.(11.5)

Если в индексах средних величин в качестве удельных весов используются не частоты (число статистических единиц с одинаковыми значениями признака), а частости (т.е. доли одинаковых значений признака в общем объеме статистической совокупности di = ), тогда система индексов может быть записана в следующем виде:

I пер.сост. = ;

I пост.сост. = ; (11. 6)

I стр.сдв. =

Система индексов переменного, постоянного состава и структурных сдвигов используется для изучения влияния качественных и количественных факторов на динамику среднего уровня цен, себестоимости продукции, фондоотдачи, рентабельности, производительности труда, заработной платы и других важнейших экономических показателей.

Общий абсолютный прирост (или уменьшение) среднего уровня признака в целом по совокупности находится как разность числителя и знаменателя индекса переменного состава:

Д = = (11.7)

Абсолютный прирост (или уменьшение) среднего уровня признака в целом по совокупности за счет изменений значений изучаемого признака у отдельных единиц совокупности рассчитывается как разность числителя и знаменателя индекса постоянного состава:

Д= (11. 8)

Абсолютный прирост (или уменьшение) среднего уровня признака в целом по совокупности за счет структурных изменений (или доли отдельных значений изучаемого признака рассчитывается как разность числителя и знаменателя индекса структурных сдвигов:

Д= (11.9)

Легко проверить, что соблюдается соотношение:

Д= Д+ Д(11.10)

ЛЕКЦИЯ 12

ТЕМА «Статистические методы прогнозирования и основы многомерного статистического анализа»

Введение

В настоящее время статистические методы прогнозирования заняли особое место в мировой статистической практике и с успехом применяются в самых разных областях экономики: как для макроэкономических прогнозно-аналитических расчетов и разработки мер по регулированию экономического развития страны, так и в микроэкономическом управленческом и маркетинговом анализе. Широкое распространение специальных статистических программных пакетов сделало использование этих методов простым и удобным.

Статистические методы прогнозирования все шире применяются в деятельности плановых, маркетинговых и аналитических отделов производственных предприятий и объединений, торговых, страховых, финансовых компаний, банков и правительственных учреждений.

Использование компьютеров для выполнения сложных и трудоемких расчетов приводит к тому, что на долю человека остается исследовательская, творческая работа: постановка задачи, выбор модели и метода прогнозирования, оценка качества построенных моделей и интерпретация полученных результатов. Однако для того, чтобы выполнять эту работу на высоком профессиональном уровне, необходима определенная подготовка в области статистических методов прогнозирования и представление о многомерном статистическом анализе.

На данной лекции мы изучим сущность статистических методов прогнозирования и основы многомерного статистического анализа. Предварительно следует рассмотреть само понятие «прогноз» и разобраться в том, что такое «прогнозирование».

1. Понятие «прогноз» и виды прогнозов

Прогноз (от греческого prognosis - предвидение, предсказание) - это научно обоснованное описание возможных состояний изучаемых объектов в будущем, а также альтернативных путей и сроков достижения этих состояний.

Процесс разработки прогнозов называется прогнозированием.

Прогнозирование должно дать ответ на два вопроса:

1) Чего вероятнее всего ожидать в будущем?

2) Каким образом нужно изменить условия, чтобы достичь желаемого состояния изучаемого Прогнозы, отвечающие на вопросы первого типа, называются поисковыми, а второго типа - нормативными (иногда их называют программно-целевыми).

Например, если Правительство г. Москвы ставит задачу обеспечить каждую семью отдельной квартирой, то нормативный прогноз покажет, при каких финансовых вложениях и в какие сроки может быть выполнена такая задача.

В зависимости от объектов прогнозирования принято разделять прогнозы на научно-технические, экономические, социальные, военно-политические и т.п. Однако такая классификация носит условный характер, так как между такими видами прогнозов обычно существует множество прямых и обратных связей.

Классификация экономических прогнозов показана на рисунке 12.1.

В зависимости от масштабности объекта прогнозирования прогнозы могут охватывать все уровни: от микроуровня (на котором рассматриваются прогнозы развития отдельных предприятий) до макроуровня, на котором анализируется и прогнозируется макроэкономическое развитие страны.

По времени упреждения (то есть длины периода, на который делается прогноз) прогнозы делятся на:

- оперативные (до 1 мес.);

- краткосрочные (от нескольких месяцев до 1 года);

- среднесрочные (с периодом упреждения более 5 лет).

Наибольший практический интерес для финансистов-аналитиков, предпринимателей, маркетологов, менеджеров, несомненно, представляют краткосрочные и оперативные прогнозы.

Для прогнозирования могут использоваться не только статистические, но и другие методы, например, экспертно-аналитические или интуитивно-логические. Но статистические методы имеют немало преимуществ, связанных с тем, что они основаны на использовании имеющейся базы статистических данных, причем процедура прогнозирования с их помощью может быть компьютеризирована, что сокращает время и затраты на сбор и обработку исходной информации.

В то же время у этих методов имеются и определенные недостатки, которые ограничивают область их применения. В частности, достаточно достоверный прогноз может быть построен только при соблюдении определенных требований к исходной статистической информации.

2. Сущность статистических методов прогнозирования и требования к исходной статистической информации

Статистические методы прогнозирования основаны на процессе экстраполяции, то есть продолжении на будущее тенденции, наметившейся в прошлом. Такая экстраполяция может быть выполнена даже на основе чисто графического анализа при наличии графика исходного ряда данных.

Однако к статистическим методам прогнозирования относится не только экстраполяция тренда (на основе одномерного временного ряда), но и экстраполяция на основе уравнений парной и множественной регрессии, которая осуществляется в два этапа. Вначале методом экстраполяции тренда прогнозируется изменение каждого из факторных признаков (показателей), а затем найденные прогнозные значения подставляются в уравнение регрессии и рассчитывается прогноз результативного показателя.

Сущность статистических методов прогнозирования приводит к ограничениям на область их использования.

В частности, такие методы дают достаточно достоверный результат, лишь при наличии сохранения в будущем некоторой тенденции, которая наметилась в прошлом. Если эта тенденция не сохранится (т.е. произойдет резкий «перелом» плавного течения процесса), то использовать статистические методы для прогнозирования не имеет смысла.

Это чаще всего происходит, если в ход исследуемого процесса неожиданно вмешиваются какие-то новые факторы, ранее не оказывающие на него влияния.

Например, таким фактором послужил банковский кризис 1998 года, который полностью изменил все условия экономической деятельности отечественных предприятий.

Далее, очень важно иметь достаточно качественную исходную информацию.

Во-первых, длина исходного ряда данных должна быть достаточной, то есть не менее чем в 3-4 раза больше периода упреждения прогноза. Во-вторых, желательно использовать для прогнозирования динамические ряды с равными интервалами между соседними уровнями ряда. В-третьих, значения показателей (уровней ряда) за разные моменты времени должны быть сопоставимыми. Проблема сопоставимости статистической информации во времени часто становится «камнем преткновения» в прогнозно-аналитических исследованиях экономических явлении и процессов. Например, несопоставимость может иметь место из-за изменения методики расчета показателей, изменения терминологии, классификации, структурных изменений в отраслях экономики и т.д. Все эти явления практически «разрушили» накопленную за 70 лет в СССР базу статистических данных, сделав ее непригодной для прогнозных расчетов. Поэтому прогноз макроэкономических показателей у нас сейчас осуществляется на основе достаточно «короткого» ряда данных чуть более 10 лет (в основном за период, начиная с 1994г). Существуют и другие ограничения на возможность использования статистических методов.


Подобные документы

  • Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.

    реферат [33,9 K], добавлен 20.01.2010

  • Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.

    шпаргалка [31,9 K], добавлен 26.01.2009

  • Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.

    курс лекций [68,4 K], добавлен 08.08.2009

  • Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.

    методичка [371,4 K], добавлен 15.01.2010

  • Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.

    курс лекций [475,4 K], добавлен 11.02.2010

  • Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.

    реферат [24,7 K], добавлен 29.03.2013

  • Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.

    реферат [192,6 K], добавлен 15.05.2009

  • Предмет и метод статистики как общественной науки. Основные задачи и виды группировок. Точность наблюдения и методы проверки достоверности данных. Понятие о статистическом наблюдении, этапы его проведения. Виды статистических показателей и величин.

    курсовая работа [1,5 M], добавлен 09.02.2014

  • Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.

    лекция [17,4 K], добавлен 14.03.2010

  • История возникновения и развития статистики. Предмет, основные понятия и категории статистики. Методы сбора, обобщения и анализа статистических данных. Экономическая статистика и ее отрасли. Современная организация статистики в Российской Федерации.

    лекция [16,5 K], добавлен 02.05.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.