Закон распределения случайных величин (в таможенном деле)

Характеристика показателей, описывающих распределение случайных величин. Анализ законов распределения дискретных и непрерывных величин в таможенной статистике. Проверка гипотезы о нормальности распределения с помощью использования различных критериев.

Рубрика Таможенная система
Вид реферат
Язык русский
Дата добавления 24.07.2014
Размер файла 450,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

Введение

Глава 1. Показатели, характеризующие распределение случайных величин

Глава 2. Законы распределения дискретных и непрерывных случайных величин

Глава 3. Проверка гипотезы о нормальности распределения

Заключение

Список использованной литературы

Введение

Актуальность темы исследования. В целях анализа состояния внешней торговли Российской Федерации, контроля за поступлением в федеральный бюджет таможенных платежей, валютного контроля, анализа состояния, динамики и тенденций развития внешней торговли Российской Федерации, ее торгового и платежного балансов и экономики в целом таможенные органы ведут сбор и обработку сведений о перемещении товаров через таможенную границу. Таможенная статистика является составной частью проводимой в стране статистики ее внешнеэкономических связей.

Величины, которые могут принять в результате опыта любое из возможных значений, являются предметом дальнейшего изучения. Случайной называется величина, которая в результате опыта может принять то или иное возможное значение, неизвестное заранее, но обязательно одно.

Дискретной случайной величиной называют такую случайную величину, множество возможных значений которой либо конечное, либо бесконечное, но счетное. Непрерывной случайной величиной называют такую случайную величину, которая может принять любое значение из некоторого конечного или бесконечного интервала.

Однако простое перечисление всех возможных значений случайной величины не дает достаточно полного представления о ней. Кроме того, необходимо знать, как часто могут появляться те или иные значения в результате испытаний или наблюдений, т.е. следует знать вероятности их появления. Полное представление о случайной величине может дать закон ее распределения.

Цель работы - характеристика законов распределения случайных величин. Основная задача - анализ приложения распределения случайных величин в таможенной статистике.

Глава 1. Показатели, характеризующие распределение случайных величин

Признаки, разрабатываемые таможенной статистикой внешней торговли, рассмотренные в предыдущей теме, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьируется по подразделениям ФТС; величина экспорта (импорта) варьируется по направлениям экспорта (по разным странам-партнерам по внешней торговле), по видам товаров и т.п.

Причиной вариации являются разные условия существования разных единиц совокупности. Например, огромное число причин влияет на масштабы внешней торговли различных стран мира.

Для управления и изучения вариации статистикой разработаны специальные методы исследования вариации, система показателей, с помощью которой вариация измеряется, характеризуются ее свойства.

Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (ели признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае - интервальный ряд);

дискретный ряд - это таблица, состоящая из двух столбцов (строк) - конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi - частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

интервальный ряд - это таблица, состоящая из двух столбцов (строк) - интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Этап 1. Построение ранжированного ряда распределения. Построим ряд распределения внешнеторгового оборота (ВО) по таможенным постам России, для чего необходимо провести статистическое наблюдение, то есть собрать первичный статистический материал, который представляет собой величину ВО по всем таможенным постам, численность которых составляет 709 ед.

Ввиду огромного массива данных применение сплошного наблюдения экономически нецелесообразно, поэтому в таких случаях применяется выборочный метод, то есть из общего массива данных (генеральная совокупность) отбирается некоторая часть (выборочная совокупность, или выборка), которая и подвергается статистическому анализу. При этом число единиц в выборке обозначают п, во всей генеральной совокупности - N. Отношение n/N называется относительный размер или частость выборки. Качество результатов выборочного метода зависит от репрезентативности выборки, т.е. от того, насколько она представительна в генеральной совокупности. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц.

В нашем примере про ВО примем частость выборки n/N =0,05 или 5%, то есть в выборку включим n = 0,05*709 = 35 таможенных постов из 709. Результаты выборочного наблюдения ВО по 35 таможенным постам за отчетный период представим в виде ранжированного по возрастанию величины ВО ряда распределения (таблица 1).

Таблица 1. Внешнеторговый оборот (ВО) по 35 таможенным постам, млн.долл.

№ поста

ВО

№ поста

ВО

№ поста

ВО

1

24,16

13

54,12

25

65,31

2

27,06

14

54,91

26

69,24

3

29,12

15

55,74

27

71,39

4

31,17

16

55,91

28

77,12

5

37,08

17

56,07

29

79,12

6

39,11

18

56,80

30

84,34

7

41,58

19

56,93

31

86,89

8

44,84

20

57,07

32

91,74

9

46,80

21

58,39

33

96,01

10

48,37

22

59,61

34

106,84

11

51,44

23

59,95

35

111,16

12

52,56

24

62,05

Итого

2100,00

Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение - или долю какого-то признака - d) генеральной совокупности, необходимо найти пределы, в которых он находится. Для этого необходимо определить изучаемый параметр по данным выборки (выборочную среднюю - и/или выборочную долю - ) и его дисперсию ().

В нашем примере про ВО определим его средний размер в выборке, приняв за X величину ВО, а за N - численность выборки n:

== 2100/35 = 60 (млн.долл.)

Дисперсию (о ней будет рассказано чуть позднее - на 4-м этапе анализа вариации в этой теме) определим по формуле (46):

= =445,778(млн.долл.2)

Затем необходимо определить предельную ошибку выборки:

= t

где t - коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки; - средняя ошибка выборки,

= - для повторной выборки

= , - для бесповторной выборки

где n - численность выборки; N - численность генеральной совокупности.

В нашем примере про ВО выборка бесповторная, значит, получим среднюю ошибку выборки при определении средней величины ВО в генеральной совокупности: = = 3,48 (млн.долл.).

Значения вероятности P и коэффициента доверия t имеются в таблицах нормального закона распределения.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950 (t = 1,96), которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы.

Предельная ошибка выборки при определении средней величины ВО: = 1,96*3,48 = 6,82 (млн.долл.).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности:

(-) (+) - для среднего значения

(-) d (+) - для какого-нибудь признака

В нашем примере

= 60 ± 6,82 или 53,18 66,82 (млн.долл.), то есть средняя величина ВО в отчетном периоде по всем 709 таможенным постам с вероятностью 0,95 лежит в пределах от 53,18 млн.долл. до 66,18 млн.долл.

Этап 2. Построение интервального ряда распределения. Построим интервальный ряд распределения ВО по таможенным постам России, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

или ,

где k - число групп (округляемое до ближайшего целого числа); N - численность совокупности.

Из формулы Стерджесса видно, что число групп - функция объема данных (N).

Зная число групп, рассчитывают длину (размах) интервала:

где Xмax и Xmin -- максимальное и минимальное значения в совокупности.

В нашем примере про ВО по формуле Стерждесса (37) определим число групп:

k = 1 + 3,322lg35 = 1+ 3,322*1,544 = 6,129 ? 6.

Рассчитаем длину (размах) интервала по формуле (39):

h = (111,16 - 24,16)/6 = 87/6 = 14,5 (млн.долл.).

Теперь построим интервальный ряд с 6 группами с интервалом 14,5 млн.долл. (см. первые 3 столбца табл. 2).

Таблица 2. Интервальный ряд распределения ВО по таможенным постам, млн.долл.

i

Группы постов по величине ВО Xi

Число постов fi

Середина интервала Хi'

Хi'fi

Накопл. Частота fi'

| Хi' -| fi

(Хi' -)2 fi

(Хi' -)3 fi

(Хi' -)4 fi

1

24,16 - 38,66

5

31,41

157,05

5

147,071

4326,001

-127246,23

3742856,97

2

38,66 - 53,16

7

45,91

321,37

12

104,400

1557,051

-23222,31

346344,16

3

53,16 - 67,66

13

60,41

785,33

25

5,386

2,231

-0,92

0,38

4

67,66 - 82,16

4

74,91

299,64

29

56,343

793,629

11178,84

157461,90

5

82,16 - 96,66

4

89,41

357,64

33

114,343

3268,572

93434,47

2670891,13

6

96,66 - 111,16

2

103,91

207,82

35

86,171

3712,758

159966,81

6892284,32

Итого

35

2128,85

513,714

13660,243

114110,66

13809838,86

Этап 3. Расчет структурных характеристик ряда распределения. При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана - величина варьирующего признака, делящая совокупность на две равные части - со значением признака меньше медианы и со значением признака больше медианы.

Этап 4. Расчет показателей размера и интенсивности вариации. Простейшим показателем является размах вариации - абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений:

Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу сочетаний по два из всех единиц совокупности (в нашем примере про ВО число сочетаний составит

).

Однако нет необходимости рассматривать, вычислять и осреднять все отклонения. Проще использовать среднюю из отклонений отдельных значений признака от среднего арифметического значения признака, а таковых в нашем примере про ВО всего 35. Но среднее отклонение значений признака от средней арифметической величины согласно первому свойству последней равно нулю. Поэтому показателем силы вариации выступает не арифметическая средняя отклонений, а средний модуль отклонений, или среднее линейное отклонение:

.

Простота расчета и интерпретации составляют положительные стороны показателя Л, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль отклонений, а среднее квадратическое отклонение, обозначаемое малой греческой буквой сигма ():

- для ранжированного ряда

- для дискретного ряда

В нашем примере про ВО среднее квадратическое отклонение величины ВО:

(млн.долл.).

Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Разница между ними тем больше, чем больше в изучаемой совокупности резких, выделяющихся отклонений, что служит индикатором «засоренности» совокупности неоднородными с основной массой элементами. Для нормального закона распределения отношение . В нашем примере про ВО: , т.е. в изучаемой совокупности наблюдаются некоторое число таможенных постов с отличающимися от основной массы величинами ВО.

Квадрат среднего квадратического отклонения представляет собой дисперсию отклонений, на использовании которой основаны практически все методы математической статистики:

- простая дисперсия

-взвешенная дисперсия.

Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним линейным отклонением и средним квартильным расстоянием служит для изучения структуры вариации: большое значение такого соотношения свидетельствует о наличии слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Для нашего примера про ВО соотношение Л/q = 1,021, что говорит о совсем незначительном различии силы вариации в центральной части совокупности и на ее периферии.

Этап 5. Расчет моментов распределения и показателей его формы. Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 3) или просто моментов (нецентральные моменты в таможенной статистике практически не используются).

Таблица 3. Центральные моменты

Порядок момента

Формула

по несгруппированным данным

по сгруппированным данным

Первый м1

Второй м2

Третий м3

Четвертый м4

Величина третьего момента м3 зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. При нормальном и любом другом строго симметричном распределении сумма положительных кубов строго равна сумме отрицательных кубов, поэтому на основе третьего момента строится показатель, характеризующий степень асимметричности распределения - коэффициент асимметрии:

В нашем примере про ВО показатель асимметрии составил (расчет числителя произведен в 9-м столбце табл. 2):

= 0,423 > 0, т.е. асимметрия значительна.

Английский статистик К. Пирсон на основе разности между средней арифметической величиной и модой предложил другой показатель асимметрии:

В нашем примере по данным табл. 18 показатель асимметрии по формуле (55) составил: = 0,09.

Показатель асимметрии Пирсона зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии (54) - от крайних значений признака. Таким образом, в нашем примере про ВО в средней части распределения наблюдается меньшая асимметрия, чем по краям, что видно и по графику (рис. 9). Распределения с сильной правосторонней и левосторонней асимметрией показаны на рис. 10.

Рис. 1. Асимметрия распределения

С помощью момента четвертого порядка характеризуется еще более сложное свойство рядов распределения - эксцесс (от англ. «излишество»). Показатель эксцесса рассчитывается по формуле:

.

Чаще всего эксцесс интерпретируется как «крутизна» распределения, что не совсем верно. График распределения может выглядеть сколь угодно крутым в зависимости от силы вариации признака: чем слабее вариация, тем круче кривая распределения при данном масштабе. Не говоря уже о том, что, изменяя масштабы по осям абсцисс и ординат, любое распределение можно искусственно сделать «крутым» и «пологим». Чтобы показать, в чем состоит эксцесс распределения, и правильно его интерпретировать, нужно сравнить ряды с одинаковой силой вариации (одной и той же величиной у) и разными показателями эксцесса. Чтобы не смешать эксцесс с асимметрией, все сравниваемые ряды должны быть симметричными. Такое сравнение изображено на рис. 2.

Рис.2. Эксцесс распределения

Наличие положительного эксцесса означает наличие слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Отрицательный эксцесс означает отсутствие такого «ядра».

В нашем примере эксцесс составил (расчет числителя произведен в 10-м столбце табл. 2): , т.е. величина ВО по таможенным постам варьирует сильнее, чем при нормальном распределении.

Этап 6. Проверка соответствия ряда распределения теоретическому. Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другими словами, теоретическое распределение может быть выражено аналитически - формулой, которая связывает частоты и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения. Большое познавательное значение имеет сопоставление фактических кривых распределения с теоретическими.

Глава 2. Законы распределения дискретных и непрерывных случайных величин

Законом распределения дискретной случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими вероятностями. Про случайную величину говорят, что она подчиняется данному закону распределения.

При табличном способе задания закона распределения первая строка таблицы содержит возможные значения случайной величины (обычно в порядке возрастания), а вторая - соответствующие вероятности ():

Дискретная случайная величина имеет биномиальный закон распределения (закон распределения Бернулли), если она принимает целочисленные неотрицательные значения 0, 1, 2, 3, …, m, …, n с вероятностями, вычисляемыми по формуле Бернулли:

0

1

m

n

где

число сочетаний из n элементов по m.

Дискретная случайная величина имеет закон распределения Пуассона с параметром , если она принимает целочисленные неотрицательные значения 0, 1, 2, 3, …, m, … с вероятностями, вычисляемыми по формуле Пуассона. Т. к. вероятность наступления события в каждом испытании мала (при ), закон распределения Пуассона еще называют законом редких событий.

0

1

m

Закон распределения непрерывной случайной величины нельзя задать также, как для дискретной. Он неприменим в силу того, что нельзя перечислить все бесконечное несчетное множество значений, а вероятности каждого отдельно взятого значения непрерывной случайной величины равны нулю.

Для описания закона распределения непрерывной случайной величины Х предлагается другой подход: рассматривать не вероятности событий Х=х для разных х, а вероятности события Х<х. При этом вероятность P(X<x) зависит от текущей переменной, т. е. является некоторой функцией от х.

Функцией распределения случайной величины Х называется функция F(x), выражающая для каждого х вероятность того, что случайная величина Х примет значение, меньшее х:

.

Функцию F(x) называют интегральной функцией распределения или интегральным законом распределения.

Способ задания непрерывной случайной величины с помощью функции распределения не является единственным. Необходимо определить некоторую функцию, отражающую вероятности попадания случайной точки в различные участки области возможных значений непрерывной случайной величины. Т. е. представить некоторую замену вероятностям для дискретной случайной величины в непрерывном случае.

Такой функцией является плотность распределения вероятностей. Плотностью вероятности (плотностью распределения, дифференциальной функцией) случайной величины Х называется функция f(x), являющаяся первой производной интегральной функции распределения:

.

Про случайную величину Х говорят, что она имеет распределение (распределена) с плотностью f(x) на определенном участке оси абсцисс.

Равномерный закон распределения. Непрерывная случайная величину Х имеет равномерный закон распределения (закон постоянной плотности) на отрезке [a; b], если на этом отрезке функция плотности вероятности случайной величины постоянна, т.е. f(x) имеет вид:

Функция плотности вероятности f(x)

Функция распределения F(x)

Рис.2. Равномерный закон распределения

Нормальный закон распределения (закон Гаусса). Непрерывная случайная величина Х имеет нормальный закон распределения с параметрами и (обозначают ), если ее плотность вероятности имеет вид:

где , .

Функция плотности вероятности f(x)

Функция распределения F(x)

Рис.3. Нормальный закон распределения

Математическое ожидание характеризует центр рассеивания значений случайной величины и при изменении кривая будет смещаться вдоль оси абсцисс (см. рис. 2 при и при ). Если же при неизменном математическом ожидании у случайной величины изменяется дисперсия, то кривая будет изменять свою форму, сжимаясь или растягиваясь (см. рис. 2 при : ; ; ). Таким образом, параметр характеризует положение, а параметр - форму кривой плотности вероятности.

Нормальный закон распределения случайной величины Х с параметрами и (обозначается N(0;1)) называется стандартным или нормированным, а соответствующая нормальная кривая - стандартной или нормированной.

Согласно определению функция плотности вероятности и функция распределения связаны между собой:

, где

Интеграл такого рода является «неберущимся», поэтому для его нахождения используют особую функцию, так называемый интеграл вероятностей или функцию Лапласа, для которой составлены таблицы (см. Приложение 2).

,

- функция нечетная!

Рис. 4. Функция Лапласа Ф(t)

Используя функцию Лапласа можно выразить функцию распределения нормального закона по формуле:

, где .

Для практических целей очень важны свойства случайной величины, имеющей нормальный закон распределения.

Если , то для нахождения вероятности попадания этой величины в заданный интервал (х1;х2) используется формула:

.

Вероятность того, что отклонение случайной величины от ее математического ожидания не превысит величину (по абсолютной величине), равна:

.

«Правило трех сигм». Если случайная величина , то практически достоверно, что ее значения заключены в интервале (). (Вероятность выхода за эти границы составляет 0,0027.) Правило позволяет, зная параметры ( и ), ориентировочно определить интервал практических значений случайной величины.

Глава 3. Проверка гипотезы о нормальности распределения

Как уже неоднократно отмечалось выше, часто пользуются типом распределения, которое называется нормальным. Формула функции плотности нормального распределения имеет следующий вид:

или

где X- значение изучаемого признака;

- средняя арифметическая ряда;

у- среднее квадратическое отклонение;

- нормированное отклонение;

р = 3,1415- постоянное число (отношение длины окружности к ее диаметру);

e = 2,7182- основание натурального логарифма.

Следовательно, кривая нормального распределения может быть построена по двум параметрам - средней арифметической и среднему квадратическому отклонению. Поэтому важно выяснить, как эти параметры влияют на вид нормальной кривой.

Если не меняется, а изменяется только у, то чем меньше у, тем более вытянута вверх кривая и наоборот, чем больше у, тем более плоской и растянутой вдоль оси абсцисс становится кривая нормального распределения (см. рис. 5).

Рис. 5. Влияние величины у на кривую нормального распределения

Если у остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (вершины) (см. рис.5).

Рис. 5. Влияние величины на кривую нормального распределения

Итак, выделим особенности кривой нормального распределения:

кривая симметрична и имеет максимум в точке, соответствующей значению  = Ме = Мо;

кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности (чем больше отдельные значения X отклоняются от , тем реже они встречаются);

кривая имеет две точки перегиба на расстоянии ± у от ;

коэффициенты асимметрии и эксцесса равны нулю.

Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в изучаемой совокупности подчиняется какому-то определенному закону. Проверка гипотезы состоит в том, чтобы на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать вывод о соответствии фактического распределения гипотетическому распределению.

Под гипотетическим распределением необязательно понимается нормальное распределение. Может быть выдвинута гипотеза о логнормальном, биномиальном распределениях, распределении Пуассона и пр. Причина частого обращения к нормальному распределению состоит в том, что, как уже было замечено ранее, в этом типе распределения выражается закономерность, возникающая при взаимодействии множества случайных причин, когда ни одна из не имеет преобладающего влияния.

В нашем примере про ВО близость значений средней арифметической величины (60,82), медианы (59,30) и моды (58,96) указывает на вероятное соответствие изучаемого распределения нормальному закону.

Проверка гипотезы о соответствии теоретическому распределению предполагает расчет теоретических частот этого распределения.

Для нормального распределения порядок расчета этих частот следующий:

по эмпирическим данным рассчитывают среднюю арифметическую ряда и среднее квадратическое отклонение у;

находят нормированное (выраженное в у) отклонение каждого эмпирического значения от средней арифметической:

с помощью таблиц интеграла вероятностей Лапласа находят значение ц(t) Простой расчет возможен при наличии Excel из пакета Microsoft Office, где имеется функция, вычисляющая плотность (или интеграл) функции нормального распределения =НОРМРАСП(А;Б;В;Г), где параметры: А - значение X; Б - средняя арифметическая ; В - среднее квадратическое отклонение у; Г - «0» для вычисления плотности (или «1» для вычисления интеграла) распределения;

вычисляют теоретические частоты m по формуле:

,

где N - объем совокупности, hi - длина (размах) i-го интервала.

Определим теоретические частоты нормального распределения в нашем примере про ВО по данным табл. 2, для чего построим вспомогательную таблицу 4. Средняя арифметическая величина и среднее квадратическое отклонение нами уже найдены ранее (); значения нормированных отклонений t рассчитаны в 5-м столбце таблицы 20, а значения плотностей ц(t) - в 8-м столбце (в 6-м и 7-м столбцах приведены промежуточные расчеты); в последнем столбце - теоретические частоты нормального распределения.

Таблица 4. Расчет теоретических частот нормального распределения

i

Xi

fi

Хi'

ц(t)

mi

1

24,16 - 38,66

5

31,41

-1,4889

-1,1084

0,3301

0,0067

3,383

2

38,66 - 53,16

7

45,91

-0,7549

-0,2850

0,7520

0,0152

7,707

3

53,16 - 67,66

13

60,41

-0,0210

-0,0002

0,9998

0,0202

10,246

4

67,66 - 82,16

4

74,91

0,7130

-0,2542

0,7756

0,0157

7,948

5

82,16 - 96,66

4

89,41

1,4470

-1,0468

0,3510

0,0071

3,598

6

96,66 - 111,16

2

103,91

2,1809

-2,3782

0,0927

0,0019

0,950

Итого

35

33,832

Сравним на графике эмпирические f (ВО по таможенным постам) и теоретические m (нормальное распределение) частоты, полученные на основе данных табл. 4 (рис. 7). Близость этих частот очевидна Иногда за счет округлений при расчетах (использование функции плотности распределения вместо интеграла) может быть нарушено равенство сумм эмпирических и теоретических частот, что и произошло в нашем примере про ВО (?f=35, ?m=33,832), но объективная оценка их соответствия может быть получена только с помощью критериев согласия.

Рис. 7. Распределение ВО по таможенным постам (эмпирическое) и нормальное

дискретный таможенный статистика нормальность

Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда - существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.

Существует ряд критериев согласия, но чаще всего применяют критерии Пирсона ч2, Колмогорова и Романовского.

Критерий согласия Пирсона ч2 (хи-квадрат) - один из основных критериев согласия, рассчитываемый:

,

где k - число интервалов;

fi- эмпирическая частота i-го интервала;

mi - теоретическая частота.

Для распределения ч2 составлены таблицы, где указано критическое значение критерия согласия ч2 для выбранного уровня значимости б и данного числа степеней свободы н.

Уровень значимости б - это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность (P) того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:

б = 0,10, тогда P = 0,90;

б = 0,05, тогда P = 0,95 Практически приемлемая вероятность в экономических исследованиях, означающая, что в 5 случаях из 100 может быть отвергнута правильная гипотеза;

б = 0,01, тогда P = 0,99.

Число степеней свободы н определяется по формуле:

н = k - z - 1,

где k - число интервалов;

z- число параметров, задающих теоретический закон распределения.

Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров - средней арифметической () и среднего квадратического отклонения (у).

Для оценки существенности расхождений расчетное значение ч2 сравнивают с табличным ч2табл. Расчетное значения критерия должно быть меньше табличного, т.е. ч2<ч2табл, в противном случае расхождения между теоретическим и эмпирическим распределением не случайны, а теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

Использование критерия ч2 рекомендуется для достаточно больших совокупностей (N>50), при этом частота каждой группы не должна быть менее 5, в противном случае повышается вероятность получения ошибочных выводов.

В нашем примере про ВО для расчета критерия ч2 построим вспомогательную таблицу 8.

Таблица 8. Вспомогательные расчеты критериев согласия

i

Xi

fi

mi

fi'

mi'

|fi'- mi'|

1

24,16 - 38,66

5

3,383

0,773

5

3,383

1,617

2

38,66 - 53,16

7

7,707

0,065

12

11,090

0,910

3

53,16 - 67,66

13

10,246

0,740

25

21,336

3,664

4

67,66 - 82,16

4

7,948

1,961

29

29,284

0,284

5

82,16 - 96,66

4

3,598

0,045

33

32,882

0,118

6

96,66 - 111,16

2

0,950

1,160

35

33,832

1,168

Итого

35

33,832

4,744

Теперь: ч2 =4,744, что меньше табличного значения ч2табл=7,8147 при уровне значимости б = 0,05 и числе степеней свободы н=6-2-1=3, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.

Критерий Романовского КР основан на использовании критерия Пирсона ч2, т.е. уже найденных значений ч2 и числа степеней свободы н, рассчитывается по формуле:

.

Он используется в том случае, когда отсутствует таблица значений ч2. Если КР < 3, то расхождения между теоретическим и эмпирическим распределением случайны, если КР > 3, то не случайны, и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

В нашем примере про ВО: = 0,712 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.

Критерий Колмогорова л основан на определении максимального расхождения между накопленными частотами эмпирического и теоретического распределений (D), рассчитывается по формуле:

.

Рассчитав значение л, по таблице P(л) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность P(л) может изменяться от 0 до 1. При P(л) = 1 (т.е. при л < 0,3) происходит полное совпадение частот, при P(л) = 0 - полное расхождение.

В нашем примере про ВО в последних трех столбцах таблицы 8 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 3-ей группе наблюдается максимальное расхождение (разность) D = 3,664. Тогда: . Находим значение вероятности при л = 0,6: P = 0,86 (наиболее близкое значение к 0,619), т.е. с вероятностью, близкой к 0,86, можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, а расхождения эмпирического и теоретического распределений носят случайный характер.

Заключение

Основные выводы:

наиболее полной характеристикой любой случайной величины является закон распределения. Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.

Законы распределения времени между отказами позволяют достаточно просто определять все основные количественные характеристики надежности.

В действительных условиях содержания систем время между отказами простейших элементов и сложных систем подчиняется ряду определенных законов распределения: нормальному, экспоненциальному, биномиальному, и др. Наиболее часто встречаются распределения, соответствующие экспоненциальному и нормальному законам.

Экспоненциальный закон достаточно хорошо описывает поведение как отдельных элементов, так и систем в целом при их нормальной эксплуатации. Подтвердив правильность выдвинутой гипотезы с помощью известных критериев согласия, можно использовать результаты распределения для практической деятельности.

нормальному закону позволяет прогнозировать, какое число таможенных постов (или их доля) попадет в тот или иной интервал значений величины ВО. Нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из чего следует, что нельзя существенно снизить вариацию величины ВО, воздействуя только на один-два управляемых фактора, скажем число работников таможенного поста или степень технической оснащенности.

Список использованной литературы

1. Таможенный кодекс Таможенного союза. М.: Проспект, 2012 - 484 с.

2. Боровиков, В.П. Прогнозирование в системе Statistica в среде Windows: основы теории и интенсивная практика на компьютере. - М.: Финансы и статистика, 2010. - 378 c.

3. Замков, О.О. Математические методы в экономике.- М.: Дело и Сервис, 2009. - 380 c.

4. Кремер, Н.Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ, 2009. - 551 c.

5. Кремер, Н.Ш. Эконометрика: учебник. - М.: ЮНИТИ, 2010. - 328 c.

6. Статистика: /под ред. И.И. Елисеевой. - М.: Юрайт, 2011. - 565 c.

Размещено на Allbest.ru


Подобные документы

  • Специальная таможенная статистика и её задачи. Определение содержания показателя и методов его оценки. Применение статистических величин в таможенной статистике на примере анализа перемещения транспортных средств через таможенную границу России.

    курсовая работа [103,2 K], добавлен 06.06.2014

  • Индивидуальные и сводные (общие) индексы. Средние индексы и индексы средних показателей. Индексы, используемые при проведении факторного анализа внешнеторгового оборота и показателей его эффективности и фактически применяемые в таможенной статистике.

    курсовая работа [140,7 K], добавлен 29.04.2009

  • Роль и место технических средств в таможенном деле. Тактико-технические характеристики и классификация технических средств таможенного контроля. Единая автоматизированная информационная система как фактор научно-технического прогресса в таможенном деле.

    курсовая работа [36,5 K], добавлен 16.03.2016

  • Понятие, классификация и типы рисков в таможенном деле. Принципы, цели, задачи и элементы системы управления ими. Анализ критериев отнесения юридических лиц и индивидуальных предпринимателей, товаров и внешнеэкономических операций к группам риска.

    курсовая работа [243,7 K], добавлен 20.04.2016

  • Понятие и состав правонарушений. Характеристики административных наказаний, применяемых в таможенном деле. Способы осуществления таможенного контроля. Судебная практика правонарушений, выявленных при пересечении физическими лицами таможенной границы.

    курсовая работа [28,3 K], добавлен 02.11.2016

  • Особенности проведения таможенной экспертизы круп на таможенном посту. Исследование методов оценки качества крупы гречневой. Порядок отбора проб и образцов товаров для проведения таможенной экспертизы. Причины отказа в проведении таможенной экспертизы.

    курсовая работа [38,9 K], добавлен 03.11.2014

  • Понятие таможенной стоимости. Закон "О таможенном тарифе" в отношении таможенной стоимости. Методология определения таможенной стоимости товаров. Практическое применение таможенных тарифов. Эффективность мер тарифного регулирования, их согласованность.

    контрольная работа [37,9 K], добавлен 02.05.2012

  • Научно-технический прогресс и его экономическая составляющая. Цели, методы осуществления и этапы формирования таможенной политики. Научно-технический прогресс в таможенном деле и его роль в повышении экономической эффективности таможенного контроля.

    курсовая работа [45,4 K], добавлен 11.12.2011

  • Правовой статус таможенного дела и таможенной службы Республики Беларусь. Методы проведения экспертизы потребительских свойств товаров. Условия и порядок производства экспертизы таможенной экспертизы. Оценка соответствия и идентификация товаров.

    курсовая работа [30,4 K], добавлен 01.12.2010

  • Основные категории, термины, используемые в таможенной статистике. Анализ динамики основных показателей экспорта, импорта и товарооборота. Расчет основных статистических показателей динамики. Характеристика торгового баланса и отраслевой структуры.

    курсовая работа [761,1 K], добавлен 25.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.