Специфика горных процессов

Оценка параметров распределения характеристик непрерывной случайной величины, графического представления и статистических принципов вариационного ряда. Описание законов распределения опытных данных. Тренд-анализ и гипотезы о наличии закономерностей.

Рубрика Производство и технологии
Вид реферат
Язык русский
Дата добавления 27.03.2017
Размер файла 50,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Горное дело - одна из определяющих отраслей народного хозяйства. Технология горного производства направлена на разработку месторождений полезных ископаемых и включает проектирование горного предприятия, строительство горных выработок, добычу и обогащение полезных ископаемых. Объектом воздействия горной технологии являются горные породы и их массивы, отличающиеся крайней неоднородностью состава и строения. Поэтому основой проектирования процессов в горном деле является инженерный эксперимент, включающий различные методы моделирования. тренд распределение графический вариационный

Основой теории и практики горного дела является эксперимент. Это обусловлено как сложностью и неоднородностью самого объекта воздействия - горной породы, так и многообразием техники и технологии разработки месторождений полезных ископаемых, не позволяющими создать чисто теоретических расчетных методов. Проведение эксперимента предусматривает его планирование, непосредственные измерения и анализ полученных опытных данных.

Организация, постановка и анализ результатов экспериментальных исследований базируются на математических методах. Специфика горных процессов, параметры которых определяются множеством случайных независимых факторов, требует привлечения методов теории вероятностей и математической статистики, теории прогнозирования и принятия решений.

1. Оценка параметров распределения опытных данных

1.1 Характеристик распределения непрерывной случайной величины

Случайным называют событие, которое при данных условиях может произойти или не произойти. Мерой возможности события является его вероятность. Она определяется отношением числа случаев m, благоприятствующих событию, к общему числу n единственно возможных, равновозможных и несовместных событий:

Р(А) = m/n. (1.1)

Совокупность отобранных для контроля объектов называется выборкой. Вся совокупность объектов, из которых производилась выборка, называется генеральной совокупностью. Число объектов обычно называют объемом (генеральной или выборочной совокупности). При изучении какого-либо объекта или процесса получают выборку значений соответствующих параметров. Эти значения записывают в журнал испытаний в той последовательности, в которой они наблюдались. Анализировать такие данные (особенно при их большом числе) весьма трудно, а подчас просто невозможно. Для выявления закономерностей значения исследуемого признака нужно каким-то образом упорядочить. Простейшим приемом является сортировка чисел по возрастанию или убыванию величин. Удобным средством обработки и анализа данных является Microsoft Excel. Поэтому здесь и далее будем ориентироваться на компьютерные возможности данного инструмента.

Пусть: x1, x2, … xn - отдельные значения исследуемого признака, которые называются вариантами. Числа, показывающие, сколько раз наблюдался вариант, называют частотами и обозначают соответственно: m1, m2, … mn. Расположение вариантов в возрастающем или убывающем порядке с указанием их частоты называется вариационным рядом. Изображают вариационные ряды обычно в виде таблиц.

Если изучаемое свойство имеет непрерывный ряд значений, что чаще всего и бывает, то может получиться так, что все варианты выборочной совокупности будут иметь частоту mi = 1, и ряд будет неудобен для анализа. В этом случае полученные данные лучше всего представить в виде интервального ряда. Здесь частоты относятся не к отдельным значениям признака, а серединам их интервалов. Очевидно, что возможность группирования данных появляется, при их достаточном числе.

Практика показывает, что для получения достоверных результатов объем выборки в этом случае должен быть не менее (n = 30-50), и в каждом интервале не менее 3-5 значений.

Оптимальную ширину интервала рекомендуется определять по формуле Стерджесса:

(1.2)

где xmax и xmin - соответственно максимальное и минимальное значением признака;

n - объем выборки.

Подставляя данные в формулу (1.2) получим:

h = (18-6,62)/(1+3,2*lg 100) = 1,54

Следует отметить, что данная формула носит чисто рекомендательный характер. Границы интервалов обычно назначают исходя из существа задачи. Более того, ширина интервалов не обязательно должны быть одинаковой. В ряде задач бывает важным обеспечить равную насыщенность интервалов путем сдвижения их границ. В каждый интервал включают варианты, значения которых больше нижней границы интервала и меньше верхней границы или равной ей. Приближенной оценкой вероятности появления измеренного значения признака в данном интервале служит его относительная частота или частость mi*. В соответствии с определением вероятности:

mi* = mi/n. (1.3)

Очевидно, что сумма частостей любого вариационного ряда должна составлять единицу. Иногда частость выражают в процентах, тогда Уmi* = 100 %.

1.2 Графическое представление и статистические характеристики вариационного ряда

Для удобства анализа опытных данных интервальный ряд в зависимости от задач исследования представляют графически в виде: гистограммы, полигона, кумулятивной кривой или огивы распределения.

Гистограмма распределения строится в прямоугольной системе координат. На оси абсцисс откладываются отрезки (столбцы) пропорциональные интервалам вариационного ряда и на каждом из них, как на основании строят прямоугольник (столбец), высота которого пропорциональна частоте или частости, соответствующей данному интервалу.

Полигон распределения строится по серединам интервалов и частоте или частости. Полученные точки соединяют отрезками прямых линий. Полигоны чаще используют для графического изображения дискретных рядов, но они бывают полезными и для интервальных рядов, когда необходимо описать опытные данные некоторым уравнением распределения.

На практике нередко бывает необходимо оценить вероятность появления признака, по величине не превышающего некоторый предел. Для этого в каждом интервале вычисляется накопленная частота или накопленный процент М и производится построение кумулятивной кривой распределения. Накопленный процент определяется суммированием частости данного интервала и всех предшествующих:

Mi = mi* 100 % + Mi-1.

По полученным точкам производится построение кумулятивной кривой распределения. В ряде практических задач целесообразно оси на графике поменять местами; такая кривая называется огивой.

Опытные данные, сгруппированные в интервальные ряды, характеризуются следующими параметрами:

- Среднее арифметическое

. (1.4)

- Дисперсия

(1.5)

- Среднее квадратическое (стандартное) отклонение

S = D1/2. (1.6)

S = 4,87/2=2,21;

- Коэффициент вариации

(1.7)

Важнейшими характеристиками вариационного ряда являются медиана и мода. Медианой называется значение признака, соответствующее середине упорядоченного вариационного ряда. Для данных, сгруппированных в интервалы:

(1.8)

где xi - нижняя граница медианного интервала; медианным считается интервал, для которого накопленная частота превышает половину объема выборки;

h - ширина интервала;

Mi-1 - накопленная частота интервала, предшествующего медианному:

mi - частота медианного интервала.

Получим:

.

Модой называется вариант, наиболее часто встречающийся в вариационном ряду. Для сгруппированного ряда модальным является интервал с наибольшей частотой. Конкретное значение моды вычисляется по формуле:

(1.9)

где xi - начало модального интервала - интервала с наибольшей частотой;

mi - частота модального интервала;

mi-1 и mi+1 - частота интервалов, которые предшествуют и последуют за модальным.

Получим:

.

Сравнение значений среднего арифметического, медианы и моды позволяет оценить степень симметричности вариационного ряда .

- Для идеально симметричного ряда:= Ме = Мо.

- Для ряда, обладающего левой асимметрией: Ме < < Мо.

- Для ряда, обладающего правой асимметрией: Ме > > Мо.

В нашем случае по абсолютному значению = Ме = Мо, соответственно мы имеем симметричный ряд.

1.3 Исследование законов распределения опытных данных

Наиболее полной характеристикой случайных величин является закон их распределения. Законом распределения случайной величины называется соответствие между ее возможными значениями и вероятностью их появления. Он задается соответствующими функциями. Интегральная функция распределения определяет вероятность того, что случайная величина X примет значение, меньшее некоторого фиксированного числа x:

F(x) = P(X < x). (1.10)

Графически интегральная функция распределения изображается в виде кумулятивной кривой. Первая производная от интегральной функции f(x) = F'(x) называется дифференциальной функцией распределения (или плотностью распределения вероятности). Она характеризует вероятность попадания случайной величины в заданный интервал:

f(x) = P(б < x < в). (1.11)

Графически дифференциальная функция соответствует кривой распределения (полигон), описывающей гистограмму опытных данных. Типичной задачей анализа экспериментальных исследований является подбор функции распределения, наиболее точно описывающей опытные данные, и определение параметров этой функции. В зависимости от характера изучаемого явления или процесса опытные данные могут описываться самыми различными законами распределения.

Изучение законов распределения случайной величины позволяет выявить тенденции изменения изучаемого показателя, оценить влияние на него различных факторов и учесть погрешности при измерении случайной величины. Кроме того, нахождение параметров того или иного закона распределения позволяет обоснованно использовать математический аппарат статистического анализа: проверки гипотез, дисперсионного и корреляционного анализа и др.

Одним из наиболее распространенных и полно изученных является нормальный закон распределения непрерывной случайной величины. Его дифференциальная функция:

(1.12)

где a - истинное значение измеряемой величина, оценкой которого является среднее арифметическое; S - среднее квадратическое отклонение.

Интегральная функция распределения:

(1.13)

График дифференциальной функции нормального распределения имеет строго симметричный вид (рис. 1.3, график 2) и называется кривой Гаусса.

Установление закона распределения опытных данных является важнейшим этапом анализа результатов исследования. Полученное уравнение распределения позволяет выявить тенденции изменения изучаемого параметра, оценить влияние на него случайных факторов и учесть погрешности измерений. Кроме того, установление закона распределения позволяет обосновать и использовать математический аппарат анализа результатов эксперимента: статистической проверки гипотез, дисперсионного и корреляционного анализа.

По принятому уравнению вычисляют теоретическую (выравнивающую) частоту miт наблюдаемых значений признака Х в предположении, что его распределение подчиняется данному закону. Из определения вероятности (Р = f(x) = m/n) следует:

miт = n f(xi), (1.14)

где f(xi) - дифференциальная функция распределения; n - объем выборки (число измерений).

Для данных, сгруппированных в интервалы:

miт = n h f(xi), (1.15)

где h - ширина интервала; xi - середина интервала.

Для нормального распределения:

(1.16)

Сравнение опытных и теоретических частот производят с помощью специальных статистических критериев. Наиболее употребительным является критерий Пирсона («хи-квадрат»):

(1.17)

Вычислив в Microsoft Excel получим:

Вычисленное по опытным данным значение 2 сравниваем с критическим значением кр2(, r), где - принятый уровень значимости; r - число степеней свободы; l - число интервалов. Для нормального распределения и распределения Вейбулла r = l - 3.

r = 8 - 3= 5.

В инженерных расчетах обычно принимают = 0,05, то кр2 будет равно 11,07.

Вычисленное значение критерия 4,36 не превышает критическое 2 < кр2, то с надежностью вывода P = 1 - можно считать, что опытные данные соответствуют принятому закону распределения.

Отличие опытного распределения от строго нормального количественно оценивается величиной асимметрии и эксцесса. Асимметрия распределения:

A = мC3/S3, (1.18)

А = -3,9/2,213 = -0,36.

Если A < 0, то это означает, что большая часть значений изучаемой величины лежит правее среднего арифметического - имеет место левая асимметрия. Эксцесс является мерой сглаженности кривой распределения и определяется формулой:

E = мC4/S4 - 3. (1.19)

Е = 68,67/2,214 - 3 = - 0,11.

Отрицательное значение эксцесса имеет место для кривых с более низким и плоским характером вершины по сравнению с нормальной кривой.

Формулы (1.18) и (1.19) определяются величиной центрального момента соответствующего порядка k:

(1.20)

Подставляя получим:

,

.

Таким образом, показатели А и Е мало отличны от нуля, то можно предположить, что исследуемый показатель распределен нормально.

О малости этих характеристик обычно судят по сравнению их величины со средней квадратической ошибкой.

Для асимметрии:

(1.21)

Для эксцесса:

(1.22)

Асимметрия и эксцесс по абсолютной величине не превышают свою среднюю квадратическую ошибку.

Это говорит о том, что имеет место нормальный закон распределения, следовательно, опытные данные соответствуют принятому закону распределения.

2. Тренд-анализ

Важнейшее значение в исследованиях в области горного дела является изучение закономерностей изменения разнообразных характеристик во времени или пространстве. Так, временные ряды описывают динамику развития горного давления по мере отработки месторождения; изменение параметров техники и технологии в связи с износом оборудования, усложнением горно-геологических условий по мере увеличения глубины разработки; тенденции роста производительности труда или изменения затрат, связанных с совершенствованием техники и технологии горных работ и т. п. Пространственные ряды отражают закономерности изменчивости характеристик горных пород и полезных ископаемых по глубине залегания или по площади шахтного поля. Временные и пространственные ряды представляют собой реализации случайной функции.

Случайной функцией X = f (t) называется функция неслучайного аргумента t, которая при каждом его фиксированном значении является случайной величиной. Таким образом, случайная функция в результате опыта может принять тот или иной конкретный вид, причем заранее неизвестно, какой именно. Аргументом случайной функции могут быть время, пространственные координаты, реже другие неслучайные параметры.

Случайная функция, по сравнению с парной зависимостью величин, определяемых в единый момент времени и обрабатываемых методами корреляционного анализа, обладает следующей спецификой.

1. Для применения методов корреляционного анализа необходимо выполнение требования независимости испытаний. При изучении же процесса во времени или пространстве последующие значения функции зависят от предыдущих значений. Например, производительность труда в данный момент времени зависит от того, какой уровень был достигнут ранее.

2. Дисперсия случайной функции зависит не только от случайных отклонений значений ряда от среднего значения, но и от длины ряда, например, от изучаемого промежутка времени.

3. Если два временных ряда имеют одинаковую зависимость от времени, то коэффициент корреляции между ними окажется высоким, хотя по существу рассматриваемые величины могут быть совершенно не связаны между собой (явление ложной корреляции). Например, рост производительности труда и увеличение глубины разработки месторождений монотонно зависят от времени, поэтому формально можно получить очень тесную зависимость увеличения производительности труда с глубиной разработки, что абсурдно.

Указанная специфика требует других, по сравнению с корреляцией, методов анализа. Не учет этой специфики может привести к серьезным заблуждениям. Основным инструментом исследования временных или пространственных рядов является тренд-анализ.

Тренд-анализом называется процесс отыскания закономерности в изменении некоторой характеристики во времени или пространстве (тренда). В общем случае уравнение тренда можно представить в виде:

X = F(t) + L(t) + е(t), (2.1)

где F(t) - закономерная составляющая тренда;

L(t) - локальная составляющая;

(t) - случайная составляющая.

Основные этапы (алгоритм) тренд-анализа можно представить в следующем виде.

2.1 Проверка гипотезы о наличии закономерности тренда

На первом этапе тренд-анализа необходимо убедиться в том, что изменение характеристики X действительно подчиняется некоторой закономерности. В противном случае есть опасность, что полином достаточно высокой степени, описывая точно опытные данные, создаст иллюзию надежности результата, в то время как изменение X может оказаться лишь «шумом» эксперимента.

Для проверки гипотезы о наличии тренда используют различные статистические критерии. Рассмотрим наиболее употребительные из них применительно к тренд-анализу изменчивости свойств горных пород по глубине их залегания.

Для проверки наличия закономерности изменчивости свойств по числу смены знаков определяется знак разности смежных показателей. Положительному значению присваивается «0», отрицательному - «1». По числу точек смены знака t в общем объеме выборки n, его теоретическому значению M (t) и дисперсии 2(t) вычисляется величина критерия Z:

M(t) = (2n - 4)/3, (2.2)

M(t)=(2*30-4)/3=18,7 ГПа.

у2(t) = (16n -29)/90, (2.3)

у2(t) = (16*30-29)/90 = 5,0 ГПа.

(2.4)

По величине критерия Z c помощью функции нормального распределения (в Microsoft Excel - функция НОРМСТРАСП) вероятность полученного отклонения фактического числа точек смены знака, от его теоретического значения равна 0,05.

2.2 Определение линии (поверхности) тренда

Определяем линию (поверхность) тренда, т. е. его закономерную составляющую. Эта составляющая описывается математическим уравнением или задается совокупностью точек X, т. е. графически в виде линии или поверхности. Такая линия тренда позволяет прогнозировать изменчивость изучаемой характеристики во времени или пространстве.

Многочисленные исследования показывают, что такие природные явления как изменчивость свойств горных пород по глубине их залегания не описываются простейшими алгебраическими функциями. В этом случае обычно используют процедуру сглаживания опытных точек ряда. Эту процедуру применяют в целях уменьшения случайных отклонений единичных значений числового ряда от тренда. При этом используется, как правило, метод скользящей средней. Для этого определяют средние значения групп точек, отсчитывая их («скользя») от начала к концу ряда.

В простейшем случае сглаживание осуществляется по трем точкам. Для этого вычисляют сглаживающие значения ряда по формулам:

- для внутренних точек ряда:

x0* = (x-1 + x0 + x+1)/3, (2.7)

где х0 - значение средней точки;

х-1 и х+1 - значения левой и правой точек по отношению к средней,

- для первой и последней точек ряда:

х-1* = (5х-1 + 2х0 - х+1)/6; (2.8)

х+1* = (-х-1 + 2х0 + 5х+1)/6. (2.9)

Для повышения точности сглаживание может осуществляться по пяти точкам или по специальным формулам типа пятичленного фильтра Шеппарда, которые приводятся в справочных руководствах по статистической обработке экспериментов. В ряде случаев бывает целесообразно выполнять повторные сглаживания, например, неоднократное использование формул (2.7 - 2.9). Однако эффективность многократного сглаживания быстро уменьшается и более двух-трех раз его выполнять нецелесообразно.

2.3 Определение случайной составляющей тренда и оценка точности прогноза

Случайная составляющая определяется по фактическому отклонению данных от поверхности тренда. Дисперсия закономерной составляющей тренда определится как разность между общей дисперсией и ее случайной составляющей:

S02=((xi - Xcp)2)/30

Sс2=((xi - xт)2)/30

S3 = S0 - Sc. (2.10)

S3=5527,21-127,20=5400 ГПа.

Закономерная составляющая тренда превышает случайную. Это говорит о том, что тренд есть, данные изменяются закономерно.

Достоверность и надежность прогноза количественно можно определить с помощью дисперсионного анализа путем сравнения закономерной и случайной составляющих тренда по критерию Фишера:

F = S32/ Sc2,

F=5400/127,2=42,45 ГПа.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.