Геоинформатика

Методические основы применения математических методов для решения задач. Первичная статистическая обработка информации и законы распределения случайных функций показателей горных пород. Обработка и обобщения геофизических и аэрокосмических исследований.

Рубрика Геология, гидрология и геодезия
Вид курс лекций
Язык русский
Дата добавления 13.06.2015
Размер файла 86,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Где P( x < X < x+ x )

f(x) = lim ----------------------------

x x

называется функция плотности распределения вероятностей, F(x)=P(X<x) функция распределения вероятностей случайных величин, которые удовлетворяют следующие соотношения:

1) P( a < X < b ) = F(b) - F(a)

F(x1) < F(x2), если x1<x2

3) lim F(x) = 1, lim F(x)=0

x x

f(x) > 0, f(x) = dF(x)/dx

b

5) f(x)dx = 1, P( a < X < b ) = f(x)dx.

- a

Дискретной случайной величиной называется переменная, общая совокупность (множество) которой может быть представлена в форме определенной занумерованной последовательности x1, x2,..., xn.

Дискретная величина x* принимает конечное или счетное значение x с вероятностью P(x) = P(X=x). Bероятность того, что величина X принимает одно значение, лежащих в интервале x' x x'',

x''

P{ x X x } = p (x).

x'

Если определим вероятность появления всех X в интервале

< X < x, то F(x)=P(- < X < x ) называется функцией распределения вероятности случайной величины X.

Далее рассматриваем несколько типов законов распределения параметров. Нормальное или Гауссовое распределение случайных величин наиболее распространено и широко применяется среди различных видов распределений.

Нормальное распределение часто используется как физическая модель, оно является главным видом распределения в параметрическом статистическом анализе.

Формула для кривой распределения

1 1 x -

f(x) = ----------- exp ( - --- ( ----------- ) 2 )

2 2

называется стандартной нормальной кривой - плотность распределения.

Параметры нормальных распределений, по которым их можно различать, является среднее и среднеквадратическое отклонение

. Если задана некоторая частная нормальная кривая, то и фиксированы, а изменения f(x) в зависимости от X можно получить.

Соотношение между функцией распределения и функцией плотности такова

F(x) = f(x)dx,т.е. функция нормального распределения равны

1 x 1 x -

F(x) = ------- exp(- --- ( ---------- )2 ) dx

2 - 2

Графическое отображение функцией распределения называется гистограммой. В зависимости от и функция плотности распределения имеет различную форму. При =0 и =1 функция F(x) называется функцией Лапласа, она обозначается в математической статистике

1 z u2

Ф(z) = ----- exp( - --- ) du,

2 0 2

которая используется при решении различных задач математической статистики, например, вероятность случайной переменной в пределах

x1 до x2 может быть определено с помощью функции Лапласа

x2 - x1 -

P( x1 < X < x2 ) = Ф( ----------- ) - Ф( ------------ )

где среднее значение с.в., а дисперсия, Ф(z) значение определяется в таблице.

К методам нормального распределения относится метод критерия согласия (асимметрия и эксцесс) и метод критерия Пирсона.

В случае утверждения нулевой гипотезы о законе нормального распределения величины xi (i=1,n) мы можем говорить об однородности выборки, в другом случае - должны искать причины или границы неоднородности. Причиной может быть наличие в совокупности данных двух или нескольких однородных распределений.

Для определения закона распределения нормального показателя свойств горных пород вычислим статистические характеристики распределения этих показателей:

математическое ожидание или среднее арифметическое

1 k

x = --- xi

n i=1

дисперсии

1 n

2 = --------- (x - x)2

n - 1 i=1

среднее-квадратическое отклонение

= 2

коэффициент вариации

V = ---- 100%

x

асимметрии

m3 1 n -

A = ------, где m = --- (xi - x)3

3 n i=1

моменты 3-порядка;

эксцесс

m4 1 n

E = ---- - 3, где m4 = --- (xi - x)4

4 n i=1

моменты 4- порядка.

Две последние характеристики используются для оценки принадлежности статистического ряда к нормальному закону распределения.

Отклонения эмпирических величин от их теоретического значения в случае соответствия нормальному распределению не должны превосходить

3 Д(А) и 5 Д(Е) т.е.

¦ А ¦ 3 Д(А) , ¦ Е ¦ 5 Д(Е)

Где

6(n - 1) 24 n(n - 2)(n - 3)

Д(А) = ----------------- , Д(Е) = ------------------------

(n + 1)(n + 3) (n + 1) (n + 3)(n + 5)

стандартные отклонения асимметрии и эксцесса: n - объем информации показателей свойств горных пород.

Наиболее гибким и одновременно эффективным критерием для проверки гипотезы о нормальном законе распределения является критерий 2 предложенный Пирсоном. Гипотеза о нормальном характере распределения позволяет вычислить теоретические значения для вероятностей Pi попасть в i - й интервал. Для этого используется формула

b - x a - x

P{ a < x < b } = Ф(--------) - Ф(-------),

где a и b границы выделенного интервала Ф(z) функция Лапласа. После того как найдено Pi можно подсчитать наивероятнейшее число попадания в i-й интервал, который равен nPi. Для сравнения эмпирического распределения с предлагаемым нормальным можно теперь сравнить числа ni и nPi. Оказывается, при условии, что все

nPi > 5, величина

k (ni - nPi )2

2 = -----------,

i=1 nPi

где n= ni, имеет приближенно 2 распределение с f = k-3 степенями свободы, так как здесь отмечаются тpи связи. Две из них x и , третья связь заключена равенстве Pi =1. Поэтому, выбрав уровень значимости и степень свободы f, а также не видя табличное значение 2,f(табл), следует проверить гипотезу нормальности и принять решение: при условии 2 2,f(табл) отвергнуть и при противном условии считать ее правильной.

В геологии могут быть статистические кривые распределения близкие к логнормальной кривой. Проверка гипотезы о логнормальном распределении не вызывает каких - либо затруднений и сводится к проверке гипотезы о нормальном распределении логарифмов изучаемой случайной величины. Кроме нормального распределения существует дискретное биномиальное распределение, закон распределения Пуассона, квантали распределения Стьюдента, критерий Колмогорова-Смирнова, распределения Фишера и др., которые применяются в решении геологических задач.

Аналитическое выражение кривой распределения, наилучшим образом описывающее эмпирическую совокупность случайных величин, может быть получено весьма многими способами, число которых, однако, значительно сократится при выполнении следующих общих условий.

1. Как правило, кривая распределения должна быть основана на определенной стохастической схеме, под действием которой формируется то или иное случайное явление. Так, например, нормальный закон распределения возникает в тех случаях, когда исследуемая случайная величина может быть представлена в виде суммы (или линейной функции) большого числа независимых между собой элементарных слагаемых (факторов), каждое из которых в отдельности сравнительно мало влияет на сумму. Если последнее условие не выполняется и влияние, например, одного из слагаемых, формирующих случайную величину, окажется резко преобладающим, то особенности распределения этого слагаемого окажут влияние на закон распределения исследуемой случайной величины. Приняв за основу теоретической схемы зависимость возникновения случайной величины не от суммы, а от произведения достаточно большого числа элементарных воздействий или, иначе говоря, от суммы их логарифмов, получим логарифмически - нормальный закон.

2. В уравнении кривой распределения должно быть возможно меньше параметров, численно определяемых по экспериментальным данным. Это условие особенно важно при статистическом анализе изучения изменения и прогноза основных компонентов геологической среды.

5. Режим изменчивости геологических параметров в характерных направлениях

Под инженерно-геологической изменчивостью горных пород подразумевается изменение значений показателей физико-технических свойств пород как по глубине, так так и по простиранию (Коломенский, 1968). Общей особенностью горных пород является изменение значений показателей их физико - технических свойств от точки к точке как по горизонтали, так и по вертикали. Он выделил три типа закономерностей инженерно - геологической изменчивости пород: скачкообразная незакономерная изменчивость, скачкообразная закономерная изменчивость и функциональная изменчивость показателей физико - технических свойств.

Инженерно-геологическая изменчивость пород является геологическим фактором, т.е. она зависит от условий образования пород и от их дальнейших изменений, а для различных генетических типов пород она будет определяться свойственными им геологическими факторами. Описанные типы инженерно-геологической изменчивости требуют различного подхода к инженерно-геологическому опробованию горных пород.

Разных систем расположения горно-буровых выработок, разного количества проб, разных математических приемов обработки экспериментальных данных.

Рассмотрим режим изменчивости параметров горных пород. Под режимом изменчивости параметров горных пород в пространстве и во времени следует понимать объективные законы их распределения. При этом формирование геологических параметров может иметь некоторую направленность (составляющая R'(1, 2, 3, t) или тренд). В итоге из этой направленности параметра горных пород необходимо выделить сочетание случайный и детерминированный компонент. Отсюда вытекает, что нет оснований предполагать наличие каких-то особых, характерных только для состава и свойств пород, режимов их пространственно-временной изменчивости.

Cуществует два основных режима пространственно-временной изменчивости показателей состава и свойств пород естественного сложения: нестационарный и стационарный (Бондарик, 1971).

Изменчивостью показателей состава и инжененрно-геологических свойств пород рассмотрены в работах Н.Н. Маслова (1949), Д.А. Зенкова (1955), Н.В. Коломенского (1966, 1968), В.П. Огоноченко (1968), Г.К. Бондарика (1968, 1971, 1976) и др.

В.П. Огоноченко (1968) разработал классификацию инженерно- геологической изменчивости, в которой на основании формальнологических признаков, по характеру статистик, описывающих поведение случайной функции (математического ожидания, стандартного отклонения и автокорреляционной функции), выделены типы, классы и виды изменчивости. В соответствии с классификацией В.П.Огоноченко выделил 14 видов изменчивости, которым он попытался поставить в соответствия тот или иной математический аппарат. Классификация В.П.Огоноченко не вполне усовершенствованная, поскольку математический аппарат выбран не вполне логично и последовательно. Следует отметить, что классификация В.П.Огоноченко близка классификации Г.К. Бондарика (1968).

В теории случайных функций приняты и обоснованы понятия и тер минология нестационарных и стационарных случайных функций и их многомерных аналогов - функций нескольких переменных или случайных полей.

Режим варьирования показателя состава или свойств пород выделенного геологического тела в каком-либо направлении, сечении или объеме, при котором осредненные по координатам статистики случайной функции (случайного поля) этого показателя связаны с началом координат называется нестационарным режимом пространственной изменчивости.

При нестационарном режиме изменчивости показателя состава или свойств породы математическое ожидание регулярно изменяется в каком-либо направлении, а автокорреляционная функция зависит от начала отсчета координат.

Нестационарный режим изменчивости показателей состава и свойств горных пород широко распространен в природе. Нестационарное изменение геологического параметра (тренд) выявляется при исследовании важнейших генетических типов горных пород в направлении, параллельном направлению транспортировки материала или близкому к нему. Выявление нестационарной изменчивости в ряде случаев требует изучения состава и свойств пород на профилях или по сечениям (разрезам) геологических тел, имеющих достаточно большую длину.

Рассмотрим основной режим изменчивости состава и свойств горных пород - стационарный. Различия между стационарным и нестационарным режимами изменчивости заключается в том, что статистики, характеризующие стационарную случайную функцию геологических параметров, остаются постоянными.

Режим варьирования исследуемого показателя, при котором свойства статистик, характеризующих его функцию (поле), не зависит от выбора начала координат, т.е. его математическое ожидание R(y) и дисперсия D(R(Y)) постоянны, а автокорреляционная функция зависит только от разности аргументов:

R_(Y) = R f(R) dR = const,

D(R(y) = (R - R_) f(R) dR = const,

K(y1,y2) = (R1-R_)(R2-R_)f(R1 R2(y1-y2) dR1 dR2 = K(y1-y2)

При использовании теории случайных функций для изучения изменчивости состава и свойств пород можно предъявлять менее строгие требования к стационарности, чем принятые в математике требования, рассмотренные выше. Это дает возможность несколько расширить класс случайных функций геологических параметров, к которым применим аппарат теории стационарных случайных функций. Выполнение следующих условий:

- постоянство оценки среднего значения случайной функции геологического параметра в соответствии с принятыми критериями;

- отсутствие регулярности в изменении дисперсии случайной функции или регулярность в изменчивости, по крайней мере, не выходящая за пределы, установления по принятым критериям; являются основными требованиями к стационарности случайных функций геологических параметров.

Для полноты характеристики режимов изменчивости геологических параметров следует хотя бы кратко обсудить квазифункциональный режим изменчивости.

Использование этого термина кажется уместным, так как, по-видимому, нельзя себе представить таких естественных образований, какими являются геологические тела или таких искусственных земляных сооружений, в которых какой-либо параметр характеризующий состав или свойства, являлся функцией координат.

Для выявления режима измечивости состава горных пород используются математические критерии. Наиболее простым критерием является критерий числа скачков (Бондарик, 1971). Для установления линейного тренда можно использовать критерий Спирмена по формуле

6 d2

s = 1 - -----------

n(n2 - 1)

где d2 - сумма квадратов разностей d между числами натурального ряда и рангами; вычисляются коэффициент ранговой корреляции Спирмена s.

Ранговый коэффициент корреляции принимает значения ¦ s ¦ < 1.

При =0 тренд отсутствует, при 1 (или-1) имеется сильно выраженная тенденция соответственно к возрастанию или снижению величин показателя.

Наиболее мощным, т.е. наиболее чувствительным, позволяющим уверенно ответить на вопрос о характере изменения состава и свойств пород, является критерий Аббе (Бондарик, Горальчук, Сироткин, 1976).

В основу критерия положена оценка дисперсии по величине последовательных разностей

1 n-1

g2 = --------- d2i ,

2(n -1) i=1

где g2 - оценка дисперсии;

n - число наблюдений;

di = (N2 - N1), (N3 - N2),..., последовательные разности.

Эта оценка практически не зависит от смещения среднего значения, тогда как

(Ni-N)2

обычная оценка дисперсии S2= --i=1-------- ) к нему очень чувствительна. Для стационарной по математическому ожиданию функции отношение оценок дисперсий, полученных этими способами, близко и равно единице.

По мере увеличения смещения математического ожидания (силы тренда) величина все более отклоняется от 1.

Для проверки гипотезы о стационарности вычисляются q для n значений и заданной надежности. Затем они сравниваются с табличными значениями (табл) с соответствующей уровню значимости . При q(выч) (табл) рассматриваемый ряд наблюдений является стационарным, а в противном случае гипотеза о стационарности отвергается.

Для обнаружения ярко выраженного тренда аналитическое выражение его записывается в виде уравнения

N(S) = a0 + a1 + a2 2 +...

где a0, a1, a2,... неизвестные коэффициенты уравнения, которые определяются методом наименьших квадратов, - расстояние сечения от начала профиля. Снятие тренда, т.е. разложение случайной функции на две составляющие - пространственно- коррелированную и остаточную, производится путем вычитания значений показателя, найденных по уравнению аппроксимирующего полинома, из экспериментальных значений, полученных в этих же точках,

N() = N( ) - N( ) = N().

В большинстве случаев остаточная функция N() относится к классу стационарных случайных функций, что подтверждается проверкой по критерию Аббе.

Остаточного ряда различаются на квазипериодические и случайные компоненты. Наилучшей и полной характеристикой стационарных случайных функций, является автокорреляционная функция. Быстро сходящаяся к нулю, затухающая автокорреляционная функция остаточного ряда указывает на отсутствие в пространственной изменчивости изучаемого геологического параметра периодической составляющей.

Опыт показывает, что в составе случайных функций геологических параметров практически всегда присутствуют периодические компоненты одного или нескольких порядков. В связи с этим Г.К.Бондарик предложил последовательное выделение периодических составляющих остаточной случайной функции которое состоит из выполнения следующих операций:

- построение графика автокорреляционной функции, найденной по функции математического ожидания в предположении ее стационарности и эргодичности;

- определение по корреляционной функции величины наиболее четких периодов;

- аппрокцимацию исследуемой остаточной случайной функции тригонометрическии полиномом (ряды Фурье);

- нахождение следующей остаточной финкции N'() = N() - T() где Т () - аппроксимирующий тригонометрический полином;

- расчет и построение графика автокорреляционной функции второй остаточной случайной функции и т.д. до тех пор, пока в составе последовательных остаточных функций обнаруживается значимая периодичность.

Высокочастотные составляющие случайной функции могут быть выявлены и при помощи периодограммного анализа.

6. Обобщение, обработка, оценка и анализ показателей горных пород. Статистические характеристики показателей горных пород и их оценка

Обработка данных показателей свойств грунтов с применением методов математической статистики дополняет качественный анализ инженерно-геологической информации и позволяет получить по целому ряду вопросов объективных суждений, в чем и заключается преимущество этим методов. Но, они применимы лишь для обработки количественной информации, поэтому, качественную или полукачественную информацию следует преобразовать в количественную информацию путем ранжирования или применения шкалы больности.

Основная цель количественного анализа инженерно-геологической информации заключается в уточнении и подтверждении предварительно выделенных геологических тел, стратиграфо-генетических комплексов, петрографических типов и видов пород, для которых может быть получены статистические характеристики показателей свойств горных пород.

Для решения основной цели количественного анализа следует последовательно выполнить следующие основные требования и этапы обработки:

- обработку инженерно-геологической информации математическими методами следует начинать с типизации кар тируемой территории по геолого-литологическому строению тому пород на основе использования карт четвертичных отложений и геоморфологической; в результате составляют схему или карту типизации или районирования геолого-литологического строения исследуемой территории, где выделяются геологические тела, однородные по генезису, возрасту, петраграфическому типу и виду пород;

- оценить однородность геологических тел по изучаемым показателям свойств грунтов на основе учета условий испытаний проб и использования методов статистических критериев, которые состоят из следующих:

а) учет выполнения инструктивных указаний о правилах отбора, транспортировки и хранения образцов, а также использование одинаковых технических средств и методических приемов при лабораторных исследованиях;

б) составление в упорядоченном виде выборочную совокупность таблиц экспериментальных значений показателей свойств грунтов для каждого геологического тела и первичная статистическая обработка информации.

Дальнейшей задачей является расчет обобщенных статистических характеристик показателей свойств грунтов и их оценка.

Основными обобщенными статистическими характеристиками свойств и состава пород является среднее арифметическое значение -Х, геометрическое среднее - Х (гео), гармоническое среднее - Х (гар), дисперсия - 2, среднее-квадратическое отклонение - , коэффициент вариации (изменчивости) - V, стандартная ошибка среднего арифметического значения (x), показатель точности - , доверительный интервал (оценка математического ожидания): Gв - верхняя граница, Gн - нижняя граница.

Расчет обобщенных статистических характеристик производится в пределах однородных (оцененных) геологических телах.

Основной вероятностной характеристикой, определяющее положение центра распределения на числовой оси называется математическое ожидание - МХ. Вокруг математического ожидания группируются остальные значения. Например, Х - случайное событие, где случайные величины принимающие значения х1, х2,... хn с вероятностью Р(х1), Р(х2),

...Р(хn), тогда n

xi p(x)

МХ = ---i=1-n----------

p(xi)

i=1

взвешивания по вероятностей называется математическое ожидание, т.к.

n n

p(xi) = 1, то MX = xi p(xi).

I=1 i=1

Для непрерывных случайных величин математическое ожидание равно

MX = x (x)dx

где x - случайные величины, (x) - плотность распределения.

Выборочным аналогом МХ является среднее арифметическое или среднее (для дискретных случайных величин) Х = хi /n где n - объем выборки.

Медиана (Ме) называется (среднее по вероятности) значение случайной величины Х, такое, что P{х < Ме} = 0.5 т.е. вероятность появления в совокупности значения выше или ниже медианы по своей величиной равны и составляют 50%.

Геометрически медиана представляет собой абсциссу такой точки, что ордината которой делит площадь под кривой распределения на две равные части.

Модой (Мо) называется наиболее вероятное значение x переменной Х, которому соответствует максимальное значение P(х) при дискретном или при непрерывном распределениях. Геометрически мода представляет собой максимум по ординату кривой распределений. В зависимости от количества модой, кривая распределения называется одномодная при количестве модой один, двухмодная при двух модой и т.д.

Среднее геометрическое значение дискретных величин хi называется

Х(гео) = n П хi, где n - объем выборки.

Среднее гармоническое значение дискретных величин x i называется

Х(гаp) = n / (1/xi), где n - объем выборки.

Центральной случайной величиной называется в статистике отклонение величины Х от своего математического ожидания МХ.

Центральный момент k - го порядка равен

k = M(X - MX)k

т.е. эта математическое ожидение k - той степени, центральной величины Х. Основной мерой рассеивания значения случайной величины Х около МХ, это при k = 2. При k = 2 2- называется дисперсией (центральный момент 2 - го порядка).

Для непрерывных случайных величин онa равнa

DX = (X - MX)2 f(x)dx.

Если Х - дискретная величина, то дисперсия равна

DX = (X - MX)2 (X).

В практике используется формула

(xi - x)2

2 = --i=1----------

(n-1)

- дисперсия для дискретных случайных величин.

Для дискретных случайных величин остальные статистические характеристики определяется следующими формулами:

= 2 - среднее-квадратическое отклонение;

V= 100/x - коэффициет изменчивости;

(x)=/n - стандартная ошибка среднего арифметического значения;

=(x) 100/x - показатель точности среднего арифметического значения.

В пределах однородных тел для оценки обобщенных значений показателей свойств пород применяется способ доверительных пределов или гарантированных значений, предложенный И.С.Комаровым (1956,1972).

Сущность способа в том, что допуская какую-либо степень вероятности, можно вычислить определенную величину ошибки, если вместо генерального среднего значения показателя и использовать его среднее значение (полученное по ограниченному количеству точек). При этом, чем больше принятая степень вероятности, тем больше величина ошибки.

Параметры выборок, составленных методом случайного отбора и используемых как точечные оценки генеральных параметров, представляют собой случайные величины. Следовательно, и их отклонения от генеральных параметров (например, выборочного среднего Х от математического ожидания МХ, т.е. Х - МХ) также представлены случайными величинами, подчиняющимися нормальному закону распределения. Установив закон распределения, можно определить и вероятность (I- ) предположения, что разность Х - МХ не превысит по абсолютному значению установленные пределы + E

P{¦Х - МХ¦ < E} = 1-

Пользуясь этим неравенством, можно решить обратную задачу по выборочному значению Х установить такой интервал, который с вероятностью I - прикроет "истинное" значение параметра МХ. Не вдаваясь в теоретическое обоснование метода, которое можно найти в специальной литературе, укажем, что нормированная разность (X-MX)/ S/n имеет распределение Стьюдента с n - 1 степенями свободы. Соответственно границы интервала для МХ могут быть установлены согласно неравенству:

S s

X - tk/2,f --- < MX < X + t/2,f ---

n n

где t/2,f - нормированное отклонение, значение которого приведено в приложениях (Комаров, 1972) в зависимость от уровня значимости и числа степеней свободы f = n - 1. Неравенство показывает, что величина математического ожидания МХ случайной величины Х при данном объеме выборки n отличается от выборочного среднего Х (с вероятностью I- ) не больше, чем на величину

+t/2,f s/n

В соответствии с этим границы выделенного интервала, обозначаемые символами Gн (нижняя граница) и Gв (верхняя граница) и равные

s s

Gн = Х - t /2,f ----- , Gв = Х - t/2,f -----,

n n

получают в математической статистике название доверительных пределов; интервал, ограничений этими пределами - доверительного интервала; вероятность 1 - - доверительной вероятности или надежности.

При решении многих задач интерес представляет не двусторонняя, а односторонняя оценка МХ, т.е. намеренное ограничение возможных значений этого параметра снизу или сверху. Этот случай отвечает таким утверждениям, как "не выше данной величины" или "не ниже данной величины":

s s

Gн = Х - t,f ----- , Gв = Х - t',f -----,

n n

Значения t',f можно брать из табличного приложения (Комаров, 1972) в соответствии со значениями и f = n - 1.

7. Корреляционно-регрессионный анализ данных

Изучение зависимостей между показателями инженерно-геологических свойств грунтов и выделение наиболее важных из них необходимо для правильной количественной оценки инженерно-геологических признаков и прогноза инженерно-геологических условий орошаемых территорий. Для этого используются методы многомерного корреляционнорегрессионного анализа и распознавания образов.

Зависимость между случайными величинами Х и У называем вероятностной или стохастической, при которой одна из них реагирует на изменение второй изменениями своего закона распределения. Коppеляционными называются такие зависимости, при которых одна из переменных реагирует на изменение второй изменениями своего математического ожидания.

Методы исследования зависимостей этого вида получили название корреляционного анализа, изучающего на основании выборки стохастическую зависимость между случайными переменными. Оцениваются мера зависимости и доверительные интервалы, проверяются гипотезы. Важной мерой зависимости является коэффициент корреляции Бравэ и Пирсона.

Для коэффициентов корреляции r двух случайных переменных Х и У

справедливо:

1) -1 < r < 1

2) при r = + 1 имеется функциональная зависимость;

3) если r= 0, то Х и У называют некоррелированными;

4) для двумерной нормально распределенной случайной переменной из равенства r = 0 следует стохастическая независимость Х и У.

В случае когда высоким значениям одной переменной соответствуют высокие значения другой переменной, а низким значениям - низкие, то корреляция между этими переменными положительная. Отрицательная корреляция имеет место там, где высоким значениям одной переменной соответствуют низкие значения другой переменной.

Абсолютное значение коэффициента корреляции характеризуют тесноту взаимосвязи. Коэффициенты корреляции рассчитываются для определений тесноты взаимосвязи между двумя какими-либо характеристиками одного и того же объекта (тела).

Параметр r оценивается с помощью выборочного коэффициента корреляции r1; r1 для случайной переменной, распределенной не по нормальному закону, с примерно линейной регрессией является мерой стохастической зависимости.

Различают: коэффициент корреляции (парный), частный коэффициент корреляции, множественный коэффициент корреляции, коэффициент корреляции рангов по Спирмэму и квадратный коэффициент.

Рассмотрим алгоритм корреляционного анализа. Пусть имеем n - проб, проанализированных по k - компонентам. Обозначим через

x11, x21,..., x1n - значения первого компонента;

x21, x22,..., x2n - значения второго компонента;

..........

xk1, xk2,..., xkn - значения К-го компонента.

Для каждого компонента опpеделяются сpедные значения, дисперсии, среднеквадратичные отклонения и коэффициенты вариации по формулам, пpиведенные в п.2.3.1.

Обозначим через К(l,p) - корреляционный коэффициент j - й пробы пары компонентов (l, р), а через K(l,p) - общий корреляционный коэффициент этой пары. Указанные величины вычисляются по формулам:

xj(l) 1 n xj(l) 1 n

Kj(l,p) = ------- , Kобщ (l,p) = --- ------ = --- Kj(l,p)

xj(p) n j=1 xj(p) n j=1

Для каждой пары компонентов ( , ) - выборочной коэффициент корреляции r (l,p) равен: n

(xj(l) - x(l)) (xj(p) - x(p))

r(l,p) = --nj=1---------------n------------------.

(xj(l) - x(l))2 (xj(p) - x(p))2

j=1 j=1

Парагенетический анализ инженерно-геологических свойств грунтов имеет большое значение в практике инженерно - геологических исследований. Связи между отдельными парами компонентов, зависимость одного компонента от сопутствующих ему других устанавливаются с помощью корреляционного анализа. При этом мы получаем точную количественную характеристику отношений между компонентами.

При малом объеме выборки значение r(l,р) получается несколько заниженным. В этом случае ( n < 10) лучше использовать для (l, р) следующую оценку

1 - r2(l,p)

r* (l,p) = r(l,p)[ 1+ -------------].

2(n - 3)

Наличие или отсутствие корреляционной связи проверяется по вычисленному значению выборочного коэффициента корреляции. Для этого используется несколько критериев, обычно критерий t = r(n-2)/(1-r2 ), который имеет t - распределение с n-2 степенями свободы, где n - число испытаний. Вычисленные по этой формуле максимальные значения выборочного коэффициента корреляции, при которых еще оправдывается нулевая гипотеза r1 = 0, приведены в книге (Комаров, 1972), где r1 = cov(x,y)/ x y- коэффициент корреляции. Если значение t - превысит табличное значение при данных и n-2, то зависимость считается установленной.

Обычно мы должны считать, что корреляция между двумя определенными переменными определяется другой переменной. Если мы рассматриваем зависимость от более чем двух случайных переменных, то предполагаем, что наблюдаемая выборка относится к нормальной многомерной генеральной совокупности. В качестве меры взаимозависимости между любыми двумя случайными переменными в этом случае может использоваться частная корреляция. Она выражает степень зависимости между двумя переменными при постоянных значениях остальных переменных

Если имеется линейная корреляция Х, У, и Z и Rху, Rхz, Rуz - - три парных коэффициента корреляции, то Rху.z есть частный коэффициент корреляции между Х и У при постоянном Z:

Rxy - Rxz Ryz

Rxy.z = --------------------------

(1 - R2xz)(1 - R2yx)

Частная корреляция выявляет зависимые переменные (по меньшей мере две) из независимых переменных. Точка в индексе Rху.z отделяет две первые независимые переменные Х и У от независимой переменной Z.

В общем случае: рассмотрим m случайных величин 1, 2,... m, являющихся моделями геологических характеристик x1, x2,..., xm.

Пусть q - набор индексов 1, 2,..., m без i и j. Тогда коэффициентом частной корреляции между i и j при фиксированных m-2 оставшихся величинах называется величина

- Cij

Pij.q = ----------

Cii Cjj

где Сij - алгебраическое дополнение, соответствующее элементу Pij в определителе корреляционной матрицы

1 P12 ... P1m

С = P21 1 ... P2m

..........

Pm1 Pm2 ... 1

Справедливо соотношение Сij =|C| C-1

Обозначим через р набор индексов 1, 2,..., m без i, j, к.

Тогда Pij.q можно выразить через коэффициенты частной кореляции на единицу меньших порядков

Pij.p - Pik.p Pjk.p

Pij.q = -----------------------------

(1 - P2ik.p)(1 - P2jk.p)

Выборочным коэффициентом частной корреляции Rij.q случайных величин i и j, являющихся моделями геологических характеристик Хi и Хj, при фиксированных m-2 оставшихся величинах называется отношение

Bij

Rij.q = - ----------,

Bii Bjj

где Вij - алгебраическое дополнение выборочной корреляционной матрицы

{ Rij } случайных величин 1....., m, соответствующее элементу Rij.

Распределение Rij.q построенное по n наблюдениям Хt, совпадает с распределением выборочного коэффициента парной корреляции Rij с заменой n на n-m+2, так что для оценки значимости коэффициента частной корреляции применим аналогичный критерий для коэффициента парной корреляции с уменьшением числа степеней свободы на m-2.

Если возникает вопрос, каким образом зависит случайная переменная Х1 одновременно от случайных переменных Х2 и Х3, то мы можем рассмотреть объект с одной выходной и двумя входными переменными; зависимость это определяется множественным коэффициентом корреляции R1.23.

Этот коэффициент множественной корреляции задается выражением

R212 + R213 - 2 R12 R13 R23

R 1.23 = ---------------------------------------------- .

1 - R223

Множественная корреляция определяет связь выходной переменной (так называемой зависимой переменной) с по меньшей мере двумя входными переменными (так называемыми независимыми переменными). Тогда в обозначении R1.23 отделяет выходную переменную от двух входных переменных. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации В=R.

В общем случае: для характеристики зависимости одной случайной величины i- модели одной геологической характеристики от совокупности других случайных величин 1, 2... m, служит коэффициент множественной корреляции. Пусть k - набор индексов

1, 2,..., i-1, i+1,..., m. Коэффициентом множественной корреляции Ri.k случайной величины от набора случайных величин 1, 2,..., i=1, i+1....... m называется величина

Ri.k = 1 - 1/Cii)

где Сii - диагональный элемент матрицы С-1, обратной корреляционной матрице С.

Справедливо соотношение

m

R1.k = 1 - П (1 - R2 ij.Lj) ,

j=1,j=i

связывающее коэффициент множественной корреляции с набором из m - 1 коэффициентов частной корреляции Rij.k между i и j при фиксированных величинах 1, 2,..., j-1 , но без i (таким образом, Lj есть множество индексов 1, 2,..., j-1, но без i ).

Выборочным коэффициентом множественной корреляции Ri.k между величиной i и набором 1,..., i-1, i+1,..., m называется величина Ri.k = 1 (1/Cii ,где Cii - диагональный элемент матрицы С-1 , обратной матрице выборочных коэффициентов корреляции.

Ранговый аналог множественного коэффициента корреляции определяется в обозначениях частной ранговой корреляции по формуле

Rk.ij = 1 - (1 - R2 kj)(1 - R2 ki.j).

Если нужно определить взаимозависимость между рядами, распределенными не по нормальному закону, т.е. двумерная выборка(Хi,Уj) относится к производному непрерывному распределению, то можно зависимость между У и Х установить с помощью коэффициента ранговой корреляции Спирмэна

Rs = 1 - (6d2 ) /n(n-1). (2.58)

Для вычисления коэффициента ранговой корреляции ( справедливо -1 < rs< 1 ) оба ряда преобразуются с помощью рангов; образуются разности для n пар рангов, они возводятся в квадрат и суммируются; значение Д2 используется в приведенной выше формуле. Равным значениям соответствует среднее ранговое число. Если два pяда pангов pавны, pазности pавны нулю и rs= -1. Если ряды рангов обратны, то rs = 1. Этот критерий позволяет тем самым ответить на вопрос ознаке имеющейся корреляции.

Одна из наиболее важных задач геологических исследований заключается в изучении зависимостей ( функциональных ) между показателями свойств и состава пород. При этом большую помощь могут оказать методы многомерного регрессионного анализа. На основании регрессионного анализа наблюдаемое облако точек аппроксимируется уравнением регрессии.

Цель регрессионного анализа заключается в том, чтобы на основании эмпирической функции Уi(Xi) найти аналитическое соотношение между У и Х, которое позволит для произвольно заданного значения Х оценить значение зависимой переменной У (Комаров, 1972, 1976). Зависимость между показателями свойств грунтов могут быть ленейными и нелинейными. Линейные регрессионные модели имеют вид:

У = A0 + Ai Xi + E

где У - зависимая переменная;

Хi - независимые переменные( i=1, k );

E - остаток;

Ai - коэффициенты регрессионного уравнения, подлежащие оцениванию.

Коэффициенты регрессионных уравнений определяются методом наименьших квадратов.

Для этого запишем У как функцию не только аргумента Х, но и параметров A0, A1, A3,...,Ak:

У = f(X; A0, A1,..., Ak).

Требуется выбрать A0, A1,..., Ak так, чтобы выполнялось условие:

(Уj - A0 - Ai Xij)2 = min E2j

Найдем значения Ai (i=1, k), обращающие левую часть выражения (2.59) в минимум. Для этого продифференцируем ее по Ai

(i=1, к) и приравняем прoизводные к нулю:

F n k

---- = -2 (Уj - A0 - Ai Xij) = 0

A0 i=1 i=1

F n k

---- = -2 (Уj - A0 - Ai Xij) X1j = 0

A1 j=1 i=1

F n k

---- = -2 (Уj - A0 - Ai Xij) Xkj = 0

Ak j=1 i=1

Заменим переменные A0, A1,..., Ak на их оценкии получим систему нормальных уравнений:

n n n n

A0 n + A1 X1j + A2 X2j +... + AkXkj = Уj

1 2 1 1 1

A0 X1j + A1 X1j + A2 X2j X1j +... + Ak Xkj X1j = Уj X1j....

A0 Xkj + A1 X1j Xkj + A2 X2j Xkj +... + Ak X2 kj = Уj Xkj

Система уравнений (2.6) содержит столько же уравнений, сколько неизвестных Ai (i=1,к). Полученная система нормальных уравнений решается по методу Крамера или Гаусса.

Для проверки достоверности уравнения используется формула:

A0 = У - Ai Xi

где У - среднее значение зависимой переменной;

Хi - средние значения независимых переменных;

Ai - коэффициенты уравнения регрессии.

Во многих случаях графическое представление данных показывает, что интересующая нас зависимость не может быть описана прямой линией. В этих случаях используется нелинейная регрессия.

Очень часто достаточно точным для описания фактической взаимозависимости является уравнение второго порядка ( У = а + b X + c X ),

где коэффициенты а, в, с определяется снова методом наименьших квадратов. При изучении регрессионных зависимостей для двух факторов существуют несколько функциональных зависимостей.

При изучении регриссионных зависимостей несколькими факторами, в качестве нелинейной регрессионной модели используется модель в виде:

У = B0 + Bj Xj + Bk+1 X21 + Bk+2 X1 X2 +...

Коэффициенты этой модели снова определяются методом наименьших квадратов. Достоверности полученных уравнений регрессии определяются методом оценки относительных ошибок параметра его разности фактических и расчетных значений.

8. Обработка и обобщение геофизических и аэрокосмических исследований

Особое место при региональных инженерно-геологических и гидрогеологических исследованиях (съемках) занимают геофизические и аэрокосмические методы. В результате их исследования увеличивается объем информации, уменьшается сроки полевых работ, сокращается объемы бурения, повышается общая экономическая эффективность исследований. При этом обработка и обобщение геофизических и аэрокосмических информации и построения различных карт и разрезов невозможно без применения математических методов и ПЭВМ.

В настоящей работе на основе имеющихся методики, алгоритмов и отдельных программ для ЭВМ тип ЕС обработки геофизических информации ВЭЗ, ВЭЗНП и КВЭЗ на языке Бейсик составлен ППП "Геофизика" для ПЭВМ и процесс подготовки и обработки информации автоматизирован.

По данным ВЭЗа изучаются геолого-тектонические условия территории при решении гидрогеологических и инженерно-геологических задач. Алгоритмы расчета приведены в методическом руководстве (Пичугин, Хабибуллаев И.Х., 1989). По данному алгоритму результаты расчета выводится в виде таблицы и в расчетах не учтены рельеф земли, т.е. точки ВЭЗа условно лежали в одной линии (плоскости). Поэтому в данной работе учитываются асоблютные отметки каждой точки ВЭЗа и результаты расчета выводится в виде таблиц и паралельно в графическом виде на графопостроителе, т.е. трудоемкая ручная работа построения "крестиков" (координаты (Xi, Zi) точки ВЭЗа - расчетная с учетом рельефа) автоматизирована машинным способом.

Методика ВЭЗНП предназначена для интериретации результатов вертикальных электрических зондирований способом нормированных производных. Алгоритмы расчета интерпретации данных и построения разрезов в виде карт приведены в методическом руководстве (Умурзаков, Хабибуллаев, 1989).

При интерпретации результатов ВЭЗ методом ВЭЗ определяются осредненные характеристики в пределах глубины по плоскости, совпадающей с азимутом установки. При поисках и разведке пресных подземных вод в части чередующихся супесь-суглинистых, гравийно-галечниновых, галечниковых, песчанистых отложениях требуется выделять наиболее обводненные прослои со значительных мощностями. Для выделения в разрезе мощной толщи однородных по электрическим свойствам пород субгоризонтального напластования маломощных неоднородностей предлагаются способ нормированных производственных. Методика интерпретации с использованием метода нормированных производственных разработана применительно к гидрогеологическим и инженерно-геологическим съемкам на основе доработки методики ВНИИ геофизикой. В результате интерпретации данных ВЭЗ с применением нормированных производных получим таблицы и разрез в виде изолиний k.

В данной работе процесс подготовки и обработки информации и построения разрезов автоматизирован, т.е. исходные данные для программы берется из базы данных и вмешательство человека для построения разреза k нет необходимости.

Изучение и оценка развития геологических, гидрогеологических и инженерно-геологических процессов (техногенное опустынивание, засоление, просадка, подтопление территории) осуществляется с использованием наземных наблюдений и аэрокосмических исследований. Наземными наблюдениями выше указанные задачи решаются количественными и качественными информациями, а аэрокосмическими методами решения этих задач осуществляются методом дешифрования аэрокосмических материалов - снимков.

В настоящее время дешифрирования аэрокосмических снимков невозможно без применения математических методов (распознования образцов) и ПЭВМ, т.е. с применением математических методов и ПЭВМ можно решать следующие задачи:

- хранение аэрокосмических изображений и схем и их дешифрирования;

- поиск изображений по эталонам (по плотности снимок) методом рас познования образов;

- определение площадей указанных диапозонов плотности изображения (определение площади распространения процесса) и сравнения их раз ного времени для целей выявления изменений процессов.

Ввод аэрокосмических снимков в ПЭВМ осуществляется гpафическими pедактоpами и скайнерами и получим образ снимок в виде файла-матрицы (K x N), значения которыхявляются буквами и числами. На основе этих матриц можно востановить на ПЭВМ введеный вид снимок или можно решать выше указанные задачи. При решении этих задач необходимо знать эталоны (интервалы плотностей) геологических процессов.

9. Модели и моделирование

9.1 Классификация моделей и цели моделирования

В основном различаются два основных класса (типов) моделей физические и символические. Большинство физических моделей являются масштабными и материальными. Символические модели представляются двумя основными формами - графической и математической.

Графические модели, такие, как разрезы, карты, графики, гистограммы и диаграммы, обычно являются мелкомасштабным изображением значительно более крупных объектов или их свойств. Эти модели не применяются в моделировании сами по себе, но их можно использовать для описания применяемых моделей.

Основное внимание необходимо уделять на математические модели, которые используются при моделировании на ПЭВМ. Математические модели можно использовать по-разному.

Так, например, статистические модели можно применять для обобщения наблюдаемых результатов. Однако большенство моделей, воспроизводимых на ПЭВМ, порождает большое количество новых данных, из чего следует, что эти модели играют совершенно иную роль, нежели модели, предназначенные для свертывания информации.

Необходимо отметить, что многие математические модели требуют небольшого объема вычислений независимо от того, используются они для моделирования на ПЭВМ или для свертывания информации. Однако существуют и такие математические модели, которые требуют столь обширных вычислений, что их можно использовать только на ПЭВМ. Воспроизведение математической модели на ПЭВМ представляется в виде алгоритмов и программы.

Модели можно разделить на следующие группы: статистические, динамические, детерминированные и вероятностные. Кроме того,существует и смешанный тип, объединяющий свойства детерминированных и вероятностных моделей. Детерминированной называется такая модель, в которой отсутствуют компоненты, учитывающие случайные воздействия. В динамической детерминированной модели состояние системы в любой момент времени точно предсказуемо. Наоборот, в вероятностных моделях всегда существует неопределенность, и их состояние в любой последующий момент времени нельзя предсказать точно в связи с наличием одной или более случайных (стохастических) компонентов.

Многие детерминированные модели можно рассматривать как частные случаи стохастических моделей.

Динамические вероятностные модели особенно важны в геологии, так как можно считать, что большинство геологических процессов содержат случайные компоненты. В связи с тем что очень многие динамические вероятностные модели содержат также и детерминированные компоненты, их следует относить к "смешанному" типу.

С точки зрения науки как целого моделирование направлено на выполнение следующих главных функций: понимания, предсказания и контроля. В инженерной геологии и гидрогеологии нам приходится иметь дело главным образом с пониманием и предсказанием пространственной изменчивости полей основных компонентов геологической среды. Контроль для большинства геологических, инженерно-геологических и гидрогеологических процессов необходимо связи с вмешательством человека, т.е. в связи с техногенным воздействием на геологическую среду.

Системы, созданные человеком, можно контролировать полностью или частично. Между двумя крайними типами систем - природными и искусственными - располагается множество смешанных систем, в изучении которых моделирование играет весьма важную роль. Природные геоэкологические системы очень точно уравновешены чрезвычайно сложными внутренными связями. Моделирование при изучении этих систем может помочь в получении ответа на вопрос о возможных результатах вмешательства человека в систему и его влияние на равновесие.

Если цель исследования, связанного с моделированием, заключается в получении ответов на конкретные вопросы, то очень важно предусмотреть в алгоритмах и программе для ПЭВМ, являющейся отражением модели, возможность получения отчетливых ответов.

9.2 Интерполяция геологических параметров горных пород на регулярную сеть

Одной из основных задач региональной инженерной геологии являются изучение пространственной изменчивости свойств грунтов методом математического моделирования на ПЭВМ.

Под моделью обычно понимают "мысленно представляемую, материально реализованную систему, которая, отображая или воспроизводя объект исследования, способна замещать его так, что ее изучение дает нам новую информацию об этом объекте (Штрофф, 1966).


Подобные документы

  • Определение основных параметров упруго-пластичного состояния породного массива вокруг горизонтальной выработки. Испытание образцов горных пород на одноосное сжатие, статистическая обработка результатов. Оценка возможности пучения породы подошвы.

    контрольная работа [555,6 K], добавлен 29.11.2012

  • Исторический образ, обзор первобытной обработки камня. Залегания горных пород и их внешний вид. Структура, текстура горных пород Южного Урала. Способы и оборудование для механической обработки природного камня. Физико-механические свойства горных пород.

    курсовая работа [66,9 K], добавлен 26.03.2011

  • Характеристика района в географо-экономическом плане, геолого-геофизическая изученность района. Выбор участка работ и методов ГИС. Методика геофизических исследований скважин. Камеральная обработка и интерпретация материалов. Смета объемов работ.

    дипломная работа [2,4 M], добавлен 04.02.2008

  • Физические свойства горных пород и петрофизические характеристики Мыльджинского месторождения. Геологическая интерпретация геофизических данных. Физико-геологические основы и спектрометрическая аппаратура литолого-плотностного гамма-гамма-каротажа.

    дипломная работа [4,0 M], добавлен 22.03.2014

  • Декриптометрические методы исследования минералов, пород и руд, их распространение. Типизация вакуумных декриптограмм пород гранитоидного ряда. Обработка и интерпретация результатов вакуумно-декриптометрических анализов метасоматически измененных пород.

    контрольная работа [702,3 K], добавлен 21.06.2016

  • Характеристика и применение нейтронных методов при облучении горных пород. Нейтрон-нейтронный каротаж в комплексе методов общих исследований. Определение влажности грунтов и почв. Изучение пористости горных пород. Анализ на нейтронопоглощающие элементы.

    реферат [1,1 M], добавлен 22.12.2010

  • Характеристика структуры, изучение строения и определение размеров пор горных пород. Исследование зависимости проницаемости и пористости горных пород. Расчет факторов проницаемости и методов определения содержания в пористой среде пор различного размера.

    курсовая работа [730,4 K], добавлен 11.08.2012

  • Подготовка горных пород к выемке. Вскрышные работы, удаление горных пород, покрывающих и вмещающих полезное ископаемое при открытой разработке. Разрушение горных пород, буровзрывные работы, исторические сведения. Методы взрывных работ и способы бурения.

    реферат [25,0 K], добавлен 19.03.2009

  • Геоморфологические особенности рельефа города Новочеркасска. Физические свойства горных пород. Методика и техника выполнения геофизических работ. Применение магниторазведки, аппаратура для электроразведочных методов, радиационных методов разведки.

    отчет по практике [1,1 M], добавлен 19.10.2014

  • Классификация горных пород по происхождению. Особенности строения и образования магматических, метаморфических и осадочных горных пород. Процесс диагенеза. Осадочная оболочка Земли. Известняки, доломиты и мергели. Текстура обломочных пород. Глины-пелиты.

    презентация [949,2 K], добавлен 13.11.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.