Статистики связи
Корреляционное отношение как мера криволинейной связи. Использование корреляции в лесном хозяйстве. Вычисление коэффициента корреляции между длиной стволиков и длиной корней сеянцев сосны. Соотношения между смешанными центральными и начальными моментами.
Рубрика | Сельское, лесное хозяйство и землепользование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 29.03.2018 |
Размер файла | 127,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СТАТИСТИКИ СВЯЗИ
План
1. Понятие о корреляции
2. Коэффициент корреляции как мера линейной связи
3. Корреляционное отношение как мера криволинейной связи
4. Другие статистические показатели корреляции. Использование корреляции в лесном хозяйстве
1. Понятие о корреляции
Исследуя лесные насаждения, мы замечаем, что в них гармонично сочетаются различные признаки. В лесу нет хаоса, а существуют законы и закономерности, по которым лесной биогеоценоз развивается и на основе которых существует. Подобные закономерности присущи как другим биологическим объектам, так и человеческому сообществу.
Взаимная зависимость двух величин (или явлений), когда изменение одной из них ведет к закономерному изменению другой называется корреляцией. Это понятие широко используется в науке, особенно в биологии, физике, химии. Например, в лесном хозяйстве известны тесные связи между диаметром и высотой дерева. Для одной породы, например березы, при большей высоте, как правило, наблюдается и больший диаметр. В свою очередь высота дерева в определенном возрасте зависит от плодородия почвы. С высотой, значит, и с плодородием почвы, тесно связана производительность древостоев. Форма ствола зависит от таксационной характеристики насаждения: его густоты, высоты дерева.
Зависимости и связи в природе и обществе, имеющие общие методы их статистического измерения, называют корреляцией, связью или зависимостью. Последние два слова - это синонимы термина “корреляция”.
Известны функциональные и корреляционные связи. Последние еще называют стохастическими. К функциональным относят законы математики и физики. Например Е = тс2; L = 2R; V = at; S = gt2/2 и другие известные из школьного курса математики и физики. Здесь изменение одной из величин всегда ведет к обязательному, четко обозначенному и всегда определенному изменению другой величины. Общие связи такого рода называются физическими или природными законами. Закон, примененный к некоторому частному случаю, называется закономерностью. Например, есть общий физический закон - металлы при нагревании расширяются. В отношении же конкретного металла, скажем меди, конкретные коэффициенты температурного расширения - это уже закономерность. Применительно к лесному хозяйству можно привести следующий пример. Рост дерева в высоту - биологический закон роста растений. Параметры роста (скорость увеличения высоты дерева с возрастом) для конкретного древесного вида, скажем, березы, - это закономерность.
В природе явления развиваются под воздействием различных факторов внешней среды. Поэтому связь между признаками проявляется в виде корреляционной связи, или корреляции.
В этом случае каждому значению одного признака здесь соответствует не одно, а несколько значений другого признака, т.е. его распределение. Один из признаков (обычно легче или точнее измеримый) принимают за факториальный, а другой - за результативный. Иногда, в условном значении, один называют независимым, а другой - зависимым от первого.
Статистическое исследование корреляции сводится к установлению факта связи, определению ее формы, направленности и тесноты. Установление факта связи специалисты в определенной отрасли производят сначала на основе общего анализа явления. Например, можно сказать о наличии корреляции между размерами дерева: толщиной и высотой еще до их измерения. В других случаях наличие корреляции между изучаемыми признаками нельзя предсказать столь определенно. Например, без измерений и последующего анализа трудно оценить связь формы ствола с его высотой. В этом случае решают вопрос о наличии корреляции на основе измерения и статистического анализа его результатов.
Поясним сказанное примерами. Так, мы уже говорили, что с увеличением диаметра дерева становится больше и его высота. Пусть у нас есть деревья ели I бонитета с диаметрами 20, 24, 28, 32 см. Высоты этих стволов равны 23, 25, 29, 32м. Но, если мы измерим, скажем, по 20 деревьев каждого из названных диаметров, то окажется, что высоты колеблются в таких пределах
Диаметр, см |
Высота (от-до), м |
|
20 |
21-25 |
|
24 |
23-27 |
|
28 |
26-32 |
|
32 |
29-35 |
Общая закономерность (увеличение высоты с ростом диаметра) выдерживается, среднее значение высоты тоже, но высота будет соответствовать вычисленному значению (23, 25, 29, 32) с определенной вероятностью (0,68) и среднеквадратической ошибкой. Это и есть вероятностная или стохастическая связь.
Корреляцию называют простой, если она измеряется на основе двух признаков, или множественной, если изменение результативного признака изучают в связи с влиянием или изменением нескольких факториальных признаков. Например, когда мы рассматриваем связь диаметр дерева - высота, то это простая корреляция. Связь, когда высоту дерева изучают в зависимости от почвенного плодородия, густоты древостоя, древесной породы, будет множественной.
По форме различают корреляцию линейную, когда зависимость между признаками отражается прямой линией, и криволинейную, когда ее отражает уравнение какой-нибудь кривой. Во многих случаях форму корреляции можно предсказать еще до опыта. Например, между длиной и толщиной корней молодых деревьев в древостое можно ожидать линейную корреляцию. Но нельзя ожидать такой же формы корреляции у деревьев, растущих в старых древостоях. Статистический анализ дает ответ о форме связи и в тех случаях, когда на основе биологического анализа ее установить трудно или вообще невозможно.
По направленности различают корреляцию прямую, когда с увеличением одного признака в среднем увеличиваются и значения другого, а с уменьшением - уменьшаются, и обратную, когда с увеличением значений одного признака значения другого в среднем уменьшаются и наоборот. Пример прямой связи приведен выше - диаметр и высота дерева. Обратную связь мы можем наблюдать, изучая влияние вредителей (допустим, обыкновенного соснового пилильщика) на прирост сосны. С увеличением количества гусениц на одном дерева прирост уменьшается.
Типичные картины статистических связей наблюдаются в двух практически разных случаях:
а) изучается связь между случайными величинами;
б) в действительности изучается функциональная связь, но погрешности измерений порождают изменчивость и создают видимость статистической связи.
С точки зрения статистического анализа на этапе выяснения существования зависимости эту разницу можно не учитывать; на этапе построения моделей возникают существенные различия в ее интерпретации и использовании.
Можно дать следующую трактовку стохастическим связям. При изучении связи между двумя величинами нельзя гарантировать, что одна величина полностью определяет значения другой, т.е. что учтены все основные факторы, общие для обеих величин. Кроме того, может существовать различная доля основных факторов, общих для обеих величин. Кроме основных существуют и случайные факторы, влияющие на изучаемые величины и затушевывающие имеющуюся закономерность. Поэтому чем больше общих факторов для изучаемых величин и чем полнее они учтены, тем отчетливее связь между изучаемыми величинами и тем уже “зона рассеивания”, которая в пределе превращается в некоторую линию, отражающую функциональную зависимость.
Из вышеприведенных рассуждений вытекает очевидная необходимость в статистических показателях, отражающих наличие и степень тесноты связи. Такие показатели (для выборки) называют статистиками связи. Важность статистик связи в моделировании очевидна: прежде чем конструировать модель, следует выяснить, в каких отношениях между собой находятся интересующие показатели. По смыслу здесь наблюдается полнейшая аналогия со статистиками распределений: статистики связи являются выборочными оценками параметров связи в генеральной совокупности.
Исходными данными для статистического анализа при большом числе наблюдений служат таблицы распределения, составляемые с соблюдением правил, идентичных правилам для составления рядов распределения, но наблюдения “разносят” с учетом обоих признаков. Пример распределения такого показан в таблице 12.1. Наглядно подобные распределения видны на графиках. Для примера такие графики приведены на рисунке 12.1. На рисунке 12.1а четко просматривается закономерная зависимость исследуемых признаков, а на рисунке 12.1б она выражена гораздо слабее.
Таблица 12.1 - Распределение диаметров и высот для 238 деревьев дуба
Ступени толщины, см (середины классов) |
Число стволов, шт. (частоты) |
Сумма частот |
Условные средние |
|||||||||
Ступени высоты, м (середины классов) |
||||||||||||
16 |
18 |
20 |
22 |
24 |
26 |
28 |
30 |
32 |
||||
12 |
3 |
- |
- |
- |
- |
- |
- |
- |
- |
3 |
16,0 |
|
16 |
3 |
3 |
3 |
- |
- |
- |
- |
- |
- |
9 |
18,0 |
|
20 |
2 |
5 |
10 |
4 |
- |
- |
- |
- |
- |
21 |
19,5 |
|
24 |
- |
2 |
2 |
11 |
12 |
3 |
- |
- |
- |
30 |
22,8 |
|
28 |
- |
- |
- |
3 |
28 |
11 |
2 |
- |
- |
44 |
24,5 |
|
32 |
- |
- |
- |
- |
5 |
38 |
11 |
- |
- |
54 |
26,2 |
|
36 |
- |
- |
- |
- |
1 |
22 |
11 |
- |
1 |
35 |
26,7 |
|
40 |
- |
- |
- |
- |
- |
1 |
15 |
7 |
- |
23 |
28,5 |
|
44 |
- |
- |
- |
- |
- |
- |
7 |
10 |
- |
17 |
29,2 |
|
48 |
- |
- |
- |
- |
- |
- |
- |
1 |
1 |
2 |
31,0 |
|
Сумма частот |
8 |
10 |
15 |
18 |
46 |
75 |
46 |
18 |
2 |
238 |
- |
|
Условные средние |
15,5 |
19,6 |
19,7 |
23,8 |
27,6 |
32,3 |
37,2 |
42,7 |
42,0 |
- |
- |
Таблицы, составляемые подобно 12.1, используют затем для расчета тесноты связи между искомыми величинами. При малом числе наблюдений тесноту связи можно вычислять непосредственно, т.е. без сводки исходных данных в таблицы.
Рисунок 12.1 - Точечные диаграммы (по К.Е. Никитину и А.З. Швиденко):
а - текущего прироста по диаметру zd и по объему zv;
(1 - регрессия у на х; 2 - регрессия х на у)
б - площади проекций крон Sкр и zv
Требуется пояснить смысл терминов “связь” и “зависимость”. Как и во всем статистическом анализе, основным здесь является выяснение причинной сути установленных корреляций. Так, если рассматривается связь между диаметром дерева и его высотой, то очевидно, что yi (Di) зависит от xi (Hi), но можно считать и наоборот. Поэтому в некоторых задачах возможна симметрия воздействия. Но если рассматривается связь между количеством выпадающих осадков и производительностью древостоев, то здесь может быть только зависимость «в одном направлении», хотя статистически можно попытаться установить и зависимость осадков от производительности древостоев, и даже получить какое-то ее цифровое выражение, но бесплодность подобных упражнений очевидна.
Тесноту корреляции, или степень сопряженности между значениями одного и другого признака, выражают в виде отвлеченных статистических характеристик (показателей) связи - коэффициента корреляции r и корреляционного отношения - .
2. Коэффициент корреляции как мера линейной связи
Коэффициент корреляции - это статистика, которая является численной характеристикой связи между признаками, когда она имеет линейный характер. Это значит, что связь между величинами x и y выражается общей формулой y=a0+a1x, где a0 и a1 - коэффициенты, которые определяют на основе выборочных наблюдений. Коэффициент корреляции численно выражает отношение числа факторов, действующих на изменение обоих признаков к общему числу факторов.
Указанное содержание коэффициента корреляции достаточно хорошо выражает формула
. (12.1)
Это выражение также можно записать
r = [(Xi - )(Yi - )] / Nx y . (12.2)
В формуле (12.1) xi и yi - случайные (исследуемые) величины; - средние значения для x и y.
Величина x и y в формуле (12.2) - среднеквадратические отклонения распределений Х и Y; N - число сопоставляемых пар или число наблюдений.
Из формулы видно, что при независимом варьировании признаков, когда любое из отклонений Xi- может сочетаться с любыми Yi- (как с положительными, так и с отрицательными, притом одинаково часто), числитель ее будет равен нулю или близкой к нулю величине. Следовательно, и r0. При сопряженном варьировании отклонения Xi- сочетаются только с некоторыми отклонениями Yi-, например, положительные в основном только с положительными (при прямой связи) или положительные с отрицательными (при обратной связи). В этом случае сумма произведений будет иметь положительное (при прямой связи) или отрицательное (при обратной связи) значение, притом тем большее по своей величине (при данном N), чем связь сопряженнее.
Делением суммы произведений отклонений на число коррелирующих пар получают среднюю величину произведения, а делением на стандартные отклонения x и y выражают это произведение отвлеченным числом, характеризующим тесноту связи.
В целом коэффициент корреляции представляет собой эмпирический первый основной смешанный момент, т.е.
(12.3)
Для его вычисления надо найти первый начальный смешанный момент m1/1 и первые два начальных момента каждого из рядов распределения. Вычисление моментов для одномерных рядов распределения описано ранее (глава 5). Здесь же покажем вычисление требуемых нам моментов для двухмерной совокупности.
Эмпирическим смешанным начальным моментом порядка (k1, k2) двух случайных величин (xi, yi), которые сведены в таблицу и сгруппированы по определенным разрядам, называется сумма произведений каждой пары отклонений x1(i2) и x2(j2). Отклонения берут от начальных значений x1(а) и x2(a) в h1 и h2 степени и умножают на соответствующую частность (формула (12.4)).
(12.4)
Придавая величинам k1 и k2 разные значения, получаем смешанные моменты m1/1, m2/1, m1/2, m1/3, m2/2.
Соотношения между определенными выше смешанными центральными и начальными моментами даются формулами:
,
,
,
,
,
.
Для проверки вычислений применяются формулы:
,
,
,
,
,
Эмпирические смешанные основные моменты порядка (h1; h2) находятся при помощи центральных:
.
В частности, корреляция длина лесной сосна
, , ,
, , .
Смешанный основной момент первого порядка называется к о э ф ф и ц и е н т о м к о р р е л я ц и и и обозначается через r:
. (12.5)
Смешанные моменты различных порядков могут быть вычислены как по способу произведений, так и по способу сумм.
По с п о с о б у п р о и з в е д е н и й вычисляется смешанный момент порядка (1,1). Для этого применяется схема, в которой наряду с таблицей распределения составляется еще вспомогательная таблица.
Схема вычисления m1/1 показана в таблице 12.2. Для примера взято распределение 238 деревьев дуба по диаметру и высоте (таблица 12.1). Схема вычисления m1/1 представляет собой таблицу распределения, в заголовках которой разрядные значения первой величины (диаметра) и разрядные значения второй величины (высоты) заменяются отклонениями и значений от соответствующих начальных величин начальных значений.
Таблица 12.2 - Схема вычисления m1/1 для распределения диаметров и высот по способу произведений для 238 деревьев дуба
Ступени толщины, см |
Число стволов, шт. (частоты) |
Сумма частот |
||||||||||
Ступени высоты, м (середины классов) |
||||||||||||
16 |
18 |
20 |
22 |
24 |
26 |
28 |
30 |
32 |
||||
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
||||
12 |
-5 |
+20 3 |
- |
- |
- |
- |
- |
- |
- |
- |
3 |
|
16 |
-4 |
+16 3 |
+12 3 |
+8 3 |
- |
- |
- |
- |
- |
- |
9 |
|
20 |
-3 |
+12 2 |
+9 5 |
+6 10 |
+3 4 |
- |
- |
- |
- |
- |
21 |
|
24 |
-2 |
- |
+6 2 |
+4 2 |
+2 11 |
12 |
-2 3 |
- |
- |
- |
30 |
|
28 |
-1 |
- |
- |
- |
+1 3 |
28 |
-1 11 |
-2 2 |
- |
- |
44 |
|
32 |
0 |
- |
- |
- |
- |
5 |
38 |
11 |
- |
- |
54 |
|
36 |
1 |
- |
- |
- |
- |
1 |
+1 22 |
+2 11 |
- |
+4 1 |
35 |
|
40 |
2 |
- |
- |
- |
- |
- |
+2 1 |
+4 15 |
+6 7 |
- |
23 |
|
44 |
3 |
- |
- |
- |
- |
- |
- |
+6 7 |
+9 10 |
- |
17 |
|
48 |
4 |
- |
- |
- |
- |
- |
- |
- |
+12 1 |
+16 1 |
2 |
|
Сумма частот |
- |
8 |
10 |
15 |
18 |
46 |
75 |
46 |
18 |
2 |
238 |
Таблица 12.3 - Вспомогательная таблица для вычисления m1/1 в древостое дуба
x2 x |
Четверти |
?стр. 1+4 |
?стр. 2+3 |
?стр. 5+6 |
Стр.0*стр.7 |
Проверка |
||||
I |
II |
III |
IV |
|||||||
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
1 |
3 |
11 |
- |
22 |
25 |
11 |
14 |
14 |
1.127+16+ +46+54- -5=238 |
|
2 |
11 |
3+2 |
- |
11+1 |
23 |
5 |
18 |
36 |
||
3 |
4 |
- |
- |
- |
4 |
- |
4 |
12 |
||
4 |
2 |
- |
- |
1+15 |
18 |
- |
18 |
72 |
||
6 |
10+2 |
- |
- |
7+7 |
26 |
- |
26 |
156 |
2.14+18+ +4+18+ +26+3+ +15+6+4+ +3=111 |
|
8 |
3 |
- |
- |
- |
3 |
- |
3 |
24 |
||
9 |
5 |
- |
- |
10 |
15 |
- |
15 |
135 |
||
12 |
2+3 |
- |
- |
1 |
6 |
- |
6 |
72 |
||
16 |
3 |
- |
- |
1 |
4 |
- |
4 |
64 |
||
20 |
3 |
- |
- |
- |
3 |
- |
3 |
60 |
||
? |
- |
- |
- |
- |
127 |
16 |
111 |
645 |
Частоты строки и столбца таблицы, расположенных против отклонений, равных нулю, будучи умножены на нуль, дадут в результате нуль. Выделив эти нулевые строку и столбец при помощи жирных линий, мы разделим всю таблицу распределения на четыре четверти.
В I (левой верхней) четверги таблицы частоты должны быть умножены на отрицательные отклонения х1 (j1) и отрицательные отклонения x2 (j2); во II (правой верхней) четверти отклонения х1 (j1) отрицательны; а отклонения x2 (j2) положительны; в III (левой нижней) четверти отклонения х1 (j1) положительны, а отклонения x2 (j2) отрицательны; наконец, в IV (правой нижней) четверти как отклонения х1 (j1) так и отклонения x2 (j2) положительны.
Таким образом, в I и IV четверги частоты должны быть умножены на положительные произведения отклонений х1 (j1) x2 (j2), а во II и III четверти - на отрицательные произведения отклонений х1 (j1) x2 (j2). Каждое такое произведение отклонений с указанием знака выписывается в правом верхнем углу соответствующей клетки таблицы распределения цифрами меньшего размера.
Вспомогательная таблица (таблица 12.3) состоит из десяти столбцов (0)-(9). В столбце (0) выписывают в возрастающем порядке, не обращая внимания на знак и на число повторений, все произведения отклонений х1 (j1) x2 (j2), помеченные маленькими цифрами в клетках таблицы распределения. В столбце (1) против соответствующих абсолютных произведений отклонений выписывают из I четверти таблицы распределения все частоты, соединяя их знаком плюс. Подобным же образом, в столбцах (2), (3) и (4) выписывают все частоты из II, Ш и IV четвертей таблицы распределения. В столбце (5) записывают суммы чисел каждой строки (1) и (4) столбцов, а в столбце (6) - суммы чисел каждой строки (2) и (3) столбцов. Затем находят итоги чисел столбца (5) и столбца (6). В рассматриваемом примере итог столбца (5) равен 127, а итог столбца (6) равен 16.
Прежде чем делать дальнейшие вычисления, необходимо произвести проверку правильности предыдущей работы. Для этого складывают итоги столбцов (5) и (6) вспомогательной таблицы 12.3 с итогами нулевой строки и нулевого столбца таблицы 12.2 распределения и из полученной суммы вычитают число, стоящее в центральной нулевой клетке таблицы распределения 12.2, так как это число, как нетрудно видеть, было подсчитано дважды. В результате таких действий должно получиться число, равное объему таблицы распределения. В рассматриваемом примере имеем:
127+16+46+54-5=238.
Проверка записывается в верхней части столбца (9) вспомогательной таблицы 12.3. Это проверка 1.
Убедившись, таким образом, в правильности проделанной вычислительной работы, составляют затем числа столбца (7), которые получаются путем вычитания чисел столбца (6) из чисел столбца (5); при этом необходимо проставлять знак полученной разности. Для проверки этого шага вычислительной работы заметим, что сумма чисел столбца (7) вспомогательной таблицы 12.3 должна равняться разности итогов столбцов (5) и (6) этой же таблицы. В рассматриваемом случае
127-16=111.
Эта проверка записывается в нижней части столбца (9) вспомогательной таблицы 12.3. Это проверка 2. У нас равенство получилось.
Последний шаг работы при вычислении смешанного момента m1/1 делается в столбце (8) вспомогательной таблицы. В этом столбце помещаются произведения чисел столбцов (0) и (7). Сумма чисел столбца (8) представляет числитель смешанного момента m1/1. Разделив эту сумму на объем таблицы распределения, получим искомый момент. В рассматриваемом примере имеем
m1/1 = .
При ручном счете большой объем вычислительной работы и отсутствие возможности полной проверки в самом ходе вычислений смешанного момента m1/1 были существенными недостатками способа произведений. Для вычисления же смешанных моментов более высокого порядка ручной способ оказывается совершенно непригодным.
В настоящее время все подобные расчеты автоматизированы и, естественно, практически никто вручную коэффициент корреляции не вычисляет, но специалист должен знать суть этого процесса и алгоритм вычислений.
Для ручного счета ранее применялся способ сумм как более легкий в расчетах. При компьютерных вычислениях проще применять способ произведений (легче составлять программу), поэтому описание громоздкого способа сумм здесь опускаем.
Вычислив первый смешанный момент, определяем коэффициент корреляции по приведенной выше формуле (12.5). Для этого необходимо вычислить первый смешанный центральный момент м1/1. Формула для его вычисления приводилась выше:
м1/1 = m1/1 - m1x • m2y, (12.6)
где м 1/1 - первый основной смешанный момент;
m1x и m2y - соответственно первые начальные моменты распределения по x и y. У нас это диаметр и высота. Эти моменты вычислены ранее (глава 10, табл. 10.9 и 10.10). Они равны m1x(D) = 0,672; m2y(M) = 0,500.
Тогда м1/1 = 2,71 - 0,672•0,500 = 2,76 - 0,336 = 2,374.
Среднеквадратическое отклонение для рядов распределения по диаметру и высоте вычислены ранее (глава 10) и равны
;
Тогда .
При малых выборках коэффициент корреляции можно вычислить непосредственно по приведенным выше формулам (12.1-12.2).
Пример вычисления коэффициента корреляции, который приводит Н.Н. Свалов, для малых выборок показан в таблице 12.4. Подставив в формулу величины, вычисленные в 12.4, получим
r = = 0,86.
Таблица 12.4 - Вычисление коэффициента корреляции между длиной стволиков и длиной корней сеянцев сосны
Длина |
Длина |
Отклонение |
Вычисление |
|||||
стволика |
корня Y |
х |
у |
ху |
х2 |
у2 |
||
Х, см |
||||||||
5 |
3,5 |
-0,5 |
-0,5 |
+0,25 |
0,25 |
0,25 |
||
6 |
4,0 |
+0,5 |
0 |
0 |
0,25 |
0 |
||
5 |
4,1 |
-0,5 |
+0,1 |
-0,05 |
0,25 |
0,01 |
= Х/N=55/10=5,5 см |
|
7 |
5,0 |
+1,5 |
+1,0 |
+1,50 |
2,25 |
1,00 |
||
6 |
3,5 |
+0,5 |
-0,5 |
0,25 |
0,25 |
0,25 |
||
4 |
3,1 |
-1,5 |
-0,9 |
+1,35 |
2,25 |
0,81 |
= Y/N=40/10=4,0 см |
|
5 |
3,5 |
-9,5 |
-0,5 |
+0,25 |
0,25 |
0,25 |
r = ху / = |
|
4 |
3,0 |
-1,5 |
-1,0 |
+1,50 |
2,25 |
1,00 |
= 7,00 / = 0,86 |
|
7 |
5,3 |
+1,5 |
+1,3 |
+1,95 |
2,25 |
1,69 |
||
6 |
5,0 |
+0,5 |
+1,0 |
+0,50 |
0,25 |
1,0 |
||
55 |
40,0 |
0 |
0 |
+7 |
10,50 |
6,26 |
Оценка показателей связи при малых выборках. При оценке коэффициента корреляции при малой выборке возникают некоторые новые проблемы в связи с тем, что при высоких значениях корреляции в генеральной совокупности (с) выборочные коэффициенты корреляции (r) имеют не нормальное, а позитивно (правостороннее) асимметричное распределение. В таких случаях на основе выборочного r и его ошибки r можно применить лишь оценку значимости r при гипотезе =0, т.е. лишь одну форму оценки из двух.
Для данных таблицы 12.4 при r=0,86 имеем следующую его оценку
.
Затем вычислим t-критерий и сравним его с табличными значениями (приложение Е)
tr = r / уr = 0,86 / 0,18 = 5,33.
Полученное значение tr превышает даже t0,001 = 5,0. Следовательно, r значимо на высоком уровне достоверности.
Эту форму оценки нельзя применять при других гипотезах, кроме =0. Равным образом критерий t нельзя использовать для построения доверительного интервала. Р.А. Фишер предложил для этих целей z-преобразование величины r.
Величина z
z= 1/2 [ln (1+r) - ln (1-r)] (12.7)
имеет нормальное распределение с дисперсией
= 1/(N-3) (12.8)
Для получения z имеются номограммы и таблицы, которые здесь не приводятся.
Для совокупности длин стволиков и корней при r=0,86 z=1,293. Ошибка этой величины z = . Доверительный интервал для zr в генеральной совокупности равен z t0,05Sz=1,2932,3 0,378, т.е. от 0,424 до 2,162. Тогда интервал для равен от 0,40 до 0,97.
Преобразование z применяется также при сравнении двух выборочных коэффициентов корреляции и при нахождении обобщенного для них коэффициента, когда оказывается, что выборки взяты из одной совокупности. Пусть взято 2 выборки всходов сосны, предположительно из одной совокупности: r1=0,86, Sr1 = 0,18, N1=10 и r2=0,70; r2 = 0,25, N2=10. Можно ли считать различие в коэффициентах значимым?
Квадратическая ошибка разности z1 и z2 следующая:
z1-z2 = (12.9)
Для сравниваемых выборок имеем
z1-z2 = ,
tz1-z2 = (z1 - z2) / Sz1-z2 = (1,293 - 0,867) / 0,54 = 0,78 < t0,05.
Имеющееся различие между коэффициентами корреляции следует считать случайным, а выборки - взятыми из одной генеральной совокупности.
Объединение выборочных коэффициентов корреляции целесообразно, если корреляция между признаками в выборках существенно не различается, как в рассмотренном примере. Обобщенный коэффициент корреляции является более надежной оценкой коэффициента корреляции в общей совокупности.
Для получения r также пользуются значениями z, находя из них среднюю взвешенную величину. В качестве веса принимают число наблюдений в каждой выборке, уменьшенное на 3 единицы, т.е.
z=[z1 (N1 - 3) + z2 (N2 - 3)] / [(N1 - 3) + (N2 - 3)]
Для двух выборок сеянцев сосны имеем
z = (1,293 7 + 0,867 7) / (7 + 7) = 1,080.
Квадратическая ошибка среднего взвешенного z
z = 1 /
Для нашего примера z =0,071, tz = z / Sz =1,080/0,071 = 15 > t0,05 и даже t0,01, т.е. z является значимым на высоком уровне значимости.
Найденному значению z=1,080 соответствует r=0,79, который является наиболее надежной оценкой в генеральной совокупности.
Коэффициент корреляции может принимать значения от +1 до -1. При полной прямой корреляции r = +1, при полной обратной r = -1. При r = 0 или близкой к 0 прямолинейная связь отсутствует (криволинейная связь при этом может быть, например, окружность). Обычно считают, при величине до 0,1 - связи нет; r = 0,11-0,30 - связь слабая, при r = 0,5-0,6 - средняя; при r = 0,7-0,9 - сильная или тесная; r = 0,9-1,0 - очень высокая.
Таким образом, в нашем примере связь между диаметрами и высотами в древостое дуба оказалась сильной. Наличие или отсутствие связи между различными явлениями или признаками можно подтвердить и другими примерами. Так, нет связи между классом бонитета древостоя и наличием лесных дорог. Слабая связь между водообеспеченностью древостоев и уровнем грунтовых вод на гидроморфных почвах: она проявляется только в засушливые годы. Средняя связь между величиной текущего прироста (м3/га) и полнотой, т.к. здесь идут два взаимно противоположные процесса: уменьшение числа деревьев и увеличение прироста на оставшихся стволах. Сильная связь наблюдается между классом бонитета древостоя и уровнем почвенного плодородия. Очень высокая связь существует в древостое между диаметрами и высотами, высотами и видовыми числами.
Детальные исследования в теории корреляции показали, что степень сопряженности случайных величин x и y более точно описывает квадрат коэффициента корреляции, получивший название коэффициента детерминации (d), определяемый как d=r2. Коэффициент детерминации, выраженный в процентах, показывает ту часть изменчивости зависимой переменной (y), которая вызвана влиянием независимой переменной (x), т.е. он более отчетливо выражает зависимость y=f(x).
3. Корреляционное отношение как мера нелинейной связи
Связь между x и y далеко не всегда выражается линейно. Поэтому для любой формы связи К. Пирсон предложил статистику зависимости между случайными величинами x и y, которую назвал корреляционным отношением. Статистическое обоснование этого показателя имеет определенную сложность и здесь не приводится. Наиболее важно знать вычисление корреляционного отношения. Особенно если с помощью коэффициента корреляции установлено, что связь слабая или средняя (r < 0,7-0,8). В этом случае связь может быть даже сильной, но иметь криволинейный характер. Например, для зависимости y=f(x), имеющей вид окружности, r=0, хотя связь есть и весьма тесная. Поэтому и был предложен новый показатель - корреляционное отношение, - который с успехом отражает как линейную, так и нелинейную связь. Корреляционное отношение выражают греческой буквой эта - з. Предварительную оценку криволинейной связи можно сделать, построив график функции y=f(x), на котором вид связи (прямолинейная или криволинейная) будет виден.
Для вычисления корреляционного отношения строят таблицу распределения. Подобную мы составляли при определении коэффициента корреляции (таблица 12.5)
Таблица 12.5 - Общий вид таблицы исходных данных для вычисления корреляционного отношения
x |
y |
||
x1 |
y11 y12 y13 … y1n |
||
x2 |
y21 y22 y23 … y2n |
||
x3 |
y31 y32 y33 … y3n |
||
… |
………………… |
… |
|
xk |
yk1 yk2 yk3 … ykn |
По данным таблицы 12.5 вычисляем следующие суммы квадратов
,
где - условные средние, вычисленные для каждой строки;
,
где - средняя по г для всей совокупности;
,
где у0 - остаточная сумма квадратов, обусловленная иными причинами, чем регрессия y на x.
Тогда
, (12.10)
а . (12.11)
После элементарных математических преобразований формулы (12.11) с учетом (12.10) получаем
. (12.12)
Выражение (12.12) есть отношение суммы квадратов отклонений, обусловленной зависимостью y от x к общей сумме квадратов отклонений. Для линейной связи это совпадает с определением коэффициента детерминации, но форма связи возможна любая.
Поясним сказанное примером вычисления корреляционного отношения. Возьмем уже ранее рассматриваемое распределение 238 деревьев дуба по диаметру и высоте (таблица 12.1). Для удобства пользования представим ее в виде таблица 12.6, т.к. нам требуется ввести дополнительные графы, а в том виде, как имеется в таблице 12.1, все графы затруднительно разместить на одном листе.
В таблице 12.6 знаком обозначены групповые средние, вычисленные в таблице 12.1. Общее среднее (для совокупности) обозначено .
По данным таблицы 12.6 определяем
.
Общая дисперсия
.
Дисперсия групповых средних
.
Таблица 12.6 - Вычисление корреляционного отношения для связи диаметров и высот в древостое дуба
Ступени толщины xi |
Ступени высот yi |
ni |
yini |
yi- |
(yi-)2 |
(yi-)2•ni |
- |
(-)2 |
(-)2ni |
||
12 |
16 |
3 |
48 |
16 |
-9 |
81 |
243 |
-9,0 |
81,0 |
243,0 |
|
16 |
16 |
3 |
48 |
18,0 |
-9 |
81 |
243 |
-7,0 |
49,0 |
441,0 |
|
18 |
3 |
54 |
-7 |
49 |
177 |
||||||
20 |
3 |
60 |
-5 |
25 |
75 |
||||||
? |
9 |
162 |
- |
- |
- |
465 |
|||||
20 |
16 |
2 |
32 |
19,52 |
-9 |
81 |
162 |
-5,48 |
30,03 |
630,1 |
|
18 |
5 |
90 |
-7 |
49 |
245 |
||||||
20 |
10 |
200 |
-5 |
25 |
250 |
||||||
22 |
4 |
88 |
-3 |
9 |
36 |
||||||
? |
21 |
410 |
- |
- |
- |
693 |
|||||
24 |
18 |
2 |
36 |
22,8 |
-7 |
49 |
98 |
-2,2 |
4,44 |
133,2 |
|
20 |
2 |
40 |
-5 |
25 |
50 |
||||||
22 |
11 |
242 |
-3 |
9 |
99 |
||||||
24 |
12 |
288 |
-1 |
1 |
22 |
||||||
26 |
3 |
78 |
+1 |
1 |
3 |
||||||
? |
30 |
684 |
- |
- |
- |
272 |
|||||
28 |
22 |
3 |
66 |
24,54 |
-3 |
9 |
27 |
-0,46 |
0,21 |
9,2 |
|
24 |
28 |
672 |
-1 |
1 |
28 |
||||||
26 |
11 |
286 |
+1 |
1 |
11 |
||||||
28 |
2 |
56 |
+3 |
9 |
18 |
||||||
? |
44 |
1080 |
- |
- |
- |
74 |
|||||
32 |
24 |
5 |
120 |
26,22 |
-1 |
1 |
5 |
+1,22 |
1,49 |
88,5 |
|
26 |
38 |
988 |
+1 |
1 |
38 |
||||||
28 |
11 |
308 |
+3 |
9 |
99 |
||||||
? |
54 |
1416 |
- |
- |
- |
142 |
|||||
36 |
24 |
1 |
24 |
26,74 |
-1 |
1 |
1 |
+1,74 |
3,03 |
106,1 |
|
26 |
22 |
572 |
+1 |
1 |
22 |
||||||
28 |
11 |
308 |
+3 |
9 |
99 |
||||||
32 |
1 |
32 |
+7 |
49 |
49 |
||||||
? |
35 |
936 |
- |
- |
- |
171 |
|||||
40 |
26 |
1 |
26 |
28,52 |
+1 |
1 |
1 |
+3,52 |
12,39 |
285,0 |
|
28 |
15 |
420 |
+3 |
9 |
135 |
||||||
30 |
7 |
210 |
+5 |
25 |
175 |
||||||
? |
23 |
656 |
- |
- |
- |
311 |
|||||
44 |
28 |
7 |
196 |
29,18 |
+3 |
9 |
63 |
+4,18 |
17,47 |
297,0 |
|
30 |
10 |
300 |
+5 |
25 |
250 |
||||||
? |
17 |
496 |
- |
- |
- |
313 |
|||||
48 |
30 |
1 |
30 |
31,0 |
+5 |
25 |
25 |
+6,0 |
36,0 |
72,0 |
|
32 |
1 |
32 |
+7 |
49 |
49 |
||||||
? |
2 |
64 |
- |
- |
- |
74 |
|||||
? |
- |
238 |
5952 |
25,0 |
-27 |
2758 |
- |
- |
2305,1 |
Корреляционное отношение
.
Оценка достоверности корреляционного отношения.
Основная ошибка:
.
Критерий Стьюдента:
.
Для г=N-2=236 критическое значение t (приложение Е) даже при достоверности 99,9% равно 3,29<30,5, т.е. наше корреляционное отношение достоверно с высоким уровнем значимости.
Вспомним, что коэффициент корреляции (раздел 12.2) для этих же исходных данных составил 0,74. Значительная разница между величиной коэффициента корреляции и корреляционного отношения показывает, что связь между диаметрами и высотами в древостое носит криволинейный характер. Это хорошо известно лесоводам, которые выражают эту связь уравнением параболы 3 порядка y=a1+a1x+a2x2+a3x3 или иными функциями, имеющими схожие графики.
Для строгого установления, является ли связь криволинейной, существует мера криволинейности (К), выражаемая через соотношение r и з.
К = з2 - r2
При К<0,1 связь прямолинейная; К?0,1 связь криволинейная.
Для нашего примера К = 0,836 - 0,548 = 0,288, что подтверждает криволинейность связи: 0,288>0,1.
Основную ошибку меры криволинейности (К) определяют по формуле
,
а ее достоверность проверяется по t-критерию Стьюдента
,
где t критическое берут по таблицам (приложение Е) для г=N-1. При t<tтаб мера криволинейности достоверна, а при t?tтаб мера криволинейности недостоверна.
Для нашего примера
= .
Для г=237 tтаб=3,29, т.е. мера криволинейности достоверна в 99,9%.
Криволинейность связи может быть установлена и через F-критерий Фишера.
,
где N - объем выборки,
К - число классов вариационного ряда.
Критические значения F берут по таблице (приложение Ж) при числе степеней свободы г1=К-2; г2=N-K.
При Fфакт<Fтаб связь прямолинейная; при Fфакт?Fтаб связь криволинейная.
Для нашего примера
.
Табличное Fтаб (при г1=236, г2=8) для достоверности 99,9% равно 9,6. Вычисленная нами величина Fфакт=95,4. Она больше табличного значения, что доказывает криволинейность связи.
Заметим, что з, как правило, имеет большее значение, чем r. Лишь в случае, когда r?1,0, величина з приближается к r. Поэтому, если окажется, что при вычислениях r ? з (такое у неопытных студентов случается), то, значит, в вычислениях допущена ошибка.
Есть и другие критерии, показывающие вид связи (прямолинейность или криволинейность): критерии Бокмана, Романовского и др., но здесь мы их не рассматривали. Интересующихся отсылаем к учебнику «Биометрия» (авторы М.П. Горошко и др.), который приведен в списке литературы.
Как уже отмечено, корреляционное отношение показывает, какую часть общей дисперсии (вариации) результативного признака (y) составляет дисперсия частных средних этого признака, т.е. измеряет относительную степень варьирования групповых средних i.
Можно вычислить два корреляционных отношения у/х и х/у. Однако реальное значение имеет, как правило, один из них. Корреляционное отношение имеет всегда положительное значение, изменяющееся от 0 до 1. Когда групповые средние одинаковы (не варьируют), =0. Связь отсутствует. В случае строго прямолинейной связи (все точки лежат на прямой) = r = 1. В других случаях > r. Чем это различие больше, тем связь более криволинейна. В предельном случае, когда связь строго криволинейна и кривая проходит через групповые средние, так что i = у, корреляционное отношение равно 1, а r=0.
Вычисление по формуле (12.12) значения возможно лишь в том случае, когда выборка большая и данные расположены в виде корреляционной таблицы, как в таблицах 12.5 и 12.6.
При малом числе наблюдений показатель недостаточно надежен. В группах может оказаться по одному значению y. Тогда i у, а 1,0.
При малой выборке следует вводить корректирование по формуле:
=, (12.13)
где m - число групп.
Ниже для примера по данным, приведенным в таблице 12.6, показан расчет з по названной формуле.
=
Отсюда . Разница между величинами з, вычисленными по формулам 12.12 и 12.13 составила 0,3%, что предпставляет незначительную величину, т.е. значения з, полученные по обоим формулам совпали. Это произошло потому, что наше N=238 велико. При N<30 разница может быть существенной. Допустим, что при том же з=0,914 имеем N=29, а m=12. Тогда будет равно =1-0,243=0,757. =0,870. Как видим, разница составила , что уже значимо.
4. Другие статистические показатели корреляции. Использование корреляции в лесном хозяйстве
При проведении исследований не всегда ограничиваются нахождением коэффициента корреляции и корреляционного отношения. Бывает, что при наблюдении встречаются случаи качественно неизмеримые или те из них, когда проводились отметки только наличия или отсутствия признаков. Тогда производят ранжирование признаков, т.е. присваивают им определенные номера и определяют показатель корреляции рангов.
В практике есть примеры, когда характер распределения неизвестен, но он явно отличается от нормального. В этом случае, если показатели поддаются ранжированию, применяются ранговые коэффициенты корреляции. Опишем нахождение показателя корреляции рангов, в редакции А.К.Митропольского.
Ранг указывает то место, которое занимает данная единица частичной совокупности среди других ее единиц. Если бы каждая из этих единиц отличалась в отношении рассматриваемого признака от всех других единиц совокупности, тогда ранги представляли бы порядковые номера от 1 до числа n, равного объему частичной совокупности. Если же некоторые из единиц совокупности оказываются в отношении рассматриваемого признака одинаковыми, тогда ранг всех этих единиц принимается равным среднему из соответствующих номеров.
Показатель корреляции рангов с равен
, (12.14)
где величины dh представляют разности между рангами единиц, извлеченных совместно из двух общих совокупностей.
Подобно коэффициенту корреляции r, показатель корреляции рангов с изменяется от -1 до + 1. Чем теснее будет связь между величинами, тем ближе к единице по своей абсолютной величине будет показатель корреляции рангов; знак же показателя указывает, является ли связь прямой или обратной.
В качестве примера вычислим показатель корреляции рангов, выражающий связь между объемным весом X1 (г, г/см3) и пределом прочности при сжатии X2 (уB, кг/см3) древесины дуба (таблица 12.7, которую приводит А.К. Митропольский).
Для проверки вычислений заметим, что сумма рангов должна равняться сумме натуральных чисел от 1 до n, т.е. . В рассматриваемом примере
.
Кроме того, сумма отрицательных разностей dh должна равняться сумме положительных разностей.
Применяя формулу (12.14), находим
Таблица 12.7 - Вычисление показателя корреляции рангов
№ |
X1 |
X2 |
h1 |
h2 |
dh |
||
1 |
758 |
676 |
19 |
19 |
0 |
0 |
|
2 |
739 |
646 |
17 |
13 |
4 |
16 |
|
3 |
719 |
642 |
13 |
12 |
1 |
1 |
|
4 |
717 |
635 |
10 |
9,5 |
0,5 |
0,25 |
|
5 |
678 |
567 |
5 |
5 |
0 |
0 |
|
6 |
613 |
476 |
2 |
2 |
0 |
0 |
|
7 |
753 |
635 |
18 |
9,5 |
8,5 |
72,25 |
|
8 |
724 |
665 |
14,5 |
18 |
-3,5 |
12,25 |
|
9 |
718 |
661 |
12 |
17 |
-5 |
25 |
|
10 |
693 |
610 |
7 |
7 |
0 |
0 |
|
11 |
658 |
531 |
4 |
3 |
1 |
1 |
|
12 |
737 |
649 |
16 |
14 |
2 |
4 |
|
13 |
707 |
635 |
8 |
9,5 |
-1,5 |
2,25 |
|
14 |
717 |
635 |
10 |
9,5 |
0,5 |
0,25 |
|
15 |
653 |
544 |
3 |
4 |
-1 |
1 |
|
16 |
724 |
650 |
14,5 |
15 |
-0,5 |
0,25 |
|
17 |
717 |
653 |
10 |
16 |
-6 |
36 |
|
18 |
685 |
578 |
6 |
6 |
0 |
0 |
|
19 |
612 |
462 |
1 |
1 |
0 |
0 |
|
? |
- |
- |
190 |
190 |
-17,5 17,5 |
171,5 |
|
Ранговый коэффициент корреляции Спирмена изложен здесь в редакции М.П. Горошко с соавторами. Уравнение коэффициента корреляции рангов имеет вид
, (12.15)
где d - разница между рангами;
xi и yi - ранги значений xi и yi (1?хi?N; 1?yi?N);
N - объем выборки.
Приведенный коэффициент является непараметрическим показателем связи и используется при изучении как количественных, так и качественных значений. При этом закон распределения этих величин и форма связи нам могут быть неизвестны, как и обычный коэффициент корреляции rs может иметь величину от -1 до +1.
При независимости величин х и у rs распределяется ассимптотично нормально при N>?, а =0, где дисперсия .
Как и другие выборочные показатели, коэффициент корреляции рангов есть оценка параметра в генеральной совокупности. Его достоверность устанавливают на основе нулевой гипотезы, которую принимают для условия, что rs=0 в генеральной совокупности. Эта гипотеза проверяется путем вычисления t-критерия Стьюдента и сопоставления его с критической величиной tкр.
.
Обычно используют 95% или 99% уровень достоверности, где применяют следующие формулы.
Для уровня достоверности 99%:
tкр% = .
Для уровня достоверности 95%:
tкр% = .
При t < tтаб принимают нулевую гипотезу (Н0), т.е. rs недостоверен.
При t ? tтаб принимается рабочая (альтернативная) гипотеза (На) и rs является достоверным.
Достоверность rs можно оценить и по специальным таблицам критических значений rs (приложение У), где оно дается в зависимости от уровня значимости (5%, 1%) и объема выборки (N). При rs < rтаб принимается нулевая гипотеза, а rs ? rтаб - альтернативная или рабочая.
Приведем пример вычисления rs (таблица 12.8). Пусть у нас есть замеры 15 высот и диаметров в древостое осины с полнотой 0,7 Iа класса бонитета в 40 лет.
, .
Сумма рангов (по х и у) контролируется по формуле арифметической прогрессии . У нас .
Величину rs определяем по формуле (12.15):
.
Как видим, коэффициент ранговой корреляции высок, что соответствует известной закономерности в отношении связи диаметров и высот деревьев в древостое. В этом убедимся, вычислив достоверность rs.
Таблица 12.8 - Вычисление коэффициента ранговой корреляции для 15 стволов осины
№ п/п |
Диаметр, см хi |
Высота, м уi |
Ранги (Р) |
d1=Р1-Р2 |
d12 |
Р1Р2 |
||
Р1 по хi |
Р2 по уi |
|||||||
1 |
13,8 |
17,5 |
1,0 |
1,0 |
0 |
0 |
1,0 |
|
2 |
16,9 |
18,4 |
2,5 |
2,0 |
0,5 |
0,25 |
5,0 |
|
3 |
16,8 |
19,5 |
2,5 |
4,5 |
-2,0 |
4,0 |
11,25 |
|
4 |
17,9 |
19,2 |
4,0 |
3,0 |
1,0 |
1,0 |
12,0 |
|
5 |
18,5 |
20,1 |
5,0 |
6,0 |
-1,0 |
1,0 |
30,0 |
|
6 |
19,2 |
19,5 |
6,5 |
4,5 |
2,0 |
4,0 |
29,25 |
|
7 |
19,2 |
21,5 |
6,5 |
8,0 |
-1,5 |
2,25 |
52,0 |
|
8 |
20,3 |
22,0 |
8,0 |
9,5 |
-1,5 |
2,25 |
76,0 |
|
9 |
21,4 |
22,0 |
9,0 |
9,5 |
-0,5 |
0,25 |
85,5 |
|
10 |
22,5 |
21,3 |
10,0 |
7,0 |
3,0 |
9,0 |
170,0 |
|
11 |
23,0 |
23,6 |
11,5 |
12,0 |
-0,5 |
0,25 |
138,0 |
|
12 |
23,0 |
22,9 |
11,5 |
11,0 |
0,5 |
0,25 |
126,5 |
|
13 |
27,6 |
24,0 |
13,0 |
13,5 |
-0,5 |
0,25 |
175,5 |
|
14 |
28,5 |
26,5 |
14,0 |
15,0 |
-1,0 |
1,0 |
210,0 |
|
15 |
30,9 |
24,0 |
15,0 |
13,5 |
1,5 |
2,25 |
202,5 |
|
? |
319,4 |
322,0 |
120 |
120 |
0 |
28,0 |
1324,5 |
Основная ошибка rs определяется по формуле:
.
.
По таблицам (приложение У) для г=N=15 для Р=0,001 находим tтаб=3,95.
Поскольку tфакт > tтаб (11,0>3,95) устанавливаем, что величина rs достоверна на высоком уровне значимости.
Есть и другие показатели ранговой корреляции, коэффициенты взаимной сопряженности, описанные в учебниках А.К. Митропольского, М.П. Горошко с соавторами, но эти показатели здесь опущены из-за их редкого использования.
Использование корреляции в лесном хозяйстве. В лесном хозяйстве приведенные величины, определяющие корреляцию между различными признаками, применяются очень широко. Уже более 100 лет коэффициент корреляции и корреляционное отношение постоянно вычисляют при проведении научных исследований в лесном хозяйстве. Эти показатели мы встречаем в трудах классиков лесоводства и лесной таксации М.М. Орлова, А.К. Турского, А.В. Тюрина, В.К. Захарова и др. Применение корреляции мы видим в классических трудах видного белорусского (гомельского) ученого, лесовода и таксатора Ф.П. Моисеенко. Он установил высокую степень корреляции между формой ствола и средним диаметром дерева и доказал небольшую изменчивость средней формы ствола в древостое. Это стало научной основой для составления объемных и сортиментных таблиц по средней форме ствола, что в несколько раз упростило составление этих нормативов и пользование ими.
В настоящее время вычисление r и з является обязательным условием проведения исследований в случае наличия связи между изучаемыми величинами. Применение ПК сделало эту работу простой и рутинной.
При исследовании лесных биогеоценозов очень часто влияние одних показателей биоценоза на другие не очевидно. Для доказательства (или опровержения) этого влияния пользуются показателями корреляции. Например, влияет ли процент физической глины в разных почвенных горизонтах (А1, А2, В, С) на величину класса бонитета без вычисления показателей корреляции для каждого типа леса (типа условий, местопроизрастания) сказать трудно, т.к. в ряде случаев (сухие боры, мокрые условия произрастания) велико влияние и других факторов, например, увлажнения почвы. Таких примеров очень много.
В то же время использование законов корреляции должно сопровождаться логическим анализом сути явления, что могут сделать только специалисты. В лесном хозяйстве это лесоводы, в отдельных случаях биологи (ботаники, зоологи). Механическое сопоставление логически несвязанных величин с вычислением показателей корреляции может привести к неверным, а иногда и абсурдным выводам. Например, мы можем связать величину, характеризующую количество лунного света с уровнем производительности древостоя и даже получим какие-то величины коэффициента корреляции, но результат таких расчетов не будет отражать реальность.
Другой пример. Мы можем связать количество сухостоя на 1 га древостоя только с плодородием почвы, но эти сопоставления будут некорректны, т.к. на количество сухостоя (отпада) на 1 га влияют (более значимо) другие факторы: густота насаждения, его возраст, рубки ухода.
Здесь, в частном случае, проявляются общие требования к определению статистических показателей - необходимость их логической верификации специалистами.
Размещено на Allbest.ru
Подобные документы
Описание селекционных признаков крупного рогатого скота, наследование его качественных признаков при воспроизводстве стада. Отбор молочных коров по генетической корреляции признаков продуктивности. Достоверность корреляции по косой длине туловища коров.
курсовая работа [324,6 K], добавлен 24.10.2014Форма собственности как инструмент политики в лесном хозяйстве. Реформирование и институциональные трансформации в лесном хозяйстве Украины. Политика по преодолению основных конфликтов в современном лесном хозяйстве. Лесные экосистемы, Киотский протокол.
контрольная работа [28,4 K], добавлен 25.02.2012Реформирование форм собственности и организации деятельности в лесном хозяйстве. Сотрудничество с международными научными организациями. Основные инструменты экономической политики в лесном хозяйстве. Национальная политика в лесном хозяйстве Украины.
контрольная работа [331,8 K], добавлен 07.03.2013Воспроизводство лесов на землях лесного фонда Иркутской области. Природно-климатические условия. Биометрические показатели сеянцев сосны. Технология выращивания сеянцев в открытом грунте в Российской Федерации. Способы лесовосстановления в лесничестве.
дипломная работа [6,6 M], добавлен 14.01.2014Краткая природно-экономическая характеристика ЗАО "Яснополянское". Анализ динамики и вариации трудоёмкости зерновых культур, система средних показателей. Взаимосвязь между урожайностью и трудоёмкостью зерновых культур, значение коэффициента корреляции.
курсовая работа [365,5 K], добавлен 11.11.2010Технологический комплекс машин для выращивания сеянцев в полиэтиленовых теплицах, для создания лесных культур на вырубках с постоянным избыточным увлажнением. Проведение осветлений культур и естественных молодняков, скашивания травянистой растительности.
курсовая работа [46,9 K], добавлен 20.04.2015Виды аэрофотосъемки и оценка ее качества. Методы изучения таксационно-дешифровочных показателей насаждений на пробных площадях. Сущность цифрового космического изображения, виды его предварительной обработки. Примеры применения авиации в лесном хозяйстве.
контрольная работа [2,6 M], добавлен 11.11.2011Хозяйственная деятельность в лесном фонде. Первые опыты по применению авиации и материалов аэрофотосъемки в лесном хозяйстве Российской Федерации. Последовательное помаршрутное наложение снимков с учетом зон продольного и поперечного перекрытия.
реферат [25,4 K], добавлен 23.08.2013Селекционная оценка деревьев и насаждений. Способы получения семян и хранения желудей. Технология выращивания сеянцев сосны обыкновенной и кедра сибирского. Инвентаризация посадочного материала в питомнике. Методика технической приемки лесных культур.
контрольная работа [466,9 K], добавлен 17.05.2009Характеристика территории и лесорастительных условий в Каймоновском лесном хозяйстве. Основные показатели деятельности предприятия. Общий надзор за состоянием лесных насаждений. Лесная энтомология и фитопатология. Экологическая обстановка в лесном районе.
отчет по практике [3,8 M], добавлен 24.10.2014