Математические методы в экологии
Экологическая система как объект математического моделирования. Классификация математических моделей и методов. Оценка аналитических и имитационных моделей. Детерминированный, стохастический, дисперсионный анализ. Информационные технологии в экологии.
Рубрика | Экология и охрана природы |
Вид | лекция |
Язык | русский |
Дата добавления | 06.09.2015 |
Размер файла | 229,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Математические методы в экологии
Оглавление
- Введение
- 1. Экологическая система как объект математического моделирования
- 2. Классификация математических моделей и методов моделирования
- 3. Аналитические модели
- 4. Имитационные модели
- 5. Эмпирико-статистические модели
- 5.1 Детерминированный анализ
- 5.2 Стохастический анализ
- 5.3 Дисперсионный анализ
- 5.4 Регрессионный анализ
- 5.5 Методы распознавания образов
- 6. Методы и модели искусственного интеллекта
- 7. Информационные технологии в экологии
- 7.1 Экологические информационные системы
- 7.2 Геоинформационные системы
- Список использованной литературы
- Введение
- Использование математических и информационных методов в экологии является непременным условием грамотного построения исследований и обработки информации на любом уровне иерархии живых систем. Безопасное управление природными процессами, особенно с учетом техногенных факторов, невозможно без прогнозирования ситуаций, что делает необходимым применение математических методов и моделей.
- Преимущества математических моделей состоят в том, что они позволяют делать предсказания, которые можно сравнить с реальными данными, поставив эксперимент или проведя необходимые наблюдения. Однако необходимо помнить, что любая математическая модель учитывает лишь некоторые стороны реальности, но не все. Поэтому важным этапом в построении модели является проверка ее адекватности, сопоставление результатов моделирования с эмпирическими данными.
- Упорядочивая массу накапливающихся сведений, можно надеяться, что в будущем будет разработана некая концептуальная основа, которая позволит свести множество взятых в массе разнообразных фактов в стройную систему, вскрыть достаточно общие закономерности и разработать универсальную теоретическую основу экологии как науки, способной свести разнообразие изучаемых явлений к небольшому числу зависимостей, выраженных строгими математическими формулами и соответствующим набором констант.
- Если придерживаться той точки зрения, что теория - это теоретическая модель, дополненная набором правил, связывающих теоретические величины с нашими наблюдениями, то теория считается хорошей, когда она удовлетворяет двум требованиям: во-первых, она должна точно описывать широкий класс наблюдений в рамках модели, содержащей лишь несколько произвольных элементов, и, во-вторых, теория должна давать вполне определённые предсказания относительно результатов будущих наблюдений. Теория всегда приходит первой, она возникает из желания получить стройную математическую модель.
- Но любая теория всегда носит временный характер в том смысле, что является всего лишь гипотезой, которую нельзя доказать.
- Сколько бы раз ни констатировалось согласие теории с экспериментальными данными, нельзя быть уверенным в том, что в следующий раз эксперимент не войдёт в противоречие с теорией.
- В то же время любую теорию можно опровергнуть, сославшись на одно-единственное наблюдение, которое не согласуется с её предсказаниями.
Природные объекты являются сложными комплексными системами. Поэтому для решения проблем природопользования все чаще применяют системный подход.
Прямое отождествление системно-аналитических принципов с методами кибернетики или с математическим моделированием является слишком узкой их трактовкой, хотя в виде идеологически-концептуальной основы системный подход можно представить как упорядоченную и логическую организацию данных и информации в виде моделей.
Основные принципы системологии были озвучены рядом ученых, в их числе Флейшман и Розенберг:
- принцип эмерджентности, принцип не сводимости свойств целого к сумме свойств его частей, важную роль которого в экологии особо подчеркивает Ю. Одум, он считает, что этот принцип "... должен служить первой рабочей заповедью экологов";
- принцип иерархической организации (или принцип интегративных уровней);
- принцип несовместимости сформулировал Л. Заде: чем глубже анализируется реальная сложная система, тем менее определенны наши суждения о ее поведении;
- принцип контринтуитивного поведения Дж. Форрестера: дать удовлетворительный прогноз поведения сложной системы на достаточно большом промежутке времени, опираясь только на собственный опыт и интуицию, практически невозможно.
1. Экологическая система как объект математического моделирования
Любая единица (биосистема), включающая все совместно функционирующие организмы (биотическое сообщество) на данном участке и взаимодействующая с физической средой таким образом, что поток энергии создает четко определенные биотические структуры и круговорот вещества между живой и неживой частями, представляет собой экологическую систему, или экосистему… Экосистемы представляют собой открытые системы, поэтому важной составной частью концепции является среда на входе и среда на выходе.
Рис. 1. Взаимосвязь компонентов экосистемы с окружающей средой
Важнейшее понятие - "сложность системы" может быть оценена на двух уровнях:
- сложность на "структурном уровне", которая определяется числом элементов системы и связей между ними (морфологическая сложность);
- сложность на "поведенческом уровне" - набор реакций системы на внешние возмущения или степень эволюционной динамики (функциональная сложность).
Определить, что такое "сложная система" на структурном уровне не представляется реалистичным, хотя большинство биологов интуитивно убеждены, что все экосистемы имеют морфологически сложное строение. Б.С. Флейшман предложил пять принципов усложняющегося поведения систем, представленных на схеме и позволяющих оценить функциональную сложность (рис. 2).
Сложность поведения систем первого уровня определяется только законами сохранения в рамках вещественно-энергетического баланса (такие системы изучает классическая физика). Особенностью систем второго уровня является появление обратных связей; определяющим для них становится принцип гомеостаза, что и задает более сложное их поведение (функционирование таких систем изучает кибернетика). Еще более сложным поведением обладают системы третьего уровня, у которых появляется способность "принимать решение", т.е. осуществлять некоторый выбор из ряда вариантов поведения ("стимул - реакция").
Рис. 2. Принципы усложняющегося поведения систем
Так, Н.П. Наумов показал, что возможен опосредованный через среду обитания обмен опытом между особями, поколениями одного вида и разными видами, т.е., по существу, обмен информацией. Системы четвертого уровня выделяются по наличию достаточно мощной памяти (например, генетической) и способности осуществлять перспективную активность или проявлять опережающую реакцию ("реакция - стимул") на возможное изменение ситуации - эффект преадаптации.
Наконец, пятый уровень сложности объединяет системы, связанные поведением интеллектуальных партнеров, предугадывающих многоходовые возможные действия друг друга. Этот тип поведения имеет отношение, в основном, к социальным аспектам взаимодействия "Человек - Природа".
Наконец, все свойства сложных систем делятся на простые (аддитивные; например, биомасса некоторого сообщества) и сложные (неаддитивные; например, устойчивость экосистемы).
Описание любой сложной системы состоит из трех компонентов: морфологической, функциональной и информационной.
Морфологическое описание должно давать полное представление о строении системы и представляет собой четверку конечных множеств:
Sм = {S--,--V,--s--,--K} ,
где S--=--{--S i} - множество элементов и их свойств; V = { Vi } - множество связей; s - структура; K - композиция. Морфологическое описание, как правило, иерархично, причем уровень детализации (глубина описания) зависит от задачи, поставленной исследователем.
Под элементом понимается подсистема, внутрь которой морфологическое описание уже не проникает. Элементный состав может содержать однотипные (гомогенные системы) и разнотипные (гетерогенные системы) элементы.
Структурные свойства систем определяются характером и устойчивостью отношений между элементами. По характеру отношений между элементами структуры делятся на многосвязные и иерархические.
Композиционные свойства систем определяются способом объединения элементов в функциональные группы и соотношением этих групп.
Различают следующие группы элементов и подсистем:
- эффекторные - способные преобразовывать воздействия и воздействовать веществом и энергией на другие подсистемы (например, техногенные компоненты экосистем);
- рецепторные - способные преобразовывать внешние воздействия в информационные сигналы, передавать и переносить информацию (биоиндикаторные компоненты);
- рефлексивные - способные воспроизводить внутри себя процессы на информационном уровне (измеряющие компоненты).
Функциональное описание. Сложная система, как правило, многофункциональна. Функции любой системы можно распределить по возрастающим рангам, примерно следующим образом:
- пассивное существование (материал для других систем);
- обслуживание системы более высокого порядка;
- противостояние другим системам или среде (выживание);
- поглощение других систем и среды (экспансия);
- преобразование других систем и среды.
Функциональное описание системы, как и морфологическое описание, как правило, иерархично. Для каждого элемента, частной подсистемы и всей системы в целом функциональность задается набором параметров морфологического описания Х (включая воздействия извне), числовым функционалом Y, оценивающим качество системы, и некоторым математическим оператором детерминированного или стохастического преобразования Y, определяющим зависимость между состоянием входа Х и состоянием выхода
Y: Y = Y (X).
Как видно из приведенной выше схемы принципов усложняющегося поведения, функция отклика Y подсистемы верхнего уровня зависит от функций, описывающих внутренние процессы подчиненных подсистем.
Из общей теории моделирования физических систем принято выделять пять групп параметров с точки зрения способа их использования в моделях:
1. входные параметры - V = (v1,v2,…,vk), - значения которых могут быть измерены, но возможность воздействия на них отсутствует (применительно к моделям экосистем, к таковым можно отнести солнечную активность, глобальные климатические явления, неуправляемую хозяйственную деятельность человека и т.д.);
2. управляющие параметры - U = (u1,u2,…,ur), - с помощью которых можно оказывать прямое воздействие в соответствии с теми или иными требованиями, что позволяет управлять системой (к ним можно отнести ряд целенаправленных мероприятий по охране и восстановлению природной среды);
3. возмущающие (стохастические) воздействия - x--=--(x--1,x--2,…,x l), - значения которых случайным образом меняются с течением времени и которые недоступны для измерения, создавая дисперсию неучтенных условий или шум;
4. параметры состояния - X = (x1,x2,…,xn) - множество внутренних параметров, мгновенные значения которых определяются текущим режимом функционирования экосистемы и, в конечном итоге, являются результатом суммарного воздействия входных, управляющих и возмущающих факторов, а также взаимного влияния других внутрисистемных компонентов;
5. выходные (целевые или результирующие) параметры - Y = (y1,y2,…,ym) - некоторые специально выделенные параметры состояния (либо некоторые функции от них), которые являются предметом изучения (моделирования, оптимизации) и которые используются в качестве критерия "благополучия" всей экосистемы.
2. Классификация математических моделей и методов моделирования
При классификации экологических моделей могут быть использованы различные подходы.
Обычно выделяют следующие группы математических методов:
I - стандартные статистические методы;
II - многомерные методы (множественная регрессия и многофакторный дисперсионный анализ);
III - отклонение от нормальности, непараметрические методы;
IV - таблицы сопряженности и множественные сравнения;
V - марковские случайные процессы;
VI - дифференциальные уравнения.
Группы II и III характеризуют более продвинутые (сложные) методы по сравнению c группой I. Группу III характеризуют методы, в которых, в отличие от базовых, не выполняется предположение о нормальности данных, а в группе II представлены многофакторные методы. Группы IV характеризуется акцентом на дискретную природу факторов. Наконец, группы V и VI связаны с построением динамических моделей - вероятностных и детерминистских. Подробнее о статистических методах можно ознакомится на сайте www.biometrica.tomsk.ru, динамические модели в биологии и экологии можно найти на www.dmb.biophys.msu.ru.
Моделирование - это один из важнейших методов научного познания, с помощью которого создается модель (условный образ) объекта исследования. Сущность его заключается в том, что взаимосвязь исследуемых явлений и факторов передается в форме конкретных математических уравнений.
Процесс построения математической модели включает в себя следующие типовые этапы:
- формулирование целей моделирования;
- качественный анализ экосистемы, исходя из этих целей;
- формулировку законов и правдоподобных гипотез относительно структуры экосистемы, механизмов ее поведения в целом или отдельных частей (при самоорганизации эти законы "находит" компьютер);
- идентификацию модели (определение ее параметров);
- верификацию модели (проверку ее работоспособности и оценку степени адекватности реальной экосистеме);
- исследование модели (анализ устойчивости ее решений, чувствительности к изменениям параметров и пр.) и эксперимент с ней.
Составить строгую единую классификацию математических моделей, различающихся по назначению, используемой информации, технологии конструирования и т.п., принципиально невозможно, хотя версий таких классификаций существует достаточно много.
В.В. Налимов делит математические модели в биологии на два класса - теоретические (априорные) и описательные (апостериорные). П.М. Брусиловский видит математическую экологию как мультипарадигматическую науку с четырьмя симбиотическими парадигмами: вербальной, функциональной, эскизной и имитационной.
Можно перечислить и другие основания для классификации моделей:
- природа моделируемого объекта (наземные, водные, глобальные экосистемы) и уровень его детализации (клетка, организм, популяция и т.д.);
- используемый логический метод: дедукция (от общего к частному) или индукция (от частных, отдельных факторов к обобщающим);
- статический подход или анализ динамики временных рядов (последний, в свою очередь, может быть ретроспективным или носить прогнозный характер);
- используемая математическая парадигма (детерминированная и стохастическая).
Наконец, по целям исследования, технологии построения, характеру используемой информации и просто для удобства последующего изложения все методы математического моделирования можно разделить на четыре класса:
- аналитические (априорные);
- имитационные (априорно-апостериорные) модели;
- эмпирико-статистические (апостериорные) модели;
- модели, в которых в той или иной форме представлены идеи искусственного интеллекта (самоорганизация, эволюция, нейросетевые конструкции и т.д.).
3. Аналитические модели
Аналитические модели (англ. analytical models) - один из классов математического моделирования, широко используемый в экологии. При построении таких моделей исследователь сознательно отказывается от детального описания экосистемы, оставляя лишь наиболее существенные, с его точки зрения, компоненты и связи между ними, и использует достаточно малое число правдоподобных гипотез о характере взаимодействия компонентов и структуры экосистемы. Аналитические модели служат, в основном, целям выявления, математического описания, анализа и объяснения свойств или наблюдаемых феноменов, присущих максимально широкому кругу экосистем. Так, например, широко известная модель конкуренции Лотки-Вольтерра позволяет указать условия взаимного сосуществования видов в рамках различных сообществ.
Одной из основных задач системной динамики является оценка устойчивости экосистем и описание качественных перестроек их поведения под воздействием внешних факторов. Наиболее адекватным математическим аппаратом построения и анализа таких аналитических моделей служит качественная теория дифференциальных уравнений и теория бифуркаций. Особую роль играют стохастические модели потенциальной эффективности экосистем Б.С. Флейшмана.
При моделировании экосистем возникает также необходимость в исследовании диссипативных структур, энтропийных характеристик и процессов самоорганизации. А.Дж. Вильсоном излагается общая теория энтропийных моделей многокомпонентных экосистем, где взаимодействия на микроуровне описываются статистикой Больцмана. Г. Шустер приводит примеры моделей динамики популяций в открытых системах, полученные на основе теории стохастического поведения динамических диссипативных структур. Работа Дж. Николиса относится к области синергетики и исследует процессы самоорганизации открытых иерархических экосистем в ходе диссипации новой информации.
В качестве примера аналитической модели гидробиологических процессов "цветения водохранилищ" можно привести работы С.В. Крестина и Г.С. Розенберга, где в рамках взаимодействий систем конкуренции видов и "хищник - жертва" дано возможное объяснение феномена вспышек численности сине-зеленых водорослей и более сложного процесса "волны цветения" по профилю водохранилища.
4. Имитационные модели
Имитационные модели (англ. simulation models) - один из основных классов математического моделирования. Целью построения имитаций является максимальное приближение модели к конкретному (чаще всего уникальному) экологическому объекту и достижение максимальной точности его описания. Имитационные модели претендуют на выполнение как объяснительных, так и прогнозных функций, хотя выполнение первых для больших и сложных имитаций проблематично (для удачных имитационных моделей можно говорить лишь о косвенном подтверждении непротиворечивости положенных в их основу гипотез).
Имитационные модели реализуются на ЭВМ с использованием блочного принципа, позволяющего всю моделируемую систему разбить на ряд подсистем, связанных между собой незначительным числом обобщенных взаимодействий и допускающих самостоятельное моделирование с использованием своего собственного математического аппарата (в частности, для подсистем, механизм функционирования которых неизвестен, возможно построение регрессионных или самоорганизующихся моделей). Такой подход позволяет также достаточно просто конструировать, путем замены отдельных блоков, новые имитационные модели. Если имитационные модели реализуются без блочного принципа, можно говорить о квазиимитационном моделировании. Имитации, в которых все коэффициенты определены по результатам экспериментов над конкретной экосистемой, называются портретными моделями.
Методы построения имитационных моделей чаще всего основываются на классических принципах системной динамики Дж. Форрестера. Создание имитационных моделей сопряжено с большими затратами. Так, модель ELM (злаковниковой экосистемы, используемой под пастбище) строилась 7 лет с годовым бюджетом программы в 1,5 млн. долл. около 100 научными сотрудниками из более 30 научных учреждений США, Австралии и Канады.
Построение имитационной модели может служить организующим началом любого серьезного экологического исследования. Хотя частная экосистема реки или озера и является элементарной ячейкой биосферы, ее математическая модель описывается системами уравнений того же порядка сложности, что и вся биосфера в целом, поскольку требует учета такого же большого количества переменных и параметров, описывающих функционирование отдельных подсистем и элементов (только на ином масштабном уровне). Поэтому исследователи ищут разумный компромисс: при составлении моделей многие параметры берутся агрегировано, допускаются разного рода аппроксимации и гипотезы, многие коэффициенты принимаются "по аналогии" с другими объектами и т.д. Поскольку среди допущений и предположений трудно выбрать наилучшее, снижается точность и познавательная ценность моделей, а, следовательно, их практическая применимость.
В настоящее время можно отметить два направления развития имитационного моделирования, где предлагаются достаточно конструктивные методы компенсации априорной неопределенности, проистекающей от нестационарного и стохастического характера экологических систем. Первое направление оформилось в виде методики решения задач идентификации и верификации как последовательного процесса определения и уточнения численных значений коэффициентов модели. Второе направление связано со стратегией поиска скрытых закономерностей моделируемой системы и интеграции их в модель.
5. Эмпирико-статистические модели
Эмпирико-статистические модели объединяют в себе практически все биометрические методы первичной обработки экспериментальной информации. Основная цель построения этих моделей состоит в следующем:
- упорядочение или агрегирование экологической информации;
- поиск, количественная оценка и содержательная интерпретация причинно-следственных отношений между переменными экосистемы;
- оценка достоверности и продуктивности различных гипотез о взаимном влиянии наблюдаемых явлений и воздействующих факторов;
- идентификация параметров расчетных уравнений различного назначения.
Часто эмпирико-статистические модели являются "сырьем" и обоснованием подходов к построению моделей других типов (в первую очередь, имитационных).
Важным методологическим вопросом является определение характера зависимости между факторами и результативными показателями: функциональная она или стохастическая, прямая или обратная, прямолинейная или криволинейная и т.д. Здесь используются теоретико-статистические критерии, практический опыт, а также способы сравнения параллельных и динамичных рядов, аналитических группировок исходной информации, графические методы и др.
5.1 Детерминированный анализ
Детерминированный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит явно выраженный функциональный характер, т.е. когда результативный показатель представляется в виде произведения, частного или алгебраической суммы исходных факторов. Многочисленными примерами детерминированного подхода являются методики расчета различных гидрохимических и гидробиологических индексов.
В этих случаях исследователь сам берет на себя ответственность в том, что:
- причинно-следственная связь между изучаемыми явлениями действительно существует;
- эта связь носит именно постулируемый функциональный характер (аддитивный, мультипликативный, кратный или смешанный с заранее подобранными коэффициентами, отражающими субъективный опыт разработчика).
Методика применения детерминированного анализа данных мониторинга для целей экологического контроля природной среды размещена на http://www.chronos.msu.ru/RREPORTS/levich_metodika_primen/levich_metodika_primen.htm.
5.2 Стохастический анализ
Стохастический анализ представляет собой обширный класс методов, опирающихся на теоретико-вероятностные представления, теоремы, критерии и методы параметрической и непараметрической статистики.
Исходный объект в любой системе обработки данных - это эмпирический ряд наблюдений или выборка. Выборки, описывающие явления и процессы в экосистеме, находятся во взаимосвязи, взаимозависимости и обусловленности. При этом каждое явление можно рассматривать и как причину, и как следствие. Одни выборки могут быть непосредственно связаны между собой, образуя подмножества сопряженных данных, другие могут соотноситься друг с другом косвенно.
Основной объект изучения параметрической статистики - это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым конкретное распределение результатов экологических наблюдений должно входить в то или иное параметрическое семейство. В подавляющем большинстве реальных ситуаций таких предположений сделать нельзя, но, тем не менее, приближение реального распределения с помощью кривых из семейства Пирсона или его подсемейств часто не является чисто формальной операцией. Закономерности расчета описательных статистик в зависимости от распределения эмпирического ряда хорошо известны: если вероятностная модель основана на нормальном распределении, то расчет математического ожидания предусматривает суммирование независимых случайных величин; если же модель приближается к логарифмически нормальному распределению, то итог естественно описывать как произведение таких величин и т.д. Непараметрические методы основаны на коэффициентах ранговой корреляции, носящих имена статистиков.
5.3 Дисперсионный анализ
Любая выборка экологических данных является принципиально неоднородной, поскольку измерения могут осуществляться в различные временные периоды, разных пространственных точках, с использованием различных инструментальных методов и т.д. В связи с этим, важным этапом математической обработки является дисперсионный анализ, с помощью которого оценивается, имеют ли место статистические различия между отдельными подмножествами данных и можно ли считать их принадлежащими одной генеральной совокупности.
Основной целью дисперсионного анализа является исследование значимости различия между средними. Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или t-критерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений).
Может показаться странным, что процедура сравнения средних называется дисперсионным анализом. В действительности, это связано с тем, что при исследовании статистической значимости различия между средними двух (или нескольких) групп, мы на самом деле сравниваем (т.е. анализируем) выборочные дисперсии. Фундаментальная концепция дисперсионного анализа предложена Фишером в 1920 году. Возможно, более естественным был бы термин анализ суммы квадратов или анализ вариации, но в силу традиции употребляется термин дисперсионный анализ.
Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (от английского Sum of Squares - Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты.
Рассмотрим следующий набор данных:
Группа 1 |
Группа 2 |
||
Наблюдение 1 Наблюдение 2 Наблюдение 3 |
2 3 1 |
6 7 5 |
|
Среднее Сумма квадратов (СК) |
2 2 |
6 2 |
|
Общее среднее Общая сумма квадратов |
4 28 |
математический моделирование информационный экология
Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2. Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислить SS исходя из общего среднего этих двух выборок, то получим величину 28. Иными словами, дисперсия (сумма квадратов), основанная на внутригрупповой изменчивости, приводит к гораздо меньшим значениям, чем при вычислении на основе общей изменчивости (относительно общего среднего). Причина этого, очевидно, заключается в существенной разнице между средними значениями, и это различие между средними и объясняет существующее различие между суммами квадратов.
Таблицей дисперсионного анализа будет:
ГЛАВНЫЙ ЭФФЕКТ |
||||||
SS |
ст.св. |
MS |
F |
p |
||
Эффект Ошибка |
24.0 4.0 |
1 4 |
24.0 1.0 |
24.0 |
.008 |
Как видно из таблицы, общая сумма квадратов SS = 28 разбита на компоненты: сумму квадратов, обусловленную внутригрупповой изменчивостью (2+2=4; см. вторую строку таблицы) и сумму квадратов, обусловленную различием средних значений между группами (28-(2+2)=24; см первую строку таблицы). Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (ст.св).
SS ошибок и SS эффекта. Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.
Проверка значимости. Проверка значимости в дисперсионном анализе основана на сравнении компоненты дисперсии, обусловленной межгрупповым разбросом (называемой средним квадратом эффекта или MSэффект) и компоненты дисперсии, обусловленной внутригрупповым разбросом (называемой средним квадратом ошибки или MSошибка; эти термины были впервые использованы в работе Edgeworth, 1885). Если верна нулевая гипотеза (равенство средних в двух популяциях), то можно ожидать сравнительно небольшое различие выборочных средних из-за чисто случайной изменчивости. Поэтому, при нулевой гипотезе, внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета групповой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F-критерия, проверяющего, действительно ли отношение дисперсий значимо больше 1. В рассмотренном выше примере F-критерий показывает, что различие между средними статистически значимо (значимо на уровне 0.008).
Основная логика дисперсионного анализа. Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Зависимые и независимые переменные. Переменные, значения которых определяется с помощью измерений в ходе эксперимента (например, балл, набранный при тестировании), называются зависимыми переменными. Переменные, которыми можно управлять при проведении эксперимента (например, методы обучения или другие критерии, позволяющие разделить наблюдения на группы или классифицировать) называются факторами или независимыми переменными.
Множество факторов. Мир по своей природе сложен и многомерен. Ситуации, когда некоторое явление полностью описывается одной переменной, чрезвычайно редки. Например, если мы пытаемся научиться выращивать большие помидоры, следует рассматривать факторы, связанные с генетической структурой растений, типом почвы, освещенностью, температурой и т.д. Таким образом, при проведении типичного эксперимента приходится иметь дело с большим количеством факторов. Основная причина, по которой использование дисперсионного анализа предпочтительнее повторного сравнения двух выборок при разных уровнях факторов с помощью серий t-критерия, заключается в том, что дисперсионный анализ существенно более эффективен и, для малых выборок, более информативен. Вам нужно сделать определенные усилия, чтобы овладеть техникой дисперсионного анализа, реализованной на STATISTICA, и ощутить все ее преимущества в конкретных исследованиях.
Общий способ описания взаимодействий. В общем случае взаимодействие между факторами описывается в виде изменения одного эффекта под воздействием другого. Если изучается взаимодействие четырех факторов, можно сказать, что взаимодействие трех факторов, изменяется под воздействием четвертого фактора, т.е. существуют различные типы взаимодействий на разных уровнях четвертого фактора. Оказалось, что во многих областях взаимодействие пяти или даже большего количества факторов не является чем-то необычным.
Дополнительная информация по методам анализа данных, добычи данных, визуализации и прогнозированию содержится http://www.statsoft.ru/home/portal/default.asp) и в http://www.statsoft.ru/home/textbook/modules/stanman.html.
5.4 Регрессионный анализ
Основной задачей регрессионного анализа является идентификация вида функциональной зависимости Y ? f(X), восстанавливаемой по эмпирическим данным. Реальный мир в подавляющем большинстве случаев объективно нелинеен. В ряде случаев вид аппроксимирующего уравнения заранее предполагается из некоторых теоретических соображений. Нелогично описывать уравнением прямой или другими простыми алгебраическими функциями динамику рядов биологических показателей, характеризующихся "горбами", перегибами и прочими нестационарными атрибутами. В этом случае неоптимальность модели связана с ее недоопределенностью, когда сложность структуры аппроксимирующей функции недостаточна для отображения сложности изучаемого процесса. Сущность нахождения модели оптимальной сложности заключается в ее поэтапной структурной идентификации, т.е. одновременном определении оптимальной структуры и оценки параметров модели.
Например, можно предложить следующий порядок подгонки моделей:
- строится модель простой линейной регрессии и оценивается его адекватность, поскольку линейная форма модели в целом является более предпочтительной;
- если уравнение прямой выглядит неудовлетворительным, то рассматривается семейство простых алгебраических функций;
- в случае наличия многовершинности или периодичности данных, ищут аппроксимацию в классе полиномов, сплайнов или алгоритмов.
5.5 Методы распознавания образов
В математической литературе часто используется тождественное "классу" понятие "образа" и многие задачи классификации объединены под названием "проблемы распознавания образов". Наиболее удачно смысл этого термина сформулирован Н.Г. Загоруйко: "Под образом будем понимать наименование области в пространстве признаков, в которой отображается множество объектов или явлений реального мира".
Понятие "образа" может быть в разной степени абстрактным по отношению к изучаемым предметам и явлениям. Например, в объективной реальности не существует "экосистемы вообще", а существуют только отдельные измерения, наделенные некоторыми общими свойствами и объединенные исследователем в некоторый образ "экосистема".
В рассматриваемом случае классы эквивалентности с той или иной степенью обоснованности задаются самим исследователем, т.е. рассматривается задача "распознавания с учителем", что отличает ее от описанного выше кластерного анализа. При этом выделяемые самостоятельные единицы ("экземпляры") образов группируются на основе некоторых содержательных представлений или используется внешняя дополнительная информация о сходстве и различии объектов в контексте решаемой задачи.
Типология методов распознавания образов основывается на двух основных способов представления знаний:
o интенсиональное представление - в виде схемы связей между признаками;
o экстенсиональное представление - с помощью описаний конкретных объектов.
Предтечей математических методов распознавания образов явился дискриминантный анализ, предложенный в 1936 г. Р. Фишером (R. Fisher), - классическая ветвь биометрии, которая уже более 60 лет находит применение в самых разных областях биологической систематики и медицинской диагностики. Этот вид анализа обобщает несколько тесно связанных статистических процедур, относящихся к подмножеству линейных методов, поскольку модель классификации линейна относительно дискриминантных функций и напоминает множественную линейную регрессию. С другой стороны, основная идея дискриминантного анализа заключается в том, чтобы определить, отличаются ли совокупности по среднему значению линейной комбинации исходных переменных, и затем использовать эту комбинацию, чтобы предсказать для новых членов их принадлежность к той или иной группе. Поставленная таким образом задача о дискриминантной функции может быть сформулирована как задача многомерного дисперсионного анализа (МANOVA).
6. Методы и модели искусственного интеллекта
Искусственный интеллект ИИ (artificial intelligence) обычно трактуется как свойство автоматических систем брать на себя отдельные функции мыслительной способности человека, например, выбирать и принимать оптимальные решения на основе ранее полученного опыта и рационального анализа внешних воздействий. Речь идет, в первую очередь, о системах, в основу которых положены принципы обучения, самоорганизации и эволюции при минимальном участии человека, но привлечении его в качестве учителя и партнёра, гармоничного элемента человеко-машинной системы.
Естественно, что попытки создать ИИ на базе компьютеров начались на заре развития компьютерной техники. Тогда господствовала компьютерная парадигма, ключевыми тезисами которой утверждалось, что машина Тьюринга является теоретической моделью мозга, а компьютер - реализацией универсальной машины и любой информационный процесс может быть воспроизведён на компьютере. Такая парадигма была доминирующей долгое время, принесла много интересных результатов, но главной задачи - построения ИИ в смысле моделирования мышления человека, так и не достигла. Компьютерная парадигма создания ИИ, потерпевшая крах в связи с неправильным набором ключевых предпосылок, логично трансформировалась в нейроинформатику, развивающую некомпьютерный подход к моделированию интеллектуальных процессов. Человеческий мозг, оперирующий с нерасчленённой информацией, оказался значительно сложнее машины Тьюринга. Каждая человеческая мысль имеет свой контекст, вне которого она бессмысленна, знания хранятся в форме образов, которые характеризуются нечёткостью, размытостью, система образов слабо чувствительна к противоречиям. Система хранения знаний человека характеризуется высокой надёжностью вследствие распределённого хранения знаний, а оперирование с информацией характеризуется большой глубиной и высоким параллелизмом.
Переработка информации в любых интеллектуальных системах основывается на использовании фундаментального процесса - обучения. Образы обладают характерными объективными свойствами в том смысле, что разные распознающие системы, обучающиеся на различном материале наблюдений, большей частью одинаково и независимо друг от друга классифицируют одни и те же объекты. Именно эта объективность образов позволяет людям всего мира понимать друг друга. Обучением обычно называют процесс выработки в некоторой системе специфической реакции на группы внешних идентичных сигналов путем многократного воздействия на распознающую систему сигналов внешней корректировки. Механизм генерации этой корректировки, которая чаще всего имеет смысл поощрения и наказания, практически полностью определяет алгоритм обучения. Самообучение отличается от обучения тем, что здесь дополнительная информация о верности реакции системе не сообщается.
Интеллектуальные информационные системы могут использовать "библиотеки" самых различных методов и алгоритмов, реализующих разные подходы к процессам обучения, самоорганизации и эволюции при синтезе систем ИИ. Поскольку к настоящему времени нет ни обобщающей теории искусственного интеллекта, ни работающего образца полнофункциональной ИИ-модели, то нельзя сказать, какой из этих подходов является правильным, а какой ошибочным: скорее всего они способны гармонично дополнять друг друга. Подробнее о проблемах искусственного интеллекта можно узнать на сайтах www.ccas.ru и www.iseu.by/rus/educ/envmon.
Искусственный интеллект реализуется с использованием четырех подходов (с трудом удержимся, чтобы не произнести модное "парадигм"): логического, эволюционного, имитационного и структурного. Все эти четыре направления развиваются параллельно, часто взаимно переплетаясь.
Основой для логического подхода служит булева алгебра и ее логические операторы (в первую очередь, знакомый всем оператор IF ["если"]). Свое дальнейшее развитие булева алгебра получила в виде исчисления предикатов, в котором она расширена за счет введения предметных символов, отношений между ними, кванторов существования и всеобщности. Практически каждая система ИИ, построенная на логическом принципе, представляет собой машину доказательства теорем. При этом исходные данные хранятся в базе данных в виде аксиом, а правила логического вывода - как отношения между ними.
Для большинства логических методов характерна большая трудоемкость, поскольку во время поиска доказательства возможен полный перебор вариантов. Поэтому данный подход требует эффективной реализации вычислительного процесса, и хорошая работа обычно гарантируется при сравнительно небольшом размере базы данных. Примером практической реализации логических методов являются деревья решений, которые реализуют в концентрированном виде процесс "обучения" или синтеза решающего правила.
Добиться большей выразительности логическому подходу позволяет такое сравнительно новое направление, как нечеткая логика. После основополагающих работ Л. Заде термин fuzzy (англ. нечеткий, размытый) стал ключевым словом. В отличие от традиционной математики, требующей на каждом шаге моделирования точных и однозначных формулировок закономерностей, нечеткая логика предлагает совершенно иной уровень мышления, благодаря которому творческий процесс моделирования происходит на более высоком уровне абстракции, при котором постулируется лишь минимальный набор закономерностей. Например, правдивость логического высказывания может принимать в нечетких системах, кроме обычных "да / нет" (1/0), еще и промежуточные значения: "не знаю" (0.5), "пациент скорее жив, чем мертв" (0.75), "пациент скорее мертв, чем жив" (0.25) и т.д. Данный подход больше похож на мышление человека, который редко отвечает на вопросы только "да" или "нет". Теоретические основы и прикладные аспекты интеллектуальных систем оценивания и прогнозирования в условиях неопределенности, основанные на теории нечетких множеств, подробно изложены в литературных источниках [Аверкин с соавт, 1986; Борисов с соавт., 1989; Нетрадиционные модели.., 1991; Васильев, Ильясов, 1995].
Под термином "самоорганизация" понимается по мнению Ивахненко "процесс самопроизвольного (спонтанного) увеличения порядка, или организации в системе, состоящей из многих элементов, происходящий под действием внешней среды".
Принципы самоорганизации были предметом исследования многих выдающихся ученых: Дж. фон Неймана, Н. Винера, У.Р. Эшби и др. Большой вклад в развитие этого направления внесли работы украинских кибернетиков под руководством А.Г. Ивахненко, разработавших целый класс адаптивных самоорганизующихся моделей (англ. selforganisation models), который можно было бы назвать "интеллектуальным обобщением" эмпирико-статистических методов.
Можно отметить следующие принципы самоорганизации математических моделей:
- принцип неокончательных решений (предложен Д. Габором и заключается в необходимости сохранения достаточной "свободы выбора" нескольких лучших решений на каждом шаге самоорганизации),
- принцип внешнего дополнения (базируется на теореме К. Геделя и заключается в том, что только внешние критерии, основанные на новой информации, позволяют синтезировать истинную модель объекта, скрытую в зашумленных экспериментальных данных);
- принцип массовой селекции (предложен А.Г. Ивахненко и указывает наиболее целесообразный путь постепенного усложнения самоорганизующейся модели, с тем чтобы критерий ее качества проходил через свой минимум).
Для возникновения самоорганизации необходимо иметь исходную структуру, механизм случайных ее мутаций и критерии отбора, благодаря которому мутация оценивается с точки зрения полезности для улучшения качества системы. Т.е. при построении этих систем ИИ исследователь задает только исходную организацию и список переменных, а также критерии качества, формализующие цель оптимизации, и правила, по которым модель может изменяться (самоорганизовываться или эволюционировать). Причем сама модель может принадлежать самым различным типам: линейная или нелинейная регрессия, набор логических правил или любая другая модель.
Самоорганизующиеся модели служат, в основном, для прогнозирования поведения и структуры экосистем, так как по самой логике их построения участие исследователя в этом процессе сведено к минимуму. Можно привести ряд конкретных примеров использования алгоритмов МГУА: для долгосрочных прогнозов экологической системы оз. Байкал, моделирования геоботанических описаний; системы "хищник-жертва", прироста деревьев, прогнозирования токсикологических показателей поллютантов, оценки динамики численности сообществ зоопланктона.
В математической кибернетике различают два вида итеративных процессов развития систем:
- адаптация, при которой экстремум (цель движения системы) остается постоянной;
- эволюция, при которой движение сопровождается изменением и положения экстремума.
Если самоорганизация связана только с адаптационными механизмами подстройки реакций системы (например, изменением значений весовых коэффициентов), то понятие эволюции связано с возможностью эффектора (термин, введенный С. Лемом) изменять свою собственную структуру, т.е. количество элементов, направленность и интенсивность связей, настраивая их оптимальным образом относительно поставленных задач в каждый конкретный момент времени. В процессе эволюции в условиях сложной и меняющейся среды эффектор способен приобрести принципиально новые качества, выйти на следующую ступень развития. Например, в процессе биологической эволюции возникли чрезвычайно сложные и вместе с тем удивительно продуктивно функционирующие живые организмы.
Эволюционное моделирование представляет собой существенно универсальный способ построения прогнозов макросостояний системы в условиях, когда полностью отсутствует апостериорная информация, а априорные данные задают лишь предысторию этих состояний. Общая схема алгоритма эволюции выглядит следующим образом:
- задается исходная организация системы (в эволюционном моделировании в этом качестве может фигурировать, например, конечный детерминированный автомат Мили);
- проводят случайные "мутации", т.е. изменяют случайным образом текущий конечный автомат;
- отбирают для дальнейшего "развития" ту организацию (тот автомат), которая является "лучшей" в смысле некоторого критерия, например, максимальной точности предсказания последовательности значений макросостояний экосистемы.
Критерий качества модели в этом случае мало чем отличается, например, от минимума среднеквадратической ошибки на обучающей последовательности метода наименьших квадратов (со всеми вытекающими отсюда недостатками). Однако, в отличии от адаптации, в эволюционном программировании структура решающего устройства мало меняется при переходе от одной мутации к другой, т.е. не происходит перераспределения вероятностей, которые бы закрепляли мутации, приведшие к успеху на предыдущем шаге. Поиск оптимальной структуры происходит в большей степени случайным и нецеленаправленным, что затягивает процесс поиска, но обеспечивает наилучшее приспособление к конкретным изменяющимся условиям.
Под структурным подходом подразумеваются попытки построения систем ИИ путем моделирования структуры человеческого мозга. В последние десять лет впечатляет феномен взрыва интереса к структурным методам самоорганизации - нейросетевому моделированию, которое успешно применяется в самых различных областях - бизнесе, медицине, технике, геологии, физике, т.е. везде, где нужно решать задачи прогнозирования, классификации или управления.
Способность нейронной сети к обучению впервые была исследована Дж. Маккалоком и У. Питтом, когда в 1943 г. вышла их работа "Логическое исчисление идей, относящихся к нервной деятельности". В ней была представлена модель нейрона и сформулированы принципы построения искусственных нейронных сетей.
Крупный толчок развитию нейрокибернетики дал американский нейрофизиолог Ф. Розенблатт, предложивший в 1962 г. свою модель нейронной сети - персептрон. Воспринятый первоначально с большим энтузиазмом, персептрон вскоре подвергся интенсивным нападкам со стороны крупных научных авторитетов. И, хотя подробный анализ их аргументов показывает, что они оспаривали не совсем тот персептрон, который предлагал Розенблатт, крупные исследования по нейронным сетям были свернуты почти на 10 лет.
Другой важный класс нейронных систем был введен в рассмотрение финном Т. Кохоненом. У этого класса красивое название: "самоорганизующиеся отображения состояний, сохраняющие топологию сенсорного пространства". Теория Кохонена активно использует теорию адаптивных систем, которую развивал на протяжении многих лет академик РАН Я.З. Цыпкин.
Весьма популярна сейчас во всем мире оценка возможностей обучающихся систем, в частности, нейронных сетей, основанная на теории размерности, созданной в 1966 г. советскими математиками В.Н. Вапником и А.Я. Червоненкисом. Еще один класс нейроподобных моделей представляют сети с обратным распространением ошибок, в развитии современных модификаций которых ведущую роль сыграл проф. А.Н. Горбань и возглавляемая им красноярская школа нейроинформатики. Большую научную и популяризаторскую работу проводит Российская ассоциации нейроинформатики под руководством президента В.Л. Дунина-Барковского.
В основе всего нейросетевого подхода лежит идея построения вычислительного устройства из большого числа параллельно работающих простых элементов - формальных нейронов. Эти нейроны функционируют независимо друг от друга и связаны между собой однонаправленными каналами передачи информации. Ядром нейросетевых представлений является идея о том, что каждый отдельный нейрон можно моделировать довольно простыми функциями, а вся сложность мозга, гибкость его функционирования и другие важнейшие качества определяются связями между нейронами. Предельным выражением этой точки зрения может служить лозунг: "структура связей - все, свойства элементов - ничто".
Нейронные сети (НС) - очень мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости, нелинейные по свой природе. Как правило, нейронная сеть используется тогда, когда неизвестны предположения о виде связей между входами и выходами (хотя, конечно, от пользователя требуется какой-то набор эвристических знаний о том, как следует отбирать и подготавливать данные, выбирать нужную архитектуру сети и интерпретировать результаты).
Подобные документы
Теоретические проблемы социальной экологии. Информационные, математические и нормативно-технологические методы, их закономерности, специфика и объективная необходимость единства. Основные законы социальной экологии, их сущность, содержание и значение.
реферат [15,0 K], добавлен 29.03.2009Определение экологии. Основные разделы. Законы экологии. Организм и среда. Практическое значение экологии. Взаимодействие сельскохозяйственных и природных экосистем, сочетания окультуренных и естественных ландшафтов.
реферат [14,4 K], добавлен 25.10.2006Проблемы экологии: невозможность планеты справиться с отходами человеческой деятельности, с функцией самоочищения и ремонта. Современная экологическая ситуация на планете. Экологическая характеристика и загрязнение среды в Новомалыклинском районе.
контрольная работа [24,6 K], добавлен 02.03.2014Зарождение и становление экологии как науки. Взгляды Ч. Дарвина на борьбу за существование. Оформление экологии в самостоятельную отрасль знаний. Свойства "живого вещества" согласно учению В.И. Вернадского. Превращение экологии в комплексную науку.
реферат [36,5 K], добавлен 21.12.2009История термина медицинской экологии. Формирование нового направления на границе медицинских дисциплин и экологии. Объект и предмет этой дисциплины. Разработка мероприятий, обеспечивающих сохранение оптимального для здоровья людей экологического баланса.
презентация [598,5 K], добавлен 05.11.2014Типы систем в экологии. Задачи исследований и границы выделения системы во времени и пространстве. Целостность системы, принцип эмерджентности. Прямые и обратные связи в наземной экосистеме. Характеристика концептуальных принципов выделения систем.
презентация [1007,8 K], добавлен 03.04.2013Общие принципы и задачи моделирования. Общее понятие о модели хищник-жертва. Конкуренция двух видов. Ярусно-мозаичная концепция леса, гэп-моделирование. Математическая модель экосистемы бореальных лесов Восточной Сибири. Проблемы моделирования в экологии.
курсовая работа [20,8 K], добавлен 03.12.2012История развития экологии. Становление экологии как науки. Превращение экологии в комплексную науку, включающую в себя науки об охране природной и окружающей человека среды. Первые природоохранные акты на Руси. Биография Келлера Бориса Александровича.
реферат [24,9 K], добавлен 28.05.2012Особенности экологии района: основные проблемы Челябинской области в сфере экологии, влияние промышленных предприятий на экологию, пути и методы решения экологических проблем. Усовершенствование технологий по очистке природной среды от отходов.
доклад [10,9 K], добавлен 15.07.2008Влияние применения методов системы фэн шуй для улучшения экологии жилых, рабочих и учебных помещений. Изучение влияния ориентации по сторонам света входных дверей и окон на жизнедеятельность людей. Соответствие экологии жилища принципам системы фэн шуй.
дипломная работа [243,6 K], добавлен 03.07.2015