Параметрические модели популяционной динамики и их приложение к задачам демографии
Методики классификации моделей демографических систем и процессов на основе эндогенных и экзогенных связей. Параметрические аппроксимации процессов рождаемости и смертности. Влияние демографических характеристик на параметры экономического роста.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 11.08.2010 |
Размер файла | 2,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
3
Содержание
- Введение
- 1. Методологические принципы моделирования
- 1.1 Параметрические функциональные зависимости
- 1.2 Обзор популяционных моделей
- 1.3 Виды параметров
- 1.4 Основные положения, лежащие в основе построения моделей динамики популяций
- 2. Методики классификации моделей демографических систем и процессов на основе эндогенных и экзогенных связей
- 3. Параметрические аппроксимации процессов рождаемости и смертности
- 3.1 Введение
- 3.2 Требования к моделям аппроксимации возрастных распределений
- 3.3 Определение понятий и простейшие модели возрастного распределения рождений
- 3.4 Модель Романюка на основе кривой Пирсона
- 3.5 Общая модель рождаемости на основе гамма-распределения
- 3.6 Смысл статистического гамма-распределения
- 3.7 Модель с исчерпанной плодовитостью (последовательное рождение детей)
- 3.8 Двухэлементная модель рождаемости
- 3.9 Влияние на рождаемость факторов окружающей среды
- 3.10 Параметрическая аппроксимация закона распределения продолжительности жизни
- 3.11 Влияние на смертность факторов окружающей среды
- 3.12 Что такое "ресурс"?
- 4. Методы определения структур новорожденных по очередностям рождений
- 4.1 Введение в проблематику задачи
- 4.2 Используемые обозначения
- 4.3 Методика “точного совпадения данных"
- 4.4 Методика “подбора вероятностей” по очередностям
- 4.5 Методика параметрического моделирования без использования базового года
- 4.6 Условие корректности применения методик
- 4.7 Методика пропорционального распределения расчета прогноза двух лет
- 4.8 Методика пропорционального распределения неизвестных
- 5. Приближение стабильного населения и решение уравнения Лотки
- 6. Влияние неоднородности на темп роста численности популяции со стабильной возрастной структурой
- 6.1 Введение в проблему
- 6.2 Функция распределения по признаку
- 6.3 Дифференциальные и интегральные величины смертности и рождаемости
- 6.4 Модель унимодального распределения по признаку
- 6.5 Зависимость интегральной смертности от среднего дохода и дисперсии
- 6.6 Зависимость интегральной рождаемости от среднего дохода и дисперсии
- 6.7 Распределение по признаку с положительной нижней границей
- 6.8 Случай полимодального распределения по признаку
- 6.9 Зависимость коэффициента Лотки от среднего дохода и дисперсии
- 7. Макроэкономическая модель устойчивого развития населения
- 7.1 Введение в проблему
- 7.2 Модель Солоу, ее результаты и недостатки
- 7.3 Влияние демографических характеристик на параметры экономического роста
- 7.4 Модифицированная модель Солоу
- Заключение
- Выводы
- Приложения
- Литература
Введение
Данная работа посвящена развитию методик параметрического моделирования динамики популяций, и применению полученных результатов в актуальных прикладных экономико-демографических исследованиях.
Моделирование систем на основе анализа влияния эндогенных и экзогенных статистических показателей на параметры функциональных зависимостей является одним из перспективных путей решения теоретических и прикладных задач в этой области. В настоящее время благодаря усилиям многих исследователей в значительной мере разработана методология математического моделирования и достигнуты большие успехи в применении таких моделей в прикладных разработках.
В настоящей работе проведена систематизация и предпринята попытка развития параметрических методов моделирования динамики численности популяций и, в частности, населения, вводится понятие "информационного параметра" как отличительной черты цивилизованного общества от биологической популяции и рассматривается его участие в демографических процессах.
В работе уделено особое внимание параметрическому описанию распределения количества рождений от возраста матери и использованию этого описания для построения прогнозов изменения численности населения.
Одним из прикладных направлений данной работы была разработка методов восстановления демографических параметров по неполным временным статистическим рядам данных. В частности, с 1995 по 1998 год в государственных статистических исследованиях в демографии на Украине и в России приводятся статистические данные не по возрастному распределению рождаемости с учетом очередности рождения ребенка, а только по возрастному распределению полной рождаемости (количество детей, рожденных за год 1000 женщин некоторого возраста, либо численность женщин некоторого возраста и количество рожденных ими детей). Поэтому, если исследователя интересует полная информация по рождаемости, он оказывается в затруднительном положении. В настоящей работе предлагается методика по получению возрастного распределения по очередности рождений исходя из чисел родившихся по возрасту матери прогнозируемого года и статистических данных по годам, по которым имеется полная информация. На основе методики был разработан программный пакет, результаты расчетов которого приняты как рекомендуемые статистические величины для практического использования, например при планировании размеров выплат по детским пособиям.
Ещё одним из направлений данной работы было исследование влияния неоднородности популяции по какому-либо признаку на динамику её численности. Обычно при построении соответствующих моделей исследователи обычно делают предположения об однородности популяции по различным биологическим, а для населения - также по социальным, экономическим признакам и об однородности влияния внешней среды на процессы рождаемости и смертности. Это, как правило, не соответствует реальности и дает расхождение между моделируемыми и наблюдаемыми величинами. В данной работе приводятся некоторые результаты моделирования популяции со стабильной возрастной структурой, неоднородной по некоторому биологическому или социальному признаку.
В работе на основе полученного оригинального аналитического выражения для коэффициента Лотки (характеризующего скорость роста численности популяции со стабильной возрастной структурой) была также рассмотрена новая модификация широко известной макроэкономической модели Солоу, которая более точно учитывает взаимное влияние друг на друга экономических и демографических процессов, позволяя адекватно оценить роль различных информационных параметров в развитии системы.
1. Методологические принципы моделирования
1.1 Параметрические функциональные зависимости
Все экспериментальные и статистические данные, как правило, можно представить в табличном виде. Это и зависимость высоты полета снаряда при выстреле из пушки от времени, и распределение умерших в популяции по возрастным группам (таблицы смертности). Однако сами значения в такой таблице не могут дать представления о качественной стороне процесса, его механизме, хотя и являются максимально полными и точными эмпирическими данными. Для понимания происходящих процессов исследователи на основе табличных данных ищут производные величины, которые имеют статистический или физический смысл. Например, в случае таблиц смертности для сравнения условий жизни в двух популяциях на основе отдельных коэффициентов вычисляют среднюю ожидаемую продолжительность жизни, параметр, который обычно используют для оценки воздействия среды на организм отдельного индивидуума. В качестве других характеристик часто используют начало детородного периода, модальный возраст смерти и т.п.
Все эти показатели имеют статистическую природу и не могут сами по себе дать представления о механизме данного процесса. На основе только этих значений мы не в состоянии даже приближенно восстановить исходную таблицу. Однако они могут служить параметрами, определяемыми некоторой функциональной зависимости, которая является результатом математической записи наших знаний о таком механизме. Множество конкурирующих между собой гипотез дают соответствующее множество функциональных зависимостей, которые удовлетворяют (в приближении минимума среднеквадратического, интегрального или иного отклонения) исходным данным при некоторых значениях параметров. Некоторые параметры могут иметь не столько статистическую, сколько физическую природу, однако на их основе могут рассчитываться статистически измеримые величины исходя из вида функциональной зависимости. Имея некоторые критерии сравнения и отбора функциональных параметрических зависимостей, мы во многих случаях можем определить наиболее адекватный для рассматриваемого процесса механизм.
1.2 Обзор популяционных моделей
Математические модели воспроизводства численности и возрастной структуры широко представлены как в экологии и микробиологии для описания взаимодействия отдельных биологических видов с окружающей средой, так и в демографии для описания населения [12]. Ниже будут приведены наиболее широко известные модели.
Простейшим примером модели однородной популяции без учета половой и возрастной структуры служит простейшая модель Мальтуса, основоположника математических популяционных моделей, в конце 18-го века постулировавшего экспоненциальный закон роста численности популяции (по геометрической прогрессии). В современной интерпретации [39] эта модель имеет следующий вид:
Здесь N (t) - численность популяции, С - темп прироста численности популяции.
Поскольку при постоянном положительном темпе прироста численность в пределе стремится к бесконечности, а ресурсы окружающей среды, необходимые для воспроизводства, ограничены, закон Мальтуса применим лишь на ограниченных интервалах времени. Было предложено много моделей, более правильно описывающих реальную эволюцию популяций. До настоящего времени часто используется модель Ферхюльста, отображающая эффект стабилизации численности популяции при ограниченном количестве жизненно важных ресурсов, содержащихся в среде обитания биологического вида:
,
где К=const - так называемая "жизненная емкость" среды. Поскольку смертность в модели Ферхюльста пропорциональна численности, такая модель может описывать внутривидовую конкуренцию, например, за источники пищи.
Следующим шагом в математическом моделировании развития популяций было изучение сосуществования видов, как конкурирующих за общие ресурсы, так и связанных отношениями типа "хищник-жертва". Основополагающими здесь являются работы Вольтерра и Лотки [7]. Модель Вольтерра - Лотки имеет вид:
.
Здесь , - численность популяций каждого из видов, , - коэффициенты взаимодействия между видами, , - коэффициенты "жизненной емкости" среды для каждого вида, , - удельная скорость роста каждой из популяций при отсутствии взаимодействия и самоограничения. Анализ модели для конкретных систем проведен в [1, 4, 41].
Динамические модели роста численности популяций, приведенные выше, строились в предположении однородности популяции, причем переменными в моделях служили характеристики, усредненные по популяции. Реально же любая популяция существенно неоднородна, начиная с возрастного распределения и кончая различиями разных особей популяции в массе, размере, наборах фенотипических и генетических признаков. Интерес к распределенным моделям, описывающих данные неоднородности и их связь между собой, был вызван прикладными задачами в микробиологии.
Самым простым типом моделей, в которых учитывается возрастная структура популяции при условии однородности всех прочих биологических характеристик особей популяции одного возраста, являются дискретные возрастные модели, в которых популяция делится на конечное число возрастных групп. Если время так же моделируется дискретным образом, то динамика таких систем описывается системой разностных уравнений Лесли [63]:
где - вектор численности возрастных групп, L - матрица вероятностей перехода из одной возрастной группы в другую. Среди таких моделей в микробиологии наиболее часто используется двухвозрастная модель популяции клеток в проточном культиваторе, где популяция разбита на две группы: первая группа содержит "молодые" клетки, которые растут, но еще не могут делиться, члены второй группы ("старые") способны к делению с образованием двух "молодых" клеток [43, 71].
,
где - численность "молодых" клеток, - численность "старых" клеток, - среднее время созревания "молодой" клетки, - среднее время пребывания "старой" клетки в детородном периоде, - скорость протока через хемостат. Другим направлением моделирования было построение моделей с непрерывной функцией распределения популяции по возрастам. Пионерской в этой области является работа МакКендрика [68], но она осталась практически незамеченной современниками. В этой работе для функции плотности распределения был записан в дифференциальной форме закон сохранения числа особей. Повторно распределение было получено фон Ферстером [75] и затем исследовано многими авторами [28, 29, 43, 74]. Фактически моделирование экологических и демографических систем на основе уравнения МакКендрика - фон Ферстера для возрастной структуры популяции является неявным стандартом [8, 37, 39, 52, 56, 77]. Запишем систему уравнений для особей популяции женского пола (дальше - женщин). Для описания указанной модели используем следующие обозначения: - плотность численности женщин в данном возрасте в некоторый момент времени ; - полная численность женщин; - доля девочек среди новорожденных; и - заданные функции смертности и рождаемости. Тогда система уравнений, описывающая динамику численности популяции, будет иметь следующий вид:
Изменение во времени численности различных возрастных групп:
.
Количество новорожденных:
.
Исходное распределение численности популяции по возрастам:
.
Полная численность женщин:
.
Альтернативным направлением в моделировании является рассмотрение популяций, неоднородных по выборке определенных биологических признаков (размер и масса особи, состояние здоровья). Примером может служить аналитическая модель эволюции биологического сообщества типа “ресурс-потребитель" [30, 31]. Пусть p - некоторый биологический признак, - количество особей популяции, имеющих значение признака в пределах от p до p+dp.
Тогда:
Например, если в качестве биологического признака взять вес особи, то одним из простых видов зависимости смертности от веса тела может быть зависимость , отражающая ослабление организма, снижение сопротивляемости болезням, хищникам в результате истощения при условии жесткой конкуренции в природных популяциях.
1.3 Виды параметров
Необходимо отметить, при описании процессов динамики численности, протекающих как в биологической популяции, так и в населении, применяются одинаковые математические конструкции и модели. Подобная эффективность междисциплинарного подхода связана с общебиологической природой процессов, определяющих динамику численности различных популяций и народонаселения. Различия начинаются при определении смысла получаемых параметров.
По отношению к отдельной особи любой популяции все влияющие на нее факторы и процессы можно разделить на внутренние (биологические, генетические) и внешние (влияние окружающей среды). Соответственно параметры, характеризующие эти процессы, можно подразделить на внутренние и внешние.
Если отдельные особи биологической популяции вынуждены приспосабливаться к постоянно изменяющимся условиям окружающей среды, то человек создал цивилизацию - своеобразную технологическую прослойку между отдельной личностью и окружающей средой, ослабляющую негативное влияние последней. Часть процессов, воздействующих на человека, созданы самим обществом, и являются управляемыми. По отношению к человеку внешние параметры можно подразделить на параметры, характеризующие энергетические и информационные взаимодействия с окружающей средой [61, 62]. Одной из целей настоящей работы и является выявление и определение влияния некоторых характерных "информационных" параметров на динамику численности населения. На рис.1.1 представлен пример построения иерархии параметров, влияющих на динамику численности популяции, использованной в данной работе.
Рис.1.1 Схема построения иерархии параметров, влияющих на динамику численности популяции.
Здесь t - время, x - возраст, p - ресурс, Bbio (x) - биологическое распределение рождений по возрастам, Bsoc (p) - коэффициент социальных рождений, Mbio (x) - биологическая компонента смертности, Msoc (p) - социальная компонента смертности (см. главу 3).
Последовательность этапов построения такой иерархии достаточно очевидна:
Выделение двух основных процессов, влияющих на динамику численности закрытой популяции (населения) - рождаемости и смертности.
Параметрическое описание рождаемости и смертности с выделением параметров биологической и социальной природы.
Выявление функциональных зависимостей данных параметров от внешних (а если необходимо, то и внутренних) факторов.
Методический подход к построению моделей, реализованный в данной работе, включает (см. также [40]):
Рассмотрение исходных положений, лежащих в основе построения моделей динамики популяций.
Анализ ряда факторов, влияющих на процессы рождаемости и смертности.
Построение параметрических функциональных аппроксимаций рождаемости и смертности с использованием "физических" представлений о моделях процессов.
Выявление параметров в различных процессах, которые могут быть определены независимым образом из статистических демографических и социологических данных.
Выявление параметров, отвечающих за энергетическое и информационное взаимодействие с окружающей средой.
Различные разделы настоящей диссертации посвящены описанию реализации данных этапов на примере решения различных теоретических и прикладных задач экологии и демографии.
1.4 Основные положения, лежащие в основе построения моделей динамики популяций
В 1900 году Гильберт выступил в Париже на II Международном конгрессе математиков со знаменитым докладом "Математические проблемы". "Когда речь идет о том, чтобы исследовать основания какой-нибудь науки, то следует установить систему аксиом, содержащих точное и полное описание тех соотношений, которые существуют между элементарными понятиями этой науки. Эти аксиомы являются одновременно определениями этих элементарных понятий, и мы считаем правильными только такие высказывания в области науки, основания которой мы исследуем, какие получаются из установленных аксиом с помощью конечного числа логических умозаключений" - такими словами [34, стр.25] Гильберт предварил формулировку проблемы. Далее он высказал требования, предъявляемые к системе аксиом математической науки: независимость и непротиворечивость.
В том же докладе под номером шесть Гильберт сформулировал задачу "об аксиоматическом построении по этому же образцу (по образцу геометрии) тех физических дисциплин, в которых уже теперь математика играет выдающуюся роль: это в первую очередь теория вероятностей и механика" [34, стр.34].
В докладе Гильберт так определяет сущность своего понимания аксиоматического метода: "Я верю, что все, что может быть объектом научного исследования и достигшее уровня зрелости, достаточного для включения в некоторую теорию, подвластно аксиоматическому методу и через него косвенно математике. Обращаясь к более глубокому пласту аксиом... мы достигаем более глубокого проникновения в сущность научного мышления и еще яснее осознаем единство нашего знания. В проявлениях аксиоматического метода математика, как представляется, призвана играть лидирующую роль в науке в целом".
В начале 20-го века многие ученые отдали дань построению аксиоматики физики на основе геометрических моделей многомерного пространства, венцом чего явилось создание общей теории относительности. Однако многочисленные открытия в области квантовой физики, открытие сильных и слабых взаимодействий не дали возможности построения "единой теории поля", не смотря на продолжавшиеся усилия ученых по ее созданию.
В отличие от физики, отдельные разделы которой зародились еще в античные времена, экология и демография являются очень молодыми науками. К сожалению, до сих пор демографию относят к разделу общественных (читайте: неточных) наук, наряду с социологией, обществоведением и философией. Для большинства демографов математика в демографии сводится к применению математических методов статистики при построении и анализе таблиц смертности и рождаемости, построению прогноза численности населения на некоторый период. Часто идет обычная констатация фактов, полученных из анализа имеющихся статистических данных, но не их объяснение.
Разделами науки, близкими к математической демографии, являются математическая экология (теория эволюции популяций), микробиология (модели дифференциации клеток), моделирование социально-экономических систем (модели макроэкономического развития). Не смотря на то, что большинство использующихся в демографии моделей были получены при решении задач в этих смежных областях, исследователями часто проводится резкое разграничение демографических и биологических понятий и объектов.
Таким образом, демография сегодня только на пути к тому, чтобы по праву считаться наукой, в которой математика играет "выдающуюся" роль (по Гильберту). Поскольку большинство объектов и процессов в демографии (этнические, религиозные и культурные факторы) считаются трудно формализуемыми с точки зрения математики и поэтому недоступными количественному измерению, для них часто используется только качественное описание. В то же время их влияние на демографические процессы (рождаемость, смертность, миграцию) можно описать количественно.
Ниже приводится ряд положений, являющихся, по нашему мнению, наиболее существенными при построении моделей динамики популяции:
Основной динамической характеристикой популяции или любой ее части является численность.
Примечание. Часто при моделировании биологических популяций, таких как растения, микроорганизмы, в качестве основной характеристики удобнее брать биологическую массу, поскольку именно эта характеристика представляет интерес и является существенной для многих процессов. Однако расчет численности является эквивалентным, добавляя учет наличия отдельной особи, что актуально для демографии.
Все возможные характеристики можно разделить на набор характеристик численности популяции и ее частей, и набор характеристик признаков (ресурсные, пространственные, биологические, социальные и т.д.).
Для моделирования существенны только величины, характеризующие реальную популяции и ее части, которые являются количественно определяемыми и статистически измеримыми.
Все возможные характеристики популяции как объекта исследования можно разделить на параметры, характеризующие признаки объекта исследования (образующие пространство аргументов соответствующей размерности, например, возраст, пол, время, координаты в пространстве), и параметры, характеризующие состояние объекта исследования и являющиеся объектом изучения и моделирования (например, численность).
Все возможные характеристики можно разделить на внутренние и внешние по отношению к данной популяции или ее части (отдельному индивидууму).
Изменение некоторой характеристики численности популяции (или ее части) в любой момент времени пропорционально ее величине (то есть все уравнения эволюции численности являются дифференциальными уравнениями первого порядка по времени).
Примечание. При этом коэффициенты рождаемости, смертности и миграции могут нелинейным образом зависеть от численности различных частей популяции.
Решение системы уравнений, характеризующих эволюцию популяции, при заданных начальных и граничных условиях должно существовать и быть единственным.
Примечание. Если мы используем вероятностную трактовку, то данное требование относится к плотности вероятности распределения характеристик популяции (населения).
Вопрос о полноте, непротиворечивости и независимости данных утверждений остается открытым.
Введем обозначения:
- набор характеристик численности популяции и ее групп, проживающих в данном ограниченном пространстве (экологический ареал, химический реактор или чашка Петри).
- набор ресурсных, пространственных, биологических, социальных характеристик (как внутренних, так и внешних), влияющих на изменение численности населения.
t - время.
- возраст: .
- матрица связей между различными характеристиками численности популяции (причем не обязательно Aii=0).
Обобщенное уравнение динамики популяций:
Дополнительно формулируются начальные (t=0) и граничные условия, замыкающие систему уравнений.
Анализ дополнительных упрощений, предположений и свойств, таких как экспоненциальный рост, самоограничение, конкуренция, дискретность или непрерывность, эндогенные или экзогенные параметры, и т.д., которые приводят к широко известным моделям, являющихся частными случаями обобщенного уравнения, позволяет предложить систему классификации существующих демографических и экологических моделей.
2. Методики классификации моделей демографических систем и процессов на основе эндогенных и экзогенных связей
В настоящей работе использована предложенная нами [49] классификация демографических и экономико-демографических математических моделей воспроизводства населения по системе взаимоотношений между экзогенными и эндогенными переменными и постоянными коэффициентами модели.
К моделям первого уровня в рамках классификации [49] относятся модели различной степени сложности (дискретные и непрерывные, детерминистские и вероятностные, с учетом возрастной структуры и без учета возрастной структуры, для однородного и неоднородного по каким-то параметрам населения), которые описывают воспроизводство популяции на основе использования различных популяционных процессов (рождаемости и смертности), являющихся эндогенными характеристиками конкретной модели при фиксированных внешних условиях. В этих моделях отсутствует явный учет экзогенных факторов, однако их влияние проявляется через величины используемых в моделях эндогенных характеристик.
Модели второго уровня - это модели воспроизводства популяции (населения), учитывающие зависимость тех или иных популяционных (демографических) процессов от внешних (экологических, экономических, социальных, культурных, правовых) факторов. Здесь задаются экзогенные характеристики без учета обратных связей, то есть без влияния на них популяционных процессов.
К моделям третьего уровня относятся модели воспроизводства населения, учитывающие обратные связи, то есть влияние друг на друга эндогенных демографических и экзогенных экономических, экологических и других факторов.
Обобщая все сказанное выше, сформулируем основные этапы, использованные в данной работе при построении экономико-демографических моделей в соответствии с данной классификацией:
Установление повозрастной плотности численности населения как основной характеристики объекта "население". Разделение характеристик совокупности "население-среда проживания" на эндогенные и экзогенные по отношению к объекту "население".
Качественное описание таких эндогенных характеристик, как смертность, рождаемость и миграция. Построение математических параметрических моделей для повозрастных распределений рождаемости и смертности исходя из следующих требований:
аппроксимация функциональными зависимостями реальных статистических данных с заданной точностью;
применимость функциональной зависимости в теоретическом анализе;
интерпретация параметров функциональных зависимостей через реальные, интегральные, статистически измеримые характеристики моделируемых процессов;
временная, пространственная и биологическая универсальность применяемых моделей.
Построение модели I уровня - демографической модели стабильного населения при фиксированном влиянии внешней среды. Решение уравнения Лотки - нахождение темпа прироста численности населения исходя из значений фиксированных параметров возрастного распределения эндогенных характеристик населения - смертности и рождаемости. Для простоты модель строится как точечная (нет распределения по пространству и миграции).
Построение связи I типа - качественное рассмотрение и математическая аппроксимация зависимости демографических характеристик от условий внешней среды. Введение интегрального параметра, обобщающего в себе степень замещения естественной природной среды на искусственную технократическую среду ("цивилизацию"), показатель защиты отдельных членов общества от неблагоприятных внешних условий и показатель эффективности распределения жизненно необходимых ресурсов, поступающих в общество из внешней среды.
Построение модели II уровня - интерпретация интегрального параметра как общественного богатства или обобщенного ресурса, которое население может производить, распределять и расходовать. Выражение значения этого параметра в единицах свободной энергии и (или) в денежном выражении как удельное потребление члена общества дает возможность построить модель изменения во времени количества общественного богатства как математическую модель экономики. Построение модели II уровня с однородным распределением общественного богатства среди членов общества.
Проведенные исследования дают возможность перейти к более сложным моделям, более адекватно описывающим реальное население:
Построение модели II уровня с фиксированным и нефиксированным неоднородным распределением общественного богатства среди членов общества.
Построение связей II типа - влияния основных демографических характеристик (смертность, рождаемость, брачность и миграция) на производство общественного богатства - долю трудоспособного населения, долю занятых в производстве, квалифицированность труда, темп научно-технического прогресса, распределение населения по доходам.
Построение глобальных моделей III уровня, вбирающих в себя эволюцию и взаимосвязи различных экзогенных и эндогенных характеристик населения, распределение плотности населения в пространстве и механизмы миграции, изменение во времени распределения населения по доходам [27, 42, 45].
Теперь перейдем к рассмотрению конкретных популяционных процессов - рождаемости и смертности.
3. Параметрические аппроксимации процессов рождаемости и смертности
3.1 Введение
При построении демографических и экологических моделей часто приходится описывать процессы, приводящие к появлению новых поколений в популяции: деление клеток, образование и пророст семян у растений, живорождение у млекопитающих. При построении моделей, учитывающих распределение популяции по возрасту, часто возникает проблема описания возрастного распределения рождений. С другой стороны, интересно понять сам механизм рождений, что в математической форме эквивалентно определению функционального вида зависимости, аппроксимирующей возрастное распределение рождений.
Заметим, что подобная работа активно ведется для процесса смертности (см. обзор [9]). Хотя в процессе старения и смерти организма изменяются множество его химических, физических и физиологических параметров, сложным образом взаимосвязанных между собой, именно в силу большого их количества возникают относительно простые функциональные выражения, описывающие статистические закономерности возрастного распределения смертности. Можно предположить, что это будет справедливо и для рождаемости, и для других сложных статистических биологических процессов.
В настоящей работе рассмотрены методика и основные принципы построения математических моделей, используемых для аппроксимации процессов рождаемости и смертности (построение связей I уровня согласно предложенной классификации). С этой точки зрения проанализирован ряд существующих моделей аппроксимации возрастной структуры рождений и предложено несколько новых моделей рождаемости.
3.2 Требования к моделям аппроксимации возрастных распределений
Не секрет, что в настоящий момент существует множество теорий о механизмах рождаемости и смертности [9, 36, 47, 56, 57, 58, 65, 66, 67, 73, 77] и соответствующее количество функциональных параметрических зависимостей, в математической форме воплощающих постулаты данных теорий. Естественным образом возникает вопрос о сравнении между собой различных законов распределения (поскольку в большом количестве работ утверждается, что используемая там модель - самая оптимальная на текущий момент). Для того, чтобы результаты, получаемые в результате математического моделирования, были корректными и поддавались обоснованной интерпретации, сформулируем несколько основных требований к выбору параметрического распределения, аппроксимирующего исследуемые характеристики [9, 51], которые и будем использовать при сравнении различных моделей:
Из опыта аппроксимации опытных или статистических данных известно, что некоторая функциональная зависимость аппроксимирует данные тем лучше, чем больше параметров (степеней свободы) содержится в данной зависимости. Таким образом, в качестве искомого закона распределения можно выбрать любую эмпирическую функциональную зависимость (например, многочлен), хорошо аппроксимирующую статистические данные. Хотя на определенных этапах развития науки такой подход был весьма плодотворен, к современным законам распределения необходимо выдвинуть требование теоретического обоснования модели как интерпретацию параметров модели через характерные измеряемые интегральные величины рассматриваемых явлений, с последующей проверкой на хорошую аппроксимацию статистических данных.
Насколько вид Homo sapiens отличается по биологической природе от других близких по физиологическому строению биологических видов? Считая, что отличия в структуре рождаемости и смертности обусловлены не качественным изменением биологического строения организма человека, а замещением части влияния “биологической” среды на влияние “искусственной” технократической среды, созданной самим человеком как “цивилизованный способ проживания", можно выдвинуть предположение об универсальности законов распределения смертности и рождаемости для различных биологических видов. Например, смертность населения и смертность некоторого биологического вида, живущего в искусственной среде обитания, созданного человеком, должны с примерно одинаковой эффективностью описываться одной и той же функциональной зависимостью с разными значениями параметров аппроксимации, отражающими влияние среды на выживание организма данного биологического вида.
Если мы пытаемся улучшить точность аппроксимации путем увеличения количества параметров в функциональной зависимости, в некоторый момент эффект введения дополнительного параметра будет нивелироваться погрешностью в получении самих статистических данных, усложнением теоретического анализа или другими причинами. Исходя из этого, можно сформулировать требование достаточной аппроксимации о нахождении оптимального количества параметров функциональной зависимости, необходимого для описания особенностей наблюдаемых данных.
Необходимо отметить еще один аспект математического моделирования процессов рождаемости и смертности. Статистически измеряемые повозрастные распределения как рождений, так и смертей являются не непрерывными функциями возраста, а некоторыми дискретными интегральными характеристиками, полученными при усреднении (и, как правило, дополнительном выравнивании) данных за некоторый период (1 год или 5 лет). Таким образом, для нахождения значения демографической характеристики для некоторого возраста из приведенных ниже непрерывных функций возраста можно взять значение функции в соответствующей целочисленной точке или среднее значение функции за некоторый период. При этом значения характерных величин распределения (например, модального возраста рождений, средняя продолжительность жизни), получаемые из оптимальных значений параметров распределения, могут не являться целочисленными величинами.
Как критерий ошибки аппроксимации некоторой функциональной зависимости (x) статистических данных в данной работе нами использовалась следующая интегральная характеристика:
,
где (j) - значения для целочисленных значений возраста. При расчетах использовался алгоритм нелинейной оптимизации, реализованный в Microsoft Excel (Сервис \ Поиск решения…) [25].
3.3 Определение понятий и простейшие модели возрастного распределения рождений
Под рождаемостью (полной рождаемостью, интенсивностью рождений) B () в дальнейшем мы будем понимать повозрастное распределение рождений, то есть среднее количество новорожденных за год, рожденных 1000 женщин в возрасте лет. Можно так же рассматривать количество новорожденных за год, в среднем приходящееся на 1000 женщин всех возрастов. В качестве наглядного примера приведем возрастное распределение рождений по Украине, 1985 год (рис.3.1):
Рис.3.1 Возрастное распределение рождений на Украине, 1985 год
Для рождаемости, подобно работе [15], мы рассматриваем полную рождаемость () как произведение биологической компоненты (биологическая способность женщины рожать ребенка - ) и множителя, принимающего значения от 0 до 1, отражающего влияние внешней социально-экономической среды и имеющего смысл коэффициента реализации видовой биологической продуктивности (коэффициент социального влияния - ):
.
Изменение возрастной структуры рождений как во времени, так и для обществ с различным уровнем экономического и социального развития можно качественно объяснить изменением представления общества об оптимальном числе детей в семье и, как следствие, изменением соотношений между собой долей детей различных очередностей рождений. Количественно связать изменение повозрастной структуры рождаемости с величиной удельного потребления на основании имеющихся у нас данных в настоящее время не представляется возможным (как одну из причин можно указать существенную неоднородность населения по социальным и экономическим признакам, по которой нет достаточного массива статистической информации). Поэтому в настоящей работе мы не обсуждаем историческое изменения повозрастной структуры рождаемости, которое может рассматриваться как следствие социально-экономических изменений, и формально рассматриваем повозрастную зависимость интенсивности рождений как исторически относительно стабильную характеристику в рамках биологической компоненты.
Рассмотрим структуру биологической компоненты. Здесь функциональная аппроксимация структуры зависит от того, существенна ли точная возрастная структура для модели. Если исследователю требуется указать лишь тот факт, что женщина за продуктивный период рожает Ф детей и средний возраст рождений о, пренебрегая точность описания самой возрастной структуры, он для упрощения теоретического анализа может воспользоваться распределением в виде дельта-функции:
,
где , .
Поскольку , f () - произвольная функция, непрерывная на интервале , о>0, то теоретический анализ модели значительно упрощается, что и было использовано в работе [32].
Если нам важно правильное описание распределения возрастной структуры рождений, то один из простейших способов аппроксимации - это трапеция (рис.3.2):
Рис.3.2 Аппроксимация возрастного распределения рождений в виде трапеции
Для биологической компоненты рождений площадь под графиком равна числу детей, в среднем рождаемых женщинами за свою жизнь в наименее развитых странах. В результате оценки исторических данных это число было принято нами равным 16, что и определило высоту трапеции - = 0,8. Хотя данная модель имеет достаточно слабое теоретическое обоснование, лишь качественно отображая тенденции возрастной динамики рождений, она удобна в качественном анализе эволюции демографических характеристик как кусочно-линейная функция.
3.4 Модель Романюка на основе кривой Пирсона
Одним из классических примеров подбора удачной математической аппроксимации рождаемости является трехпараметрическая (пяти-параметрическая с учетом произвольности выбора возраста вступления в детородный период и продолжительности детородного периода) модель Романюка на основе кривой Пирсона типа I [57]:
,
с дополнительным требованием .
Обозначим: - нижняя граница детородного периода, - верхняя граница детородного периода, - модальный возраст матери, - средний возраст матери при рождении детей. Тогда - продолжительность детородного периода; , - верхняя и нижняя границы интегрирования.
Параметры аппроксимации , , , через измеримые статистические величины можно выразить следующим образом:
- имеет смысл возрастного промежутка от начала детородного периода до модального возраста матери;
- имеет смысл возрастного промежутка от модального возраста матери до конца детородного периода;
,.
Поскольку при решении задачи оптимизации мы подбираем значения четырех параметров (модальный возраст рождений, средний возраст рождений, возраста начала и конца детородного периода), данная функциональная зависимость с высокой точностью описывает возрастное распределение рождений при возрастах матери выше модального возраста рождений. Как недостаток данной модели можно отметить существенную зависимость от выбора значения нижней детородной границы: для удовлетворительной аппроксимации приходится выбирать завышенный возраст начала детородного периода (), при этом рождаемость в более молодых возрастах не учитывается. Ошибка аппроксимации (критерий приведен в начале статьи) составляет для статистики по повозрастному распределению рождений на Украине в 1965, 1970, 1975, 1980, 1982, 1985, 1990, 1992, 1994-1997 годах (таблицы №1-2 в конце работы) в среднем 10,5%, причем ошибка распределения увеличивается для более поздней статистики с уменьшением значения коэффициента исчерпанной плодовитости.
Модель рождаемости Романюка имеет большое значение в исторической демографии для реконструкции возрастного распределения рождений по известным интегральным характеристикам рождаемости. К сожалению, использование модели в теоретическом анализе затруднено из-за сложного функционального вида и отсутствия ясной интерпретации функциональной зависимости и ее параметров через биологические и социальные характеристики.
3.5 Общая модель рождаемости на основе гамма-распределения
В наших работах [22, 49-56] предлагается метод математической аппроксимации рождаемости, более точно описывающий реальную возрастную структуру рождений. Используем зависимость следующего вида:
.
Здесь - возраст вступления женщины в детородный период, , n, - параметры функциональной зависимости, принимающие положительные значения.
Основными достоинствами предлагаемой аппроксимации являются аналитичность функции, аналитический вид результата интегрирования от нуля до бесконечности и возможность связывания параметров предлагаемой аппроксимации с реальными, легко определяемыми демографическими характеристиками:
- биологический коэффициент исчерпанной плодовитости:
.
- возраст максимальной рождаемости (модальный возраст):
.
- временной интервал между возрастом, когда женщина становится способна к деторождению, и возрастом максимальной рождаемости.
- максимальная рождаемость: .
Для коэффициентов n, , справедливы следующие оценки:
,,
Поскольку коэффициент социальных рождений входит как множитель, можно рассчитать коэффициенты функциональной зависимости и для любого реального повозрастного распределения рождений для данного коэффициента исчерпанной плодовитости :
,,.
Здесь - гамма-функция Эйлера. Обозначая , получаем для :
,
где f (x) - возрастное распределение вероятности рождения женщиной ребенка.
Минимизация отклонения расчетной кривой от статистических данных ведется уточнением возраста начала рождений и модального возраста при фиксированных значениях модальной рождаемости и коэффициента исчерпанной плодовитости, то есть данная модель выражается четырех-параметрической функцией (двухпараметрической функцией при поиске минимума отклонения). Минимизация проводилась стандартной программой Microsoft Excel (Сервис \ Поиск решения…) [25]. Для электронных таблиц, где данная опция не установлена, можно воспользоваться опцией “Сервис \ Подбор параметра... ”. Применяется следующая оригинальная методика расчета: вначале решается задача равенства расчетного и истинного коэффициентов исчерпанной плодовитости подбором соответствующего значения параметра a (временной интервал между возрастом, когда женщина становится способна к деторождению, и возрастом максимальной рождаемости), затем подбором оптимального значения параметра возраста начала рождений сдвигаем всю кривую до минимума отклонения от статистических данных, задавая последовательно уменьшающиеся фиксированные значения ошибки аппроксимации. Поскольку при этом значение расчетного коэффициента исчерпанной плодовитости несколько меняется, повторяем процедуру несколько раз до достижения приемлемого значения.
Полученные таким образом теоретические значения повозрастной рождаемости согласуются со статистическими данными по Украине 1965-1997 годов (таблицы №1-2 в конце работы) с средней погрешностью 8,8% (критерий ошибки аппроксимации приведен в начале статьи). В тоже время аппроксимация гамма-распределением с подбором оптимальных значений для всех параметров дает среднюю погрешность 7,0%. Исследование показывает, что дополнительная ошибка возникает как из-за неточного определения модального значения интенсивности рождений при нецелых значениях параметра модального возраста, так и из-за наложения обязательного условия на функцию проходить через заданное модальное значение.
Поскольку гамма-функция является лишь приближением повозрастного распределения рождаемости, ее дисперсия несколько больше истинной дисперсии распределения рождений для 1990-1997 годов, что и вызывает ошибку в возрастах, близких к возрасту модальной рождаемости. Кроме того, и гамма-распределение с оптимальными параметрами, и предлагаемая выше функциональная зависимость не аппроксимируют реальную рождаемость в возрасте 15-17 лет, обнуляя расчетные значения.
Однако получаемая погрешность несущественна для теоретического исследования модели [51], поскольку основную роль будут играть коэффициент исчерпанной плодовитости, который при аппроксимации реальных данных в Microsoft Excel воспроизводится с очень высокой точностью (до 0,001%), и средний возраст матери при рождениях, ошибка определения которого компенсируется чрезвычайно низкой смертностью в этих возрастах.
3.6 Смысл статистического гамма-распределения
Поскольку гамма-функция аппроксимирует статистические данные с хорошей точностью, возникает вопрос о интерпретации как функционального вида распределения рождений, так и параметров распределения. Ситуацию, в которой возникает гамма-распределение, можно показать на следующем примере.
Рассмотрим систему из фонарей, причем каждый фонарь состоит из n светящихся лампочек. В начальный момент имеется светящихся лампочек. Пусть существует некий внешний фактор, с интенсивностью выводящий лампочки из строя, то есть в единицу времени из горящих лампочек гаснет. Тогда зависимость числа горящих лампочек от времени x определяется следующим выражением:
Назовем фонарь потухшим, если в нем погасли все n лампочек. Для n=1 мы получаем равенство числа светящих фонарей числу горящих лампочек:
Тогда плотность вероятности для лампочки погаснуть в момент времени x определяется выражением:
При большем количестве лампочек в фонаре () картина качественно меняется. Поскольку потухшая лампочка с равной вероятностью может оказаться в любом фонаре, а фонарь светится, пока в нем есть хотя бы одна горящая лампочка, появляется фаза накопления дефектов в фонарях. Теория математической статистики дает следующее выражение для распределения плотности вероятности гашения фонаря:
,
то есть приведенное выше гамма-распределение. Таким образом, для процесса реализации рождений гамма-распределение можно толковать как распределение плотности вероятности перехода в новое качественное состояние системы из n элементов, имеющих два устойчивых состояния и с одинаковой интенсивностью необратимо переходящих из первого состояния во второе.
3.7 Модель с исчерпанной плодовитостью (последовательное рождение детей)
Рассмотрим случай, когда реализацию n этапов качественного развития процесса рождаемости можно рассматривать как последовательное рождение женщиной детей соответствующих очередностей. Поскольку среднее число детей, которое рождает женщина за детородный период, равно коэффициенту исчерпанной плодовитости , положим . Тогда функциональное выражение для повозрастного распределения рождений при будет иметь следующий вид:
,
где , - интервал между началом детородного периода и модальным возрастом.
При гамма-распределение вырождается в экспоненциальное распределение, что не справедливо для возрастного распределения рождений с эквивалентным коэффициентом исчерпанной плодовитости, и не имеет смысла при , который достигнут в настоящее время в ряде городов России и Украины. Соответственно ошибка аппроксимации рождаемости на Украине в различные годы велика для последних лет, характеризующихся особо низкой рождаемостью (в среднем 12,1% за 1995-1997 года). Для более ранних данных (1965-1992 года) данная функциональная зависимость дает в среднем погрешность 8,6%. Коэффициент исчерпанной плодовитости при этом воспроизводится с средней погрешностью 2,0%. Несмотря на значительную погрешность, данная модель может хорошо описывать возрастное распределение рождений при высоком уровне рождений.
3.8 Двухэлементная модель рождаемости
Полагая в аппроксимации возрастного распределения вероятности рождений с помощью гамма-распределения n=2, получаем следующую функциональную зависимость повозрастной рождаемости:
где , - интервал между началом детородного периода и модальным возрастом.
Необходимо отметить, что данная трехпараметрическая функциональная зависимость (двухпараметрическая при минимизации отклонения) с очень высокой точностью аппроксимирует реальное повозрастное распределение рождений - средняя погрешность метода 7,15% по сравнению со средней погрешностью 7,00% для наилучшей аппроксимации среди функционального класса гамма-распределений, являющихся трехпараметрическими при минимизации отклонения. Как достоинство данной модели рождений можно отметить простоту нахождения оптимальных значений параметров, аналитичность и интегрируемость функции при хорошей аппроксимации статистических данных, как недостаток - значительную погрешность вычисляемого коэффициента исчерпанной плодовитости для распределений рождаемости ранее 1970 года (около 1%) и неточное описание ранних рождений ( лет).
Из высокого качества аппроксимации реальных данных следует утверждение про целесообразность описания процесса рождений как качественный переход двухэлементной системы с равными интенсивностями перехода в новое состояние обоих элементов системы. Вопрос об идентификации каждого из элементов системы и качественного описания его характеристик остается открытым.
Подобные документы
Эконометрическое моделирование стоимости квартир в Московской области. Исследование динамики экономического показателя на основе анализа одномерного временного ряда. Параметры линейной парной регрессии. Оценка адекватности модели, осуществление прогноза.
контрольная работа [925,5 K], добавлен 07.09.2011Понятие экономико-математического моделирования. Совершенствование и развитие экономических систем. Сущность, особенности и компоненты имитационной модели. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
курсовая работа [451,4 K], добавлен 23.04.2013Особенности и сущность моделей системной динамики. Характеристика контуров с положительной и отрицательной обратной связью. Моделирование S-образного роста. Разработка модели запаздывания и ее построение. Основные разновидности моделей мировой динамики.
реферат [134,7 K], добавлен 22.02.2013Характеристика российской модели переходной экономики. Математические модели социально-экономических процессов, факторы и риски экономической динамики, посткризисные тренды. Роль Краснодарского края в экономике РФ, стратегия его экономического развития.
дипломная работа [385,0 K], добавлен 21.01.2016Характеристика основных принципов создания математических моделей гидрологических процессов. Описание процессов дивергенции, трансформации и конвергенции. Ознакомление с базовыми компонентами гидрологической модели. Сущность имитационного моделирования.
презентация [60,6 K], добавлен 16.10.2014Классификация бизнес-процессов, различные подходы к их моделированию и параметры качества. Методология и функциональные возможности систем моделирования бизнес-процессов. Сравнительная оценка систем ARIS и AllFusion Process Modeler 7, их преимущества.
дипломная работа [1,6 M], добавлен 11.02.2011Изучение и отработка навыков математического моделирования стохастических процессов; исследование реальных моделей и систем с помощью двух типов моделей: аналитических и имитационных. Основные методы анализа: дисперсионный, корреляционный, регрессионный.
курсовая работа [701,2 K], добавлен 19.01.2016Основные математические модели макроэкономических процессов. Мультипликативная производственная функция, кривая Лоренца. Различные модели банковских операций. Модели межотраслевого баланса Леонтьева. Динамическая экономико-математическая модель Кейнса.
контрольная работа [558,6 K], добавлен 21.08.2010Функциональные преобразования переменных в линейной регрессии. Формулы расчета коэффициентов эластичности. Характеристика экзогенных и эндогенных переменных. Построение одно- и двухфакторного уравнений. Прогнозирование значения результативного признака.
курсовая работа [714,1 K], добавлен 27.01.2016Теоретическая оценка инфляционных процессов, обзор исследований по российской инфляции и статистических данных. Обзор используемых методов эмпирического анализа, особенности эконометрического моделирования инфляционных процессов в современной России.
курсовая работа [44,3 K], добавлен 04.02.2011