Ретроспективная оценка численности населения муниципальных образований "новой Москвы" методом площадной интерполяции

Задача пересчета пространственных социально-экономических данных из одного абстрактного типа данных (АТД) в другой, способы ее реализации. Сбор информации на микроуровне с последующей агрегацией в разные АТД. Использование метода площадной интерполяции.

Рубрика Экономика и экономическая теория
Вид статья
Язык русский
Дата добавления 19.07.2017
Размер файла 785,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский городской университет управления Правительства Москвы

Ретроспективная оценка численности населения муниципальных образований "новой Москвы" методом площадной интерполяции

Сидоренко В.Н.,

Экономический факультет МГУ имени. М.В. Ломоносова Доцент, к. э. н., к. ф. - м. н., к. ю. н

Латышев К. В.,

аспирант

Аннотация

В настоящее время существует актуальная задача пересчета пространственных социально-экономических данных из одного АТД в другое. Данная задача может быть решена двумя способами. Первый способ - сбор информации на микроуровне с последующей агрегацией в разные АТД (например, сбор информации на уровне муниципалитетов). Второй способ - использование метода площадной интерполяции. В некоторых ситуациях первый способ нереализуем.

Ключевые слова: социально-экономические данные, "Новая Москва", площадная интерполяция, кригинг, ГИС.

В настоящее время значительная часть социально-экономических (в том числе демографических) данных является пространственными или пространственно-временными и может быть обработано методами геостатистики и геоэконометрики [Сидоренко, 2005], в частности методом пространственного или пространственно-временного кригинга, используемого для получения недостающих пространственных и пространственно-временных данных. В дальнейшем рассматривается только площадной пространственный кригинг [Krivoruchko, Gribov, Krause, 2011], реализованный в программном продукте ArcGIS 10.3 компании ESRI [Справка по ESRI ArcGIS], примененный для ретроспективного расчета численности населения "Новой Москвы" по данным Федеральной службы государственной статистики РФ (http://www.gks.ru). Решение данной задачи позволяет проводить пересчет многих социально-экономических данных при изменении административно-территориального деления (АТД) и получать сопоставимые ряды сопоставимых показателей.

Рассмотрим область применения и ограничения инструмента "площадной интерполяции" согласно описанию с официального сайта компании ESRI [Справка по ESRI ArcGIS]. При площадной интерполяции могут применяться следующие типы данных:

Усредненные данные (с нормальным распределением)

Для защиты личной информации или для снижения затрат непрерывные точечные измерения иногда усредняются по определенным территориям, при этом изначальные точечные данные устраняются или держатся в тайне. К примеру, может сообщаться средний уровень загрязнения окружающей среды на определенную территорию, но при этом измерения в отдельных точках держатся в тайне. Для площадной интерполяции непрерывных данных необходимо, чтобы данные имели распределение Гаусса и были усреднены по заданным полигонам. На основе этих полигонов и средних измерений происходит построение поверхности интерполяции (или стандартной ошибки) со значением гауссовой переменной в каждой точке домена данных.

При площадной интерполяции гауссовой величины инструмент "Слой площадной интерполяции в полигоны" вычисляет среднее значение гауссовой переменной (со стандартной ошибкой интерполяции) для целевых полигонов. К примеру, на основе средней температуры во всех областях в данный день может быть вычислена средняя температура в городах этих областей.

Данные в виде отношения (с биномиальным распределением)

Иногда данные по полигонам получают следующим образом: случайно создается выборка из отдельных элементов генеральной совокупности полигона и подсчитывается количество элементов, имеющих определенную характеристику. При этом значение имеет процент элементов выборки, имеющих эту характеристику.

Учитывая количество элементов в выборке и количество элементов с определенной характеристикой для каждого полигона, при площадной интерполяции биномиальной величины происходит построение поверхности интерполяции (или поверхности стандартных ошибок) для всех точек домена данных. При этом каждая точка поверхности отражает вероятность того, что элемент выборки, взятый в этом месте, будет иметь данную характеристику.

В случае площадной интерполяции биномиальной величины инструмент "Слой площадной интерполяции в полигоны" вычисляет процент элементов с определенной характеристикой для каждого указанного полигона. К примеру, если известно число зарегистрированных случаев рака легких для каждого города в области (а вместе с ним и риск заболевания в каждом городе), то можно получить процент населения с раком легких по каждому району в этих городах. Для того чтобы оценить количество случаев рака легких в каждом районе города, нужно умножить полученный процент случаев рака легких на численность населения в данном районе. Таким же образом, умножьте стандартную ошибку на численность населения района, чтобы получить стандартную ошибку оценки количества случаев рака легких в данном районе.

Редкие события (распределение Пуассона с избыточной дисперсией)

Другой стандартный способ сбора данных по полигонам - подсчет количества происшествий определенного события на заданной территории за указанный период времени. Поскольку количество событий пропорционально времени наблюдения, необходимо также записывать количество времени, затраченного на подсчет. Каждая команда по подсчету событий будет знать свой полигон (территорию) наблюдения, количество зарегистрированных событий и время, затраченное на наблюдение.

При площадной интерполяции редких событий будет построена поверхность, отражающая вероятность происхождения какого-либо события в конкретном месте. Чем больше вероятность, тем больше шанс того, что в данном месте будет зарегистрировано это событие. В случае, когда событием является обнаружение физического объекта (например, подсчет редких животных, такого как кит), поверхность интерполяции может представлять собой карту плотности.

В большинстве реальных случаев, время наблюдения для каждого полигона будет одинаковым. Например, статистика уголовных преступлений обычно имеет форму количества преступлений, произошедших за один год на каждом из полигонов. Поскольку времена наблюдения зачастую равны, если не указано время наблюдения, в алгоритме принимается, что подсчет значений происходил для каждого полигона за одну единицу времени. В случае полного обследования (когда регистрируется каждое произошедшее событие, например, при общей переписи населения) время наблюдения для каждого полигона следует принимать одинаковым.

При наблюдении не обязательно регистрировать каждое событие. Необходимо только, чтобы число событий в единицу времени было пропорционально общей плотности наблюдаемых объектов. На практике это означает, что технология наблюдений должна быть приблизительно одинаковой для каждого полигона. Например, если в одной команде по сбору статистики по редким событиям "наблюдатель-регистратор" более опытен, чем в другой команде, результаты интерполяции будут иметь систематическую ошибку.

В случае площадной интерполяции величины с избыточной дисперсией инструмент "Слой площадной интерполяции в полигоны" вычисляет количество событий в единицу времени для каждого указанного полигона. Например, если наблюдатели-регистраторы записывают свое время наблюдения в часах, то вычисленное для нового полигона значение описывает предполагаемое количество событий, которое можно будет наблюдать в этом полигоне за один час. Для данных переписи населения эти значения просто отражают предполагаемую численность населения полигона на момент проведения переписи.

В продукте ESRI ArcGIS 10.3 метод площадной интерполяции подразумевает использование метода "Кригинг" [Krivoruchko, Gribov, Krause, 2011], который входит в состав инструментов геостатистического анализа (Geostatistical Analyst). Кригинг предполагает, что по крайней мере часть пространственных вариаций, наблюдаемых в природных явлениях, можно смоделировать при помощи случайных процессов с использованием пространственной автокорреляции, причем последняя должна быть смоделирована в явном виде. Приемы работы кригинга могут быть использованы для описания и моделирования пространственных структурных закономерностей, предсказывания значений в неизмеренных местоположениях, доступа погрешности, связанной с прогнозируемым значением в неизмеренных местоположениях.

Мастер геостатистики (Geostatistical Wizard) предусматривает несколько типов кригинга для разных типов данных с разными основными допущениями: обычный (Ordinary), простой (Simple), универсальный (Universal), индикаторный (Indicator), вероятностный (Probability), дизъюнктивный (Disjunctive), эмпирический байесовский (Empirical Bayesian), площадная интерполяция (Areal Interpolation).

Эти методы могут быть использованы для создания следующих поверхностей: карты кригинга прогнозируемых значений, карты стандартных ошибок кригинга, связанных с прогнозируемыми, значениями, карты вероятности, которые указывают, был ли превышен предопределенный критический уровень или нет, карты квантилей для предустановленного уровня вероятности (исключения см. в таблице 1).

Таблица 1. Методы кригинга и выходных карт

Кригинг и кокригинг

Проинтер - полированные значения

Стандартные ошибки интерполяции

Карты

квантилей

Карты

вероятности

Стандартные ошибки индикаторов

Ординарный

(Ordinary)

X

X

X*

X*

Универсальный

(Universal);

X

X

X*

X*

Простой

X

X

X*

X*

Индикаторный

(Indicator);

X

X

Вероятностный

(Probability);

X

X

Дизъюнктивный

(Disjunctive);

X**

X**

X**

X**

Эмпирический

байесовский

X

X

X*

X*

Площадная интерполяция (Areal interpolation)

X

X

Примечание: * Требуется допущение многомерного нормального распределения. ** Требуется допущение попарного двумерного нормального распределения.

Рассмотрим особенности применения метода площадной интерполяции в ArcGIS 10.3. Точность результатов площадной интерполяции зависит от точности применяемой модели. Поскольку площадная интерполяция в дополнительном модуле "Geostatistical Analyst" ArcGIS реализована на основе метода кригинга, важным этапом построения модели является интерактивная вариография. Зачастую непросто визуально определить качество кривой ковариации, поэтому для каждой эмпирической ковариации (синие перекрестия на рис. 1,2) предоставляются доверительные интервалы (красные вертикальные линии на рис. 1,2). Если модель ковариации задана верным образом, можно ожидать попадания в доверительные интервалы 90% эмпирических ковариаций.

Так, данные по численности наличного населения "Новой Москвы", образованной 1 июля 2012 года, за предыдущие 2010 и 2011 гг. в границах "Новой Москвы" местами отсутствовали. Применив метод кригинга с различными параметрами в рамках площадной интерполяции ко всем муниципальным образованиям "Новой Москвы" были получены оценки, точность которых оценивалась по данным за 2012 г., имеющимся для старого (рис.3,4) и нового (рис.6) АТД. В процессе расчета отбрасывались 5 ЗАТО Московской области и населенные пункты вдоль Рублево-Успенского шоссе в составе Москвы, поскольку на сайте ks.ru отсутствовали статистические данные по этим административно-территориальным образованиям.

Рис. 1. Модель ковариации

Рис. 2. Модель вариограммы

агрегация интерполяция площадная пространственный

Рис. 3. Численность наличного населения Московской области на 1 января 2011 г. (по данным Росстата (www.gks.ru) и ассоциации "ГИС Лаборатория")

В процессе выбора параметров для метода площадной интерполяции выяснилось, что наилучшими для точности предсказания являются следующие опущения:

1) исходные данные о численности наличного населения районов г. Москвы описываются распределением Пуассона с избыточной дисперсией;

ковариационная функция описываются сферической моделью (рис.5);

3) отбрасываются области, состоящие из двух и более почти несвязных выпуклых многоугольников с сильной внутренней неоднородностью плотности населения (районы "Молжаниновский" и "Можайский"). Результаты представлены на рисунке 6 и в таблице 2.

Рис. 4. Численность наличного населения Москвы на 1 января 2011 г. по данным Росстата (www.gks.ru) и ассоциации "ГИС Лаборатория")

Рис. 5. Ковариация для данных "Численность наличного населения на 1 января 2011 г." для Москвы и Московской области

Рис. 6. Ретроспективная оценка численности наличного населения на 1 января 2011 г. в границах "Новой Москвы"

Результат ретроспективной оценки (табл. 2) показал, что, отбрасывая "специальные случаи" (районы "Молжаниновский" и "Можайский"), с учетом сделанного выбора статистической модели и выбора модели ковариации, погрешность предсказания не превышает 17%, что вполне приемлемо для таких сложных в географическом и демографическом плане регионов, как "Новая Москва" и Московская область.

Список литературы

1. Сидоренко В.Н. Применение геостатистики и пространственной эконометрики в экономике // Материалы международной научной конференции “Ломоносов 2005”. М.: Изд-во МГУ, 2005. С.184-185.

2. Krivoruchko, K., A. Gribov, E. Krause (2011). “Multivariate Areal Interpolation for Continuous and Count Data," (“Многомерная площадная интерполяции для непрерывных и дискретных данных,”) Procedia Environmental Sciences, Volume 3 (Том 3): 14-19.

3. Справка по ESRI ArcGIS. - http://www.arcgis.com

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.