Измерение информации

Синтаксическая, семантическая и прагматическая меры информации. Типы данных географических и земельноинформационных систем и их источники. Виды картографических материалов. Инвентаризация охотничьих угодий по результатам мультиспектральных изображений.

Рубрика Сельское, лесное хозяйство и землепользование
Вид реферат
Язык русский
Дата добавления 08.10.2015
Размер файла 425,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Новгородский государственный университет имени Ярослава Мудрого

Кафедра управления земельными ресурсами

Реферат

Измерение информации

Введение

1. Каркасом послужил источник [1]. Он был дополнен теорией [2]. Примеры основной части №1 не подвергались изменениям. В её заключении представлены схема и таблица по теме.

2. Вторая часть дополнена примером, собственным осмыслением третьего источника литературы в виде таблиц.

3. В приложение помещен текст [4] без анализа, без интерпретации как самоценный ресурс в фундаментальном понимании теории информации, меры информации.

земельноинформационный картографический охотничий

1. Измерение информации

В зависимости от форм адекватности различают меры информации: синтаксическую, семантическую и прагматическую.

Синтаксическая мера информации определяется объемом данных, количеством информации и коэффициентом информативности.

Объем данных - это количество символов в сообщении. Оно измеряется в битах и дитах. Бит (bit - binary digit) - двоичный разряд, дит - десятичный. Например, в электронном тахеометре запись, состоящая из ряда чисел составляет объем данных V=34 дит, то есть в этой записи насчитывается 34 десятичных цифры. Если запись перевести в двоичную систему счисления, то число двоичных знаков определит количество информации в битах. Пример этой записи такой:

2001 - номер пикета,

1.600 - высота отражателя на пикете,

11.0300 - расстояние от станции до пикета в метрах,

49.05000 - отсчет по горизонтальному кругу,

359.03050 - отсчет по вертикальному кругу,

11:43:00 - время съемки.

Количество информации - это разность между неопределенностью (неполнотой) знаний до получения сообщения об объекте и после его получения.

Неопределенность (неполнота) знаний выражается энтропией,

Энтропия системы - это степень (мера) неопределенности (неосведомленности) о состоянии системы.[2, 3с.]

которая вычисляется так:

где вероятность исхода события, о котором принимается сообщение.

Если через обозначить энтропию события до полученного сообщения, а через его энтропию после получения сообщения, то количество информации будет:

Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы (теория Шеннона).[2, 3с.]

Мера информации по Шеннону

Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе б. Мерой его неосведомленности о системе является функция H(б), которая в то же время служит и мерой неопределенности состояния системы.

После получения некоторого сообщения в получатель приобрел некоторую дополнительную информацию Iв(б), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения в) неопределенность состояния системы стала Hв (б).

Тогда количество информации Iв(б) о системе, полученной в сообщении в, определится как:

Iв(б) = H(б) - Hв (б),

т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.

Если конечная неопределенность Hв (б) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации Iв(б) = H(б). Иными словами, энтропия системы H(б) может рассматриваться как мера недостающей информации.

Энтропия системы H(б), имеющая N возможных состояний, согласно формуле Шеннона, равна:

где Pi - вероятность того, что система находится в i-м состоянии.

Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi =(1/N), ее энтропия определяется соотношением:

Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения

N=mn,

где N - число всевозможных отображаемых состояний;

m - основание системы счисления (разнообразие символов, применяемых в алфавите);

n - число разрядов (символов) в сообщении.

Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.

Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.:

,

причем 0<Y<1.

С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.[2, 3-4с.]

Пример. На абрисе тахеометрической съемки точки рельефа, между которыми возможна интерполяция горизонталей соединяются стрелками, которые указывают направление ската. До проведения эксперимента допустимо предположение соединения некоторой точки n с остальными n - 1 точками. При этом вероятность каждого соединения равна

где число соединений.

Однако в результате эксперимента было установлено (получено экспериментально), что точка n соединилась лишь с одной точкой. Вероятность этого события а вероятность соединения с остальными точками равна нулю.

Тогда очевидно, что

Следовательно, количество информации, доставляемой такой линией абриса равно

Коэффициент информативности определяется величиной

Семантическая мера информации - измеряется совокупностью сведений, которыми располагает пользователь о предметной области, называемой тезаурусом пользователя. В данном случае количество информации определяется компетентностью пользователя. Для некомпетентного пользователя (тезаурус равен нулю) при любых соотношениях количество семантической информации будет нулевым.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Рис. 1 Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса Ic = F(Sp)

Максимальное количество информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к ее объему:[2, 4-5с.]

Пример. Определим число классов геодезической сети равным четырем. И пусть некомпетентный пользователь знает, что геодезические сети строятся только одного класса точности. Пусть сообщение о классе точности пункта сети равно 3. Определить количество информации, получившееся для компетентного и некомпетентного пользователей.

Зная, что существует лишь один класс точности некомпетентный пользователь определит:

То есть данное сообщение для этого пользователя приносит 0 семантической информации.

Для компетентного:

Здесь знание вероятности принадлежности пункта к третьему классу равно 1 после получения сообщения.

Поскольку Рi=1/4

то количество информации, полученное компетентным пользователем равно

Коэффициент содержательности семантической информации определяется формулой:

Прагматическая мера информации определяется ее полезностью для достижения определенных целей. Она может измеряться количеством информации также как синтаксическая и семантическая, но здесь пользователь должен быть компетентным в целесообразности информации.

Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же единицах (или близких к ним), в которых измеряется целевая функция.[2, 5с.]

Типы данных и их источники

По форме представления данные подразделяются на графические и текстовые. Текстовые бывают буквенные, цифровые и буквенно-цифровые.

По степени предварительной обработки данные подразделяются на первичные и вторичные. Первичные данные это такие, которые хранятся в таком виде, в каком они были получены. Это результаты непосредственных измерений и наблюдений. Вторичные - это данные, прошедшие предварительную обработку. Это карты, планы, фотоплан и др. К текстовым следует отнести следующие данные.

1. Идентификационные, которые однозначно определяют местоположение объектов или территориальных единиц. К ним относятся координаты точек, результаты измерений, съемок. Эти данные относятся к разряду основных данных ГИС. Они представляются в основном в цифровой форме. Их источник - каталог координат пунктов созданной геодезической сети, журналы измерений и съемок.

2. Описательные, которые относятся к тематическим данным, связанным определенной территориальной единицей. Это в основном буквенно-цифровые данные. Примером таких данных может быть административное описание положения геодезического опорного пункта, тип его центра, наружного оформления, данные привязки к местным предметам. Источником таких данных являются результаты описей и измерений по привязке геодезических пунктов, журналы выполнения геодезических измерений и съемок.

3. Нормативные данные - это данные планирования, полученные из нормативной документации, инструкций, положений.

4. Статистические данные - это такие, которые являются отражением деятельности определенной отрасти народного хозяйства. Их источником являются данные государственной статистики, статистической отчетности по различным отраслям хозяйственной деятельности. К таким данным относятся результаты наблюдений за различными природными явлениями - гидрологическими, метеорологическими, геоботаническими, океанографическими и др.

Источником графических данных являются картографические и аэрокосмические материалы.

К картографическим материалам следует отнести следующие:

1. Общегеографические карты. Это топографические карты - масштаба 1:200000 и крупнее, обзорно-топографические - масштаб менее 1:200000 до 1:1000000 и обзорные - масштаба 1:1000000.

2. Тематические карты. К ним относятся природные карты и социально-экономические. Природные карты делятся на геологические, геодезические, метеорологические и климатические, океанографические, почвенные, геоботанические, охранно-природные, земельно-ресурсные.

Социально-экономические карты подразделяются на карты промышленности, сельского хозяйства и др.

Аэрокосмические материалы называются еще материалами дистанционного зондирования. Они получаются на основе аэрофотосъемок и космических съемок. В разряд дистанционных методов зондирования можно отнести съемки и методы наземного зондирования. К ним относятся фототеодолитная съемка, сейсмо-, электро-, и магниторазведка, гидроакустические съемки морского дна с кораблей.

Космические съемки выполняются как с фотографических, так и со сканерных систем. Системы съемки могут быть как пассивные, так и активные.

Пассивные системы воспринимают отражение от объектов и фиксируют его на фотопленке или электромагнитных накопителях.

Активные излучают электромагнитные сигналы по направлению к объекту и фиксируют отражение этих сигналов на электромагнитных носителях.

Рассмотрим на конкретном примере как тип данных и его источник влияет на конечный результат представления объекта. Основано на статье Абросимова А.В. «Инвентаризация охотничьих угодий по результатам классификации мультиспектральных изображений».[3]

1. Проблема: Низкий уровень использования «революционных», «новаторских» технологий в повседневной работе земле- и охотустроителя.

Замечание: Однако задачи связанные с владением и применением геоинформации на современном этапе уже решаются при помощи ГИС-технологий.

2. Постановка задачи: Построение схемы территориального планирования (проекта охотустройства) с применением ГИС-технологий.

3. Конкретизация задачи: Инвентаризация охотничьих (с/х) угодий.

4. Основа для решения задачи: Цветные снимки и результаты их распознавания.

Выбор подхода

Традиционный (основной, базовый)

С использованием снимков ДЗЗ

Данные берутся с

1. планов лесных насаждений,

2. земельных планов,

3. карт сельскохозяйственного кадастра,

4. прочих материалов.

Информация большей частью берется со снимка.

Разрешение на местности: 10 м.

Проверка качества и достоверности результатов:

Традиционный (основной, базовый)

С использованием снимков ДЗЗ

Результаты соотносят с местностью (полевое обследование), производится корректировка на изменение ситуации (натуры) во времени.

Закрепление опознаков на местности с фотографированием окружающего ландшафта.

Замечание. Земле- и охотустроитель должен знать местность и сопоставлять её с ситуацией изображенной на снимке.

Реализация исследования на практике

Распознавание цветного снимка (с обучением или без такового)

1 шаг

1 вариант

2 вариант

2 шаг. Процесс разбиения на составляющие

на 5 - 10 классов

на 15 - 25 классов

Последующая обработка полученных изображений:

3 шаг

Перевод в векторный вид без объединения классов

Генерализация растра

Процесс объединения

Создание слоя

Средства последующего анализа

Классы слоя используются для формирования участков некоторых типов угодий (полевые и водные угодья)

Перевод в векторный вид

Векторные полигоны

Формирование контуров

Создание слоев в MapInfo

Заключение

1. Дальнейшие исследования возможности применения цветных снимков для проекта земле- и охотустройства.

2. Применение ГИС-технологий и данных ДЗЗ не отменяет необходимости полевых работ.

3. Необходима «ручная» обработка производных снимков (изображений) для получения корректных векторных данных.

4. Использование планово-картографического материала.

5. Поиск новых методов для более детального разделения угодий по типам.

6. Перспектива в алгоритме дерева решений.

Литература

1. Ярмоленко А.С. Географические и земельноинформационные системы: учеб. пособие/ НовГУ им. Ярослава Мудрого. - Великий Новгород, 2007. - 99-102с.

2. http://dl.my1.ru/cs2011/Theme_3-The_concept_of_information.pdf

3. http://www.geomatica.ru/pdf/2009_03/2009_03_006.pdf

4. http://www.rae.ru/fs/pdf/2011/12-1/18.pdf

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.