Теория определения информации и данных
Интервальное гарантированное оценивание, распределение возможных значений результатов измерений. Анализ эффективности в условиях неопределённости. Основные правила преобразования законов распределения. Анализ и оценка рисков недостижения реальных целей.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 25.09.2018 |
Размер файла | 405,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
Теория определения информации и данных
Введение
Определение понятий данные и информация приводятся во многих учебниках по информатике /152…157/ и литературных источниках, посвященных описанию IT-технологий /там же/. При различных структурных выражениях семантика понятий одинакова у всех авторов.
Приведем общие определения данных и информации /158…160/.
Н. Винер: «Информация есть информация, а не материя и энергия. Тот материализм, который не признает этого, не может быть жизнеспособным в настоящее время».
Т. Сарацевич: «Все недовольны тем, что информационная наука не хочет потрудиться над определением информации … на самом деле ни одна современная наука не имеет определений своих основных феноменов. В биологических науках нет определения жизни, в медицинских - здоровья, в физике - энергии, в электротехнике - электричества, в ньютоновских законах - противодействия. Это просто основные явления, и эта их первичность и служит им определением».
Н.Н. Моисеев: «Ныне существует обширная наука, именуемая информатикой. И ей посвящает свои усилия едва ли не половина всего научного персонала (даже не осознавая этого). А феномен этой дисциплины состоит в том, что центральное ее понятие «информация» до сих пор не имеет четкого и общепринятого определения - его используют главным образом на интуитивном уровне … я уверен, что строгого и достаточного универсального определения информатики не только нет, но и быть не может».
А.Д. Урсул, К.К. Колин и др.: Информация является неотъемлемым свойством (атрибутом) материи, может проявлять себя во всех объектах, процессах и явлениях как живой, так и неживой природы.
Н. Винер, Н.Н. Моисеев и др.: Информация присуща только объектам живой природы, для которых характерны целенаправленные действия (принятие решений).
Обобщим сказанное.
Данные - сведения /162…167/ (знание, представление о чем-либо) необходимые для какого-либо вывода, решения или свойства, способности, качества как условия или основания для чего-либо. Данные могут рассматриваться как признаки, используемые для уменьшения неопределенности.
Информация - /162…167 / сведения об окружающем мире и протекающих в нем процессах на основе совокупности данных. Сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний. Или коротко - информацией является совокупность используемых данных.
Информация - это самое ценное достижение человечества. Информация помогает нам жить. На сегодня можно сказать, что получение новых данных и знаний является основной задачей человечества.
Основополагающая роль информации в целенаправленной человеческой деятельности осознана уже давно. Любая деятельность начинается с получения и осмысления информации: прежде чем что-то сделать человек это должен представить, смоделировать. Академик А.А. Харкевич писал: «Никакая организованная форма деятельности немыслима без обмена информацией. Без информации невозможно ни планирование, ни управление» /168/.
На современном этапе со всей очевидностью вскрылось явное противоречие между важностью информации для организации любой деятельности и уровнем понимания её сущности, свойств и методов анализа. С одной стороны, на любом предприятии, в любой области деятельности накоплены и используются большие объёмы данных, реализуются всё более сложные методы и средства для их хранения, оперативного поиска и доступа, представления в удобном виде, преобразования, обмена. А с другой стороны, мы пока плохо представляем, когда данные можно считать информацией, какими информационными свойствами и особенностями можно воспользоваться для повышения эффективности деятельности. В связи с этим остановимся кратко на основных свойствах и особенностях информации.
Как мы уже определились, информация - это адекватные результаты отражения. Информация может быть и ресурсом, и продуктом человеческой деятельности, а в условиях рыночных отношений - и товаром. У информации, как ресурса, есть замечательное свойство: одна и та же информация может использоваться многократно и многими пользователями. То есть коэффициент использования (полезного действия) информации может быть безграничен.
Информация, как продукт деятельности, способна удовлетворять определённые потребности, а значит должна характеризоваться совокупностью свойств, то есть качеством. Способность информации удовлетворять определённые потребности иногда называют не качеством, а пертинентностью.
Основные показатели качества информации:
материальность - способность воздействовать на органы чувств;
объективность - независимость от потребителя и целей использования;
доступность - возможность использования различными потребителями;
безопасность - способность сохраняться при воздействии угроз;
защищённость - способность быть доступной для одних и недоступной для других потребителей;
временные характеристики - сроки получения, подтверждения идентичности, хранения, поиска и т.п.;
актуальность - необходимость для удовлетворения уже существующих потребностей и др.
Главным атрибутивным свойством информации, наличие которого позволяет данные перевести на уровень информации, является адекватность (или неопределённость), характеризующая степень соответствия результата отражения отображаемому объекту. И вот здесь нужно признать, что в практической деятельности предприятий информации используется немного: как правило, мы имеем дело с описаниями, сведениями, сообщениями, изображениями и пр., уровень определённости (или неопределённости) которых охарактеризовать очень непросто. Пока ещё не предложены даже атрибутивы к данным, способные выработать к ним определённый уровень доверия. Более того, даже количественные данные, как правило, представляются не в интервальном, а точечном виде и без указания уровня неопределённости. Типичной является ситуация, когда вообще о погрешности количественных данных сведений просто нет: данные представляются как точные и без указания степени округления.
Таким образом, из трёх уровней представления данных (рис. 1) мы, в основном, работаем на самом нижнем, то есть с сообщениями, сведениями и пр., степень неопределённости которых обычно трудно оценить.
Несомненно, на предприятиях накоплены большие объёмы описательной (в том числе изобразительной) и измерительной информации, которая всесторонне проверена практикой, экспериментальными работами. Такую информацию нужно выделить, определить к ней соответствующий уровень доверия и при переводе в электронный вид этой информации присвоить соответствующие атрибуты, правильно выбрать методы и средства её последующего хранения и преобразования. В то же время сомнительные данные нужно подвергнуть дополнительной проверке, оценить их качество.
Восхождение на информационные уровни может быть только последовательным. Чтобы перейти на описательный информационный уровень, нужно полученные сведения (например, текст) строго упорядочить: проверить соответствие описываемых объектов принятым определениям (понятиям), в случае необходимости ввести новые определения, выделить свойства объектов. С помощью логических схем проверить непротиворечивость сведений, их соответствие уже имеющимся данным.
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
Рис. 1. Описательные и количественные уровни представления данных
Для перехода на уровень измерительной информации необходимо выбрать количественные показатели для отражения рассматриваемых свойств, обосновать методы, методики, алгоритмы для измерений или расчётов, выбрать необходимые метрологические средства, получить результаты измерений, представить их в интервальном виде и оценить количество измерительной информации.
К сожалению, алгоритмы перевода данных на информационные уровни практически не отработаны. О правильности (грамотности) представления описательных материалов сейчас заботятся редко: понятийный аппарат, как правило, не поясняется, нормативная база (в виде ГОСТов, ОСТов) совершенствуется слабо. В результате специализированные тексты обычно требуют уточнений и пояснений, а логические процедуры проверки не используются вообще. В итоге даже описательной информации на предприятиях значительно меньше, чем общего объёма описательных данных. Количественные данные для перевода на уровень измерительной информации малопригодны: потребители результатов измерений редко интересуются метрологическими свойствами используемых измерительных средств, а методы, модели, методики, алгоритмы и программы расчётов вообще не подвергаются метрологической аттестации. То есть перейти к обоснованному интервальному представлению количественных данных весьма не просто.
1. Неопределённость данных
Все данные, используемые на практике, по уровню определённости могут быть отнесены к одному из следующих трёх классов:
1. Точно определённые;
2. Вероятностные или статистические;
3. Приближённые данные, не имеющие статистических (вероятностных) характеристик.
З...5% 2...3%
Рис. 2. Примерное соотношение точных, вероятностных и приближенных данных
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
- Приближенные данные
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
- Точные данные
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
- Вероятностные данные
Точные данные получают либо в результате элементарного счёта (в цехе 10 станков, в неделе 7 дней, в отделе 15 человек и т.п.), либо на основе результатов измерений, погрешностью которых можно пренебречь (если она не отражается на результатах решения конкретной прикладной задачи): округляя результаты измерений, мы избавляемся от приближённости (неопределённости). Точных данных в жизни встречается не много, а вот к округлению данных мы настолько привыкли, что, как правило, даже не задумываемся, можно ли не учитывать объективно существующую погрешность.
Данные, имеющие вероятностные (статистические) характеристики, на практике встречаются ещё реже. Для получения таких данных требуется соблюдение 2-х принципов: массовости данных и статистической однородности (одинаковости) условий их получения. На практике эти принципы часто оказываются трудновыполнимыми. Вместе с тем целый ряд очень важных задач решается именно на вероятностном уровне. К таким задачам относится, например, задача метрологической аттестации измерительных средств, ставшая обязательной нормативной процедурой: в результате решения этой задачи для каждого типа измерительных средств строится вероятностный закон распределения погрешностей, приводимый в технических паспортах.
По разным оценкам доля точных и вероятностных данных в общем объёме данных в различных областях составляет не более 10%.
Наиболее многочисленную группу в жизни обычно составляют приближённые данные - единичные результаты измерений и оценки расчётов. Погрешностью этих данных пренебрегать нельзя, её необходимо учитывать.
А из-за единичности (не массовости) этих данных нет возможности перейти на уровень статистических оценок и применить аппарат теории вероятностей. К числу задач, использующих подобные данные, относятся, в первую очередь, многочисленные задачи анализа качества продукции, планирования, прогнозирования, управления. Причём, учёт неопределённости в этих задачах играет принципиальную роль: при детерминированном представлении, когда всё точно известно и неопределённости нет многие важные практические задачи вырождаются до некорректных, а получить вероятностные оценки даже с помощью моделирования сложных объектов либо очень трудоёмко и дорого, либо просто невозможно. Характерным примером подобных задач являются широко распространённые задачи управления социально-экономическими системами (предприятиями, компаниями, организациями), которые при ближайшем рассмотрении оказываются уникальными (не массовыми), а деятельность их приходится организовывать в динамично меняющихся условиях (правовых, административных, кадровых, технологических, производственных, информационных и т.п.).
Приближённые данные по особенностям получения подразделяются на 2 группы. Первую группу составляют результаты измерений, получаемые на выходе аттестованных метрологических средств с известными вероятностными законами распределения погрешностей. В этом случае по имеющейся оценке Х измеренной величины можно только заключить, что действительное значение X этой величины с определённой (гарантированной) вероятностью РД находится в соответствующем интервале Д, т.е. получить только интервальное представление об измеренной величине. Например, при нормальном законе распределения погрешностей измерений
(4)
где - погрешность измерений;
- математическое ожидание и среднеквадратическая ошибка измерений.
По полученной оценке Х можно лишь заключить, например, что действительное значение измеренной величины:
с вероятностью находится в интервале 6
с вероятностью находится в интервале 4
с вероятностью находится в интервале 2
В последующих расчётах, когда погрешностью измерений пренебречь нельзя, необходимо использовать именно интервальную оценку измеренной величины, представляющую эту величину в виде интервала неопределённости Д и соответствующего ему уровня гарантированной вероятности РД.
Величина неопределённости Д оцениваемой величины X зависит от уровня гарантированной вероятности РД. Значения величин Д и РД всегда связаны однозначной зависимостью. Важно сначала понять, с каким уровнем гарантированной вероятности должна решаться задача? Тогда с выбором конкретного интервала неопределённости затруднений не возникает. Вторую группу приближённых данных составляют результаты измерений простейшими измерительными средствами (линейкой, транспортиром и т.п.), не имеющими законов распределения погрешностей, и количественные оценки различных специалистов. В этом случае получаемые результаты характеризуют предельной или предельно допустимой погрешностью. Например, производя измерения линейкой, мы получаем результат с предельной погрешностью в 1мм (± 0,5мм), микрометром - в 0,01мм (± 0,005мм). Диспетчер на основании имеющегося опыта и конкретных условий определяет время окончания какой-то работы в виде интервала. При этом он не анализирует корректную выполнимость вероятностных условий (массовости и статистической однородности) для тех опытных данных, на которые он опирается в своих рассуждениях (он даже может и не знать вероятностных основ). Он пользуется приближёнными данными на простейшем, детерминированном уровне. И так поступают в большинстве случаев на практике высококвалифицированные специалисты (эксперты), досконально знающие свою предметную область (начальники участков, цехов, производств, экономисты, логистики и т.п.). И несмотря на то, что никаких строгих статистических оценок и методик получения подобных данных эти специалисты не используют, такие данные служат основой очень важных расчётов, планов и решений. Очевидно, степень приближения таких данных нужно учитывать и оценивать её влияние на неопределённость конечных результатов.
Если математический аппарат для детерминированных точных и вероятностных представлений хорошо разработан (теория чисел, функциональный анализ, теория вероятностей, математическая статистика и др.) и составляет базовую основу образования высшей школы, то для приближённых интервальных представлений такого аппарата до последнего времени не было. Для преодоления этого принципиального недостатка предлагались (и предлагаются) различные идеи. В частности, для работы с приближёнными интервальными данными разработана специальная интервальная математика, отражающая не только элементарные действия с этими данными и пересчёты интервалов неопределённостей, но и определяющая правила более сложного анализа /137,169,170/. Однако можно уверенно утверждать, что методы интервальной математики не нашли широкого практического применения. Это является следствием важного недостатка интервальной математики, имеющего принципиальное значение: в интервальной математике не учитывается частота появления возможных значений рассматриваемой величины в пределах выделенного интервала неопределённости. К сожалению, эта частота не остаётся неизменной при выполнении действий с интервальными величинами. Это обстоятельство можно проиллюстрировать на следующем простейшем примере.
Допустим, для получения оценки X некоторого показателя приходится складывать значения двух слагаемых X1 и Х2, имеющих одинаковые интервалы неопределенностей, в пределах которых эти слагаемые могут принимать любые целочисленные значения от -5 до +5, частота f1,2 появления которых одинакова и равна 1/11 (рис. 3). В результате сложения могут быть получены значения оцениваемого показателя X в интервале от -10 до +10, почти в два раза превышающем величину исходных интервалов неопределенности. Частота появления отдельных значений в рамках интервала [-10, +10] будет далеко не одинаковой. Так, значение, равное нулю, получится, когда значение второго слагаемого будет равным значению первого, но противоположно ему по знаку. Всего таких комбинаций будет 11. Значение, равное единице, получится в десяти комбинациях и т. д. В итоге частота fx появления значений результирующего показателя X будет иметь вид, представленный на рис. 4, и будет существенно отличаться от частоты появления значений исходных слагаемых. Это отличие становится еще большим в задачах, не сводящихся к простому суммированию показателей Х1 и Х2.
fх1,2 fх
1/11 11/121 Х1 1/121
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
-5 -4 -3 -2 -1 0 1 2 3 4 5 Х2 -10 -8 -6 -4 -2 0 2 4 6 8 10 Х
Рис. 3. Частота появления
Рис. 4. Частота появления значений Х1 и Х2 значений Х = Х1+Х2
Так как характер изменения частоты возможных значений в интервальной математике не отражается, то объективно сравнить уровень неопределённости вычисленных результатов (а следовательно и уровень риска формируемых решений) становится невозможным. Кроме того, интервалы неопределённостей конечных результатов оказываются неоправданно расширенными, что также затрудняет проведение обоснованного выбора. Избежать указанных недостатков можно за счёт объединения достоинств интервального представления с анализом качества получаемых оценок. Именно эта идея положена в основу предложенного интервального гарантированного подхода или интервального гарантированного оценивания.
2. Гарантированное интервальное оценивание
Идея гарантированного подхода в оценивании известна достаточно давно, но корректного и широкого использования для решения важных практических задач до последнего времени так и не получила. В лучшем случае под гарантированными оценками понимаются точечные пессимистические оценки, характерные для наиболее неблагоприятных (наиболее тяжелых или предельных) условий подготовки и проведения операций. Количественный уровень гарантии получения планируемого результата (или уровень риска) при использовании таких оценок не определяется. Интуитивно он представляется как некоторый предельный, абсолютный. Однако вполне очевидно, что свести к нулю степень риска в условиях неопределенности практически невозможно. Уменьшение степени риска всегда связано с необходимостью расходования определенных ресурсов, т.е. с вложением дополнительных затрат. И чем существеннее мы хотим уменьшить риск, тем больше требуется затрат.
Объективные гарантированные оценки с количественным отражением степени неопределённости или риска могут быть получены, если обоснованно определять не только интервал неопределённости, но и частоту появления возможных значений рассматриваемой величины в рамках этого интервала. Именно на этой основе можно объективно установить и величину интервала неопределённости, и соответствующий ему уровень гарантированности. Для вероятностных величин (множество значений которых получено в одинаковых условиях) сложностей с таким представлением нет /171/. В этом случае результирующая оценка рассматриваемого показателя X представлена законом распределения возможных значений (например, плотности распределения W(X)), отражающим уровень и характер (вид, форму) неопределенности получаемых результатов. На основании этого закона определяются гарантированные значения
Х1 : Р (Х1 ? Xтр) ? Ртр ,
если мы стремимся получить значения X, не меньше требуемого Xтр и
Р(Х1 ? Хтр ) ? Ртр , если мы стремимся получить значения Х1 не больше Xтр (рис. 5)
W(X)
Рис. 5. Получение гарантированных оценок
а - X1 не меньше Xтр
б - X1 не больше Xтр
Следует иметь в виду, что распространённые и широко используемые при обосновании важных решений усредненные оценки рассматриваемых показателей, выражаемые, например, в виде среднего числа (математического ожидания) боевых блоков, доставляемых к поражаемым целям, средних значений предполагаемых финансовых затрат и т.п., в общем случае, оказываются практически неприемлемы, так как могут приводить к формированию явно ошибочных решений. Подобная типичная ситуация показана на рис. 6, на котором представлены плотности распределения значений анализируемого показателя X для двух вариантов. Если варианты оценивать по значениям математических ожиданий m 1 и m2, то наиболее предпочтительным оказывается первый вариант, так как m1 > m2 при этом условие пригодности по математическому ожиданию выполняется для каждого варианта: m1 > m2> Xтр. В то же время первый вариант из-за большого разброса возможных значений имеет низкий уровень гарантированных оценок (P1 < 0,7), неприемлемый для характеристики единичных исходов. Второй вариант, хотя и имеет меньшее среднее значение, вполне приемлем по уровню гарантированности (Р2 > 0,95) получаемых оценок и в действительности гораздо предпочтительнее первого.
Рис. 6. Сравнение альтернативных вариантов по средним и гарантированным оценкам
Для статистических данных с известными законами распределения методы гарантированного интервального оценивания хорошо разработаны и широко применяются. Однако применение методов классической теории вероятностей и математической статистики к приближённым единичным количественным данным невозможно из-за несоблюдения принципиальных условий, лежащих в основе этой науки - массовости и статистической однородности. В случае использования результатов единичных измерений объективной основой гарантированного интервального оценивания является величина интервала неопределённости и соответствующий ей уровень гарантированной вероятности. Для обоснования вида распределения частоты возможных значений в рамках интервала неопределённости нужна дополнительная информация. Если такой информации нет, вид распределения можно предположить. Например, исходя из принципа наибольшей неопределённости его можно считать равномерным и использовать в последующих расчётах. Использование этого закона позволит с одной стороны применить хорошо разработанный математический инструмент теории вероятностей, а с другой - получить гарантированную интервальную оценку необходимого результата.
Если же приближённые данные рассматриваются на детерминированном уровне и для них указан только интервал неопределённости, «доопределять» нужно ещё и уровень гарантированности (уверенности) или риска.
Очевидно подобные «доопределения» вида распределения возможных значений и уровня гарантированности могут отражаться на обоснованности конечных результатов и формируемых решений. Чтобы этого избежать нужно дополнительно исследовать влияние «доопределяемых» факторов на величину и неопределённость конечного результата. Если это влияние будет заметным, придётся либо проверять дополнительные гипотезы (условия), либо уточнять исходные данные: от приближённых детерминированных (экспертных) величин переходить к результатам измерений, а на основе результатов измерений, если потребуется, набирать необходимые объёмы статистических данных. Важным при этом является то, что процесс уточнения количественных данных становится обоснованным и целенаправленным.
Корректное применение гарантированного интервального оценивания требует оценки неопределённости (приближённости) не только используемых количественных исходных данных, но и анализа проводимых с ними действий. Чтобы этого не выполнять каждый раз при решении прикладных задач, метрологической аттестации нужно подвергнуть все используемые алгоритмы, программы, модели, методики, методы. Причём делать это нужно на вероятностной (статистической) основе. Если для измерительных средств процедура метрологической аттестации, предусматривающая получение законов распределения погрешностей, стала по существу обязательной и привычной, то точностные свойства разрабатываемых математических моделей, алгоритмов, программ, методик и методов, необходимых для проведения количественных расчетов, исследуются весьма поверхностно или не исследуются вообще. Поэтому, прежде чем что-то рассчитывать, нужно понимать, с какой точностью это нужно делать и знать (или устанавливать) точность применяемого математического инструмента и используемых исходных данных.
Точность используемых методов, методик, моделей и исходных данных должна выбираться такой, которая позволит обеспечить получение результата с требуемым уровнем неопределенности. Недостаточная точность может привести к получению ошибочных результатов и принятию неверных решений. Излишняя точность порождает неоправданную громоздкость и трудоемкость вычислений. В этом случае требуется большая предварительная работа по построению высокоточных моделей, разработке необходимых методов и получению "очень точных" исходных данных. Все это связано с дополнительными экономическими и временными затратами и к тому же трудно реализуемо на практике.
Следует заметить, что в случае имеющихся статистических данных математический аппарат теории вероятностей и математической статистики используется в привычном (классическом) виде. Для единичных результатов измерений и для приближённых оценок использование математического аппарата теории вероятностей носит условный, формальный характер - оно не свидетельствует о вероятностной природе рассматриваемой величины или процесса (для результатов измерений оно отражает только вероятностную природу погрешностей измерений аттестованных измерительных средств).
Важным при этом является то, что вид результирующего закона неопределённости (закона распределения значений определяемой величины в рамках интервала неопределённости) формируется на объективной основе (обосновывается) и обеспечивает получение гарантированных оценок с количественным определением уровня риска.
3. Анализ эффективности в условиях неопределённости
При анализе эффективности дело приходится иметь с различными данными. Например, у покупателя может быть весьма поверхностное (описательное, вербальное) представление о необходимых свойствах интересующей его продукции. Однако уже консультант по продажам, предлагая потенциальному покупателю различные виды продукции, знает её многие свойства на количественном уровне и более объективно может представлять достигнутый уровень качества продукции и её конкурентоспособность. А разработать сложную продукцию без детального количественного представления её свойств просто невозможно - нужна конструкторская документация, все данные в которой представлены в количественном виде.
Несомненно, всем хотелось бы иметь полную количественную определённость: производителю - точную оценку показателей эффективности, и в первую очередь, планируемого дохода, покупателю -«полную» гарантию качества продукции и предлагаемых услуг. Однако при решении сложных задач получить абсолютно точные количественные данные принципиально нельзя, поэтому нужно уметь получать корректные приближённые оценки. При этом необходимо помнить: чем точнее мы хотим что-то измерить или оценить (рассчитать), тем дороже и продолжительнее становится процедура получения исчерпывающих количественных данных. Поэтому точность используемых данных должна быть приемлемой: недостаточная точность может привести к неприемлемым ошибкам, а в конечном счёте к недостижению намеченной цели, а избыточная точность связана с неоправданными затратами /133,171/.
Уровень количественного представления для разных показателей эффективности может быть разным. Так, отдельные показатели качества продукции могут быть заданы на вероятностном (статистическом) уровне. Например, точность стрельбы ракет, погрешность метрологических средств и др. Некоторые показатели качества имеют интервальные детерминированные представления - классы допусков и посадок, классы чистоты обработки металлических поверхностей и т.п.
Значения многих показателей времени и затрат на этапе планирования работ задаются как на статистическом уровне, так и на уровне интервальных измерительных и экспертных оценок. Так, временные нормы (трудовые нормативы) выполнения отдельных операций, лежащие в основе всех экономических оценок - себестоимости продукции, заработной платы рабочих, показателей использования фондов, оборачиваемости средств и др., представляются на предприятиях в статистическом виде. Многие данные, предоставляемые для планирования руководителями различных иерархических уровней - начальниками участков, цехов, производств, технологами, энергетиками и др., представляются в виде экспертных оценок, формируемых на основе имеющегося опыта организации и проведения работ и знания конкретных условий деятельности. Так, опытный начальник участка или цеха без особого труда оценит возможный интервал времени изготовления определённого узла или подсистемы, технолог - интервал времени разработки технологического процесса, оснастки для имеющегося оборудования, управляющей программы для станка с компьютерным управлением; специалист по снабжению - интервал времени приобретения и доставки необходимых материалов, покупных элементов и изделий. Аналогично, экономисты и нормировщики на основе технологических карт и маршрутов выдадут интервальные детерминированные прогнозные оценки затрат рабочего времени, необходимого на изготовление деталей, узлов и подсистем.
Именно на основе всех этих данных осуществляется всё последующее планирование, формируется реальная цель, как критериальная основа будущей деятельности и анализа эффективности.
Как уже отмечалось, корректно использовать приближённые количественные данные, определённые на разном уровне -вероятностном, измерительном и экспертном, можно в рамках метода гарантированного интервального оценивания: только в этом случае удаётся получить количественные результаты с обоснованным уровнем неопределённости.
Для этого придётся измерительные и экспертные данные «доопределять»: для измерительных данных придётся доопределить форму закона распределения возможных значений в рамках интервала неопределённости, а для экспертных данных доопределять нужно ещё и уровень гарантированности задаваемых интервальных значений. В связи с этим ещё раз следует подчеркнуть: и для результатов измерений, и для экспертных оценок использование в последующем математического аппарата теории вероятностей носит условный, формальный характер - оно не свидетельствует о вероятностной природе рассматриваемой величины. Зато применение этого аппарата позволяет, во-первых, получать обоснованные значения интервалов неопределённостей результирующих величин, а во-вторых, выделять те исходные данные, которые вносят наибольшую неопределённость в получаемые результаты, и принимать обоснованные меры по их уточнению (от экспертных величин переходить к результатам измерений, а в случае необходимости - к получению статистических оценок). В условиях неопределённости и применения метода гарантированного интервального оценивания критерий эффективности будет представляться выражением:
(5)
где Р - вероятность того, что значения всех показателей эффективности
будут удовлетворять заданным требованиям ;
Ртр- требуемый (гарантированный) уровень вероятности.
Величина вероятности Р вычисляется из совместного закона распределения анализируемых показателей эффективности , который в общем случае определяется через условные вероятности анализируемых величин /132,171,173/:
(6)
где - вероятность того, что значения показателя 2 будут соответствовать предъявляемым требованиям при условии выполнения требований для значений показателя 1;
- вероятность того, что значения показателя 3 будут соответствовать предъявленным требованиям при условии выполнения требований для значений показателя 1 и 2, и т.д. В случае независимости рассматриваемых показателей условные вероятности переходят в соответствующие безусловные, а последнее выражение приобретает вид:
(7)
Для наглядности на рис. 7 представлена совместная плотность распределения вероятностей показателя эффективности W(K,3), объединяющего две составляющие: качество продукции К и расходуемые на это затраты З. На соответствующих осях показаны ограничения Ктр и Зтр, накладываемые на значения этих показателей. Вероятность выполнения установленных требований может быть определена двойным интегрированием совместной плотности вероятности f() в выделенном пространстве:
(8)
Как уже отмечалось, на практике при анализе эффективности деятельности предприятий дело приходится иметь с тремя группами данных: с показателями качества продукции, затратами и временем выполнения работ.
Рис. 7. Двумерная плотность распределения показателей качества продукции и ресурсов
Зная оценки частных показателей эффективности и учитывая присущую им неопределённость, нужно уметь получать обоснованные данные не только значений результирующих показателей эффективности, но и интервала их неопределённости с соответствующим уровнем гарантированной вероятности. Для показателей времени и затрат оценка обобщённых интервалов неопределённостей не вызывает сложностей, так как значения обобщающих показателей этих величин получаются простым суммированием составляющих.
Действительно, учитывая, что общие дисконтированные затраты являются простой суммой составляющих затрат
, (9)
где 3(Т) - общие затраты на временном интервале [0,Т];
- i-ая составляющая затрат, расходуемых в t-ый порядковый год интервала [0,Т];
и принимая, например, закон распределения погрешностей оценки i-x затрат нормальным с математическим ожиданием m3j со среднеквадратической ошибкой у31:
,
получаем
,
где - математическое ожидание суммарных затрат;
- среднеквадратичная ошибка определения суммарных затрат.
Временные схемы организации работ могут быть либо последовательными, либо параллельными, либо комбинированными. При последовательной схеме выполнения работ неопределённость момента завершения работ определяется аналогично предыдущему случаю и при нормальных законах распределения погрешностей математическое ожидание тТ и среднеквадратическая ошибка уТ определения значений результирующего временного показателя будут равны:
где mТ - математические ожидания и среднеквадратические ошибки определения времени выполнения i-ых работ ().
При параллельном выполнении всех работ общая неопределённость времени завершения работ определяется не только продолжительностью самой растянутой во времени работой, но и уровнями неопределённости этих работ.
Как видно из этого рисунка, без учёта неопределённости самой продолжительной работой является пятая. Однако гарантированное окончание работ определяется продолжительностью 3-ей работы.
При последовательно-параллельной (комбинированной или смешанной) схеме работ вначале ищется продолжительность всех последовательных «цепочек» работ, а окончательное решение о неопределённости принимается в результате анализа этих «цепочек», как для случая параллельного выполнения работ.
Наибольшие трудности с определением интервалов неопределённостей возникают для показателей качества продукции. Показатели качества потребительского уровня формируются из показателей качества нижних иерархических уровней в результате самых разных преобразований. Характер этих преобразований определятся в проектно-конструкторских материалах. Однако, серьёзного анализа неопределённостей (оценок точности или погрешности) получаемых результирующих характеристик, как правило, не проводится. Да и в теории вероятностей подобным задачам необходимого внимания тоже не уделялось. Именно поэтому целесообразно привести наиболее распространённые преобразования основных используемых на практике законов распределения погрешностей.
4. Основные правила преобразования законов распределения
Основная задача анализа эффективности деятельности социально-экономических систем заключается не только в получении количественных значений показателей эффективности, но и в оценке степени их неопределённости. В рамках гарантированного интервального оценивания нужно уметь преобразовывать вид закона распределения (существующий или предполагаемый) исходных величин в законы распределения показателей эффективности. С этой целью воспользуемся рекомендациями хорошо известных специалистов в области теории вероятностей и математической статистики, например, Тихонова В.И./132/ или Левина Б.Р. /173/. Приведём вначале общее правило преобразования, а затем рассмотрим случаи, наиболее характерные для задач эффективности. Пусть известна совокупность исходных величин Ei с n-мерной плотностью распределения вероятности Wn(E1,E2,...,En). Нужно найти плотность распределения возможных значений показателей эффективности иn, которые получаются из исходных величин Е1,Е2,...,Еn путём их нелинейного преобразования:
(13)
Для двух величин
,
и обратных функций
якобиан преобразования равен:
(14)
Поэтому
Из последней формулы получаем одномерную плотность распределения вероятностей для одной величины :
(15)
Откуда для плотности вероятностей результирующей величины, получаемой в результате выполнения наиболее распространенных арифметических действий (суммы, разности, произведения и частного) двух случайных величин имеем следующие формулы:
а) Для суммы двух величин :
(16)
б) Для разности :
; (17)
в) Для произведения :
(18)
г) Для частного :
(19)
Для плотности распределения вероятностей суммы двух независимых величин Е1 и Е2, когда совместная плотность распределения вероятности равна произведению одномерных плотностей распределения W(E1) и W(E2) каждая из которых описывается равномерным законом распределения:
интервальный гарантированный риск недостижение
Получаем формулу для плотности распределения вероятностей результирующей величины , представленную на рис. 1.9:
(20)
,
a b c a + c b + c d a + d b + d
Рис. 9. Плотность распределения суммы независимых равномерно распределенных величин
При одинаковых равномерных законах распределения исходных величин
результирующая плотность распределения величины приобретает вид известного треугольного закона распределения (закона Симпсона), показанного на рис.1.10:
(21)
a b 2a 2b
Рис. 10. Плотность распределения суммы величин при одинаковых равномерных законах распределения
Как видим, при равномерных законах распределения исходных величин форма закона распределения не сохраняется даже при простейших преобразованиях. Это приводит к тому, что для обеспечения требуемого уровня гарантированности получаемых результатов интервалы неопределённости нужно корректно пересчитывать. Так, если взять полный интервал неопределённости величины 0, распределённой по закону Симпсона, то для разных уровней гарантированности он может оказаться существенно расширенным по отношению к необходимому. При суммировании п одинаково распределённых величин с равномерным законом распределения величина допустимого уменьшения результирующего интервала неопределённости X вычисляется по формуле, которую нетрудно получить из простых геометрических рассуждений (рис. 11):
(22)
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
a б в b na x/2 x/2 nb
Рис. 11. Результирующий интервал неопределённости суммы равномерно распределённых величин
Из этой формулы следует, что величина необходимого сокращения интервала неопределённости результирующего показателя прямо пропорциональна количеству суммируемых величин и находится в квадратичной зависимости от заданного уровня гарантированности результатов Рд. Так, для двух суммируемых величин Е (n = 2) при Рд = 0,9 правильно определённый интервал оказывается короче общего интервала неопределённости 2(b-а) на величину 0,66 (b-а), а при Рд = 0,75 - на (b-а), т.е. в два раза; для четырёх исходных величин это уменьшение уже составляет 1,32 (b-а) и 2(b-а) соответственно по отношению к общему интервалу неопределённости 4(b-а).
Учитывая, что при анализе эффективности дело приходится иметь с большим числом составляющих показателей и качества, и затрат, и времени, корректно рассчитанные интервалы неопределённостей оказываются совершенно иными по сравнению с исходными.
Универсальной формы представления законов распределения, одинаково удобной для решения всех практических задач, не существует: даже самые известные и широко используемые в теории вероятностей и математической статистике законы распределения имеют и достоинства, и недостатки. Так, равномерный закон распределения в наилучшей мере отражает характер наибольшей неопределённости значений в рамках выбранного интервала. Для него просто считается уровень гарантированной вероятности. Однако даже при простейших преобразованиях он существенно трансформируется.
Нормальный закон распределения привлекает внимание из-за центральной предельной теоремы теории вероятностей - этим законом хорошо описываются данные измерений, проводимых в одних и тех же условиях (если в процессе измерений все мешающие факторы примерно одинаково отражаются на результатах измерений).
Однако нормальный закон имеет теоретически бесконечные «хвосты» (он не ограничен никаким интервалом), что противоречит практическому представлению статистических данных. Кроме того, уровень гарантированной вероятности при этом законе рассчитывается по формуле Лапласа:
, (22)
через соответствующую функцию Ф(t) - функцию Лапласа, которая вычисляется только таблично:
Нормальный закон удобен при композиции величин, но неудобен при других преобразованиях, например, при дифференцировании и интегрировании.
В некоторых задачах оказывается удобным экспоненциальный закон распределения или закон Пуассона в силу присущих ему свойств. Например, при дифференцировании и интегрировании экспоненциальной функции характер её сохраняется. Однако для этого закона даже простейшие вычисления приходится выполнять численно.
Именно поэтому в каждом конкретном случае вид представления закона распределений вероятностей целесообразно выбирать, исходя из особенностей решаемой задачи.
Устойчивость (возможность сохранения формы представления с изменением параметров) нормального закона распределения в практических задачах проявляется достаточно часто. Так, если провести композицию двух величин , одна из которых имеет нормальную плотность распределения с параметрами , а другая - равномерную плотность распределения на интервале [а,b], то в соответствии с формулой (16) плотность распределения суммы этих величин будет иметь вид:
(24)
Подинтегральная функция в последнем выражении есть не что иное, как нормальный закон с центром рассеивания и среднеквадратическим отклонением , а интеграл в этом выражении есть вероятность попадания величины , подчинённой этому закону, на участок от a до b, т.е.
(25)
Графики исходных и результирующего законов распределений для параметров a = -2; b = 2; представлены на рис. 12:
W(и1), W(и2), W(и)
и1, и2, и
Рис. 12. Вид плотности распределения композиции величин и1 и и2
При композиции достаточно большого числа исходных величин с произвольными законами распределения суммарный закон оказывается близок по форме к нормальному. Так, при равномерно распределённых исходных величинах уже для трёх слагаемых закон распределения результирующей величины по форме напоминает нормальный (рис. 13):
W(и1), W(и2), W(и3) W(и = и1+ и2+ и3)
Рис. 13. Вид плотности распределений композиций трёх равномерно распределённых величин
5. Анализ рисков недостижения реальных целей
Проблема риска является одной из ключевых при принятии решений и управлении. При организации любой деятельности риска избежать невозможно по двум основным причинам. Во-первых, социально-экономические условия скрывают в себе много неожиданных и трудно прогнозируемых факторов, которые обостряются в условиях рынка. Рынок динамичен и изменчив по своей природе. Он сталкивает интересы предпринимателей, втягивает их в конкурентную борьбу, заставляет повышать качество продукции, идти на внедрение новых прогрессивных решений, предлагать новые виды услуг, тем самым вносит новые факторы неопределённости. Эта неопределённость с точки зрения оценки риска является ситуационной.
Во-вторых, даже при стабильных социально-экономических условиях и установившемся спросе на рынке, получить точные количественные представления намеченных реальных целей, условий их достижения, точно рассчитать ожидаемые результаты будущей деятельности принципиально невозможно. Используемые на практике исходные данные, модели, методы, методики, алгоритмы и программы расчётов в общем случае всегда приближенны и естественно приводят к получению приближённых результатов. Неопределённость, порождающая такой риск, является количественной неопределённостью. Таким образом, риск существует объективно и порождается ситуационной и количественной неопределённостью (рис. 14).
Поэтому, планируя любую деятельность, нужно непременно количественно оценивать и анализировать величину сопутствующего риска, понимая его объективную природу, стремиться не к исключению риска вообще, а к снижению его до приемлемого уровня.
Несмотря на то, что в последнее время о риске говорится и пишется очень много, количественно риск по существу не оценивается. В лучшем случае приводятся вероятностные оценки возможности наступления неблагоприятных событий (ситуаций).
Размещено на http://www.Allbest.ru/
Размещено на http://www.Allbest.ru/
Рис. 14. Основные причины возникновения риска
Однако, как корректно применять аппарат теории вероятностей к исследованию социально-экономических систем, которые обычно уникальны, функционируют в специфических (отнюдь не типовых!) и постоянно изменяющихся условиях, как получать необходимые исходные данные на вероятностном уровне, обычно не объясняется /106,175,176/. Поэтому вероятностные количественные оценки риска в лучшем случае носят экспертный характер. Интервальное гарантированное оценивание открывает широкие возможности для получения обоснованных количественных оценок риска. Учитывая, что ситуационная неопределённость должна рассматриваться для каждого конкретного вида деятельности и для вполне определённых условий, остановимся на методических вопросах оценки риска, порождаемого количественной неопределённостью.
Задача оценки риска, возникающего из-за количественной неопределённости, характерна для любых видов деятельности. Обычно эту составляющую риска не оценивают вообще, да и количественные оценки показателей будущей деятельности, получаемые традиционными методами, не пригодны для анализа риска - они не содержат никакой неопределённости. При этом совершенно игнорируется предупреждение о том, что количественные данные без указания их погрешности не имеют никакой ценности. Можно сказать больше - такие данные вредны: они создают иллюзию обоснованности, не концентрируют внимание на уровне неопределённости получаемых результатов и не позволяют определить, насколько им можно доверять.
Игнорирование количественной неопределённости стало привычным и естественным. Оно характерно для любого уровня управления, включая государственный макроэкономический уровень: в официальных документах любого ранга все экономические оценки приводятся в виде точных данных. Причём точность их поражает - приводятся десятые доли процентов (например, рост валового внутреннего продукта, темпы роста основных показателей). А представление (модель) экономической системы государства, собираемые с предприятий первичные исходные данные, используемые математические методы (алгоритмы) и методики расчётов не подвергаются даже самому примитивному анализу на достоверность. И можно уверенно предположить, что ошибки в этой области измеряются в лучшем случае в разах значений оцениваемых показателей.
В словаре Вебстера «риск» определяется как «опасность, возможность убытка или ущерба». Именно этого определения мы будем придерживаться в дальнейшем. Если мы хотим оценивать риск, следуя этому определению, нужно уметь измерять, во-первых, величину возможного ущерба, а во-вторых, - возможность его наступления.
При оценке показателей эффективности ущерб заключается в неполучении требуемых значений каждого анализируемого показателя (величины недополученной выручки, прибыли, рентабельности, конкретного показателя качества, перерасхода затрат и т.п.). Возможность же любого подобного исхода при интервально-гарантированном методе оценивания количественно измеряется уровнем соответствующей вероятности.
С учётом неопределённости эффективность деятельности на количественном уровне оценивается как вероятность достижения намеченной реальной цели:
(26)
Учитывая, что события «достижения» и «не достижения» цели составляют полную группу событий, риск возможного не достижения цели будет определяться выражением:
(27)
Следовательно, определяя эффективность с учётом неопределённости значений показателей, мы получаем и оценку риска не достижения поставленной цели.
Так как эффективность деятельности характеризуется многими показателями и<n> = {и 1, и 2,..., иn}, то риск не достижения цели будет зависеть от степени неопределённости этих показателей. В общем случае эта зависимость выражается через условные вероятности не получения требуемых значений соответствующих показателей:
Подобные документы
Теоретические основы первичной обработки статистической информации. Особенности определения минимального числа объектов наблюдения при оценке показателей надежности. Анализ вероятностной бумаги законов нормального распределения и распределения Вейбулла.
курсовая работа [163,5 K], добавлен 22.03.2010Анализ распределений для выявления закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Характеристика центральной тенденции распределения и оценка вариации признака.
лабораторная работа [606,7 K], добавлен 13.05.2010Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Значения показателей и коэффициент вариации. Пределы возможных ошибок, исключение ошибочных результатов. Величина доверительных интервалов для заданных значений доверительных вероятностей. Средние квадратичные отклонения. Значения коэффициента доверия.
лабораторная работа [38,4 K], добавлен 01.03.2011Графический и содержательный анализ данных об объеме рынка бытовой техники на основе методов прогнозирования: сравнение прогнозных и реальных значений, оценка адекватности и точности модели. Построение прогноза на год и расчет прогнозируемого дохода.
курсовая работа [245,2 K], добавлен 29.04.2011Оценка параметров шестимерного нормального закона распределения с помощью векторов средних арифметических и среднеквадратического отклонений и матрицы парных коэффициентов корреляции (по программе Statistica). Методика определения Z-преобразования Фишера.
контрольная работа [33,6 K], добавлен 13.09.2010Теория измерений является составной частью эконометрики, которая входит в состав статистики объектов нечисловой природы. Краткая история теории измерений. Основные шкалы измерения. Инвариантные алгоритмы и средние величины – в т. ч. в порядковой шкале.
реферат [30,2 K], добавлен 08.01.2009Проблемы неравномерного распределения доходов среди населения. Закон распределения Парето: зависимость между размером доходов и количеством людей. Распределение Парето в теории катастроф. Методы обработки данных с распределением с тяжелыми хвостами.
курсовая работа [413,0 K], добавлен 06.01.2012Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Теория измерений. Использование чисел в жизни и хозяйственной деятельности людей. Инвариантные алгоритмы и средние величины. Численность работников различных категорий, их заработная плата и доходы. Величины в порядковой шкале. Средние по Колмогорову.
реферат [34,5 K], добавлен 09.01.2009