Информационный процесс
Типовые функциональные компоненты информационной системы. Создание архитектуры клиент-сервер. Жизненный цикл информационных систем. CASE-технологии проектирования. Средства конфигурационного управления. Принципы построения и проектирования баз данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курс лекций |
Язык | русский |
Дата добавления | 31.05.2012 |
Размер файла | 2,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Анализ информационных потребностей потенциальных пользователей имеет два аспекта: 1) определение собственно сведений об объектах ПрОбл; 2) анализ возможных запросов к БД и требований по оперативности их выполнения.
Размещено на http://www.allbest.ru/
178
Рис. 3. Этапы проектирования БД.
Анализ возможных запросов к БД позволяет уточнить связи между сведениями, которые необходимо хранить. Пусть, например, в БД по учебному процессу института хранятся сведения об учебных группах, читаемых курсах и кафедрах, а также связи "учебные группы--читаемые курсы" и "читаемые курсы--кафедры". Тогда запрос о том, проводит ли некоторая кафедра занятия в конкретной учебной группе может быть выполнен только путем перебора всех читаемых в данной группе курсов.
Хранение большого числа связей усложняет БД и приводит к увеличению потребной памяти ЭВМ, но часто существенно ускоряет поиск нужной информации. Поэтому разработчику БД (АБД) приходится принимать компромиссное решение, причем процесс определения перечня хранимых связей, как правило, имеет итерационный характер.
Датологическое проектирование подразделяется на логическое (построение концептуальной модели данных) и физическое (построение физической модели) проектирование.
Главной задачей логического проектирования (ЛП) БД является представление выделенных на предыдущем этапе сведений в виде данных в форматах, поддерживаемых выбранной СУБД.
Задача физического проектирования (ФП) -- выбор способа хранения данных на физических носителях и методов доступа к ним с использованием возможностей, предоставляемых СУБД.
Инфологическая модель "сущность--связь" (entity relationship model; ER-model) П. Чена (Р. Chen) представляет собой описательную (неформальную) модель ПрОбл, семантически определяющую в ней сущности и связи.
Относительная простота и наглядность описания ПрОбл позволяет использовать ее в процессе диалога с потенциальными пользователями с самого начала инфологического проектирования. Построение инфологической модели П. Чена, как и любой другой модели, является творческим процессом, по этому единой методики ее создания нет. Однако при любом подходе к построению модели используют три основных конструктивных элемента:
§ сущность;
§ атрибут;
§ связь.
Сущность -- это собирательное понятие некоторого повторяющегося объекта, процесса или явления окружающего мира, о котором необходимо хранить информацию в системе. Сущность может определять как материальные (например, "студент", "грузовой автомобиль" и т.п.), так и нематериальные объекты (например, "экзамен", "проверка" и т.п.). Главной особенностью сущности является то, что вокруг нее сосредоточен сбор информации в конкретной ПрОбл. Тип сущности определяет набор однородных объектов, а экземпляр сущности -- конкретный объект в наборе. Каждая сущность в модели Чена именуется. Для идентификации конкретного экземпляра сущности и его описания используется один или несколько атрибутов.
Атрибут -- это поименованная характеристика сущности, которая принимает значения из некоторого множества значений. Например, у сущности "студент" могут быть атрибуты "фамилия", "имя", "отчество", "дата рождения", "средний балл за время обучения" и т.п.
Связи в инфологической модели выступают в качестве средства, с помощью которого представляются отношения между сущностями, имеющими место в ПрОбл. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями) и, в общем случае, n-арные (между п сущностями) связи. Например, сущности "отец", "мать" и "ребенок" могут находиться в триарном отношении "семья" ("является членом семьи").
Связи должны быть поименованы; между двумя типами сущностей могут существовать несколько связей.
Наиболее распространены бинарные связи. Любую n-арную связь можно представить в виде нескольких бинарных.
Различают четыре типа связей:
§ связь один к одному (1:1);
§ связь один ко многим (1:М);
§ связь многие к одному (М:1);
§ связь многие ко многим (M:N).
Связь один к одному определяет такой тип связи между типами сущностей А и В, при которой каждому экземпляру сущности А соответствует один и только один экземпляр сущности В, и наоборот. Таким образом, имея некоторый экземпляр сущности А, можно однозначно идентифицировать соответствующий ему экземпляр сущности В, а по экземпляру сущности В -- экземпляр сущности А. Например, связь типа 1:1 ("имеет") может быть определена между сущностями "автомобиль" и "двигатель", так как на конкретном автомобиле может быть установлен только один двигатель, и этот двигатель, естественно, нельзя установить сразу на несколько автомобилей.
Связь один ко многим определяет такой тип связи между типами сущностей А и В, для которой одному экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, но каждому экземпляру сущности В соответствует один экземпляр сущности А. При этом однозначно идентифицировать можно только экземпляр сущности А по экземпляру сущности В. Примером связи типа 1:М является связь "учится" между сущностями "учебная группа" и "студент". Для такой связи, зная конкретного студента, можно однозначно идентифицировать учебную группу, в которой он учится, или, зная учебную группу, можно определить всех обучающихся в ней студентов.
Связь многие к одному по сути эквивалентна связи один ко многим. Различие заключается лишь в том, с точки зрения какой сущности (А или В) данная связь рассматривается.
Связь многие ко многим определяет такой тип связи между типами сущностей А и В, при котором каждому экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, и наоборот. При такой связи, зная экземпляр одной сущности, можно указать все экземпляры другой сущности, относящиеся к исходному, т.е. идентификация сущностей не уникальна в обоих направлениях. В качестве примера такой связи можно рассмотреть связь "изучает" между сущностями "учебная дисциплина" и "учебная группа".
Реально все связи являются двунаправленными, т.е., зная экземпляр одной из сущностей, можно идентифицировать (однозначно или многозначно) экземпляр (экземпляры) другой сущности. В некоторых случаях целесообразно рассматривать лишь однонаправленные связи между сущностями в целях экономии ресурсов ЭВМ. Возможность введения таких связей полностью определяется информационными потребностями пользователей. Различают простую и многозначную однонаправленные связи, которые являются аналогами связей типа 1:1 и 1:М с учетом направления идентификации. Так, для простой однонаправленной связи "староста" ("является старостой") между сущностями "учебная группа" и "студент" можно, зная учебную группу, однозначно определить ее старосту, но, зная конкретного студента, нельзя сказать, является ли он старостой учебной группы. Примером многозначной однонаправленной связи служит связь между сущностями "пациент" и "болезнь", для которой можно для каждого пациента указать его болезни, но нельзя выявить всех обладателей конкретного заболевания.
Графически типы сущностей, атрибуты и связи принято изображать прямоугольниками, овалами и ромбами соответственно. На рис. 4 представлены примеры связей различных типов; на рис. 5 и 6 - фрагменты инфологических моделей "военнослужащий" (без указания атрибутов) и "учебный процесс факультета".
Несмотря на то, что построение инфологической модели есть процесс творческий, можно указать два основополагающих правила, которыми следует пользоваться всем проектировщикам БД:
§ при построении модели должны использоваться только три типа конструктивных элементов: сущность, атрибут, связь;
§ каждый компонент информации должен моделироваться только одним из приведенных выше конструктивных элементов для исключения избыточности и противоречивости описания.
Моделирование ПрОбл начинают с выбора сущностей, необходимых для ее описания. Каждая сущность должна соответствовать некоторому объекту (или группе объектов) ПрОбл, о котором в системе будет накапливаться информация. Существует проблема выбора конструктивного элемента для моделирования той или иной "порции" информации, что существенно затрудняет процесс построения модели.
Размещено на http://www.allbest.ru/
178
Рис. 4. Примеры связей между сущностями.
Размещено на http://www.allbest.ru/
178
Рис. 5. Фрагмент ER-модели "Военнослужащий".
Так, информация о том, что некоторый студент входит в состав учебной группы (УГ) можно в модели представить:
§ как связь "входит в состав" для сущностей "студент" и "УГ";
§ как атрибут "имеет в составе "студента" сущности "УГ";
§ как сущность "состав УГ".
В этих случаях приходится рассматривать несколько вариантов и с учетом информационных потребностей пользователей разбивать ПрОбл на такие фрагменты, которые с их точки зрения представляют самостоятельный интерес.
При описании атрибутов сущности необходимо выбрать ряд атрибутов, позволяющих однозначно идентифицировать экземпляр сущности. Совокупность идентифицирующих атрибутов называют ключом.
Помимо идентифицирующих используются и описательные атрибуты, предназначенные для более полного определения сущностей. Число атрибутов (их тип) определяется единственным образом -- на основе анализа возможных запросов пользователей. Существует ряд рекомендаций по "работе с атрибутами", например, по исключению повторяющихся групп атрибутов (см. рис. 7).
При определении связей между сущностями следует избегать связей типа M:N, так как они приводят к существенным затратам ресурсов ЭВМ. Устранение таких связей предусматривает введение других (дополнительных) элементов -- сущностей и связей. На рис. 8 приведен пример исключения связи многие ко многим.
Размещено на http://www.allbest.ru/
178
Рис. 7. Пример исключения повторяющейся группы атрибутов.
Приведем типовую последовательность работ (действий) по построению инфологической модели:
§ выделение в ПрОбл сущностей;
§ введение множества атрибутов для каждой сущности и выделение из них ключевых; исключение множества повторяющихся атрибутов (при необходимости);
§ формирование связей между сущностями;
§ исключение связей типа M:N (при необходимости);
§ преобразование связей в однонаправленные (по возможности).
Помимо модели Чена существуют и другие инфологические модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструктивные элементы и соглашения по их использованию для представления в БД информации о ПрОбл. Иными словами, первый этап построения БД всегда связан с моделированием предметной области.
Размещено на http://www.allbest.ru/
178
Рис. 8. Пример исключения связи типа M:N.
Лекция №9
Принципы построения и этапы проектирования баз данных
Концептуальные модели данных
В отличие от инфологической модели ПрОбл, описывающей по некоторым правилам сведения об объектах материального мира и связи между ними, которые следует иметь в БД, концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД (см. Лекция №8 рис. 3).
По существу модель данных -- это совокупность трех составляющих:
§ типов (структур) данных;
§ операций над данными;
§ ограничений целостности.
Другими словами, модель данных представляет собой некоторое интеллектуальное средство проектировщика, позволяющее реализовать интерпретацию сведений о ПрОбл в виде формализованных данных в соответствии с определенными требованиями, т.е. средство абстракции, которое дает возможность увидеть "лес" (информационное содержание данных), а не отдельные "деревья" (конкретные значения данных).
Типы структур данных
Среди широкого множества определений, обозначающих типы структур данных, наиболее распространена терминология КОДАСИЛ (Conference of DAta SYstems Language) - международной ассоциации по языкам систем обработки данных, созданной в 1959 г.
В соответствии с этой терминологией используют пять типовых структур (в порядке усложнения):
§ элемент данных;
§ агрегат данных;
§ запись;
§ набор;
§ база данных.
Дадим краткие определения этих структур.
Элемент данных -- наименьшая поименованная единица данных, к которой СУБД может адресоваться непосредственно и с помощью которой выполняется построение всех остальных структур данных.
Агрегат данных -- поименованная совокупность элементов данных, которую можно рассматривать как единое целое. Агрегат может быть простым или составным (если он включает в себя другие агрегаты).
Запись -- поименованная совокупность элементов данных и (или) агрегатов. Таким образом, запись - это агрегат, не входящий в другие агрегаты. Запись может иметь сложную иерархическую структуру, поскольку допускает многократное применение агрегации.
Набор -- поименованная совокупность записей, образующих двухуровневую иерархическую структуру. Каждый тип набора представляет собой связь между двумя типами записей. Набор определяется путем объявления одного типа записи "записью-владельцем", а других типов записей -- "записями-членами". При этом каждый экземпляр набора должен содержать один экземпляр "записи-владельца" и любое количество "записей-членов". Если запись представляет в модели данных сущность, то набор -- связь между сущностями. Например, если рассматривать связь "учится" между сущностями "учебная группа" и "студент", то первая из сущностей объявляется "записью-владельцем" (она в экземпляре набора одна), а вторая - "записью-членом" (их в экземпляре набора может быть несколько).
База данных поименованная совокупность экземпляров записей различного типа, содержащая ссылки между записями, представленные экземплярами наборов.
Отметим, что структуры БД строятся на основании следующих основных композиционных правил:
§ БД может содержать любое количество типов записей и типов наборов;
§ между двумя типами записей может быть определено любое количество наборов;
§ тип записи может быть владельцем и одновременно членом нескольких типов наборов.
Следование данным правилам позволяет моделировать данные о сколь угодно сложной ПрОбл с требуемым уровнем полноты и детализации.
Рассмотренные типы структур данных могут быть представлены в различной форме -- графовой; табличной; в виде исходного текста языка описания данных конкретной СУБД.
Операции над данными
Операции, реализуемые СУБД, включают селекцию (поиск) данных; действия над данными.
Селекция данных выполняется с помощью критерия, основанного на использовании либо логической позиции данного (элемента; агрегата; записи), либо значения данного, либо связей между данными.
Селекция на основе логической позиции данного базируется на упорядоченности данных в памяти системы. При этом критерии поиска могут формулироваться следующим образом:
§ найти следующее данное (запись);
§ найти предыдущее данное;
§ найти n-ое данное;
§ найти первое (последнее) данное. Этот тип селекции называют селекцией посредством текущей, в качестве которой используется индикатор текущего состояния, автоматически поддерживаемый СУБД и, как правило, указывающий на некоторый экземпляр записи БД.
Критерий селекции по значениям данных формируется из простых или булевых условий отбора. Примерами простых условий поиска являются:
§ ВУС = 200100;
§ ВОЗРАСТ > 20;
§ ДАТА < 19.04.2002 и т. п.
Булево условие отбора формируется путем объединения простых условий с применением логических операций, например:
§ (ДАТА_РОЖДЕНИЯ < 28.12.1963) И (СТАЖ> 10);
§ (УЧЕНОЕ_ЗВАНИЕ=ДОЦЕНТ:) ИЛИ (УЧЕНОЕЗВАНИЕ-ПРОФЕССОР).
Если модель данных, поддерживаемая некоторой СУБД, позволяет выполнить селекцию данных по связям, то можно найти данные, связанные с текущим значением какого-либо данного. Например, если в модели данных реализована двунаправленная связь "учится" между сущностями "студент" и "учебная группа", можно выявить учебные группы, в которых учатся юноши (если в составе описания студента входит атрибут "пол").
Как правило, большинство современных СУБД позволяет осуществлять различные комбинации описанных выше видов селекции данных.
Ограничения целостности
Ограничения целостности -- логические ограничения на данные -- используются для обеспечения непротиворечивости данных некоторым заранее заданным условиям при выполнении операций над ними. По сути ограничения целостности -- это набор правил, используемых при создании конкретной модели данных на базе выбранной СУБД.
Различают внутренние и явные ограничения.
Ограничения, обусловленные возможностями конкретной СУБД, называют внутренними ограничениями целостности. Эти ограничения касаются типов хранимых данных (например, "текстовый элемент данных может состоять не более чем из 256 символов" или "запись может содержать не более 100 полей") и допустимых типов связей (например, СУБД может поддерживать только так называемые функциональные связи, т.е. связи типа 1:1, 1:М или М:1). Большинство существующих СУБД поддерживают, прежде всего, именно внутренние ограничения целостности, нарушения которых приводят к некорректности данных и достаточно легко контролируются.
Ограничения, обусловленные особенностями хранимых данных о конкретной ПрОбл, называют явными ограничениями целостности. Эти ограничения также поддерживаются средствами выбранной СУБД, но они формируются обязательно с участием разработчика БД путем определения (программирования) специальных процедур, обеспечивающих непротиворечивость данных. Например, если элемент данных "зачетная книжка" в записи "студент" определен как ключ, он должен быть уникальным, т.е. в БД не должно быть двух записей с одинаковыми значениями ключа. Другой пример: пусть в той же записи предусмотрен элемент "военно-учетная специальность" и для него отведено 6 десятичных цифр. Тогда другие представления этого элемента данных в БД невозможны. С помощью явных ограничений целостности можно организовать как "простой" контроль вводимых данных (прежде всего, на предмет принадлежности элементов данных фиксированному и заранее заданному множеству значений: например, элемент "ученое звание" не должен принимать значение "почетный доцент", если речь идет о российских ученых), так и более сложные процедуры (например, введение значения "профессор" элемента данных "ученое звание" в запись о преподавателе, имеющем возраст 25 лет, должно требовать, по крайней мере, дополнительного подтверждения).
Разнообразие существующих моделей данных соответствует разнообразию областей применения и предпочтений пользователей.
В специальной литературе встречается описание довольно большого количества различных моделей данных. Хотя наибольшее распространение получили иерархическая, сетевая и, бесспорно, реляционная модели, вместе с ними следует упомянуть и некоторые другие.
Используя в качестве классификационного признака особенности логической организации данных, можно привести следующий перечень известных моделей данных:
§ иерархическая;
§ сетевая;
§ реляционная;
§ бинарная;
§ семантическая сеть.
Иерархическая модель данных
Наиболее давно используемой (можно сказать классической) является модель данных, в основе которой лежит иерархическая структура типа дерева. Дерево -- орграф, в каждую вершину которого, кроме первой (корневой), входит только одна дуга, а из любой вершины (кроме конечных) может исходить произвольное число дуг. В иерархической структуре подчиненный элемент данных всегда связан только с одним исходным.
На рис. 1 показан фрагмент объектной записи в иерархической модели данных. Часто используется также "упорядоченное дерево", в котором значим относительный порядок поддеревьев.
Достоинства такой модели несомненны: простота представления предметной области, наглядность, удобство анализа структур и простота их описания. К недостаткам следует отнести сложность добавления новых и удаления существующих типов записей, невозможность отображения отношений, отличающихся от иерархических, громоздкость описания и информационную избыточность.
Размещено на http://www.allbest.ru/
178
Рис. 1. Фрагмент иерархической модели данных.
Характерные примеры реализации иерархических структур -- язык Кобол и СУБД семейства IMS (создана в рамках проекта высадки на Луну - "Аполлон") и System 2000 (S2K).
Сетевая модель данных
В системе баз данных, предложенных CODASYL, за основу была взята сетевая структура. Существенное влияние на разработку этой модели оказали ранние сетевые системы -- IDS и Ассоциативный ПЛ/1. Необходимость в процессе получения одного отчета обрабатывать несколько файлов обусловила целесообразность установления перекрестных ссылок между файлами, что, в конце концов, и привело к сетевым структурам.
Сетевая модель данных основана на представлении информации в виде орграфа, в котором в каждую вершину может входить произвольное число дуг. Вершинам графа сопоставлены типы записей, дугам -- связи между ними. На рис. 2. представлен пример структуры сетевой модели данных.
По сравнению с иерархическими сетевые модели обладают рядом существенных преимуществ: возможность отображения практически всего многообразия взаимоотношений объектов предметной области, непосредственный доступ к любой вершине сети (без указания других вершин), малая информационная избыточность. Вместе с тем в сетевой модели невозможно достичь полной независимости данных -- с ростом объема информации сетевая структура становится весьма сложной для описания и анализа.
Размещено на http://www.allbest.ru/
178
Рис. 2. Фрагмент сетевой модели данных.
Известно, что применение на практике иерархических и сетевых моделей данных в некоторых случаях требует разработки и сопровождения значительного объема кода приложения, что иногда может стать для информационной системы непосильным бременем.
Реляционная модель данных
В основе реляционной модели данных лежат не графические, а табличные методы и средства представления данных и манипулирования ими (рис. 3). В реляционной модели для отображения информации о предметной области используется таблица, называемая "отношением". Строка такой таблицы называется кортежем, столбец -- атрибутом. Каждый атрибут может принимать некоторое подмножество значений из определенной области -- домена.
Таблица организации БД позволяет реализовать ее важнейшее преимущество перед другими моделями данных, а именно -- возможность использования точных математических методов манипулирования данными, и прежде всего -- аппарата реляционной алгебры и исчисления отношений, К другим достоинствам реляционной модели можно отнести наглядность, простоту изменения данных и организации разграничения доступа к ним.
Основным недостатком реляционной модели данных является информационная избыточность, что ведет к перерасходу ресурсов вычислительных систем. Однако именно реляционная модель данных находит все более широкое применение в практике автоматизации информационного обеспечения профессиональной деятельности.
Рис. 3. Фрагмент реляционной модели данных.
Подавляющее большинство СУБД, ориентированных на персональные ЭВМ, являются системами, построенными на основе реляционной модели данных -- реляционными СУБД.
Бинарная модель данных
Бинарная модель данных -- это графовая модель, в которой вершины являются представлениями простых однозначных атрибутов, а дуги представлениями бинарных связей между атрибутами (см. рис. 4).
Размещено на http://www.allbest.ru/
178
Рис. 4. Пример бинарного отношения.
Бинарная модель не получила особо широкого распространения, но в ряде случаев находит практическое применение. Так, в области искусственного интеллекта уже давно ведутся исследования с целью представления информации в виде бинарных отношений. Рассмотрим триаду (тройку) "объект--атрибут--значение". Триада "Кузнецов--возраст--20" означает, что возраст некоего Кузнецова равен 20 годам. Эта же информация может быть выражена, например, бинарным отношением ВОЗРАСТ. Понятие бинарного отношения положено в основу таких моделей данных, как, например, Data Semantics (автор Абриал) и DIAM II (автор Сенко).
Бинарные модели данных обладают возможностью представления связки любой сложности (и это их несомненное преимущество), но вместе с тем их ориентация на пользователя недостаточна.
Семантическая сеть
Семантические сети как модели данных были предложены исследователями, работавшими над различными проблемами искусственного интеллекта. Так же, как в сетевой и бинарной моделях, базовые структуры семантической сети могут быть представлены графом, множество вершин и дуг которого образует сеть. Однако семантические сети предназначены для представления и систематизации знаний самого общего характера.
Таким образом, семантической сетью можно считать любую графовую модель (например -- помеченный бинарный граф) если изначально четко определено, что обозначают вершины и дуги и как они используются.
Семантические сети являются богатыми источниками идей моделирования данных, чрезвычайно полезных в плане решения проблемы представления сложных ситуаций. Они могут быть использованы независимо или совместно с идеями, положенными в основу других моделей данных. Их интересной особенностью является то, что расстояние, измеренное на сети (семантическое расстояние или метрика), играет важную роль, определяя близость взаимосвязанных понятий. При этом предусмотрена возможность в явной форме подчеркнуть, что семантическое расстояние велико. Как показано на рис. 5, СПЕЦИАЛЬНОСТЬ соотносится с личностью ПРЕПОДАВАТЕЛЬ, и в то же время ПРЕПОДАВАТЕЛЮ присущ РОСТ. Взаимосвязь личности со специальностью очевидна, однако из этого не обязательно следует взаимосвязь СПЕЦИАЛЬНОСТИ и РОСТА.
Размещено на http://www.allbest.ru/
178
Рис. 5. Соотношение понятий в семантической сети.
Следует сказать, что моделям данных типа семантической сети при всем присущем им богатстве возможностей при моделировании сложных ситуаций присуща усложненность и некоторая неэкономичность в концептуальном плане.
Лекция № 10
Технология моделирования информационных систем
Методы моделирования систем
Понятие модели является ключевым в общей теории систем. Моделирование как мощный -- а часто и единственный -- метод исследования подразумевает замещение реального объекта другим -- материальным или идеальным.
Важнейшими требованиями к любой модели являются ее адекватность изучаемому объекту в рамках конкретной задачи и реализуемость имеющимися средствами.
В теории эффективности и информатике моделью объекта (системы, операции) называется материальная или идеальная (мысленно представимая) система, создаваемая и/или используемая при решении конкретной задачи с целью получения новых знаний об объекте-оригинале, адекватная ему с точки зрения изучаемых свойств и более простая, чем оригинал, в остальных аспекта.
Классификация основных методов моделирования (и соответствующих им моделей) представлена на рис. 1.
При исследовании информационных систем (ИС) находят применение все методы моделирования, однако основное внимание будем уделять семиотическим (знаковым) методам.
Напомним, что семиотикой (от греч. semeion -- знак, признак) называют науку об общих свойствах знаковых систем, т.е. систем конкретных или абстрактных объектов (знаков), с каждым из которых сопоставлено некоторое значение. Примерами таких систем являются любые языки (естественные или искусственные, например, языки описания данных или моделирования), системы сигнализации в обществе и животном мире и т.п.
Рис. 1. Классификация методов моделирования.
Семиотика включает три раздела:
· синтактика;
· семантика;
· прагматика.
Синтактика исследует синтаксис знаковых систем безотносительно к каким-либо интерпретациям и проблемам, связанным с восприятием знаковых систем как средств общения и сообщения.
Семантика изучает интерпретацию высказываний знаковой системы и с точки зрения моделирования объектов занимает в семиотике главное место.
Прагматика исследует отношение использующего знаковую систему к самой знаковой системе, в частности -- восприятие осмысленных выражений знаковой системы.
Из множества семиотических моделей в силу наибольшего распространения, особенно в условиях информатизации современного общества и внедрения формальных методов во все сферы человеческой деятельности, выделим математические, которые отображают реальные системы с помощью математических символов. При этом, учитывая то обстоятельство, что мы рассматриваем методы моделирования применительно к исследованию систем в различных операциях, будем использовать общеизвестную методологию системного анализа, теории эффективности и принятия решений.
Математическая модель системы
Задача построения математической модели ИС может быть поставлена следующим образом: для конкретной цели моделируемой операции с учетом имеющихся ресурсов построить операторы моделирования исхода операции и оценки показателя ее эффективности. Формальная запись этой задачи имеет вид:
,
где - цель; - имеющиеся ресурсы; - оператор моделирования исхода операции; - оператор оценки показателя эффективности.
Перед рассмотрением каждого из названных операторов приведем два важных определения.
Оператором в математике называют закон (правило), согласно которому каждому элементу х множества X ставится в соответствие определенный элемент у множества Y. При этом множества X и Y могут иметь самую различную природу (если они представляют, например, множества действительных или комплексных чисел, понятие оператор совпадает с понятием функции).
Множество Z упорядоченных пар , где , , называется прямым произведением множеств X и Y и обозначается . Аналогично, множество Z упорядоченных конечных последовательностей , где , называется прямым произведением множеств и обозначается
.
Оператором моделирования исхода операции называется оператор Н, устанавливающий соответствие между множеством учитываемых в модели факторов, множеством U возможных стратегий управления системой (операцией) и множеством Y значений выходных характеристик модели
,
где -- ресурсы на этапе моделирования исходов операции и учитываемые свойства моделируемой системы соответственно.
Оператором оценки показателя эффективности системы (операции) называется оператор , ставящий в соответствие множеству Y значений выходных характеристик модели множество W значений показателя эффективности системы
,
где -- ресурсы исследователя на этапе оценивания эффективности системы.
Особо отметим, что построение приведенных операторов всегда осуществляется с учетом главного системного принципа - принципа цели. Кроме того, важным является влияние объема имеющихся в распоряжении исследователя ресурсов на вид оператора моделирования исхода Н и состав множества U стратегий управления системой (операцией). Чем больше выделенные ресурсы, тем детальнее (подробнее) может быть модель и тем большее число стратегий управления может быть рассмотрено (из теории принятия решений известно, что первоначально множество возможных альтернатив должно включать как можно больше стратегий, иначе можно упустить наилучшую).
В самом общем виде математической моделью системы (операции) называется множество
,
элементами которого являются рассмотренные выше множества и операторы.
Способы задания оператора и подходы к выбору показателя эффективности W рассматриваются в теории эффективности; методы формирования множества возможных альтернатив - в теории принятия решений.
Для двух классов задач показатель эффективности в явном виде не вычисляется:
· для задач так называемой прямой оценки, в которых в качестве показателей эффективности используются значения одной или нескольких выходных характеристик модели;
· для демонстрационных задач, в ходе решения которых для изучения поведения системы используются лишь значения ее выходных характеристик и внутренних переменных.
В таких случаях используют термин "математическое описание системы", представляемое множеством
.
Классификация математических моделей
В качестве основного классификационного признака для математических моделей целесообразно использовать свойства операторов моделирования исхода операции и оценки показателя ее эффективности.
Оператор моделирования исхода Н может быть функциональным (заданным системой аналитических функций) или алгоритмическим (содержать математические, логические и логико-лингвистические операции, не приводимые к последовательности аналитических функций). Кроме того, он может быть детерминированным (когда каждому элементу множества соответствует детерминированное подмножество значений выходных характеристик модели ) или стохастическим (когда каждому значению множества соответствует случайное подмножество ).
Оператор оценивания показателя эффективности может задавать либо точечно-точечное преобразование (когда каждой точке множества выходных характеристик Y ставится в соответствие единственное значение показателя эффективности W), либо множественно-точечное преобразование (когда показатель эффективности задается на всем множестве полученных в результате моделирования значений выходных характеристик модели).
В зависимости от свойств названных операторов все математические модели подразделяются на три основных класса:
· аналитические;
· статистические;
· имитационные.
Для аналитических моделей характерна детерминированная функциональная связь между элементами множеств U, , Y, а значение показателя эффективности W определяется с помощью точечно-точечного отображения. Аналитические модели имеют весьма широкое распространение. Они хорошо описывают качественный характер (основные тенденции) поведения исследуемых систем. В силу простоты их реализации на ЭВМ и высокой оперативности получения результатов такие модели часто применяются при решении задач синтеза систем, а также при оптимизации вариантов применения в различных операциях.
К статистическим относят математические модели систем, у которых связь между элементами множеств U, , Y задается функциональным оператором Н, а оператор является множественно-точечным отображением, содержащим алгоритмы статистической обработки. Такие модели применяются в тех случаях, когда результат операции является случайным, а конечные функциональные зависимости, связывающие статистические характеристики учитываемых в модели случайных факторов с характеристиками исхода операции, отсутствуют. Причинами случайности исхода операции могут быть случайные внешние воздействия; случайные характеристики внутренних процессов; случайный характер реализации стратегий управления. В статистических моделях сначала формируется представительная выборка значений выходных характеристик модели, а затем производится ее статистическая обработка с целью получения значения скалярного или векторного показателя эффективности.
Имитационными называются математические модели систем, у которых оператор моделирования исхода операции задается алгоритмически. Когда этот оператор является стохастическим, а оператор оценивания эффективности задается множественно-точечным отображением, имеем классическую имитационную модель. Если оператор Н является детерминированным, а оператор задает точечно-точечное отображение, можно говорить о вырожденной имитационной модели,
На рис. 2 представлена классификация наиболее часто встречающихся математических моделей по рассмотренному признаку.
Важно отметить, что при создании аналитических и статистических моделей широко используются их гомоморфные свойства (способность одних и тех же математических моделей описывать различные по физической природе процессы и явления). Для имитационных моделей в наибольшей степени характерен изоморфизм процессов и структур, т.е. взаимно-однозначное соответствие элементов структур и процессов реальной системы элементам ее математического описания и, соответственно, модели.
Основная классификация математических моделей.
Вид основных операторов |
H |
|||||
функциональный |
алгоритмический |
|||||
детермин. |
стохастих. |
детермин. |
стохастих. |
|||
Множественно-точечное отображение |
Статистические |
Имитационные |
||||
Точечно-точечное отображение |
Аналитические |
Имитационные |
Изоморфизм -- соответствие (отношение) между объектами, выражающее тождество их структуры (строения). Именно таким образом организовано большее число классических имитационных моделей. Названное свойство имитационных моделей проиллюстрировано рис. 3. На рисунке обозначены: -- система-оригинал; -- изоморфное отображение оригинала; -- гомоморфное отображение оригинала.
Имитационные модели являются наиболее общими математическими моделями. В силу этого иногда все модели называют имитационными:
· аналитические модели, "имитирующие" только физические законы, на которых основано санкционирование реальной системы, можно рассматривать как имитационные модели I уровня;
· статистические модели, в которых, кроме того, "имитируются" случайные факторы, можно называть имитационными моделями II уровня;
· собственно имитационные модели, в которых еще имитируется и функционирование системы во времени, называют имитационными моделями III уровня.
Размещено на http://www.allbest.ru/
178
Рис. 3. Пример изоморфного и гомоморфного отображений.
На рис. 4 представлена классификация моделей (прежде всего аналитических и статистических) по зависимости переменных и параметров от времени. Динамические модели, в которых учитывается изменение времени, подразделяются на стационарные (в которых от времени зависят только входные и выходные характеристики) и нестационарные (в которых от времени могут зависеть либо параметры модели, либо ее структура, либо и то и другое).
Размещено на http://www.allbest.ru/
178
Рис. 4. Классификация математических моделей по зависимости переменных и параметров от времени.
На рис. 5 показана классификация математических моделей еще по трем основаниям: по характеру изменения переменных; по особенностям используемого математического аппарата; по способу учета проявления случайностей.
Названия типов (видов) моделей в каждом классе достаточно понятны. Укажем лишь, что в сигнально-стохастических моделях случайными являются только внешние воздействия на систему.
Имитационные модели, как правило, можно отнести к следующим типам:
· по характеру изменения переменных -- к дискретно-непрерывным моделям;
· по математическому аппарату -- к моделям смешанного типа;
· по способу учета случайности -- к стохастическим моделям общего вида.
Рис. 5. Классификация математических моделей.
Лекция № 11
Имитационные модели информационных систем
Методологические основы применения метода имитационного моделирования
Приведем классическое вербальное определение имитационного моделирования и проведем его краткий анализ.
По Р. Шеннону (Robert E. Shannon -- профессор университета в Хантсвилле, штат Алабама, США) "имитационное моделирование - есть процесс конструирования на ЭВМ модели сложной реальной системы, функционирующей во времени, и постановки экспериментов на этой модели с целью либо понять поведение системы, либо оценить различные стратегии, обеспечивающие функционирование данной системы".
Выделим в этом определении ряд важнейших обстоятельств, учитывая особенности применения метода для исследования информационных систем (ИС).
Во-первых, имитационное моделирование предполагает два этапа: конструирование модели на ЭВМ и проведение экспериментов с этой моделью. Каждый из этих этапов предусматривает использование собственных методов. Так, на первом этапе весьма важно грамотно провести информационное обследование, разработку всех видов документации и их реализацию. Второй этап должен предполагать использование методов планирования эксперимента с учетом особенностей машинной имитации.
Во-вторых, в полном соответствии с системными принципами четко выделены две возможные цели имитационных экспериментов:
· либо понять поведение исследуемой системы (о которой по каким-либо причинам было "мало" информации) -- потребность в этом часто возникает, например, при создании принципиально новых образцов продукции;
· либо оценить возможные стратегии управления системой, что также очень характерно для решения широкого круга экономико-прикладных задач.
В-третьих, с помощью имитационного моделирования исследуют сложные системы. Понятие "сложность" является субъективным и по сути выражает отношение исследователя к объекту моделирования. Укажем пять признаков "сложности" системы, по которым можно судить о ее принадлежности к такому классу систем:
· наличие большого количества взаимосвязанных и взаимодействующих элементов;
· сложность функции (функций), выполняемой системой;
· возможность разбиения системы на подсистемы (декомпозиции);
· наличие управления (часто имеющего иерархическую структуру), разветвленной информационной сети и интенсивных потоков информации;
· наличие взаимодействия с внешней средой и функционирование в условиях воздействия случайных (неопределенных) факторов.
Очевидно, что некоторые приведенные признаки сами предполагают субъективные суждения. Вместе с тем становится понятным, почему значительное число ИС относят к сложным системам и, следовательно, применяют метод имитационного моделирования.
В-четвертых, методом имитационного моделирования исследуют системы, функционирующие во времени, что определяет необходимость создания и использования специальных методов (механизмов) управления системным временем.
Наконец, в-пятых, в определении прямо указывается на необходимость использования ЭВМ для реализации имитационных моделей, т.е. проведения машинного эксперимента (машинной имитации), причем в подавляющем большинстве случаев применяются цифровые машины.
Даже столь краткий анализ позволяет сформулировать вывод о целесообразности (а, следовательно, и необходимости) использования метода имитационного моделирования для исследования сложных человекомашинных (эргатических) информационных систем. Особо выделим наиболее характерные обстоятельства применения имитационных моделей:
· если идет процесс познания объекта моделирования;
· если аналитические методы исследования имеются, но составляющие их математические процедуры очень сложны и трудоемки;
· если необходимо осуществить наблюдение за поведением компонент системы в течение определенного времени;
· если необходимо контролировать протекание процессов в системе путем замедления или ускорения явлений в ходе имитации;
· если особое значение имеет последовательность событий в проектируемых системах и модель используется для предсказания так называемых "узких" мест;
· при подготовке специалистов для приобретения необходимых навыков в эксплуатации новой техники;
· и, конечно, если имитационное моделирование оказывается единственным способом исследований из-за невозможности проведения реальных экспериментов.
До настоящего момента особое внимание в толковании термина "имитационное моделирование системы" было уделено первому слову. Однако не следует упускать из вида, что создание любой (в том числе и имитационной) модели предполагает, что она будет отражать лишь наиболее существенные с точки зрения конкретной решаемой задачи свойства объекта-оригинала.
Английский аналог этого термина -- systems simulation -- при дословном переводе непосредственно указывает на необходимость воспроизводства (симуляции) лишь основных черт реального явления (сравним с термином "симуляция симптомов болезни" из медицинской практики). Важно отметить еще один аспект: создание любой (в том числе и имитационной модели) есть процесс творческий (не случайно Р. Шеннон назвал свою книгу "Имитационное моделирование систем -- искусство и наука"), и, вообще, каждый автор имеет право на собственную версию модели реальной системы. Однако за достаточно длительное время применения метода накоплены определенный опыт и признанные разумными рекомендации, которыми целесообразно руководствоваться при организации имитационных экспериментов.
Укажем ряд основных достоинств и недостатков метода имитационного моделирования. Основные достоинства:
· имитационная модель позволяет, в принципе, описать моделируемый процесс с большей адекватностью, чем другие;
· имитационная модель обладает гибкостью варьирования структуры, алгоритмов и параметров системы;
· применение ЭВМ существенно сокращает продолжительность испытаний по сравнению с натурным экспериментом (если он возможен), а также их стоимость.
Основные недостатки:
· решение, полученное на имитационной модели, всегда носит частный характер, так как оно соответствует фиксированным элементам структуры, алгоритмам поведения и значениям параметров системы;
· большие трудозатраты на создание модели и проведение экспериментов, а также обработку их результатов;
· если использование системы предполагает участие людей при проведении машинного эксперимента, на результаты может оказать влияние так называемых хауторнский эффект (заключающийся в том, что люди, зная (чувствуя), что за ними наблюдают, могут изменить свое обычное поведение).
Итак, само использование термина "имитационное моделирование" предполагает работу с такими математическими моделями, с помощью которых результат исследуемой операции нельзя заранее вычислить или предсказать, поэтому необходим эксперимент (имитация) на модели при заданных исходных данных. В свою очередь, сущность машинной имитации заключается в реализации численного метода проведения на ЭВМ экспериментов с математическими моделями, описывающими поведение сложной системы в течение заданного или формируемого периода времени.
Каждая имитационная модель представляет собой комбинацию шести основных составляющих:
· компонентов;
· переменных;
· параметров;
· функциональных зависимостей;
· ограничений;
· целевых функций.
Под компонентами понимают составные части, которые при соответствующем объединении образуют систему. Компоненты называют также элементами системы или ее подсистемами. Например, в модели рынка ценных бумаг компонентами могут выступать отделы коммерческого банка (кредитный, операционный и т.д.), ценные бумаги и их виды, доходы, котировка и т.п.
Параметры -- это величины, которые исследователь (пользователь модели) может выбирать произвольно, т.е. управлять ими.
В отличие от них переменные могут принимать только значения, определяемые видом данной функции. Так, в выражении для плотности вероятности нормально распределенной случайной величины X:
,
где - переменная; , - параметры (математическое ожидание и стандартное отклонение соответственно); , -- константы.
Различают экзогенные (являющиеся для модели входными и порождаемые вне системы) и эндогенные (возникающие в системе в результате воздействия внутренних причин) переменные. Эндогенные переменные иногда называют переменными состояния.
Функциональные зависимости описывают поведение параметров и переменных в пределах компонента или же выражают соотношения между компонентами системы. Эти соотношения могут быть либо детерминированными, либо стохастическими.
Ограничения -- устанавливаемые пределы изменения значений переменных или ограничивающие условия их изменения. Они могут вводиться разработчиком (и тогда их называют искусственными) или определяться самой системой вследствие присущих ей свойств (так называемые естественные ограничения).
Целевая функция предназначена для измерения степени достижения системой желаемой (требуемой) цели и вынесения оценочного суждения по результатам моделирования. Эту функцию также называют функцией критерия. По сути, весь машинный эксперимент с имитационной моделью заключается в поиске таких стратегий управления системой, которые удовлетворяли бы одной из трех концепций ее рационального поведения: оптимизации, пригодности или адаптивизации. Если показатель эффективности системы является скалярным, проблем с формированием критерия не возникает и, как правило, решается оптимизационная задача -- по иска стратегии, соответствующей максимуму или минимуму показателя. Сложнее дело обстоит, если приходится использовать векторный показатель. В этом случае для вынесения оценочного суждения используются методы принятия решений по векторному показателю в условиях определенности (когда в модели учитываются только детерминированные факторы) или неопределенности (в противном случае).
При реализации имитационной модели, как правило, рассматриваются не все реально осуществляемые функциональные действия (ФД) системы, а только те из них, которые являются наиболее существенными для исследуемой операции. Кроме того, реальные ФД аппроксимируются упрощенными действиями ФД' причем степень этих упрощений определяется уровнем детализации учитываемых в модели факторов. Названные обстоятельства порождают ошибки имитации процесса функционирования реальной системы, что, в свою очередь, обусловливает адекватность модели объекту-оригиналу и достоверность получаемых в ходе моделирования результатов.
На рис. 1 схематично представлен пример выполнения некоторых ФД в -м компоненте реальной системы и ФД' в -м компоненте ее модели.
В -м компоненте реальной системы последовательно выполняются , , ,… за времена , , ,…, соответственно. На рисунке эти действия условно изображены пунктирными ("непрямыми") стрелками. В результате ФД наступают соответствующие события: , , ,… В модели последовательность имитации иная: выполняется при неизменном времени, наступает модельное событие а, после чего время сдвигается на величину , инициируя наступление события и т.д. Иными словами, модельной реализации упрощенных ФД (ФД') соответствует ломаная . Отметим, что в принципе возможен и другой порядок моделирования: сначала сдвигать время, а затем инициировать наступление соответствующего события.
Очевидно, что в реальной системе в различных ее компонентах могут одновременно (параллельно) производиться функциональные действия и, соответственно, наступать события. В большинстве же современных ЭВМ в каждый из моментов времени можно отрабатывать лишь один алгоритм какого-либо ФД. Возникает вопрос: каким образом учесть параллельность протекания процессов в реальной системе без потери существенной информации о ней?
Для обеспечения имитации наступления параллельных событий в реальной системе вводят специальную глобальную переменную , которую называют модельным (системным) временем. Именно с помощью этой переменной организуется синхронизация наступления всех событий в модели ИС и выполнение алгоритмов функционирования ее компонент. Принцип такой организации моделирования называется принципом квазипараллелизма.
Таким образом, при реализации имитационных моделей используют три представления времени:
· -- реальное время системы;
· -- модельное (системное) время;
· -- машинное время имитации.
Лекция № 12
Имитационные модели информационных систем
Классификация имитационных моделей
Имитационные модели принято классифицировать по четырем наиболее распространенным признакам:
· типу используемой ЭВМ;
· способу взаимодействия с пользователем;
· способу управления системным временем (механизму системного времени);
· способу организации квазипараллелизма (схеме формализации моделируемой системы).
Подобные документы
Жизненный цикл автоматизированных информационных систем. Основы методологии проектирования автоматизированных систем на основе CASE-технологий. Фаза анализа и планирования, построения и внедрения автоматизированной системы. Каскадная и спиральная модель.
курсовая работа [1,1 M], добавлен 20.11.2010Основы методологии проектирования информационных систем, понятие их жизненного цикла. Основные модели жизненного цикла. Методология функционального моделирования SADT. Состав функциональной модели. Моделирование данных, характеристика case-средств.
реферат [327,5 K], добавлен 28.05.2015Методология проектирования и особенности организации технического обслуживания информационных систем. Понятие, сущность, стадии, стандарты, структура и процессы жизненного цикла информационной системы, а также анализ достоинств и недостатков его моделей.
реферат [66,1 K], добавлен 07.05.2010Проектирование информационной системы на основе архитектуры "файл-сервер", "клиент-сервер", многоуровневой архитектуры, Intranet-системы. Преимущества и недостатки файл-серверного подхода при обеспечении многопользовательского доступа к базе данных.
лабораторная работа [220,5 K], добавлен 02.02.2015Общее понятие и признаки классификации информационных систем. Типы архитектур построения информационных систем. Основные компоненты и свойства базы данных. Основные отличия файловых систем и систем баз данных. Архитектура клиент-сервер и ее пользователи.
презентация [203,1 K], добавлен 22.01.2016Этапы разработки модели базы данных: составление логической схемы и создание на ее основе физической формы графическим инструментарием Erwin. CASE-технологии для проектирования прикладного программного обеспечения и конфигурационного управления проектом.
контрольная работа [370,7 K], добавлен 03.01.2011Особенности проектирования информационных систем основанных на базах данных. Использование CASE-средств и описание бизнес процессов в BP-Win. Этапы проектирования современных информационных систем, виды диаграмм и визуальное представление web-сайта.
курсовая работа [1,9 M], добавлен 25.04.2012Анализ архитектуры информационной системы, в структуру которой входят системы файл-сервер и клиент-сервер. Сравнение языков запросов SQL и QBE. Принципы разработки приложений архитектуры клиент-сервер при помощи структурированного языка запросов SQL.
курсовая работа [88,9 K], добавлен 11.04.2010Исследование технологии проектирования базы данных. Локальные и удаленные базы данных. Архитектуры и типы сетей. Программная разработка информационной структуры предметной области. Обоснование выбора архитектуры "клиент-сервер" и операционной системы.
дипломная работа [1,1 M], добавлен 15.02.2017Анализ информационных потоков. Разработка структуры таблиц базы данных. Выбор CASE-средства для проектирования информационной системы и среды программирования. Разработка программных модулей (программного обеспечения). Подготовка справочных баз данных.
дипломная работа [6,8 M], добавлен 19.11.2013