Информационные системы и технологии

Понятие информатизации, информационной среды, информационных технологий. Классификация информационных систем. Интегрированные системы управления предприятием. Архитектура информационно-аналитических систем. Информатизация железнодорожного транспорта.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 22.08.2014
Размер файла 47,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Информационные системы и технологии

1. Пояснения основных терминов и понятий

Говоря о внедрении средств электроники и вычислительной техники в процессы управления технологическими и организационными системами, в настоящее время чаще всего используют термин “информатизация”. Это понятие определено в Законе РФ “Об информации, информатизации и защите информации” (№24-03 от 20.02.95 г.) как “организационный, социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организаций, общественных объединений на основе формирования и использования информационных ресурсов”. В последнем определении важно отметить то, что информатизация - это процесс, а не просто перечень мер. Для удовлетворения информационных потребностей нужно не только обеспечить возможность пользоваться информацией, но и создать информационные ресурсы, т.е. накопить информацию, обеспечить её сохранность и возможность доступа к ней.

Развитие производства, науки, техники приводит к появлению более сложных производственных, экономических, социальных структур, эффективное управление которыми требует постоянно растущих объёмов информации. Возможность принимать (на основе обработки возрастающих объёмов информации) эффективные решения обуславливает дальнейший прогресс в экономике, производстве, общественной жизни. Это означает, что уровень информатизации должен соответствовать уровню развития общества; повышение уровня информатизации является важным условием дальнейшего прогресса человечества.

Значение информатизации возрастает, когда увеличиваются объёмы информации, необходимые для выработки решений. При этом возникают трудности, связанные с созданием информационных ресурсов, поиском, передачей и обработкой этой информации.

Использование для сбора, передачи, хранения, обработки и представления информации средств современной электроники и вычислительной техники является действенным способом повышения уровня информационной поддержки всех видов человеческой деятельности и, следовательно, повышения эффективности общественного производства.

Информатизация включает в себя создание информационной среды, инфраструктуры, поддерживающей информационные процессы, и информационных технологий, определяющих способы реализации этих процессов.

Информационную среду информатизации составляет совокупность систематизированных и организованных специальным образом данных и знаний.

Инфраструктура информатизации - это совокупность технических и программных средств, обеспечивающая получение, хранение, передачу, обработку и представление информации.

Информационная технология - это система приёмов, способов и методов сбора, хранения, обработки, передачи, представления и использования информации. Так поясняется этот термин в нормативных документах [1], словарях и справочниках [2, 3]. Термин система, используемый в этом определении, подразумевает наличие совокупности взаимосвязанных приёмов, методов, способов, осуществляемых для достижения определенной цели.

Процессы получения, хранения, транспортировки, преобразования и представления информации называют информационными процессами [4]. Следовательно, информационная технология - это система приёмов, способов и методов осуществления информационного процесса определенного назначения.

Понятие информационная технология связывают с использованием электронных средств передачи и обработки информации [1,4]. В этом случае правильнее было бы использовать термин новая информационная технология, оставив за понятием информационная технология более широкое значение. Однако распространение получило именно узкое понимание термина информационная технология как система методов сбора, хранения, обработки, передачи, представления и использования информации, основанной на применении средств электроники и вычислительной техники [2, 4]. Именно в таком, узком, смысле термин информационная технология используется в этой книге.

Есть ли различие в таких терминах, как обработка информации и обработка данных, передача информации и передача данных и т.д.? Информация - это сведения о фактах, концепциях, объектах, событиях и идеях, которые в данном контексте имеют вполне определенное значение [5]. Данные - это информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека.

Таким образом, понятие информация является более общим по отношению к понятию данные и, следовательно, вместо, например, термина “передача данных” всегда можно использовать термин “передача информации”.

Уточним смысл понятия метод обработки информации в определении термина информационная технология. Предположим, что в компьютере имеются несколько программ, реализующих ряд процедур обработки данных (метод наименьших квадратов, метод сортировки и т.д.). Можем ли мы в этом случае утверждать, что совокупность методов, реализуемых этими программами - информационная технология? Конечно, нет, ибо совокупность методов компьютерной обработки данных, не связанных между собой в процессе их применения и не объединённых общей целью применения, не является системой методов и, следовательно, информационной технологией. Если же, например, имеется пакет прикладных программ обработки данных, объединенных в рамках пакета общими правилами (методами) ввода, контроля, корректировки и представления данных, то совокупность этих правил (методов) представляет собой информационную технологию.

Метод наименьших квадратов может стать элементом информационной технологии, если его использование предполагается при реализации какого-либо информационного процесса (например, для интерполяции или экстраполяции данных наблюдений при их представлении пользователю).

Информационная технология охватывает только приёмы, методы, способы и не включает в себя средства реализации этих приёмов, методов и способов. Можно ли из этого сделать вывод, что информационная технология не зависит от того, с помощью каких средств она реализуется? Нет. Например, технология ввода в ЭВМ информации с помощью сканера зависит от того, какой сканер используется (ручной, планшетный и т.д.). Таким образом, говоря о способах, методах, приёмах обработки информации, мы должны иметь в виду вполне определенные средства реализации технологии. К средствам реализации информационных технологий относят аппаратные средства (электронные устройства, блоки, электронные вычислительные машины, аппаратура передачи данных и т.п.), программные средства (пакеты прикладных программ, системы управления базами данных (СУБД), операционные системы ЭВМ и т.д.), аппаратно-программные комплексы и автоматизированные информационные системы.

Автоматизированная информационная система (или просто информационная система) - это совокупность технических (аппаратных) и программных средств, а также работающих с ними пользователей (персонала), обеспечивающая ввод, передачу, хранение, обработку и представление информации.

Рассмотрим автоматизированную систему резервирования и продажи билетов на средства транспорта (“Экспресс”, “СИРЕНА” и др.). Эта система строится на базе аппаратных и программных средств вычислительной техники и средств передачи данных. Такие системы являются средствами реализации информационной технологии резервирования и продажи билетов.

Система управления базой данных (СУБД), например, ORACLE, является средством реализации информационной технологии управления данными, определяемой способом представления данных, методом поиска данных, средствами защиты информации и т.п.

2. Классификация информационных систем

Классификацию информационных систем можно проводить по ряду признаков: назначению, структуре аппаратных средств, режиму использования, поддерживаемому виду деятельности и т.п. (рис.1.1).

Приведём определения и пояснения ряда терминов и понятий, связанных с классификацией информационных систем.

По назначению (виду основной технологической операции над данными) информационные системы делят на системы передачи данных (СПД), системы сбора данных, системы обработки данных (СОД).

Системы передачи данных (СПД) - совокупность аппаратных и программных средств, обеспечивающая обмен данными между различными удаленными системами обработки данных, а также между отдельными пользователями систем обработки данных, с использованием каналов связи.

Система сбора данных - совокупность аппаратных и программных средств, обеспечивающих ввод, преобразование, передачу и накопление данных от различных источников с целью их дальнейшего использования.

Система обработки данных (СОД) - класс информационных систем, основным назначением которых является обработка массивов данных, осуществляемая с различными целями и в различных режимах.

В группу систем обработки данных входят следующие типы информационных систем: системы оперативной транзакционной обработки (OLTP - системы), информационно-аналитические (ИАС), информационно-поисковые системы (ИПС), информационно-справочные системы (ИСС).

информатизация управление железнодорожный

Системы оперативной транзакционной обработки данных (OLTP - системы, On-line Transaction Processing Systems) - системы, предназначенные для оперативной обработки (т.е. в on-line режиме, режиме реального времени) поступающих запросов, причём виды запросов предопределены (т.е. установлены при создании системы) .

Отметим, что транзакция - это последовательность операций, рассматриваемая как единое целое, инициируемая одним сообщением. Таким образом, в системах транзакционной обработки мы имеем дело с фиксированным набором сообщений (запросов, заданий ), каждому из которых соответствует определенная последовательность операций.

Информационно-аналитические системы - системы, предназначенные для обработки данных, накопленных за определенный период времени (исторических данных, в отличие от оперативных данных, обрабатываемых в OLTP - системах), по запросам произвольного вида (в отличие от транзакционной обработки в OLTP - системах).

Информационно-поисковые системы - это системы, основное назначение которых - поиск информации, содержащейся в различных базах данных, различных вычислительных системах, разнесенных, как правило, на значительные расстояния. Примером таких систем являются, в частности, поисковые системы (серверы) в сети INTERNET, автоматизированные системы поиска научно-технической информации (АСНТИ) и др. Информационно-поисковые системы делятся на документальные (назначение - поиск документов) и фактографические (назначение - поиск фактов).

Информационно-справочные системы - это автоматизированные системы, работающие в интерактивном режиме и обеспечивающие пользователей справочной информацией. К таким системам относятся системы информационного обслуживания пассажиров на железнодорожных вокзалах.

По поддерживаемому виду деятельности информационные системы делятся на автоматизированные системы управления (информационно-управляющие системы) (АСУ, ИУС), системы поддержки принятия решений (СППР), системы автоматизированного проектирования (САПР), автоматизированные обучающие системы (АОС), автоматизированные системы научных исследований (АСНИ), автоматизированные системы научно-технической информации (АСНТИ), системы резервирования и продажи билетов и т.д. (см. рис.1.1.).

Автоматизированные системы управления по виду объекта, функции управления которым поддерживает система, делят на следующие типы [15]:

комплексные многоуровневые системы (например, АСУ дороги, АСУ путевым хозяйством и т.п.);

системы управления предприятиями (АСУП) (например, АСУ-ДЕПО, АСУ вагоно-ремонтным заводом и т.д.);

информационно-управляющие системы организационно-производственными процессами (АСУ сортировочной станции, АСУ контейнерной площадки и пр.);

автоматизированные системы управления технологическими процессами (АСУТП).

По структуре аппаратных средств выделяют однопроцессорные, многопроцессорные и многомашинные системы (сети ЭВМ, сосредоточенные системы, системы с удаленным доступом) [7].

Многомашинные и многопроцессорные системы создаются для повышения производительности и надежности вычислительных комплексов.

Сосредоточенные системы - это вычислительные системы, весь комплекс оборудования которых, включая терминалы пользователей, сосредоточен в одном месте, так что для связи между отдельными машинами используются интерфейсы ЭВМ и не требуется применять системы передачи данных.

Системы с удаленным доступом (с телеобработкой) обеспечивают связь между терминалами пользователей и вычислительными средствами способом передачи данных по каналам связи (с использованием систем передачи данных).

Сети ЭВМ (вычислительные сети) - это взаимосвязанная совокупность территориально рассредоточенных систем обработки данных, средств и (или) систем связи и передачи данных, обеспечивающая пользователям дистанционный доступ к вычислительным ресурсам и коллективное использование этих ресурсов [1].

Режимы использования информационных систем включают режимы обработки данных (обработка в режиме “off-line”; обработка в режиме реального времени, или “on-line”- обработка), режимы обслуживания пользователей (пакетный, режим “запрос-ответ”, режим разделения времени), режимы взаимодействия с пользователями (диалоговый, интерактивный).

Режим реального времени (“on-line”режим) - это режим обработки информации, при котором обеспечивается взаимодействие системы обработки данных с внешними по отношению к ней процессами в темпе, соизмеримом со скоростью протекания этих процессов [6].

В случае использования режима “off-line” временной регламент обработки данных независим от каких-либо внешних процессов.

Пакетная обработка заданий пользователей - это выполнение совокупности (пакета) накопленных заранее заданий, при которой пользователь не может влиять на обработку, пока она продолжается.

Режим “запрос-ответ” предполагает, что система обслуживает задание (запрос) каждого пользователя без прерываний.

В режиме “разделения времени” вычислительные ресурсы предоставляются различным задачам (различным пользователям) последовательно квантами. По истечении кванта времени задача возвращается в очередь ожидания обслуживания.

По характеру взаимодействия с пользователями выделяют системы, работающие в диалоговом и интерактивном режимах [5].

Диалоговый режим - режим взаимодействия человека с системой обработки информации, при котором человек и система обмениваются информацией в темпе, соизмеримом с темпом обработки информации человеком.

Интерактивный режим - режим взаимодействия человека и процесса обработки информации, реализуемого информационной системой, выражающийся в разного рода воздействиях на этот процесс, предусмотренных механизмом управления конкретной системы и вызывающих ответную реакцию процесса.

3. Понятие о структуре информационной системы

Термин “система” применительно к некоторому объекту используется тогда, когда этот объект рассматривается как совокупность взаимодействующих (взаимосвязанных) элементов. Структура системы - это графическое представление системы в виде множества её элементов и связей между ними.

Элементами структуры могут являться составляющие (элементы) объекта, выделенные по различным признакам. Признаков существует много, поэтому информационная система, как и всякая иная, может иметь множество различных структур: функциональную, структуру комплекса технических средств, структуру функциональной части, структуру обеспечивающей части, объектную структуру.

Элементами функциональной структуры информационной системы являются функциональные подсистемы.

Функциональная подсистема - это часть системы, предназначенная для выполнения заданной функции, например функции оперативного управления перевозочным процессом, управления инфраструктурой железнодорожного транспорта и т.д.

Элементами объектной структуры информационной системы являются объектные подсистемы.

Объектная подсистема - это часть информационной системы, предназначенная для поддержки функционирование некоторой части (элемента) объекта. Объект, для обеспечения функционирования которого создается информационная система, может быть представлен в виде системы взаимосвязанных элементов. Объектная структура информационной системы железнодорожного транспорта включает в себя объектные подсистемы на трех уровнях: общесистемном, дорожном и линейном (уровне отделений, станции, депо). Отметим, что функциональные подсистемы также могут иметь объектную структуру, элементы которой на разных уровнях объекта предназначены для выполнения заданной функции в пределах соответствующего уровня.

Функциональная часть состоит из совокупности функций и задач информационной системы.

Обеспечивающая часть - это совокупность средств обеспечения (компонентов обеспечения) выполнения системой предписанных функций. В состав обеспечивающей части входит ряд обеспечивающих подсистем.

Информационное обеспечение - это совокупность форм документов, классификаторов, нормативной базы и реализованных решений по объёмам, размещению и формам существования информации, применяемой при функционировании информационной системы [6].

Техническое обеспечение - это совокупность всех технических средств, используемых при функционировании информационной системы.

Программное обеспечение - совокупность программ на носителях данных и программных документов, предназначенных для отладки, функционирования и проверки работоспособности информационной системы.

Математическое обеспечение - совокупность математических методов, моделей и алгоритмов, применяемых в информационной системе.

Методическое обеспечение - совокупность документов, описывающих технологию функционирования информационной системы, методы выбора и применения пользователями технологических приёмов для получения конкретных результатов при функционировании информационной системы.

4. Интегрированные системы управления предприятиями (ERP - системы)

ERP (Enterprise Resource Planning) - системы, или системы планирования ресурсов предприятия, - это класс автоматизированных систем управления предприятий, получивший широкое распространение в последние 10 лет (начиная с 90-ых годов 20-ого столетия). Это системы, интегрирующие функции управления финансовой и хозяйственной деятельностью всех подразделений предприятия (планирование производства, финансовая деятельность, учёт, материально-техническое снабжение, управление кадрами, сбыт, управление запасами и т.д.) [8].

В основе концепции ERP - систем лежат следующие принципы:

Использование при управлении предприятием единой базы данных, содержащей информацию, относящуюся ко всем подразделениям предприятия и достаточную для использования всеми сотрудниками предприятия (в рамках их полномочий). Единая база данных позволяет учитывать при принятии решений взаимосвязи отдельных процессов, например, процессов принятия заказов на текущий месяц с графиками отпусков персонала. Единая база повышает достоверность данных, используемых в различных подразделениях, сокращает затраты на ввод и обработку данных.

Стандартизация бизнес - процессов предприятия. Бизнес - процесс - это серия взаимозависимых действий, направленная на получение определенного конечного результата. Например, можно говорить о бизнес-процессе оформления заказа на перевозку грузов, начисления заработной платы, приёма на работу и т.д. Стандартизация бизнес-процессов в рамках предприятия упрощает взаимодействие подразделений, даёт возможность сократить административный аппарат и, в конечном счете, повышает эффективность управления предприятием.

С точки зрения классификации информационных систем, представленной в разделе 1.2, ERP -системы по своему назначению относятся к системам оперативной транзакционной обработки данных, а по поддерживаемому виду деятельности- к автоматизированным системам управления (информационно-управляющим системам).

Предшественниками ERP-систем являлись системы планирования материальных ресурсов или MRP-системы (MRP-Material Resource Planning), появившиеся в конце 80-ых годов прошлого столетия. Основная цель MRP-систем заключалась в минимизации затрат, связанных со складскими запасами на различных участках производства. Концепция MRP не учитывала при расчетах потребностей в материалах, имеющихся производственных мощностей, их загрузки, стоимости рабочей силы. Этот недостаток был устранен в системах планирования производственных ресурсов, или MRP II-системах (здесь MRP - Manufacturing Resource Planning). MRP II-система позволяла учитывать и планировать все производственные ресурсы предприятия - сырье, материалы, оборудование, персонал и т.д. По мере развития концепции MRP II к ней постепенно добавлялись возможности учёта остальных затрат предприятия. Так появилась концепция ERP-систем.

Разработка ERP-систем для конкретных предприятий, как правило, сводится к настройке типовой программной оболочки ERP-системы. Такая возможность появляется в силу того, что, несмотря на уникальность каждого предприятия по характеру своей финансовой и хозяйственной деятельности, удается выделить бизнес-процессы, общие для предприятий всех типов. К общим бизнес-процессам можно отнести управление материальными и финансовыми ресурсами, закупками, сбытом, заказами потребителей и поставками, управление кадрами, основными фондами, складами, бизнес-планирование и учёт, бухгалтерию, расчеты с покупателями и поставщиками, ведение банковских счетов и др.

Среди программных оболочек ERP-систем, предназначенных для крупных предприятий (корпораций), наиболее полно современным требованиям удовлетворяет система R/3 компании SAP, являющейся одним из лидеров на рынке ERP-систем.

На базе программной оболочки R/3 в настоящее время создается Единая Корпоративная Автоматизированная Система Управления Финансами и Ресурсами на железнодорожном транспорте (ЕК АСУ ФР).

5. Информационно-аналитические системы

Определение и классификация информационно-аналитических систем

Информационно-аналитические системы (ИАС) предназначены для извлечения полезной информации из данных, которые накоплены за определенный промежуток времени (исторических данных). На основе этих данных могут быть выявлены скрытые тенденции, закономерности, построены прогнозные модели, способные существенно повлиять на эффективность стратегических (а также и оперативных) решений по развитию и управлению железнодорожным транспортом.

ИАС относятся к новым и перспективным информационным технологиям, реализация которых стала возможной в силу того, что, с одной стороны, значительные объёмы исторических данных в настоящее время накоплены в функционирующих информационных системах, а, с другой стороны, появились технологические возможности для обработки и анализа этих данных.

Основная область применения ИАС - это поддержка принятия решений (оперативных или стратегических) по управлению объектом. ИАС, поддерживающие этот вид деятельности, называют Системами поддержки принятия решений (СППР).

В зависимости от требований к функциональным и временным характеристикам различают следующие два типа СППР [11]:

1. Системы поддержки принятия решений по оперативному управлению объектом. Этот тип СППР включает 2 подтипа:

1.1. СППР с предопределенным набором сценариев аналитической обработки данных и составления отчётов. Такие системы иногда называют “статическими СППР”. В эту категорию входят так называемые “информационные системы руководителя” (Executive Information Systems, EIS). По сути, они представляют собой конечные наборы отчётов, построенные на основании данных из транзакционной информационной системы предприятия, или OLTP - системы (OLTP- On-line Transaction Processing). Для EIS характерны следующие основные черты:

отчёты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;

EIS представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т.п.

Результат работы EIS-системы - это, как правило, многостраничный отчет, который нельзя “прокрутить”, “развернуть” или “свернуть”, чтобы получить желаемое представление данных.

Важно отметить, что для систем типа EIS, как правило, не требуется использовать какие-либо технологии управления данными, отличные от СУБД реляционного типа.

1.2. Системы поддержки принятия решений по оперативному управлению объектом, поддерживающие нерегламентированные аналитические запросы и формирование отчётов произвольной формы. Такие системы называют “динамическими СППР”. Этот тип СППР в полной мере отвечает требованиям к так называемым OLAP-системам. (OLAP-On-Line Analytical Processing).

2. Системы интеллектуального анализа данных (ИАД - системы)

Основное назначение ИАД - систем - поиск в данных скрытых закономерностей. Большинство методов ИАД первоначально разрабатывалось в рамках направления исследований, которое получило название “системы искусственного интеллекта”. Только в настоящее время, когда образовались большие и быстро растущие массивы корпоративных данных, эти методы оказались востребованными.

В СППР второго типа для того, чтобы удовлетворить требования по времени реакции, оказалось необходимым использовать новую технологию организации и хранения данных. Эта новая технология получила название “хранилище данных” (Data Warehouse).

Понятие о хранилищах данных

Хранилище данных (по определению автора концепции хранилища данных Б. Инмона [9]) - это “предметно-ориентированные, интегрированные, неизменчивые, поддерживающие хронологию наборы данных, организованные для целей поддержки принятия решений” В этом определении под интеграцией данных понимается объединение и согласованное представление данных из различных источников. “Поддержка хронологии” означает наличие “исторических” данных, т.е. данных, соответствующих интервалу времени, предшествующему текущему моменту. Неизменчивость данных означает, что изменение данных в хранилище осуществляется путем добавления новых данных, соответствующих определенному временному интервалу, без изменения информации, уже находящейся в хранилище. К основным требованиям, предъявляемым к хранилищам данных, относятся:

поддержка высокой скорости получения данных из хранилища (т.е. малого времени реакции на запросы, обычно не более 5 секунд);

поддержка внутренней непротиворечивости данных;

возможность получения срезов данных (например, значений совокупности показателей за определенный временной интервал, значение одного показателя за ряд последовательных временных интервалов и т.д.);

наличие удобных средств для просмотра данных в хранилище;

полнота и достоверность хранимых данных.

Хранилище данных - это единый источник данных, относящихся к функционированию отрасли, предприятия, организации, содержащий всю необходимую и достоверную информацию для поддержки принятия решений.

Типичное хранилище, как правило, отличается от обычной реляционной базы данных. Поясним это утверждение, путём рассмотрения логических моделей реляционной базы данных и данных хранилища.

В традиционных базах данных реляционного типа логическая модель данных - это совокупность двумерных (плоских) таблиц, построенных так, чтобы обеспечить возможность наиболее эффективного осуществления различных операций с данными. Нормализованная логическая модель базы данных реляционного типа характеризуется, в частности, следующими особенностями:

все значения, хранимые в ячейках таблиц (значения атрибутов), атомарны (т.е. в каждой ячейке таблицы располагается только одно значение);

данные не дублируются (т.е. в базе данных отсутствует избыточность).

Такое представление данных не всегда соответствует целям поддержки принятия решений, когда возникает необходимость быстрого получения ответов на сложные аналитические запросы. Более адекватной здесь является логическая модель данных в виде многомерного куба [10]. Куб - это геометрическая фигура с тремя измерениями. Кубы данных на практике имеют от 4 до 12 измерений. Измерение в кубе - это одна из характеристик данных. Например, в кубе, показанном на рис. 1.2, измерениями являются “время” (2001 г., 2002 г.), “пункт назначения” (Москва, Санкт-Петербург), “груз” (бензин, уголь). В ячейках куба хранятся данные об объёмах перевозок. Эти данные агрегированы по другим измерениям. Например, для куба на рис.1.2, если существуют измерение “пункт отправки”, то приведенные на рис.1.2 данные следует рассматривать как агрегированные по этому измерению (т.е. “1000” это есть общая масса угля, завезенного в Москву в 2001 году от всех поставщиков). На многомерном кубе легко определить множество операций, которые типичны при аналитической работе: сокращение числа измерений (проекции), слияние (объединение кубов, имеющих общие измерения) и т.д. Например, при агрегировании по измерению “груз” куб рис.1.2 превращается в квадрат, показанный на рис.1.3.

Логическая модель хранилища при этом представляется множеством многомерных (гиперкубов) в общем случае с различными размерностями, каждый из которых соответствует одному или нескольким из количественных показателей отрасли, организации, предприятия.

Надо отметить, что измерения многомерного куба могут иметь иерархическую структуру. Например, измерение “пункт отправки” может быть представлено трехуровневой иерархической схемой (см. рис.1.4).

В отличие от нормализованной логической модели базы данных реляционного типа, логическая модель типа куба допускает избыточность данных, т.е. содержит помимо исходных данных и некоторые заранее вычисленные итоговые данные (агрегированные данные). Это оправдано в СППР, т.к. позволяет уменьшить время реакции системы.

Мы рассмотрели логическую модель хранилища, представляющую данные в виде совокупности многомерных кубов. Физическая реализация хранилища обычно осуществляется одним из следующих способов [10]:

с использованием специализированных многомерных структур , отличающихся от традиционных реляционных баз данных;

с использованием для хранения данных реляционных баз данных;

гибридное решение: детальные данные хранятся в базах реляционного типа, а агрегатированные - в специальных многомерных структурах.

Интеллектуальный анализ данных

Сфера поиска закономерностей отличается от оперативной аналитической обработки данных (OLAP) тем, что в ней накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания. Этот процесс чрезвычайно актуален сейчас, и важность его будет со временем только расти, так как, согласно утверждениям специалистов, “количество информации в мире удваивается каждые 20 месяцев”, в то время как “компьютерные технологии, обещавшие фонтан мудрости, пока что только регулируют потоки данных”.

Интеллектуальный анализ данных определяется в большинстве публикаций как извлечение «зерен знаний из гор данных». При этом в английском языке существуют два термина, переводимые как ИАД, - Knowledge Discovery in Databases (KDD) и Data Mining (DM). В большинстве работ они используются как синонимы.

Покажем на примерах различие в задачах “оперативной аналитической обработки данных” (OLAP) и “интеллектуального анализа данных” (ИАД). Если задачей OLAP является, например, ответ на вопрос, “как изменились эксплуатационные затраты путевого хозяйства Московской железной дороги в период с 1998 по 2002 год?”, то цель ИАД найти ответ на вопросы, “какие факторы в наибольшей степени влияют на эксплуатационные расходы путевого хозяйства Московской железной дороги”?, “каковы ожидаемые величины эксплуатационных расходов в 2003 году”? и т.д.

Первоначально средства ИАД разрабатывались так, что в качестве исходного материала для анализа принимались данные, организованные в плоские реляционные таблицы. Применение ИАД к данным, представленным с помощью хранилищ в виде гиперкуба, во многих случаях может оказаться более эффективным, а главное - гораздо более тесно интегрированным в единую информационно-аналитическую систему.

Обычно выделяют следующие пять типов задач ИАД [1]:

1. Классификация. Наиболее распространенная задача ИАД. Она позволяет выявить признаки, характеризующие однотипные группы объектов - классы, - для того, чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Ключевым моментом решения этой задачи является анализ множества заранее классифицированных объектов. Наиболее типичный пример использования классификации - конкурентная борьба между поставщиками товаров и услуг за определенные группы клиентов. Классификация способна помочь определить характеристики неустойчивых клиентов, склонных перейти к другому поставщику, что позволяет найти оптимальную стратегию их удержания от этого шага (например, посредством предоставления скидок, льгот или даже с помощью индивидуальной работы с представителями “групп риска”).

2. Кластеризация. Логически продолжает идею классификации на более сложный случай, когда сами классы не предопределены. Результатом использования метода, выполняющего кластеризацию, как раз является определение присущего исследуемым данным варианта разбиения на группы. Так, можно выделить родственные группы клиентов или покупателей с тем, чтобы вести в их отношении дифференцированную политику. В приведённом выше примере “группа риска” - категории клиентов, готовых уйти к другому поставщику - средствами кластеризации могут быть определены до начала процесса ухода, что позволит производить профилактику проблемы, а не экстренное исправление положения. В большинстве случаев кластеризация очень субъективна; будучи основанной на измерении “информационного расстояния” между объектами и группами объектов (кластерами), любой вариант разбиения на кластеры напрямую зависит от выбранной меры этого расстояния. В качестве примера использования методов кластеризации можно привести обучение “без учителя” особого вида нейронных сетей - сетей Кохонена [12].

3. Выявление ассоциаций. Ассоциация - это связь между двумя или несколькими одновременно наступающими событиями. Количественной мерой может быть, например, условная вероятность события А при условии, что событие В произошло.

4. Выявление последовательностей. Подобно ассоциациям, последовательности определяют связь между событиями, но наступающими не одновременно, а с некоторым определенным разрывом во времени. Мерой взаимосвязи между последовательными событиями А, В, С могут быть условные вероятности события В при условии, что событие А произошло, и условная вероятность события С при условии, что А и В имели место.

5. Прогнозирование. Это задача оценки будущих значений показателя на основе анализа текущих и исторических данных. Например, может быть сделан прогноз объёма перевозок, который ожидается в следующем году, на основе данных, накопленных в базе производственно-экономических показателей работы железной дороги. В задачах подобного типа наиболее часто используются традиционные методы математической статистики.

Архитектура информационно-аналитических систем

Архитектура информационной системы - это концепция её построения, устанавливающая состав и взаимосвязь компонентов системы. Рассматриваемая ниже архитектура ИАС определяет взаимодействие различных технологий хранения и использования данных.

Поддержка принятия управленческих решений на основе накопленных данных может выполняться в трёх базовых сферах [9]:

1. Сфера детализированных данных. Это сфера действия большинства систем, нацеленных на поиск информации. В большинстве случаев реляционные СУБД отлично справляются с возникающими здесь задачами. Информационно-поисковые системы, обеспечивающие интерфейс конечного пользователя в задачах поиска детализированной информации, могут использоваться в качестве надстроек как над отдельными системами обработки данных (СОД), так и над хранилищем данных в целом.

2. Сфера агрегированных показателей. Комплексный взгляд на собранную в хранилище данных информацию, её обобщение и агрегация, гиперкубическое представление и многомерный анализ являются задачами систем оперативной аналитической обработки данных (OLAP). Здесь можно или ориентироваться на специальные многомерные СУБД, или (что, как правило, предпочтительнее) оставаться в рамках реляционных технологий. Во втором случае заранее агрегированные данные могут собираться в БД звездообразного вида, либо агрегация информации может производиться на лету в процессе сканирования детализированных таблиц реляционной БД.

3. Сфера закономерностей. Интеллектуальная обработка производится методами интеллектуального анализа данных (ИАД, Data Mining), главными задачами которых являются поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые объясняют найденные аномалии и/или (c определенной вероятностью) прогнозируют развитие некоторых процессов.

Архитектура ИАС, построенной на основе хранилища данных, показана на рис. 1.5. В конкретных реализациях отдельные компоненты этой схемы могут отсутствовать.

Основой для данных, накапливаемых в хранилище, являются детализированные данные, содержащиеся в СУБД реляционного типа и используемые в системах оперативной транзакционной обработки данных (OLTP - системах).

Хранилища данных содержат агрегированные данные, представляемые на логическом уровне в виде гиперкубов. Наряду с общим хранилищем используются так называемые витрины данных. Витрина данных - это специализированное хранилище, обслуживающее одно из направлений деятельности отрасли, предприятия, организации. Согласно с современной концепцией ИАС витрины данных являются надстройкой над корпоративным хранилищем данных.

Информационно-аналитические системы на железнодорожном транспорте

Информационное хранилище ОАО “РЖД”

С начала 1999г. осуществляется построение единого Информационного Хранилища (ИХ) показателей эксплуатационной деятельности железнодорожного транспорта в виде интегрирующей надстройки над всеми функционирующими в отрасли информационными системами. В настоящее время в Информационное хранилище интегрированы данные двух предметных областей: «Грузовые перевозки» и «Вагонные парки».

В среде «Грузовые перевозки» находятся агрегированные данные об отправлении и прибытии грузовых отправок по станциям, отделениям, дорогам, административным районам и округам, государствам ближнего и дальнего зарубежья, грузоотправителям и грузополучателям, по организациям-плательщикам и ряду других показателей. В состав анализируемых количественных и качественных показателей входят: объем перевозок грузов в тоннах, данные о вагонах и контейнерах, грузооборот, средняя дальность перевозок, провозная плата в рублях и валюте, сумма скидки, доходная ставка. Интерфейс позволяет получать как стандартные отчеты так и строить собственные, на базе существующих.

Предметная область «Вагонные парки» аккумулирует информацию нескольких оперативных баз данных: модели перевозочного процесса сети, автоматизированного банка данных парка вагонов и банка данных собственных вагонов. На основе данных о состоянии, местонахождении и других важных характеристиках парка грузовых вагонов разработаны приложения для анализа распределения вагонов по объектам дислокации (станции, отделения, дороги, депо), типам парка (рабочий, нерабочий, резерв, запас и др.), роду подвижного состава. Отслеживаются размеры передачи вагонов по стыковым междорожным и межгосударственным пунктам, выявляются непроизводительные простои вагонов на дорогах и станциях, нарушения в погрузке вагонов и в работе вагонов на кольцевых маршрутах, контролируется продвижение вагонов в адрес припортовых станций и погранпереходов, проведение всех видов ремонтных работ с вагонами, а также время нахождения «чужих» вагонов на территории России и российских - на территории других администраций железных дорог, а также другие задачи.

Центр ситуационного управления Российскими железными дорогами (ЦСУ РЖД)

Центр Ситуационого Управления - информационно-аналитическая система (ИАС), представляющая собой сложный комплекс объектов, программно-технических средств и научных методов, предназначенный для индивидуальной и коллективной работы по анализу ситуаций, выработке и принятию управленческих решений, направленных на достижение целевых ориентиров.

ЦСУ РЖД содержит пять хранилищ данных:

Производственно-экномические показатели работы ж.д.;

Перевозки грузов;

Оперативная информация;

Экономика России;

Макроиндикаторы.

На основе данных, содержащихся в хранилищах, решается комплекс аналитических задач, включающий следующие задачи:

Мониторинг состояния отрасли и ситуации вокруг неё.

Выявление , идентификация и оценка неблагоприятных изменений состояний отрасли и внешней среды.

Поддержка принятия оперативных и стратегических решений по управлению отраслью с возможно полным учётом переменных условий и факторов состояния отрасли и внешней среды.

ЦСУ создаёт эффективную среду для принятия решений, облегчает руководителю доступ к получению различной информации, но не принимает на себя все функции административного управления и не диктует готовых решений. ЦСУ является некой “матрицей”, которая сводит в единую информационно-прозрачную систему данные и позволяет лица, принимающим решения (ЛПР), увидеть разнородную, разноуровневую информацию в концентрированном и удобном виде.

6. Технологии проектирования информационных систем

Понятие о проектировании информационных систем

Проектирование - это процесс перехода от первичного описания информационной системы в виде проектного (технического) задания к описанию её в виде набора стандартных документов (проектной документации), достаточного для создания системы.

В ходе проектирования находится способ реализации технического задания, т.е. воплощения того, что требуется создать согласно техническому заданию. При этом набор стандартных документов - это технический и рабочий (или технорабочий) проекты, содержание которых регламентируется государственными стандартами [12, 14].

Поиск проектных решений, как правило, сводится к выбору одного из возможных вариантов построения системы или её частей. Проблема выбора возникает при решении следующих основных задач:

состав функций, реализуемых информационной системой, их объединение в группы (структуризация) и распределение по уровням объекта, для поддержки функционирования которого создаётся информационная система (отметим, что для железнодорожного транспорта уровни объекта - это уровень общесетевой, уровень дорог и уровень отделений, станций, депо):

разработка технологий обработки данных информационной системы: определение форм представления вводимых данных и системы методов сбора, ввода, передачи, обработки, хранения и выдачи информации;

разработка баз данных и информационных сервисов;

выбор технических средств (технического обеспечения) информационной системы: состав, тип, количество, размещение устройств сбора, передачи, обработки, накопления и представления данных;

выбор программной платформы (операционной среды), разработка и отладка программных средств системы (программное обеспечение информационной системы);

анализ достижимости требований, предъявляемых к показателям качества функционирования информационной системы (по показателям качества информации, безопасности данных, временным характеристикам, показателям надежности и т.д.) и поиск путей для удовлетворения этих требований.

Отметим, что совокупность основных решений, касающихся построения информационной системы или её компонент, называют обычно архитектурой системы. Так, можно говорить об архитектуре программного обеспечения системы, архитектуре комплекса технических средств и т.д.

Этапы разработки информационных систем

Проектирование это один из этапов жизненного цикла (ЖЦ) информационной системы (ИС). ЖЦ ИС состоит из последовательности состояний ИС, начиная от момента возникновения необходимости в данной ИС до момента прекращения её использования. Применительно к программному обеспечению (ПО), являющемуся наиболее сложной и трудоёмкой компонентой ИС, обычно выделяют следующие этапы ЖЦ [13, 14, 15]: анализ и формирование требований, проектирование, реализация, эксплуатация (сопровождение), снятие с эксплуатации. Аналогичные стадии (этапы) составляют и жизненный цикл информационной системы [14]. Первые три этапа ЖЦ (анализ и формирование требований, проектирование, реализация) объединяют общим понятием разработка ИС. Каждый этап разработки ИС можно представить в виде последовательности подэтапов.Так, этап анализ и формирование требований включает: предпроектное обследование объекта информатизации (анализ существующей ИС), разработка концепции ИС, разработка технического задания. Этот этап предшествует проектированию, иногда его называют предпроектным. Этап проектирование в свою очередь включает такие подэтапы: эскизное проектирование, разработка пилот-проекта, техническое проектирование, рабочее проектирование. Этот этап завершается созданием проектной документации, достаточной для реализации ИС. Этап реализация включает: создание ИС, тестирование, системная отладка, ввод в эксплуатацию.

При предпроектном обследовании объекта информатизации осуществляется сбор и анализ данных (путём опроса специалистов, изучения документов и технических описаний) о структуре, функциях объекта информатизации. Описываются информационные потоки, реализуемые в объекте бизнес-процессы, существующие технологии управления. Выявляются недостатки существующей информационной системы и обосновывается целесообразность проведения работ по созданию новой (модернизации старой) ИС. Формируются требования пользователей к создаваемой ИС.

На подэтапе разработка концепции ИС осуществляется поиск путей удовлетворения требований пользователей на уровне концепции создаваемой системы (назначение, функции, программно-техническая платформа, режимы использования). Рассматриваются альтернативные варианты концепции построения системы, производится их анализ, выбирается лучшая концепция системы.

На стадии разработка технического задания формируется техническое задание (ТЗ) на информационную систему. Состав и содержание ТЗ определены ГОСТ 34.602-89. Основой ТЗ являются требования к создаваемой системе.

На этапе “эскизное проектирование” осуществляется предварительная проработка проектных решений по системе в целом или её частям. Необходимость этого этапа возникает при создании сложных систем, состоящих из большого числа взаимодействующих элементов, например, информационных систем крупных предприятий, отраслей и т.п.

Пилотные проекты создаются в случаях, когда необходимо проверить правильность тех или иных проектных решений. Как правило, пилот-проекты реализуются для отдельных элементов сложных информационных систем.

На этапе технического проектирования осуществляется разработка основных проектных решений по системе и её частям: определение функциональной структуры, выбор комплекса технических средств, выбор СУБД, проектирование баз данных, входных и выходных форм; разработка технологии обработки информации, обеспечивающей выполнение требований, предъявляемых к данным; разработка алгоритмов обработки данных при выполнении различных функций.

На этапе рабочего проектирования проводится разработка программных средств системы, их автономная отладка, осуществляется адаптация приобретаемых программных продуктов, готовится проектная докуме, ввода в действия и эксплуатации ИС.

Этап реализация включает выполнение строительно-монтажных работ, тестирование и системную отладку программных средств, организационную подготовку к вводу ИС в действие, обучение персонала, пусконаладочные работы, опытную эксплуатацию (с необходимой доработкой по её результатам), приёмочные испытания.

Понятие о моделях жизненного цикла информационной системы

Модель ЖЦ определяет последовательность выполнения и взаимосвязь рабочих процессов, действий и задач, выполняемых на протяжении ЖЦ.

Состав процессов, действий и задач на разных стадиях разработки программного обеспечения ИС рассмотрен в стандарте ГОСТ Р ИСО/МЭК 12207-99. Информационная технология. Процессы жизненного цикла программных средств. Рабочие процессы и их взаимосвязь с этапами разработки детально описаны в [13].

В этом разделе мы дадим ответ на вопрос, всегда ли удается при разработке ИС строго сохранить последовательность этапов, показанную на рис.1.6 Рассмотренные ниже модели ЖЦ обычно относят к ЖЦ программного обеспечения (ПО), однако, имея в виду, что создание ПО - одна из самых трудоёмких процедур разработки ИС, представляется возможным те же модели ЖЦ отнести и в целом к разработке ИС [14].

К настоящему времени наибольшее распространение получили следующие две основные модели ЖЦ [13]:

каскадная модель;

спиральная модель.

При каскадной модели разработка ИС разбивается на этапы, причем переход с одного этапа на следующий происходит только после того, как будет полностью завершена работа на текущем (рис.1.7). Каждый этап завершается выпуском полного комплекта документации, достаточной для того, чтобы разработка могла быть продолжена другой командой разработчиков. Положительные стороны применения каскадного подхода заключаются в следующем [13]:

на каждом этапе формируется законченный набор проектной документации;

выполняемые в логичной последовательности этапы работ позволяют планировать сроки завершения всех работ и соответствующие затраты.

Каскадный подход хорошо зарекомендовал себя при построении ИС, для которых в самом начале разработки можно достаточно точно и полно сформулировать все требования, с тем чтобы предоставить разработчикам свободу реализовать их как можно лучше с технической точки зрения. Однако, реальный процесс создания ИС никогда полностью не укладывался в такую жесткую схему. В процессе создания ИС постоянно возникала потребность в возврате к предыдущим этапам и уточнении или пересмотре ранее принятых решений. В результате реальный процесс создания ИС принимает следующий вид (рис. 1 .8).

Спиральная модель ЖЦ (рис.1.9) делает упор на начальные этапы ЖЦ: анализ и проектирование. На этих этапах реализуемость технических решений проверяется путем создания прототипов. Созданию прототипа на рис.1.9 соответствуют сегменты “реализация и тестирование” и “интеграция”. Каждый виток спирали соответствует созданию фрагмента или вер-сии программного обеспечения ИС, на нем уточняются цели и характеристики проекта, определяется его качество и планируются работы следующего витка спирали. Таким образом углубляются и последовательно конкретизируются детали проекта и в результате выбирается обоснованный вариант, который доводится до реализации.


Подобные документы

  • Роль структуры управления в информационной системе. Примеры информационных систем. Структура и классификация информационных систем. Информационные технологии. Этапы развития информационных технологий. Виды информационных технологий.

    курсовая работа [578,4 K], добавлен 17.06.2003

  • Классификация автоматизированных информационных систем. Классические примеры систем класса А, B и С. Основные задачи и функции информационных систем (подсистем). Информационные технологии для управления предприятием: понятие, компоненты и их назначение.

    контрольная работа [22,9 K], добавлен 30.11.2010

  • Современное состояние информационных систем и технологий и их роль в управлении предприятием. Экономическая информация на предприятиях и способы ее формализованного описания. Стадии создания автоматизированных систем. Классы информационных технологий.

    курс лекций [146,8 K], добавлен 16.11.2009

  • Характеристика информационных систем управления предприятием. Виды информационных систем управления предприятием, их применение. Специфика систем управления торговым предприятием класса ERP и применение данной системы в деятельности торговой компании.

    дипломная работа [1,8 M], добавлен 15.09.2012

  • Цели и направления информатизации общества. Состав инфраструктуры информатизации. Факторы, влияющие на становление информационных технологий. Анализ состояния государственных информационных ресурсов. Информатизация в социальной и экономической сферах.

    контрольная работа [19,5 K], добавлен 23.06.2011

  • Основные характеристики и принцип новой информационной технологии. Соотношение информационных технологий и информационных систем. Назначение и характеристика процесса накопления данных, состав моделей. Виды базовых информационных технологий, их структура.

    курс лекций [410,5 K], добавлен 28.05.2010

  • Информационные технологии и системы. Связь организаций и информационных систем. Интегрированная система управления промышленными предприятиями. Возможности информационных технологий в бизнесе, их влияние на организацию и роль менеджеров в этом процессе.

    курсовая работа [147,7 K], добавлен 07.05.2012

  • Понятие и виды информационно-аналитических систем. Разработка информационной системы, предназначенной для учета корреспонденции отдела канцелярии, с использованием передовых информационных технологий и современных вычислительных средств и средств связи.

    отчет по практике [295,4 K], добавлен 07.03.2012

  • Информационные системы - обычный программный продук, но они имеют ряд существенных отличий от стандартных прикладных программ и систем. Классификация, области применения и реализации информационных систем. Фазы проектирования информационных систем.

    реферат [22,9 K], добавлен 05.01.2010

  • Развитие информационных технологий. Концепция информатизации железнодорожного транспорта. Задачи автоматизации управления эксплуатационной работой и ремонтом технических средств хозяйств пути. Технологии хозяйств и служб в области управления кадрами.

    презентация [1,1 M], добавлен 10.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.