Анализ и разработка системы автоматизации документооборота для предприятия, работающего в сфере информационных услуг

Обобщение задач, решаемых системами электронного документооборота. Масштабируемость, распределенность, модульность - основные требования к ним. Документирование управленческой деятельности. Векторная и линейная модель индексирования и поиска документов.

Рубрика Менеджмент и трудовые отношения
Вид курсовая работа
Язык русский
Дата добавления 10.12.2011
Размер файла 41,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

46

Введение

Целью данной выпускной работы является анализ и разработка системы автоматизации документооборота для предприятия, работающего в сфере информационных услуг.

Задача накопления, обработки и распространения (обмена) информации стояла перед человечеством на всех этапах его развития. В течение долгого времени основными инструментами для ее решения были мозг, язык и слух человека. Первое кардинальное изменение произошло с приходом письменности, а затем изобретением книгопечатания. Поскольку в эпоху книгопечатания основным носителем информации стала бумага, то технологию накопления и распространения информации естественно называть “бумажной информатикой”.

Положение в корне изменилось с появлением электронных вычислительных машин (ЭВМ). Первые ЭВМ использовались как большие автоматические арифмометры. Принципиально новый шаг был совершен, когда от применения ЭВМ для решения отдельных задач перешли к их использованию для комплексной автоматизации тех или иных законченных участков деятельности человека по переработке информации.

Одним из первых примеров подобного системного применения ЭВМ в мировой практике были так называемые административные системы обработки данных: автоматизация банковских операций, бухгалтерского учета, резервирования и оформления билетов и т.п. Решающее значение для эффективности систем подобного рода имеет то обстоятельство, что они опираются на автоматизированные информационные базы. Это означает, что в памяти ЭВМ постоянно сохраняется информация, нужная для решения тех задач, на которые рассчитана система. Она и составляет содержимое информационной базы соответствующей системы.

При решении очередной задачи система нуждается во вводе только небольшой порции дополнительной информации, остальное берется из информационной базы. Каждая порция вновь вводимой информации изменяет информационную базу системы. Эта база (информационная, или база данных) находится, таким образом, в состоянии непрерывного обновления, отражая все изменения, происходящие в реальном объекте, с которым имеет дело система.

Хранение информации в памяти ЭВМ придает этой информации принципиально новое качество динамичности, т.е. способности к быстрой перестройке и непосредственному ее использованию в решаемых на ЭВМ задачах. Устройства автоматической печати, которыми снабжены современные ЭВМ, позволяют в случае необходимости быстро представить любую выборку из этой информации в форме представления на бумаге.

По мере своего дальнейшего развития административные системы обработки данных перерастают в автоматизированные системы управления соответствующими объектами, в которых, как правило, не ограничиваются одной ЭВМ, а в составе двух и более ЭВМ объединяют в вычислительный комплекс.

В этом ряду особое место занимают базы данных и другое программное обеспечение, связанное с их использованием в качестве инструмента для делопроизводства и рационализации труда. Их использование позволяет сократить время, требуемое на подготовку конкретных маркетинговых и производственных проектов, уменьшить непроизводительные затраты при их реализации, исключить возможность появления ошибок в подготовке бухгалтерской, технологической и других видов документации, что дает для предприятия прямой экономический эффект.

Разумеется, для раскрытия всех потенциальных возможностей, которые несет в себе использование баз данных, необходимо применять в работе комплекс программных и аппаратных средств максимально соответствующий поставленным задачам. Поэтому в настоящее время велика потребность предприятий в компьютерных программах, поддерживающих и согласующих работу управленческого и финансового звеньев компании, а также в информации о способах оптимального использования имеющегося у компании компьютерного оборудования.

Дерево целей «Автоматизированная система документооборота»

Общие требования и задачи, решаемые системами документооборота

Вначале рассмотрим общие требования к системе электронного документооборота.

Масштабируемость. Желательно, чтобы система документооборота могла поддерживать как пять, так, и пять тысяч пользователей, и ее способность наращивать мощность определялась только мощностью аппаратного обеспечения, на котором она установлена. Выполнение этого требования может быть обеспечено с помощью поддержки индустриальных серверов баз данных, производства, например, компаний Sybase, Microsoft, Oracle, Informix, которые существуют практически на всех возможных программно-аппаратных платформах, обеспечивая тем самым максимально широкий спектр производительности.

Распределенность. Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура системы документооборота должна поддерживать взаимодействие распределенных площадок. Причем они могут быть объединены самыми разнообразными по скорости и качеству каналами связи. Также архитектура системы обязана обеспечивать взаимодействие с удаленными пользователями.

Модульность. Вполне возможно, что заказчику может не потребоваться сразу внедрение всех компонентов системы документооборота, а иногда круг решаемых заказчиком задач меньше всего спектра задач документооборота. Поэтому очевидно, что система должна состоять из отдельных модулей, интегрированных между собой.

Открытость. Система документооборота не может и не должна существовать в отрыве от других приложений, к примеру часто необходимо интегрировать систему с прикладной бухгалтерской программой. Следовательно, система документооборота должна иметь открытые интерфейсы для возможной доработки и интеграции.

Рассмотрим общий спектр задач электронного документооборота. Задачи и, соответственно, необходимая система автоматизации определяются стадией жизненного цикла документа, которую необходимо поддерживать. Вообще жизненный цикл состоит из двух основных стадий.

1. Разработка документа, которая может включать собственно разработку содержания документа, оформление документа, утверждение документа.

В том случае если документ находится на стадии разработки, он считается неопубликованным, и права на него определяются правами доступа конкретного пользователя.

2. Стадия опубликованного документа, которая может содержать: активный доступ, архивный документ краткосрочного и долгосрочного хранения, уничтожение документа.

Когда документ переходит на вторую стадию, он считается опубликованным, и на него остается только одно право - доступ на чтение. В качестве примера опубликованного документа приведем шаблон стандартного бланка предприятия. Кроме права доступа на чтение могут существовать права на перевод опубликованного документа в стадию разработки.

В зависимости от конкретной стадии жизненного цикла документа, с которым имеют дело архивные системы, они подразделяются на следующие типы.

Статические архивы документов (либо просто архивы) - системы, которые обрабатывают только опубликованные документы.

Динамические архивы (либо системы управления документами) работают как с опубликованными документами, так и с теми, которые находятся в разработке.

Рис. 3. Дерево работ «Автоматизированная система документооборота»

Структурная организация управления информатизации

В соответствии с положением об Управлении, было создано в 1998 году "Управление информатизации". Целью Управление информатизации явилось объединение в единую корпоративную компьютерную информационную сеть Министерства Транспорта и Коммуникаций и организовать обучение и работу в компьютерной сети интернет руководителей и сотрудников управлений.

Основными задачами Управления являются:

- создание необходимых условий для наиболее полного удовлетворения информационных потребностей государственных органов, предприятий, учреждений, организаций и граждан путем предоставления им доступа к информационным ресурсам на основе внедрения средств вычислительной техники и телекоммуникаций;

- подготовка проектов нормативных правовых актов, определяющих права и обязанности юридических и физических лиц по формированию и использованию информационных ресурсов, средств их обработки и доставки;

- интеграция с мировым информационным пространством;

- создание и развитие информационной инфраструктуры.

Центр компетенции
В связи с "Проблемой 2000 года", по постановлению правительства №117 при Министерстве Транспорта и коммуникаций был создан Центр компетенции, в его функции входит поддержка контактов с обществом для ответа на технические вопросы, повышение осведомленности, сбор и анализ данных, подготовка и распространение отчетов по Y2K прогрессу. Центр компетенции также разрабатывает методы анализа рисков, сертифицирует тесты для ПО и инструментарии, проводит консультации по оценке ИС, а также делает рекомендации по решению проблемы. Центр компетенции организовывает семинары, готовит материалы для средств массовой информации и поддерживает Y2K web-site. Он также готовит все формы для утверждения Техническим советом и Межведомственным комитетом, и отвечает за распространение утвержденных форм. Также, Центр компетенции готовит способы координации и сотрудничества между министерствами, и перед объявлением представляет на рассмотрение Технического совета для утверждения.
На базе Центра компетенции по «Проблеме 2000 года» при управлении информатизации был организован «Проектно-исследовательский «Центр информатизации Министерства транспорта и коммуникаций». «Проектно-исследовательский «Центр информатизации Министерства транспорта и коммуникаций» является проектно-исследовательским учреждением, предназначенным для проведения проектных, исследовательских, образовательных и других работ в области информационных, компьютерных технологий. Центр информатизации в установленном законодательством порядке осуществляет прямые связи с международными организациями, научно-исследовательскими, проектными, учебными и другими юридическими и физическими лицами по всем вопросам сотрудничества.

Рис. 2. Структура организации.

Документирование управленческой деятельности

В целях дальнейшего совершенствования документационного обеспечения управления и улучшения организации делопроизводства. Правительство Кыргызской Республики постановило утвердить типовую инструкцию по документационному обеспечению управления (делопроизводству) в Кыргызской Республике. Данная инструкция устанавливает совокупность принципов и правил, регламентирующих единые требования к документированию управленческой деятельности и организации работы с документами в учреждениях, организациях и на предприятиях.

Основная цель типовой инструкции - упорядочивание документооборота, сокращение количества и повышение качества подготовки документов, совершенствование работы аппарата управления. Общие требования, изложенные в инструкции, распространяются на организационно - распорядительную документацию. Порядок работы с секретными документами устанавливается специальной инструкцией. Ответственность за организацию и состояние документационного обеспечения управления возлагается на руководителя учреждения, а в структурных подразделениях - на их руководителей.

Состав управленческих документов определяется компетенцией и функциями учреждения, порядком решения вопросов, объемом и характером взаимосвязей с другими учреждениями. Единство правил документирования управленческих действий на всех уровнях управления обеспечивается применением унифицированных систем документации, ГОСТ 6.38-90. Виды и разновидности документов, необходимых и достаточных для работы учреждений, определяются в соответствии с фундаментальным назначением каждого документа в глоссарии.

Составление текстов управленческих документов является выраженное средствами делового языка содержание управленческих действий. Текст документа должен быть ясным, информационно емким и убедительным. Ясность текста или отдельного предложения достигается логичностью и точностью выражения содержания. Логичность текста зависит от расположения элементов в каждом предложении, а также от правильности выбора формы предложения.

Точность текста или предложения заключается в правильном употреблении слов и словосочетаний с точки зрения их значения и формы. Правильность формы слова и словосочетания определяется нормами словообразования, управления, употребления предлогов с учетом специфики деловой речи. Текст управленческого документа и каждое его предложение должны быть информационно емкими. Для этого необходимо избегать слов и словосочетаний, несущих избыточную информацию, не имеющих конкретной смысловой нагрузки. Убедительность является одной из важнейших черт текста документа. Убедительным является документ, содержащий аргументированную и логически обоснованную информацию, необходимую для принятия решения.

Приступая к составлению документа, прежде всего следует определить его целесообразность, убедиться в соответствии предлагаемого содержания компетенции данного учреждения, правильно выбрать вид документа для фиксации управленческого действия.

Стиль документа, характер изложения текста во многом связаны с видом документа. Документ должен отражать объективную действительность, поэтому требование к документу - правдивое, точное, достоверное освещение события, формулировки документа должны быть безупречными в юридическом отношении, текст не должен допускать двояких толкований.

Тексты документов рекомендуется разделять на две основные части. В первой части указывается основание составления документа. Во второй части излагаются выводы, предложения, решения, распоряжения, мнения, просьбы. Если текст такого документа состоит из одной фразы, то в первой ее части указывается основание или причина, во второй - решение. Если же содержание документа не нуждается в пояснении и обосновании, текст может содержать одну заключительную часть: приказы - распорядительная часть без констатирующей, письма - просьбу без пояснения и т.д.

Оформление документов.

1. Реквизиты документа.

При оформлении документов необходимо соблюдать правила, обеспечивающие юридическую силу, качественное и оперативное исполнение документа.

Для организационно-распорядительных документов устанавливается 31реквизит в соответствии с ГОСТ 6.38-90.

Обязательными реквизитами документов являются: наименования учреждения - автора документа, название вида документа, текст, заголовок к тексту, дата и индекс документа, подпись, отметка об исполнении документа, место создания или издания документа, код организации - автора, код формы документа.

В процессе подготовки и оформления документов состав обязательных реквизитов при необходимости может быть дополнен другими реквизитами.

2. Бланк документа.

Применение бланков при подготовке документов повышает культуру управленческого труда, придает информации официальный характер, облегчает исполнение и дальнейшее использование документа. Служебные документы составляются на бланках форматов А-4 и А-5, отпечатанных типографским способом, в соответствии с ГОСТ 9327-60. Для отдельных видов документов допускается применение формата А-3.

Установлено два вида бланков: бланк письма и общий бланк для всех других видов организационно-распорядительных документов.

Бланк письма состоит из следующих реквизитов, отпечатанных типографским способом. Для каждого из этих видов бланков допускает два варианта расположения реквизитов - угловой и продольный. При продольном расположении реквизитов наименование учреждения размещается вдоль верхнего поля документов. При угловом - границы левого края в верхнем углу.

3. Заголовок документа.

Заголовок - краткое изложение содержание документа. Он должен быть максимально кратким и емким, точно передавать смысл текста, грамматически согласовываться с названием документа. Если в документе отражается несколько вопросов, то заголовок формируется обобщенно. К документам большого объема, или отражающим несколько вопросов, наряду с заголовками составляются подзаголовки. Их располагают в левой части листа.

4. Датирование.

Датой документа является дата его подписания, утверждения или события, которое зафиксировано в документе. Даты подписания, утверждения, согласования, а также содержащиеся в тексте, оформляют цифровым способом. Элементы даты приводятся в одной строке в следующей последовательности: число месяца, месяц, год.

5. Согласование.

Подготовленные проекты документов перед подписанием в ряде случаев согласовывается с заинтересованными учреждениями, структурными подразделениями, отдельными должностными лицами. Это делается для подтверждения их согласия с содержанием документа. Согласование проводится внутри учреждения и вне его.

Внутреннее согласование обычно оформляется визой, состоящей из должностей визирующего, подписи, ее расшифровки и даты. Визируются экземпляры документов, которые остаются в учреждении.

Внешнее согласование может быть оформлено грифом согласования, листом согласования. Гриф согласования состоит из слова «Согласовано», наименование должности лица, с которым согласовывается документ, личной подписи, ее расшифровки и даты, и располагается после реквизитов «Подпись» в левой части бланка.

Движение документов в учреждении с момента их получения или создания до завершения исполнения, отправки или сдачи в дело образуют документооборот.

Прохождение документов в учреждении должно быть оперативным и целенаправленно регулироваться. Следует исключить инстанции прохождения и действия с документами, не обусловленные деловой необходимостью. Каждое перемещение документов должно быть оправданным.

Прием и первичная обработка поступающей корреспонденции в учреждении осуществляется в централизованном порядке экспедицией или работниками служб делопроизводства. Все конверты, за исключением личной корреспонденции и писем в адрес общественных организаций, вскрываются. При этом проверяется целостность конвертов и наличие вложенных в них документов. При обнаружении повреждения, отсутствие документов или приложения к ним необходимо сообщить об этом отправителю. Конверты, как правило, уничтожаются, кроме случаев, когда только по конверту можно установить адрес отправителя или время отправки и получения документа.

Ошибочно доставленная корреспонденция пересылается по принадлежности. Документы сортируются на регистрируемые и нерегистрируемые.

Концептуальное и информационное моделирование. Выявление и моделирование бизнес-процессов

Основу деятельности любой организации составляют ее деловые процессы или бизнес-процессы, которые определяются целями и задачами организации. Каждый бизнес-процесс характеризуется четко определенными во времени началом и концом. Для каждой работы, входящей в бизнес-процесс, определены временные характеристики, определяющие ее место в общей последовательности работ. Описание деятельности организации с помощью бизнес-процессов позволяет определить где, когда и кем выполняется каждая функция, какие данные, информационные или функциональные взаимосвязи для этого нужны и откуда эти данные поступают.

В данной выпускной работе рассматривается работа Управления Информатизации и ее подразделений.

Каждый бизнес-процесс характеризуется четко определенными во времени началом и концом, внешними интерфейсами, которые либо связывают его с другими бизнес - процессами внутри организации, либо описывают выход во внешнее окружение, последовательностью выполняемых работ и правилами их выполнения (бизнес-правилами). Для каждой работы, входящей в бизнес-процесс, определены временные характеристики, определяющие ее место в общей последовательности работ, условия инициализации и время выполнения.

Создаваемая модель бизнесс-процессов организации строится на базе построенных бизнесс-процессов по результатам обследования деятельности организации, проводимого на уровне подразделений.

На этом этапе проводится обследование подразделений, в результате которого выявляются выполняемые в них основные функции, их вход и выход. Эти функции распределяются по бизнесс-процессам, проходящим через каждое подразделение. В результате формируются и уточняются общие списки бизнес-процессов и функций по подразделениям, списки входных и выходных документов и другие характеристики, и вся эта информация наполняет каждый бизнес-процесс конкретным содержанием.

В процессе отображения бизнес-процессов по уровням организационной иерархии формируется и уточняется общий список бизнес-процессов, и могут появиться новые бизнес-процессы.

Главной целью создания модели бизнесс-процессов предприятия является детализация описания деятельности организации. От уровня описания реализации общих бизнесс-процессов в организации и списковых моделей в подразделениях до уровня детальных моделей подразделений, позволяющих выделить все функции подразделений, обрабатываемые документы, основные данные, описать регламент работы персонала и создать в итоге функциональную модель организации и концептуальную модель данных.

Выявленные в процессе обследования подразделения функции распределяются по бизнесс-процессам этого подразделения, наполняя их конкретными работами данного подразделения. При этом описания бизнесс-процессов могут дополняться и уточняться. В моделях описываются и детализируются бизнес-процессы, функции, информационные потоки, входные и выходные документы, взаимодействие внутри организации и с внешними объектами, данные, бизнес - правила, роли персонала и регламент, их взаимосвязи, временные и прочие характеристики.

Модель бизнес-процессов Управления Информатизации описываются в Приложении 1. Созданные в средстве анализа (Upper CASE), предназначенном для построения и анализа моделей предметной области (BPwin (Logic Works)). На основе созданной в Bpwin системе, можно построить отчеты, диаграммы.

BPwin - это мощный инструмент моделирования, который используется для анализа, документирования и реорганизации сложных бизнес-процессов. Модель, созданная средствами BPwin, позволяет четко документировать различные аспекты деятельности - действия, которые необходимо предпринять, способы их осуществления, требующиеся для этого ресурсы и др. Таким образом формируется целостная картина деятельности предприятия - от моделей организации работы в маленьких отделах до сложных иерархических структур. Модели BPwin дают основу для осмысления бизнес - процессов и оценки влияния тех или иных событий, а также описывают взаимодействие процессов и потоков информации в организации. Неэффективная, высоко затратная или избыточная деятельность может быть легко выявлена и, следовательно, усовершенствована, изменена или устранена в соответствии с общими целями организации.

Концептуальное моделирование

электронный документооборот управленческий

С точки зрения системного анализа концептуальное моделирование является структуризацией предметной области, для которой разрабатывается система. Ее цель - выявление перечня и иерархии предметов, объектов, факторов и явлений, полный набор которых позволяет реализовать поставленные перед системой цели и задачи.

Согласно методологии ООАПиП системный анализ проекта предполагает на первом этапе рассмотрение и физическое моделирование предметной области. На данном этапе проводится расчленение (выделение, разбивка) предметной области, объектов системы на ряд подобластей или подсистем (уровней), характеризуемых целостностью их восприятия и однородностью выполняемых работ (функций).

При этом требуемый критерий целостности восприятия дает право продолжать расчленение до тех пор, пока предмет или объект (фактор системы) не перестанет восприниматься как в свою очередь состоящий из объектов, т.е. до элементарного, неделимого уровня.

Критерий однородности выполняемых работ (функций) дает возможность использовать концептуальную модель для корректировки разработанного во введении дерева работ.

Результаты концептуального моделирования являются базисными для реализации этапов информационного моделирования и затем разработки моделей состояний (жизненных циклов системы) - моделей, определяющих функционирование разрабатываемой системы.

Для углубленного изучения и закрепления проделанной работы, немаловажную роль играет детальное рассмотрение различных объектов.

Именно в этом состоит задача концептуального моделирования. Иными словами, говоря концептуальное моделирование включает системное представление доменов предметной области с кратким описанием назначения или функций объекта и структуризацию факторов (атрибутов).

Так как, объекты составляют основу концептуального моделирования, я хотел бы остановиться на них более подробно.

Объект это абстракция множества предметов реального мира. Различают следующие виды объектов:

Реальные объекты - предметы реального мира, а точнее абстракции реальных объектов, как их мы представляем для наших целей. Например: завод, бухгалтерия, склад.

Ролевые объекты - абстракции цели или назначения человека, функциональные части оборудования или организации. Например: бухгалтер, экономист, аудитор.

Инциденты - абстракция чего-то произошедшего или случившегося. Например: перечисление в банк, проводка, платежи, поставка.

Взаимодействие - объекты, получаемые из отношений с другими объектами. Например: контракт, платежная ведомость, налоги, главная книга.

Спецификация - используется для представления правил, нормативных документов или критериев качества, стандартов.

Методы концептуального моделирования используют широкий диапазон математических средств и методов представления знаний. Широко используются как древовидные, так и сетевые конструкции, в которых различаются как вершины, так и ребра. Одним из видов являются графы связей, позволяющие разбивать структуру на узкие классы объектов системы. Очень часто графы связей отображаются таблицами в виде логических матриц отношений. Построение графов связей или таблиц один из распространённых методов формализации проектных задач. В данной курсовой работе была выбрана древовидная структура как более удобная и наглядная в конкретном случае. Древовидная или иерархическая структура - эта структура, в которой каждый компонент системы, исключая первый непосредственно подчиняется только одному (вышестоящему) компоненту структуры. Это хорошо видно в (Приложении 2) на приведенных примерах концептуальных моделей.

Информационное моделирование

Цель этапа информационного моделирования состоит в том, чтобы идентифицировать концептуальные сущности, или объекты, которые составляют подсистему для анализа. Объекты информационной модели представляются через их имена и имена их атрибутов. Здесь устанавливаются связи между информационными объектами и функциональные зависимости.

Кроме структурной направленности информационное моделирование связанно с особенностями реализации связей в различных компьютерных технологиях, в зависимости от количества связываемых предметов.

Методология ООАПиП, в этой связи различает и рассматривает три вида связей:

1) один к одному

2) один ко многим

3) многие ко многим

Это объясняется различными подходами и методами их реализации в отдельных компьютерных технологиях. Так, связи один к одному реализуется преимущественно матрицами, связи один ко многим на базе реляционной алгебры и реляционных таблиц, а связи “многие ко многим” требуют использования вспомогательного объекта.

Поэтому данная глава курсовой работы двунаправлена - решает как задачу структуризации системы, так и задачу анализа и формирования упомянутых трех видов связей.

Кроме того, в методологии ООАПиП принят графический вид информационных моделей, как предварительных, базисных для последующего моделирования состояний - жизненных циклов.

В информационной модели каждому объекту должно быть назначено уникальное имя. При этом имя должно явно указывать отношение объекта или к классу объектов или к экземпляру.

Для успешной реализации проекта объект проектирования должен быть прежде всего адекватно описан, должны быть построены полные и непротиворечивые функциональные и информационные модели ИС. Накопленный к настоящему времени опыт проектирования ИС показывает, что это логически сложная, трудоемкая и длительная по времени работа, требующая высокой квалификации участвующих в ней специалистов. Однако до недавнего времени проектирование ИС выполнялось в основном на интуитивном уровне с применением неформализованных методов, основанных на искусстве, практическом опыте, экспертных оценках и дорогостоящих экспериментальных проверках качества функционирования ИС. Кроме того, в процессе создания и функционирования ИС информационные потребности пользователей могут изменяться или уточняться, что еще более усложняет разработку и сопровождение таких систем. Ручная разработка обычно порождала следующие проблемы:

неадекватная спецификация требований;

неспособность обнаруживать ошибки в проектных решениях;

низкое качество документации, снижающее эксплуатационные качества;

затяжной цикл и неудовлетворительные результаты тестирования.

Перечисленные факторы способствовали появлению программно-технологических средств специального класса - CASE-средств, реализующих CASE-технологию создания и сопровождения ИС. Термин CASE (Computer Aided Software Engineering) используется в настоящее время в весьма широком смысле. Первоначальное значение термина CASE, ограниченное вопросами автоматизации разработки только лишь программного обеспечения (ПО), в настоящее время приобрело новый смысл, охватывающий процесс разработки сложных ИС в целом. Теперь под термином CASE-средства понимаются программные средства, поддерживающие процессы создания и сопровождения ИС, включая анализ и формулировку требований, проектирование прикладного ПО и баз данных, генерацию кода, тестирование, документирование, обеспечение качества, конфигурационное управление и управление проектом, а также другие процессы. CASE-средства вместе с системным ПО и техническими средствами образуют полную среду разработки ИС.

CASE-технология представляет собой методологию проектирования ИС, а также набор инструментальных средств, позволяющих в наглядной форме моделировать предметную область, анализировать эту модель на всех этапах разработки и сопровождения ИС и разрабатывать приложения в соответствии с информационными потребностями пользователей. Большинство существующих CASE-средств основано на методологиях структурного (в основном) или объектно-ориентированного анализа и проектирования, использующих спецификации в виде диаграмм или текстов для описания внешних требований, связей между моделями системы, динамики поведения системы и архитектуры программных средств.

Пример информационной модели данных по системе «Автоматизированная система документооборота» проработан в системе ERwin. (Приложение 3)

Определение жизненного цикла модели

Необходимость анализа и разработки больших сложных, а в последнее время и сверхсложных систем, появление и использование при этом новых методологий, в частности ООАПиП, корпоративное проектирование, методология управления проектами, появление современных компьютерных технологий привело к следующему факту:

- при планировании и реализации этих работ алгоритмический подход, которым ранее широко пользовались, имеет существенный недостаток препятствующий этим работам.

Обнаружилось, что при алгоритмическом подходе трудно отслеживать все нюансы поведения (изменений состояний) анализируемых и разрабатываемых информационных объектов и систем, охватить все аспекты их поведения (функционирования), управления и пребывания в отдельных промежуточных состояниях. В связи с этим современные методы анализа разработки, моделирования, а также компьютерной технологии предлагают рассматривать поведение информационных объектов и систем в динамике (при функционировании) вводя понятие жизненного цикла объектов, подсистем, систем и надсистем.

Жизненный цикл представляет как модель их поведения, т.е. переход из одного состояния в другое. При этом считается наиболее подходящей моделью для представления жизненного цикла дискретный автомат Мура. С этих позиций проанализируем и сопоставим трактовку модели представления жизненного цикла (состояний) методологии ООАПиП и классическую модель конечного автомата Мура представляющего частный их вид - автоматы без выходов. Методология считает, что модель имеет следующий состав :

1. Множество состояний. Каждое состояние представляет стадию или этап в жизненном цикле типичного экземпляра объекта, при этом в качестве объектов рассматриваются не только элементарные но и подсистемы и надсистемы. С точки зрения теории КА - это внутреннее состояние автомата которое, как правило, обозначается в алфавите Q.

2. Множество событий. Каждое событие представляет собой некоторое законченное действие влекущее за собой некоторое действие изменяющее поведение, состояние объекта или системы.

3. Множество правил перехода. Правило перехода определяет в какое следующее состояние переходит объект или система совпадая с теорией КА.

4. Действия. Действия - это деятельность или совокупность операций которые должны быть выполнены над объектами системы для достижения определенного состояния.

По крайней мере, одно определенное действие должно быть связанно каждым состоянием, с точки зрения теории КА действие соответствует функциям перехода.

Придание функциям перехода более широкого смысла действия расширяет возможности моделирования жизненных циклов поскольку внутреннее состояние рассматривается в течении промежутка времени во время которого решается частная задачи ведущие к достижению данного состояния или совершается определенная работа результатом которой является данное состояние.

В качестве примеров действий приводятся выполнение расчетов над некоторой промежуточной таблицей; реализации элементарного этапа; действие по достижению заданного критериального значения; определенная работа требующееся для достижения данного состояния; определенной обработки данных заданных состояний и т.п.

Анализ описания действий в методологии ООПиП рпиводит к выводу, что это понятие подробно обсуждается в связи с удобством его использования при реализации модели состояний в различных компьютерных технологиях.

С другой стороны широкой трактовкой действия подтверждается сущность систем как интерпретирующих блок-схемы системы. Ибо как указанно выше интерпретирующая система по своему определению связанна с определенными действиями.

Каков бы ни был замысел проекта, сам по себе, без реализации он мало что значит. Важен результат выполнения проекта, нужна работа по его осуществлению. Каждый проект независимо от его сложности и объема работ, необходимых для его выполнения, проходит в своем развитии определенные состояния: от состояния, когда «проекта еще нет», и до состояния, когда «проекта ужу нет». Это упрощенное представление о «начале» и «конце» жизни проекта требует уточнения.

Что считать началом проекта? Иногда это момент рождения идеи, особенно если ее рождению предшествовал скрупулезный поиск. Для деловых людей начало проекта связанно, скорее с началом его реализации и началом вложения денежных средств в его выполнение.

Концом проекта может быть:

завершение работ над его реализацией, то есть ввод проекта в действие

перевод персонала, выполняющего проект, на другую работу

достижение проектом заданных результатов

прекращение финансирования проекта

Понятие жизненного цикла ее программного обеспечения (ЖЦ ПО) - это непрерывный процесс, который начинается с момента принятия решения о необходимости его создания и заканчивается в момент его полного изъятия из эксплуатации.

Согласно сложившейся практике, состояния, через которые проходит проект, называют фазами (этапами, стадиями).

Деление проекта на фазы может быть самым разнообразным, такое деление выявляет некоторые важные контрольные точки «вехи», во время прохождения которых просматривается дополнительная информация и оцениваются возможные направления развития проекта.

В свою очередь каждая выделенная фаза (этап) может делиться на фазы следующего уровня (подфазы, подэтапы) и т.д.

Применительно к очень крупным проектам, количество фаз и этапов их реализации может быть увеличено. Выделение дополнительных этапов связанно с необходимостью более тщательного согласования действий.

Математическое моделирование

Проблема поиска и индексирования документов

Наряду с организацией хранения документов, их необходимо также быстро и эффективно искать. Со скоростью поиска все относительно понятно - чем быстрее вы найдете необходимые документы, тем лучше. А вот с эффективностью поиска документа ситуация не так проста. Что считать эффективным поиском? Для того чтобы понять это, рассмотрим модели поиска. Здесь существует два подхода. Первый состоит в том, что в процессе поиска вы ищете документ, который точно существует в системе, и ваша задача - свести процесс к его нахождению. Этот метод применяется в 90% всех случаев. Второй подход состоит в том, что вы ищете все документы, которые могут относиться к интересующему вас вопросу. Очевидно, применение данного подхода целесообразно в аналитических и исследовательских задачах. Для него характерны такие термины, как полнота поиска - соответствие между найденными документами по данному запросу и действительному списку документов; шум при поиске - соотношение (соответствие) соответствующих и несоответствующих запросу документов.

Существует два основных типа поиска. Атрибутивный, когда каждому документу присваивается набор определенных атрибутов (полей). При сохранении документа в архив поля заполняются определенными значениями, в дальнейшем при поиске проверяется совпадение значений этих полей запросу. К атрибутам документа можно отнести имя документа, время создания, автора, машинистку, имя подразделения, тип документа (факс, письмо, контракт, спецификация). Ясно, что список таких атрибутов должен быть расширяем. Их совокупность называется карточкой документа. Поля могут заполняться произвольно или из предопределенных справочников. Причем последнее наиболее предпочтительно, так как сужает области поиска.

Второй тип поиска носит название полнотекстовый. В этом случае автоматически обрабатывается все содержание, как правило предварительно проиндексированного, документа, и затем его можно найти по любому входящему в него слову.

Соответственно, существует зависимость между типами поиска и подходами к поиску. Для поиска известного документа более пригоден атрибутивный поиск, тогда как для исследовательского - полнотекстовый. Существует комбинация полнотекстового и атрибутивного поиска, когда атрибуты документа обрабатываются так же, как все содержание документа. Полнотекстовый поиск зависит от формата документа и языка, на котором он создан. Электронный документ любого формата необходимо предварительно преобразовывать в плоский текст для обработки системой полнотекстового поиска, следовательно, любая такая система должна содержать в своем составе конвертеры форматов.

Зависимость от языка выражается в следующих факторах:

Поиск документа более полный, если в результате запроса будут найдены не только документы, которые точно соответствуют слову в запросе, но и те, в которых присутствуют различные его словоформы. Данная технология носит название нормализации. Причем эффективность метода зависит от применяемого алгоритма. Для русского языка наиболее эффективен словарный метод, когда слово нормализуется на основе словарей, в которых содержатся словоформы. Кроме словарного может применяться эвристический метод нормализации, когда слово может быть приведено к нормальному виду путем выполнения определенных правил, описывающих алгоритм нормализации. Если для английского языка свод правил нормализации составляет 300 страниц машинописного текста, то для русского он на несколько порядков больше.

Аналогично нормализации было бы логично выполнять поиск не только по конкретному слову, но и его синонимам.

Процессом, аналогичным индексации, в бумажном делопроизводстве является регистрация.

Регистрация является "священной коровой" делопроизводства. Историческая неразвитость системы управления в сочетании с большими расстояниями и традиционно низкой ответственностью исполнителей породила своеобразный, скрупулезный подход к регистрации документов на всех уровнях управления.

Хрестоматийным примером может послужить журнал учета входящих документов. Индексация электронных документов, осуществляемая системами автоматизации делопроизводства, преследует несколько иную цель - получить максимальное количество достоверной информации о формируемом документе и создать его регистрационную карточку. Процесс этот тем более важен, что в дальнейшем система управления документами имеет дело именно с этой карточкой, не затрагивая реальные объекты файловой системы. Далее мы в общих чертах рассмотрим известные методы индексации.

Итак, на основе вышесказанного становится очевидным то, что успешный поиск документа во многом зависит от реализованного в системе метода индексирования документов. Рассмотрим основные положения индексирования.

Индексирование документа обычно организуется через автоматическую обработку его текста и заполнение метаданных. Автоматическая обработка - полнотекстовое индексирование - заключается в преобразовании текста документа в набор слов. Причем обычно для слов сохраняется их позиция в документе, для обеспечения возможности поиска по словосочетаниям. Существуют два принципиально различных метода такого индексирования с учетом применяемых в дальнейшем методов поиска:

бинарное индексирование - не зависит от языка документа по причине бинарной или словарной индексации;

морфологическое индексирование - производится с учетом морфологии и семантики языка.

При бинарном индексировании поиск ведется на основе алгоритмов “нечеткого поиска”, т.е. поиска с ошибками. В этом случае допускается неполное (с заданным количеством ошибок в начале, середине и конце слова) совпадение слов с шаблоном. При втором методе индексации слова преобразуются в словоформы с отсечением суффиксов и окончаний, что позволяет искать склонения и спряжения шаблонов.

Стандарта на метаданные на текущий момент не существует, но обычно они включают по крайней мере дату создания документа, его размер, возможно, тип и автора, краткое содержание - аннотацию и ключевые слова. Стоит отметить, что последние поля (аннотация и ключевые слова) на сегодняшний день заполняются вручную. При этом, если формат документа их предусматривает и автор их заполнил, то все неплохо, но практически всегда в реальных документах они отсутствуют. Поэтому существующие сегодня системы документооборота их обычно игнорируют по причине крайне дорогого и медленного их заполнения оператором, вводящим документы в систему.

Векторная и линейная модель индексирования и поиска документов

Ниже приведен разработанный алгоритм процесса индексирования документа:

Присвоение документу уникального идентификатора, внесение в файл идентификаторов

Определение формата документа

Определение кодировки документа

Перевод текста в «плоский» формат

Определение единицы поиска

Выделение отдельных слов

Выделение отдельных предложений

Исключение из запроса шумовых слов

Составление (пополнение) индекса определенного формата (рис. 4)

Слово

id документа, номер слова, номер слова.

id документа, номер слова, номер слова.

Рис. 4 Формат индекса

При индексировании нового документа в уже существующий индекс напротив слов добавляется идентификатор нового документа и номера данного слова в нем. При этом идентификаторы документов сортируются в соответствии с количеством вхождений слова в документ.

Таким образом, приведенный выше алгоритм обеспечивает составление единого индекса для всех индексируемых документов, что существенно уменьшает объем занимаемого индексами дискового пространства, а также уменьшает время, затрачиваемое на поиск документа.

В модели информационного потока вообще можно выделить несколько основных понятий: словарь, документ, поток и процедуры поиска и коррекции запросов.

Под словарем понимают упорядоченное множество терминов, мощность которого обозначают как D.

Документ - это двоичный вектор размерности D. Если термин входит в документ, то в соответствующем разряде этого двоичного вектора проставляется 1, в противном же случае - 0. Обычно все операции в линейной модели индексирования и поиска документов выполняются над поисковыми образами документов, но при этом их как правило называют просто документами.

Информационный поток или массив L представляют в виде матрицы размерности NxD, где в качестве строк выступают поисковые образы N документов. При таком рассмотрении можно сформулировать процедуру обращения к информационной системе следующим образом:

L x q = r;(1)

где q - вектор запроса, r - отклик системы на запрос.

Это традиционное определение процедуры поиска документов в информационно-поисковой системе, которое ввел Солтон в 1977 году. Оно было введено для решения проблемы автоматического индексирования документов, но оказалось чрезвычайно полезным и для описания процедуры поиска.

Существуют и другие определения процедуры обращения пользователя к системе, но для описания работы распределенных информационно-поисковых систем в интернете больше подходит определение Солтона - в подавляющем большинстве этих систем применяются информационно-поисковые языки типа "Like This". Данный подход хорошо известен как вычисление мер близости "документ-запрос".

В современных распределенных информационно-поисковых системах Internet реально используются только 6 мер близости. При этом наиболее часто в качестве меры близости рассматривают определение Солтона, например, системы RBSE и WAIS, и его же улучшенную меру близости - системы WebCrawler и Lycos.

Начало применению запросов типа "Like This" положила система WAIS. Именно в ней был впервые сформулирован отказ от использования традиционных информационно-поисковых языков булевого типа и было заявлено о переносе центра тяжести информационного поиска на языки, основанные на вычислении меры близости "документ-запрос". Основная причина такого подхода - желание снять с пользователей заботу по формулированию запросов на информационно-поисковых языках и дать им возможность использовать обычный естественный язык. Ради справедливости следует отметить, что от запросов на естественном языке практически сразу отказались. Система просто проводила нормализацию лексики и удаляла из списка терминов запроса общие и стоп - слова. Тем самым практически один в один выполнялись условия линейной модели индексирования и поиска. После этой процедуры система вычисляла меру близости по выражению и в соответствии с полученными значениями ранжировала информационный массив. Практически все информационно-поисковые системы в интернете устроены по этому принципу. Единственным исключением является применение более сложных мер близости.

В приложении 4 приведен разработанный алгоритм процесса обработки запроса.

Заключение

В любой организации, как большой, так и маленькой, возникает проблема такой организации управления данными, которая обеспечила бы наиболее эффективную работу. Небольшие организации используют для этого шкафы с папками, однако крупные корпоративные предприятия используют компьютеризированные системы автоматизации, позволяющие эффективно хранить, извлекать информацию и управлять большими объемами данных.

Темпы внедрения новых технологий в компьютерной отрасли вызывают изумление. Компании, конкурирующие за рынки и прибыли, стремятся моментально реализовать технические новшества в аппаратных средствах, программном обеспечении и парадигмах вычислений, стимулирующих развитие всей технологии управления информацией. Однако для успешной реализации крупных систем управления требуется применить нестандартный подход, творческое решение. Использование основ эргономики при проектировании, реализации и внедрении системы управления позволит решить многие «психологические» и «технологические» проблемы предприятий.

В данной выпускной работе решены следующие задачи:

1. Приведена структура оформления документов

2. Выполнена постановка задачи на разработку функций поиска информации в системе документооборота

3. Рассмотрены преимущества полнотекстовой индексации документов как основа для математического аппарата решения поставленной задачи и разработана математическая модель, реализующая выбранный алгоритм индексации документов.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.