Обзор проблематики и теоретических основ электронного документооборота

Ознакомление с результатами сравнительного анализа программ для распознавания текста. Исследование и характеристика особенностей объекта автоматизации и структуры документооборота. Изучение и анализ процесса написания кода программы для автоматизации.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 09.09.2016
Размер файла 2,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

Введение

1. Обзор проблематики и теоретические основы

1.1 Определение документооборота

1.2 Объект автоматизации и структура документооборота

1.3 Актуальность автоматизации

2. Автоматизация бизнес-процесса обработки документации

2.1 Постановка задачи

2.2 Виды обрабатываемых документов

2.3 Сравнительный анализ программ для распознавания текста

2.4 Разработка автоматизированной модели

2.5 Расчет экономической эффективности проекта

3. Применение разработанной системы

3.1 Описание модулей системы

3.2 Описание классов и методов

3.3 Оценка качества разработанной системы

3.4 Инструкция и рекомендации по работе с системой

Заключение

Список использованной литературы

Приложение

Введение

Областью изучения данной работы являются системы электронного документооборота. Применение этих исследований является значимым на сегодняшний день и очень интересным во многих отношениях.

В настоящее время сложно представить серьезную организацию, в которой не используется система электронного документооборота. В современных условиях ведения бизнеса - это одно из ключевых управленческих решений для регулирования входящих, исходящих и внутренних информационных потоков. Системы электронного документооборота (СЭД) позволяют ускорить ведение бизнес-процессов, а также увеличивают конкурентоспособность организации. [1].

Документооборот является неотъемлемой частью различных организаций, компаний и фирм. В последнее время рынок СЭД показывает высокий уровень развития и увеличение потребности в данном сегменте IT-индустрии как необходимого элемента в управлении документооборотом. Одним из основных потребителей данных систем является государство, вследствие чего рынок СЭД является устойчивым и достаточно стабильным. В теории современные системы документооборота - это системы, с помощью которых можно оптимизировать и автоматизировать основные процессы обработки, хранения, передачи и контроля исполнения документов в организации, что делает аппарат управления предприятием более эффективным. [2].

В нашем случае будет представлено детальное описание существующего документооборота и его оптимизация.

Цель данной работы состоит в том, чтобы во взятой за основу системе электронного документооборота оптимизировать и автоматизировать процесс обработки документации сотрудником фирмы/предприятия. Необходимо максимально снизить время, затрачиваемое на обработку документации, уменьшить функциональную часть работы сотрудника, сведя ее до минимума. Программа должна иметь следующую функциональность: загружать и обрабатывать входящие документы, анализировать полученные данные, опираясь на поиск ключевых слов, загружать их в базу данных, выгружать конечную информацию, полученную в ходе анализа, в файл Excel. Для организации исследования в данной области будут полезны тем, что ускорится бизнес-процесс документооборота и сократятся затраты на зарплату персоналу, т.к. после автоматизации данную работу сможет выполнять один сотрудник вместо трех. А также рассмотренный метод оптимизации будет актуален и применим не только в других департаментах банка, но и в различных фирмах, где имеются системы электронного документооборота.

Структура работы будет выглядеть следующим образом:

В главе 1 будет проведен обзор проблематики и описаны теоретические основы, связанные с документооборотом.

Глава 2 будет включать в себя структуру документооборота, описанного на частном примере, и процесс автоматизации.

В главе 3 будет представлен сам процесс автоматизации и применение разработанной системы.

1. Теоретические основы и постановка задачи

1.1 Определение документооборота

Для начала разберемся, что же означает термин «система электронного документооборота», что включается это понятие и в чем его сущность. Документооборот - это движение различных документов в компании, начиная с момента их поступления в организацию и до конечного исполнения или отправления. Другими словами, СЭД - это система, позволяющая автоматизировать управление электронной документацией, которое включает в себя:

· Создание

· Обработку

· Хранение

· Классификацию

· Контроль исполнения

· Отправку

Это основные процедуры работы с электронными документами.

Также документы могут быть не только в электронном формате, но и в бумажном. Обычно в компаниях присутствуют и те и другие, так как полностью перейти на электронную документацию в современных условиях ведения бизнеса невозможно. При обработке бумажных документов в любой организации имеется жесткая иерархия распределения документов по различным департаментам. Имеются регламенты, в соответствие с которыми и происходит документооборот. Основные пункты рассмотрим на примере банка - это происходит следующим образом:

· изначально вся входящая бумажная документация попадает в департамент, отвечающий за обработку всей документации, как входящей, так и исходящей.

· Далее происходит регистрация входящих документов.

· Сканирование и отправка тех документов, которые по регламенту можно передать в работу других департаментов в электронном виде, а сами документы остаются на хранение в архиве.

· Документы, по которым необходимо передать оригинал, отдаются в определенный департамент строго в соответствии с утвержденным регламентом.

После первичной обработки и регистрации электронные и бумажные документы распределяются по различным департаментам, где далее ведется работа по ним. Электронный документ может быть переслан для дальнейшего исполнения из одного департамента в другой посредством СЭД. Дойдя до конечной точки своего пути в организации, документ должен быть исполнен, т.е. сотрудник принял и обработал документ и больше никому не пересылает. Это необходимый пункт для контроля исполнения.[3]

Оригиналы документов также могут передаваться из одного департамента в другой, но, дойдя до конечного человека, ответственного за исполнение, документ может как остаться в департаменте, так и передаться по почте в другие филиалы компании.

Исходя из этого можно сделать вывод, что самое важное в документообороте любой организации - это время, затрачиваемое на обработку и передачу документации, поэтому для оптимизации процесса документооборота необходимо максимально автоматизировать обработку и передачу документов.

Для качественного анализа и автоматизации документооборота необходимо его разбить на потоки, называемые документопотоки. Обычно документооборот разделяют на три потока:

· Входящая документация

· Исходящая документация

· Внутренняя документация

Первый поток отвечает за документы, входящие в организацию, которые поступают от других сторонних компаний. Второй - за документы, исходящие из организации. И третий, соответственно, - за документы, которые перемещаются внутри компании и не выходят за ее пределы. Чем более детально описан поток, тем его проще проанализировать и в дальнейшем оптимизировать.[4]

1.2 Объект автоматизации и структура документооборота

На примере департамента в банке рассмотрим объект автоматизации. В нашем случае - это бизнес-процесс, который выполняется сотрудником банка, ответственным за документооборот в данном департаменте. Именно автоматизация функциональной части сотрудника и является основным предметом исследования в данной работе. Давайте разберемся по порядку, что под собой подразумевает данный процесс, какой функционал выполняется сотрудником и суть автоматизации.

Изначально оригинал документа (в нашем случае это исполнительный лист, решение суда или постановление, полученные из суда), поступивший в работу банка, обрабатывается на внутренней почте. Этот процесс включает в себя присвоение документу индивидуального регистрационного номера, сканирование документа и направление электронной версии и оригинала этого документа в работу определенного департамента банка (более подробно процесс описан в главе 1.1). Уже в департаменте идет непосредственное распределение этих документов в работу сотрудника, отвечающего за обработку входящей документации. Задача такого сотрудника заключается в следующем:

1) Определение различной, самой необходимой информации по клиенту, на которого пришел исполнительный лист, а именно: фамилия, имя, отчество, дата рождения,13-значный счет ссуды, статус ссуды, номер кредитного договора, сумма общей просроченной задолженности, а также номер исполнительного листа и дата решения суда

2) Распределение ссуд. Сначала происходит определение статуса ссуды. Ссуда может быть активная и неактивная.

Если ссуда неактивная (т.е. закрытая), то оригинал документа уходит на хранение в архив. Если ссуда активная, то далее определяется ее значимость: ссуда, которая пробыла в работе приставов более одного года и все, что смогли взыскать с заемщика, взыскали, то ссуда идет в субпортфель на списание и далее выходит из работы, а ссуда, которая пробыла в работе меньше года или у заемщика имеется имущество (земельный участок, квартира, машина и т.д.), то оригинал документа и электронная версия идут дальше в работу на взыскание просроченной задолженности (смотрим пункт 3)

3) Установление, кто из участников ведет данную ссуду. С одной стороны, ссуда может находиться непосредственно в работе банка, тогда документ будет направлен на ответственного сотрудника в один из офисов банка, расположенных по всей территории России. С другой стороны, ссуда может находиться в работе коллекторского агентства (коллекторское агентство -- агентство, профессионально специализирующееся на внесудебном получении просроченной и проблемной задолженности, опираясь на законы РФ, а также бизнес, целью которого является способствование производству платежей по задолженностям физических и юридических лиц), тогда документ по данному заемщику будет направлен в КА.

4) Формирование реестров по полученным ссудам и подготовка отчетов о проделанной работе с входящей корреспонденцией.

Документы, направленные в территориальные офисы и коллекторские агентства, будут находиться в работе до тех пор, пока не будет взыскана (полностью или частично) просроченная задолженность по кредиту или же пока не закончится срок действия исполнительного листа. Также в течение этого времени может меняться участник, который ведет ссуду, тогда документ будет направлен в головной офис банка и далее ссуда будет перераспределена в работу нового участника.

Суть автоматизации документооборота в данной работе состоит в том, чтобы оптимизировать процесс на уровне обработки документов сотрудником, отвечающим за это (подраздел - структура, пункты - 1,2,3,4). Необходимо свести к минимуму время, затрачиваемое на обработку документов, и максимально снизить функциональную часть работника.

1.3 Актуальность автоматизации

Во-первых, на данный момент в динамично развивающемся мире системы электронного документооборота заняли прочное место на рынке IT-услуг. По актуальным данным прирост рынка СЭД от всего рынка IT cоставил 25%. Конечно, это обусловлено тем, что государственный сектор предприятий переходит на электронное управление документацией, но стоит заметить, что и сторонние организации не отстают в применении данных систем. Рост рынка на мировой арене вырос более чем в два раза, а это указывает на то, что данная область актуальна для новых идей и разработок.[5] Во-вторых, возможно реально снизить функциональную часть сотрудника, отвечающего за обработку документации. Автоматизация приведет к снижению затрачиваемого времени на ведение данного бизнес- процесса, что позволит сотруднику меньше заниматься рутинной обработкой документации и больше уделять внимания реальным банковским задачам. Со стороны предприятия данная автоматизация выгодна тем, что возможно дать дополнительную нагрузку сотрудникам или же сократить часть штата. А это означает, что можно, имея тех же сотрудников, выполнять больше поставленных и актуальных задач или при сокращении штата снизить затраты на выплату дополнительных зарплат персоналу.

В-третьих, данный процесс автоматизации позволит начинающим предпринимателям избавиться от бумажной волокиты и нацелиться на более важные задачи ведения бизнеса. А это означает, что данная работа может повлиять на поддержку малого бизнеса, как в России, так и за рубежом.

2. Автоматизация бизнес-процесса обработки документации

2.1 Постановка задачи

Основная задача автоматизации документооборота в работе состоит в оптимизации бизнес-процесса на уровне обработки документов сотрудником банка. В нашем случае необходимо свести к минимуму время, затрачиваемое на обработку документов, и максимально снизить функциональную часть работника. Давайте рассмотрим, как это можно реализовать.

Для описания дальнейшего процесса автоматизации нам понадобится такое программное обеспечение как «Visual Studio», «My SQL», «ABBY FineReader», «Блокнот». Каждая из этих программ будет иметь немаловажно значение.

В самом начале мы имеем документ в электронном формате (его скан, полученный с внутренней почты банка). Далее нам необходимо перевести изображение документа в текстовый формат. Это делается с помощью программы «ABBY FineReader». Полученный текстовый файл мы сохраняем с расширением .txt, другими словами, в текстовом документе (Блокнот - встроенное программное обеспечение в Windows). Следующий этап автоматизации заключается в том, чтобы написать код на языке программирования, используя программное обеспечение «Visual Studio», и создать базу данных с помощью «My SQL». Основная задача написанного кода - это считывание необходимой информации из нашего текстового документа, а именно: фамилия, имя и отчество заемщика, дата рождения, дата документа, номер входящего документа, номер исполнительного листа, дата решения суда. Вся эта информация будет загружена в созданную нами базу данных. В нашей базе эти данные будут сразу систематизироваться под необходимый реестр и стандарты отчетности. Полученная нами информация с помощью кода - это только часть данных, которые нам нужны. Также необходимо идентифицировать 13-значный счет ссуды, статус ссуды, номер кредитного договора, сумму общей просроченной задолженности, чтобы дальше корректно распределить ссуды по трем направлениям: закрытые ссуды в архив, ссуды с частично взысканной задолженностью или с датой исполнительного документа более одного года на списание, активные ссуды в работу территориальных офисов или коллекторских агентств. Получить эти данные можно посредством выгрузки из внутрибанковской базы данных. Этот процесс будет происходить так: в базе данных, которую мы создали, будет иметься столбец с фамилией, именем, отчеством и столбец с датой рождения заемщика. Эти два столбца будут загружаться в глобальную общую базу и оттуда будет выгружаться списком информация по каждому клиенту, другими словами, во внутрибанковской базе будут осуществляться поиск совпадений по двум столбцам из нашей базы, и вся необходимая информация по совпадениям будет выгружаться обратно в нашу базу. Таким образом, у нас получится реестр, готовый под стандартный отчет, с полной и необходимой информацией по каждому заемщику, на которого пришел документ.

2.2 Виды обрабатываемых документов

В данном разделе рассмотрим те виды документов, которые обрабатываются сотрудником в департаменте по работе с просроченной задолженностью в банке, а также документы, которые получим на выходе работы программы автоматизации.

Имеются три основных вида документов, которые поступают в работу данного департамента: постановления, решения суда и исполнительные листы. Все эти документы поступают в работу из федеральных арбитражных судов, федеральных судов общей юрисдикции и мировых судей субъектов Российской Федерации.[6]

Постановление - это один из видов судебных актов в РФ. Судья может вынести постановление для выяснения дополнительных факторов ведения дела. Другими словами - это такой вид судебного акта, который необходим для выявления особых случаев судебного процесса. Также постановление не является конечным решением судьи и его можно обжаловать.

Рис.1 Определение суда

В данном виде документа содержится различная информация по делу: номер дела, ФИО заемщика, его дата рождения, место жительства, сумма взыскиваемой просроченной задолженности.

Решение суда - это вид судебного документа, в результате которого завершается судебное разбирательство, подводятся итоги, а также в нем содержатся результаты разрешения судебного спора.

Рис.2 Судебное решение

Данный вид документов содержит больший объем информации по судебному делу, чем постановление суда. А именно: номер дела, ФИО заемщика, его дата рождения, номер кредитного договора (важное поле), дата выдачи кредита, дата вынесения решения и дата его вступления в законную силу, суммы взыскиваемой просроченной задолженности и сумма на оплату государственно пошлины.

Исполнительный лист - это вид исполнительного документа, который выдается судом взыскателю на основании вступления судебного постановления или решения в законную силу.

Рис.3 Исполнительный лист

Исполнительный лист содержит такую информацию, как номер дела, наименование и адрес суда, ФИО заемщика, год и место рождения, адрес проживания, сумму взыскиваемой просроченной задолженности и сумму на оплату государственной пошлины, наименование и адрес взыскателя, дату вынесения решения и дату его вступления в законную силу (или указывается на немедленное исполнение).

Обычно исполнительный лист выдается по каждому решению суда, но в некоторых случаях бывает так, что один исполнительный лист выдается на несколько решений.

Исполнительный лист является самым важным объектом исследования в данной дипломной работе, т.к. это ключевой документ при работе с просроченной задолженностью на судебной стадии (legal). Он содержит множество необходимой информации для корректного определения данных по заемщику, что в дальнейшем играет важную роль в распределении и направлении суд сотрудником.

Теперь обратимся к документам, которые мы получим в результате. Так как основной задачей сотрудника банка, ответственного за сопровождение документации, является передача бумажных носителей информации в территориальные офисы банка, то на выходе нам необходимо получить акт приема-передачи документов. Он включает в себя различную информацию по передаваемым документам: номер ссуды, ФИО заемщика, дату выдачи документа, номер документа и так далее, в зависимости от необходимости включения той или иной информации.

Рис.4 Примерная форма акта приема-передачи

Стандартной и регламентированной формы акта приема-передачи не существует, т.к. в разных организациях он может выглядеть по-разному, но общий смысл такого документа во всех компаниях одинаков, и его примерное содержание таково: Дата передачи документов, описание различной информации по документам, подпись отдающей стороны, подпись принимающей стороны.

2.3 Сравнительный анализ программ для распознавания текста

В данной части работы, рассмотрим необходимое программное обеспечение для распознавания и перевода вышеприведенных документов из графического формата в текстовый. Безусловно, лидер программ в распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-первых, оценить рынок доступных ПО для распознавания текста, во-вторых, указать сильные и слабые стороны каждого из них.

ABBYY FineReader 12 - это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. ABBYY FineReader конвертирует файлы из форматов PDF, TIFF, JPEG в форматы PDF, DOC, XLSX, TXT и другие. [7]

Рис.5 Начальное окно программы ABBYY FineReader 12

Далее проведем анализ на выявление слов с ошибками и качество обрабатываемого документа на примере 10 исполнительных листов:

Таблица 1 Данные, полученные при обработке документов программой ABBYY FineReader 12

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

11

100

90,09

2

124

10

114

91,94

3

273

3

270

98,90

4

151

13

138

91,39

5

144

16

128

88,89

6

178

9

169

94,94

7

199

2

197

98,99

8

201

3

198

98,51

9

121

25

96

79,34

10

126

25

101

80,16

Среднее значение

162,8

11,7

151,1

91,32

MIN

111

2

96

79,34

MAX

273

25

270

98,99

Рис.6 Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)

Как видим из показанной выше диаграммы, программа ABBYY FineReader 12 очень качественно обрабатывает документы, переводя их из графического формата в текстовый формат. В среднем, количество распознанных слов составляет 91,3 %. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать.

Плюсы: высокое качество распознавания текстов, широкий выбор входных и выходных форматов документов, простой и понятный пользовательский интерфейс

Минусы: данное ПО платное, не имеется открытого доступа к исходным кодам программы (используя их, можно было бы запускать программу с помощью написанного кода на С#)

FREE ONLINE OCR SERVICE - это бесплатный он-лайн сервис для распознавания текста из различных форматов. Его легко и просто использовать любому пользователю, т.к. нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания (в том числе и русский).

Форматы выходных файлов в FREE ONLINE OCR SERVICE:

Рис. 7 Поддерживаемые форматы в FREE ONLINE OCR SERVICE

Имеется возможность перевести текст в один из трех форматов: Microsoft Word, Microsoft Excel и Text Plain. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат .txt, то сравним качество обработанного документа и вероятность некорректного перевода текста.

Таблица 2. Данные, полученные при обработке документов программой FREE ONLINE OCR SERVICE

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

14

97

87,39

2

124

61

63

50,81

3

273

120

153

56,04

4

151

20

131

86,75

5

144

22

122

84,72

6

178

156

22

12,36

7

199

5

194

97,49

8

201

12

189

94,03

9

121

73

48

39,67

10

126

43

83

65,87

Среднее значение

162,8

52,6

110,2

67,51

MIN

111

5

22

12,36

MAX

273

156

194

97,49

Рис.8 Соотношение слов без ошибок к общему количеству слов (обработано FREE ONLINE OCR SERVICE)

Исходя из полученных результатов, можно сделать вывод, что данный сервис имеет высокий уровень распознавания текста. В среднем, количество распознанных слов составляет 67,5 %. Данный сервис является хорошим способом быстро распознать графический файл и перевести его в текстовый формат, но для оптимизации реального бизнес-процесса данный продукт не подходит из-за узкого спектра функциональных возможностей.

Плюсы: простота в использовании, быстрый доступ с любого устройства с выходом в интернет, множество языков для распознавания.

Минусы: в отличие от загруженных программ для оптического распознавания текста, данный продукт не имеет таких широких функциональных возможностей.

CuneiForm - это программа, используемая для распознавания текста документов и дальнейшего перевода в редактируемый вид. Данный продукт бесплатный и доступный любому пользователю. В результате работы программы можно получить файл в нужном формате с отредактированным текстом.

Форматы выходных файлов в CuneiForm:

Рис.9 Поддерживаемые форматы в CuneiForm

Исходя из увиденного выше, делаем вывод, что данное ПО не поддерживает одни из основных форматов файлов, как Microsoft Word (расширение .doc) и Acrobat Reader DC (расширение .pdf). Следовательно, данный продукт будет проигрывать по широте использования тому же ABBYY FineReader 12. Но в этой дипломной работе как раз необходим текст исполнительного листа в формате .txt, поэтому сравним качество обработанного документа и вероятность некорректного перевода текста.

Таблица 3. Данные, полученные при обработке документов программой OCR CuneiForm

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

18

93

83,78

2

124

120

4

3,23

3

273

273

0

0,00

4

151

147

4

2,65

5

144

141

3

2,08

6

178

175

3

1,69

7

199

166

33

16,58

8

201

175

26

12,94

9

121

119

2

1,65

10

126

122

4

3,17

Среднее значение

162,8

145,6

17,2

12,78

MIN

111

18

0

0,00

MAX

273

273

93

83,78

OCR CuneiForm является низкокачественным программным продуктов для распознавания оптического текста. Основную часть слов переводит в непонятный набор символов или вообще не распознает. В среднем, количество распознанных слов составляет 12,8 %. Это очень низкое качество.

Плюсы: данная программа бесплатная, русифицированная, имеется доступ к исходным кодам программы (используя их, можно запускать программу для анализа графического документа с помощью написанного кода на С#)

Минусы: низкое качество распознавания

Выводы после проведенного анализа:

Анализ проводился без корректировки активных полей для распознавания, т.е. программы переводили текст только в тех местах графического файла, где они его определили. Суть распознавания без корректировки в том, что мы не тратим время на выбор того или иного поля, соответственно, не затрачиваем время на обработку. В таком виде анализа возможны потери качества, но так как основная цель дипломной работы - оптимизировать бизнес-процесс, значит, будем полагаться на корректную обработку документа программой для оптического распознавания текста.

Ниже представлена диаграмма, сравнивающая количество обработанных слов различными программами:

Рис.10 Соотношение слов без ошибок к общему количеству слов для разных программ по распознаванию текста

Рис.11 Качество обработки документов (количество обработанных слов, выраженное в процентах, %)

Исходя из результатов анализа, можно сделать вывод, что программа ABBYY FineReader является наилучшим продуктом для оптического распознавания графического файла. Данная программа имеет широкий спектр возможностей и множество плюсов. Сервис FREE ONLINE OCR SERVICE также неплох для быстрого распознавания текста на картинке, но не подходит для автоматизации бизнес-процесса из-за минимального функционала. Программное обеспечение OCR CuneiForm оказалось низкокачественным продуктом и не будет использовано в качестве программы, используемой в данной дипломной работе.

Также были проанализированы программы для распознавания текстов, такие как TopOCRDemo и Capture Text, но ни одна из них в нашем случае не показала достойных результатов в качественном переводе текста из графического формата в текстовый. В данной дипломной работе будет использована программа ABBYY FineReader 12.

2.4 Разработка автоматизированной модели

В данной дипломной работе для автоматизации процесса документооборота в банке использовалось такое программное обеспечение, как Microsoft Visual Studio 2015. Этот программный продукт имеет широкий спектр возможностей, применяемый как к обычным пользовательским задачам, так и к профессиональным.

Microsoft Visual Studio 2015 - это интегрированная среда разработки с огромными возможностями для создания превосходных приложений для Windows, Android и iOS, а также современных веб-приложений и облачных служб. В данном программном пакете имеются инструменты и службы для проектов различных размеров и любого уровня сложности. Доступна разработка и написание кодов на таких языках программирования как C#, Visual Basic, F#, C++, Python, Node.js и HTML/JavaScript. Также имеются расширенные возможности отладки, профилирования и тестирования как в автоматическом, так и в ручном режиме.[8] На рис. 12 представлен начальный проект, созданный VS2015 через контекстное меню, с выбранным языком C#.

Рис.12 Начальное окно программы Visual Studio 2015

В данной работе с помощью этого программного обеспечения будет написан код на языке программирования C#. С его помощью можно будет получить необходимую информацию из текстового файла, проанализировать ее, загрузить в БД и выгрузить в Excel для подготовки акта приема-передачи.

Так как конечным пользователем данной программы будет человек, не имеющий технического образования, то было решено использовать графический интерфейс, а не командную строку. Для этого будет использован интерфейс Windows Forms, доступный на платформе VS 2015. Данный интерфейс предоставляет широкие возможности по созданию и настройке графических окон, поддерживая при этом отображение русского языка. По сути - это всего лишь внешняя оболочка, которая ждет действия от пользователя. Самые простые элементы - это кнопки и формы для вывода информации, дающие безграничные возможности. Связующие и более сложные элементы скрыты в окне и не отображаются для пользователя. "Windows Forms -- интерфейс программирования приложений (API), отвечающий за графический интерфейс пользователя и являющийся частью Microsoft .NET Framework. Данный интерфейс упрощает доступ к элементам интерфейса Microsoft Windows за счет создания обёртки для существующего Win32 API в управляемом коде".

На рис. 13 видно, как выглядит простая форма, созданная в несколько кликов мышки.

Рис.13 Созданная форма с помощью Windows Forms в VS2015.

Обращаясь к интеграции с СУБД, стоит отметить то решение, которое было выбрано для реализации данного проекта - это локальная или встраиваемая база данных. Архитектура клиент-сервер заняла бы слишком большое количество ресурсов для исполнения. Локальная же база выигрывает от снижения общей сложности и уменьшения затрат на администрирование. Также локальная база данных направлена на решение узконаправленных задач, чем и является данная система автоматизации.

Изначально было задумано двухуровневая архитектура: первый уровень - пользовательское ПО с локальной базой данных, в которую будет заноситься основная информация по заемщику, а второй уровень - банковское ПО, с помощью которого можно выгружать дополнительную информацию из глобальной банковской базы данных в локальную. Но реализовать столь интересную задумку не получится, так как прямого доступа к глобальной базе данных банка нет, а получить доступ не предоставляется возможным, так как нет специализированного доступа. К тому же такая информация является банковской тайной, и ее распространение влечет за собой уголовную ответственность. Также необходимо отметить, что данные в локальной базе не могут быть защищены, т.к. необходим постоянный доступ простого сотрудника к данной БД, чтобы исправлять неисправности и вносить корректировки по полученной информации. Если же данные будут защищены, то простой сотрудник не сможет вносить какие-либо изменения в БД без вмешательства человека из техподдержки или администратора.

Написанная программа должна иметь следующую функциональность:

1) Обеспечение загрузки и анализа трех видов документов:

· Исполнительный лист

· Решение суда

· Постановление

2) Возможность менять и корректировать полученную и проанализированную информацию:

· ФИО должника

· Дата рождения должника

· Номер ИЛ

· Дата выдачи ИЛ

3) Предлагать возможность сформировать акт приема-передачи, на основе полученных данных из таблицы:

· Последние добавленные

· За все время работы (для отчетности)

Для разработки базы данных, необходимо заранее указать значение полей, в которые будут заноситься полученная информация:

· Id (Счётчик, Первичный ключ, уникальное);

· ФИО (Текстовый, не более 50 символов, необязательно, неуникально)

· Дата рождения (Текстовый, не более 20 символов, необязательно, неуникально)

· Номер ИЛ (Текстовый, не более 15 символов, необязательно, неуникально)

· Дата выдачи ИЛ (Текстовый, не более 20 символов, необязательно, неуникально)

Так как полученная информация из таблицы в дальнейшем будет использоваться только для составления актов приема-передачи, то было принято решение оставить все поля базы данных в переведенном типе string.

После запуска программа с именем Diploma открывает окно Windows Form с 5 ключевыми элементами:

1. Кнопка загрузки файлов, которая позволяет загрузить сразу несколько файлов - переведенные сканы документов из изображения в текстовый документ, с расширением txt

2. Кнопка анализа полученных данных, реализующая основную задачу автоматизации - поиск ключевых слов и занесение их в локальную базу данных

3. Кнопка выгрузки данных из базы данных и формирование акта приема-передачи по заданным параметрам, в нашем случае - акт по форме отдела по работе с просроченной задолженностью.

4. Таблица отображения данных, находящихся в локальной базе данных, и возможность их корректировки. Возможность исправления ошибок и добавления информации здесь реализована, потому что программы по распознаванию текста неидеальны и не всегда информация выводится верная.

5. Текстовое окно, служащее для отображения данных, загруженных из текстовых файлов, служит вспомогательным элементом для понимания сути происходящего в тексте.

2.5 Расчет экономической эффективности проекта

Прежде всего, для расчета эффективности данного проекта необходимо понять, как данная система будет экономить деньги владельцу и сможет ли программа заменить труд 2-х, 3-х сотрудников, ответственных за данный процесс.

В ходе работы было проанализировано, сколько в среднем проходит документов через департамент по работе с просроченной задолженностью в неделю, в месяц и в год. Данная информация была получена в ходе прохождения производственной преддипломной практики. На рисунке 14 можем видеть часть полей отчетного файла, который содержит информацию по полученным и переданным документам. Большей информации предоставить нельзя, так как это нарушит банковскую тайну.

Рисунок.14 Часть полей отчетного документа.

В первой ячейке содержится 13-значный счет ссуды заемщика, которая состоит из трех частей: первые четыре цифры - номер территориального офиса, шесть следующих - персональный номер клиента, последние три - номер ссуды. Во второй ячейке - полное имя должника. Далее идет ячейка, содержащая информацию об участнике, то есть кто ведет данную ссуду. Это может быть как коллекторское агентство, так и ответственный сотрудник банка в одном из территориальных офисов. Последние две ячейки показывают, какие еще судебные документы приходят в банк.

Чтобы понять, какое количество документов проходит в разные промежутки времени, будем обращаться в отчетный файл. Количество входящих документов сильно варьируется, и это зависит от дня недели, конца квартала и общей загруженности отдела.

Например, на рисунке 15 мы можем видеть, что за неделю было обработано более 100 документов, а именно - 143.

Рис. 15 Количество документов за неделю работы.

А следующий рисунок показывает, что за месяц работы было обработано более полутысячи документов двумя сотрудниками, а это значит, что в среднем каждый обработал по 325 документов.

Рисунок 16. Количество документов за месяц работы.

Эти данные необходимы нам для визуального понимания количества полученных и обработанных документов отделом по работе с просроченной задолженностью. Также эти данные будут играть важную роль при дальнейшем анализе. В итоге были найдены пути автоматизации, проведены расчеты и конкретные аргументы в пользу реализации данного процесса:

1) За месяц работы сотрудники отдела должны получить, обработать и отправить более полутысячи документов, находящихся на бумажных носителях. В год данная цифра достигает более 5000 документов.

2) От скорости обработки и отправки документов зависит скорость предъявления документов в суд на местах, а это влияет на скорость возвращения денежных средств должников в банк.

3) От качества обработки и соблюдения процесса зависят расходы на канцелярию и почтовые отправления

4) Чем больше людей вовлечены в процесс обработки, тем выше качество обработки, но также больше и затраты на человеческие ресурсы. Чаще всего данными процессами заняты 1-5 человек.

При проведении анализа затрат времени на обработку документации тремя сотрудниками до и после автоматизации был построен сравнительный график, представленный на рисунке 17

Рис. 17 График затрат человеко-часов ежедневно.

Для выражения эффективности в денежном эквиваленте обратимся за информацией на сайты gderabotaem.ru и ru.indeed.com, откуда узнаем, что средняя зарплата в Росбанке составляет 26 тысяч рублей.[9]

Рис. 18 Статистика средней зарплаты в Росбанке.

В апреле было 168 рабочих часов. А это означает, что 1 час работы одного сотрудника равен 154, 8 рублям. В отделе, где проходилась практика, работало 3 сотрудника, которые отвечали за обработку входящей документации. Поэтому при внедрении данной автоматизации Росбанк смог бы сэкономить около 465 рублей за 1 час работы. Если посмотреть на эту сумму в реальности, то, согласно представленному графику, сохраняется более 1 часа в день. Подсчитав сумму часов за месяц для одного человека и переведя ее в рубли, а затем умножив на троих сотрудников, получим, что в среднем отдел сохранял бы около 30 тысяч в месяц, что является зарплатой еще одного специалиста. В год Росбанк сохранил бы около 350 тысяч для своего департамента. Считаю, что данная цифра является серьезной для работы даже одного департамента, поэтому аргументацию по необходимости внедрения автоматизации в процесс работы считаю обоснованной.

3. Применение разработанной системы

3.1 Описание модулей системы

Первый модуль - это перевод документов из формата pdf в формат txt. Как было представлено ранее, самым качественным ПО для оптического распознавания текста оказался ABBY FIneReader 12. Данная программа наиболее корректно переводит документы из изображения в текстовый формат. Из-за невозможности получить доступ к исходным кодам данной программы подразумевается, что сотрудник будет выполнять данный модуль вручную. На рисунке 19 представлен перевод сканированного файла из формата pdf в формат txt.

Рис. 19 Пример обрабатываемого текста в ABBYY FineReader 12.

Второй модуль заключается в том, чтобы внести текстовые фалы в окно программы. Данный модуль реализован на языке C# на платформе Microsoft Visual Studio 2015. Метод взаимодействия пользователя и программы - Windows Forms. Данный модуль работает следующим образом: при запуске программы в окне Form имеется кнопка «загрузка файлов». По нажатию на нее можно выбрать те самые переведенные файлы в формате txt. На рисунке 20 показано начальное окно с активной кнопкой «загрузка из файла».

Рис. 20 Начальное окно программы с активной кнопкой.

Третий модуль - это анализ загруженных файлов из модуля 2 и загрузка полученных в ходе анализа данных в локальную базу данных.

Данный модуль был реализован с помощью Visual Studio 2015. Для работы данного модуля имеется кнопка «Анализ и занесение в таблицу», которая становится активной только после нажатия на кнопку «загрузка из файла». Последовательность активации кнопок сделана для того, чтобы соблюсти правильный ход выполнения программы. Обработка и анализ по нажатию кнопки данного модуля происходит следующим образом: полученный массив входящих файлов перебирается и разбивается на массив слов из каждого документа. Далее, с помощью конструкции if - else ищутся по заранее заданным параметрам ключевые слова в массиве слов и заносятся в строку таблицы, которая по окончании цикла добавляется в строку базы данных. И так происходит для каждого файла. На рисунке можем видеть пример обработанных и занесенных в таблицу данных.

Рис. 21 Проанализированные и занесенные данные.

Сложность заключается в том, что программа для распознавания текста не всегда правильно распознает слова и, соответственно, часть информации может не загрузиться в таблицу. Именно для этого в данной системе была реализована локальная база данных без ограничения на внесение изменений информации.

Четвертый модуль данной программы - это создание акта приема-передачи. Данный модуль также реализован на языке C#. В данном модуле имеется кнопка «Экспорт в Excel», которая становится активной, только после нажатия на кнопку «Анализ и занесение в таблицу». При нажатии на кнопку полученная из БД информация будет выгружена в файл Excel, сделанный в формате акта приема-передачи документов. На рисунке 22 показано, как это выглядит

Рис. 22 Выгрузка данных из БД в Excel для акта приема-передачи

В дальнейшем данный акт можно направлять по почте в территориальные офисы банка или в коллекторские агентства с уведомлением о том, что документы направлены в работу.

3.2 Описание классов и методов

В данной работе реализован один публичный класс Form1, в котором и происходит основной функционал программы, посредством выполнения методов по кнопкам.

Первый метод - это метод, не возвращающий значений, действие которого происходит при загрузке программы. В первой строке задается неактивность кнопки «Анализ и занесение в таблицу», а во второй - неактивность второй кнопки «Выгрузка в Exсel», что сделано для правильной и последовательной работы программы. На рисунке 23 представлен данный метод.

Рис. 23 Код Form1_Load.

Далее реализован метод Upload, с помощью которого происходит загрузка файла в программу. Для удобства было сделано, чтобы видимыми были только файлы txt, а также изначально открывается папка проекта, где хранятся нужные файлы. Считывание файлов, показанное на рис. 24, происходит за счет потока StreamReader, доступного за счет библиотеки System.IO. Считанный текстовый файл помещается в безразмерный массив _Test типа List. Также в данном методе происходит активация кнопки анализа данных на форме, если были загружены какие-либо данные.

Рис. 24 Метод Upload, загружающий выбранные файлы

В следующем методе CreateTable происходит анализ и занесение данных в LocalDB. В данном методе основное внимание стоит уделить разбиению строки файлов на слова, так как от этого будет зависеть качество дальнейшего анализа. На рисунке 25 не показано, что метод состоит из огромного цикла, но показано основное, что создается новая запись или строка в базе данных, а также происходит разбиение за счет встроенного метода Split.[10] При разделении на слова, происходит удаление всех ненужных знаков, оставляя только слова и цифры, что и будет являться основой для поиска ключевых слов.

Рис. 25 Разделение текста на слова для дальнейшего анализа.

В данном методе также происходит анализ или, другими словами, поиск ключевых слов и занесение их в таблицу базы данных, реализованный через if с условиями. На рисунке 26 представлен анализ на поиск ФИО должника. Происходит это следующим образом: нам заранее известно, что в тексте после слова «должник» идет ФИО должника, поэтому последующие три слова склеиваются в одну ячейку и добавляются к формируемой строке. Также стоит упомянуть об отчестве должников, таких как Оглы и Кызы. В работе банка такие должники часто встречаются, поэтому при реализации данного метода данный важный пункт не был упущен.

Рис. 26 Анализ и поиск ключевых полей.

Поиск других ключевых полей происходит по тому же принципу, поэтому при необходимости код можно найти в Приложении после диплома.

В конце метода происходит активация третьей кнопки - «Выгрузка в Excel».

Следующий метод включает в себя выгрузку в Excel и формирование актов приема-передачи для дальнейшей их передачи вместе с документами в территориальные офисы банка.

3.3 Оценка качества разработанной системы

На основе описания методов можно с уверенностью сказать, что данная система может успешно справляться с автоматизацией анализа документации. При этом используя данную программу, можно ускорить бизнес-процесс документооборота в разы с минимальным присутствием человека. Разбиение системы по модулям дает возможность в будущем усовершенствовать технологию поиска ключевых слов, методы загрузки-выгрузки документов, что позволит применять данное решение в других задачах банка. Простота использования оконного режима и выгрузка файлов во всем известный Excel позволяют справляться с данным функционалом совсем неопытным сотрудникам и новичкам. Через описание класса и методов можно понять, что код программы написан понятно и доступно, а метод поиска ключевых слов реализован через простую и всем знакомую конструкцию if-else. По результатам тестирования было выявлено высокое качество работы программы, также описаны ошибки и неточности, что позволяет развивать данный проект в будущем и вывести его на более высокий уровень качества.

3.4 Инструкция и рекомендации по работе с системой

В данной инструкции будет показан процесс работы с разработанной автоматизированной системой по обработке документации и будут приведены пункты, которые следует выполнять для корректной работы программы. Данное ПО рассчитано на человека, знакомого с операционной системой Windows и знающего продукт Microsoft Office Excel.

В самом начале сотрудник банка получает пакет с оригиналами исполнительных документов, таких как исполнительный лист, решение суда или постановление. Первым делом необходимо подготовить сканер к работе, настроив на нем максимальное качество сканирования и вид исходного документа в формате pdf. Также важно упомянуть, что нельзя сканировать все документы в один большой электронный файл, так как это приведет к некорректной работе программы, поэтому каждый документ сканируем отдельно, то есть, если имеем 10 документов, то исходных файлов будет тоже 10. В работе системы данная операция занимает наибольшее количество времени, но стоит сказать, что часть документов, пришедших в департамент банка, уже заранее будут отсканированы на внутренней почте банка, а сканы документов будут направлены в работу департамента с помощью электронного документооборота, и поэтому останется только сохранить файлы документов в отдельную папку.

Далее необходимо перевести файлы из формата pdf в формат txt. Это делается с помощью программы ABBY FineReader 12. В открытом окне программы нажимаем кнопку «открыть» и выбираем нужный файл, а затем нажимаем копку «распознать» и видим результат работы программы в отдельном окне. Далее сохраняем распознанный текст в формате txt в нужную нам папку. На этом процесс распознавания завершается.

Следующим шагом является запуск разработанной программы. В открывшемся диалоговом окне выбираем кнопку «Загрузка из файла» и ищем нужные нами документы в формате txt. Стоит отметить, что никаких других форматов документов не будет видно - это реализовано для упрощения нахождения и выбора нужных файлов. Как только выбор будет сделан, станет активной кнопка анализа.

При нажатии на кнопку «Анализ и занесение в таблицу» начнет работать программа, по завершении которой мы сможем увидеть необходимые данные, которые были найдены и занесены в базу данных, в таблице. Так как качество переведенных в формат txt фалов не всегда идеально, то некоторые поля таблицы останутся незаполненными, поэтому для ручного анализа необходимо воспользоваться текстовым представлением, расположенным справа внизу. По завершении процесса обработки информации и вывода ее на экран станет активной следующая кнопка - кнопка выгрузки.

Завершающим этапом работы программы является выгрузка данных в файл приема - передачи, которая осуществляется при нажатии на кнопку «Экспорт в Excel». При нажатии можно увидеть, что те данные, которые были в таблице, теперь перенесены в файл, который, в свою очередь, уже сформирован программно под акт приема - передачи. Далее сохраняем этот файл, и на этом основная работа системы заканчивается.

Заключение

В современном динамично развивающемся мире рынок электронного документооборота не только занял прочную позицию, но и растет с каждым годом, потому что имеется спрос. Большинство компаний переходят на такие автоматизированные системы, которые помогают облегчить работу предприятия в целом. Но что делать организациям, в которых невозможно отказаться от бумажных носителей информации и перейти на электронные? Каким образом можно оптимизировать и автоматизировать процессы, связанные с обработкой документации?

В данной работе приводится решение в виде программы, с помощью которой можно автоматизировать процесс документооборота, снизить время, затрачиваемое на обработку и анализ документации, а также максимально снизить функциональную часть сотрудника.

В самом начале был проведен анализ самого объекта автоматизации - обработка и анализ документации сотрудником банка, его суть и основные задачи, которые включают в себя: поиск необходимой информации в документе, занесение данной информации в таблицы и базы данных, подготовка документов к дальнейшей передаче в другие департаменты или территориальные офисы. Этот процесс однотипный и трудоемкий, поэтому одной из причин актуальности данной работы является сокращение времени на обработку документации и поиск ключевых слов, что также снижает денежные затраты на данный процесс.

Далее были определены типы обрабатываемых документов, которые обрабатываются в банке в департаменте по работе с просроченной задолженностью. Их бывает три основных вида: исполнительные листы, решения суда и постановления. Все документы содержат ключевые поля такие, как ФИО заемщика, его дата рождения, номер дела и документа. А это и есть самая необходимая информация, с помощью которой можно узнать другие дополнительные данные по клиенту. Также было определено, что документы состоят не из одной страницы, что заметно усложняет анализ человеком, но все документы оказались однотипными и имели одну и ту же структуру, благодаря чему разработанной программе проще осуществлять поиск ключевых слов.

Основная задача данной работы - это написание кода программы для автоматизации. И это было реализовано с помощью программного обеспечения Visual Studio 2015 и языка программирования C#. Локальная же база данных упростила систему и ее управляемость в целом. Также очень важно было выбрать качественную программу для оптического распознавания текста. Поэтому в результате проведенного анализа было выявлено, что программа ABBY FineReader 12 справилась с этим успешнее остальных. Качество перевода составило 91,3 %.

После по построенной модели была определена экономическая эффективность данного проекта. Было вычислено, сколько документов в среднем обрабатывается в месяц сколькими сотрудниками. Далее было представлено, как с этой задачей может справляться автоматизированная система. И, исходя из полученных данных, было установлено, что департамент в банке может экономить в год в среднем 350 тысяч рублей, а это немаленькая сумма, которую можно вложить в нововведения.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.