Автоматическое распознавание текстов в FineReader
Описание поэтапного преобразования бумажного документа в электронный программой FineReader. Сканирование документа и процесс распознавания. Редактирование, проверка и сохранение текста. Возможности прямой передачи полученного текста из FineReader в Word.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | разработка урока |
Язык | русский |
Дата добавления | 20.08.2010 |
Размер файла | 1,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Автоматическое распознавание текстов. Программа FineReader
После сканирования документа получается графическое изображение исходного документа. Такое графическое изображение представляет собой набор разноцветных точек и редактированию в программах, предназначенных для обработки текстовых документов не подлежит. Программа FineReader решает проблему распознавания текста в составе точечного графического изображения.
Пуск - Программы - FineReader.
Окно программы содержит строку меню, ряд панелей инструментов и рабочую область.
Рисунок 1 - Порядок распознавания текстовых документов
Преобразование бумажного документа в электронный происходит поэтапно или автоматически. Для автоматической работы используется инструмент Scan&Read.
Поэтапное распознавание:
- Первый этап работы - сканирование.
Если документ был уже отсканирован ранее, его открывают. Если изображение находится на бумажном носителе, то на первом этапе выбирают действие сканировать.
Программа FineReader использует для сканирования устройство, заданное по умолчанию. По завершении процесса сканирования полученное графическое изображение автоматически выгружается в рабочую область программы FineReader.
Рисунок 2 - Программа FineReader
Задание: Выполните первый этап - сканирование документа.
- Второй этап - распознавание текста.
Прежде чем включать текст в документ, он разбивается на блоки, содержащее цельные фрагменты. Эту операцию программа может выполнить автоматически, хотя разбиение не всегда проходит удачно.
Границы и типы блоков можно устанавливать вручную. Эту возможность мы рассмотрим чуть позже.
Процесс распознавания отображается в специальном информационном окне:
- Полученный текст помещается в окно «Текст».
Рисунок 3 - Тестовое окно FineReader
Задание: Выполните второй этап - автоматическое распознавание отсканированного документа.
- Третий этап - проверка.
На данном этапе программа выполняет поиск ошибок распознавания. FineReader выделяет цветом те символы, которые она сама рассматривает как неоднозначно опознанные.
С помощью диалогового окна Проверка можно отредактировать нераспознанные символы.
Рисунок 4 -Процесс распознавания
Если вариант интерпретации программы верный нажимаем кнопку Пропустить.
В случае обнаружения символов неверно распознанных программой ошибки исправляют вручную и фиксируют исправления нажатием кнопки Подтвердить.
Задание: Выполните третий этап - проверку распознанного текста.
- Четвёртый этап - сохранение текста.
Программа FineReader предусматривает возможность прямой передачи полученного текста в Word:
Сохранение текстового документа выполняют в программе Word.
Задание: Сохраните документ в программе Word.
Дополнительные сведения. Сегментация текста на этапе распознавания.
Задание: Выполните первый этап - сканирование документа.
При автоматической сегментации программа разбивает отсканированный документ на блоки различных типов: текстовые, графические и т. д.
Если исходный текст содержит рисунки, подрисуночные подписи, таблицы, примечания и другие элементы, автоматическое распознавание текста может пройти неудачно.
В таких случаях границы блоков указывают вручную. Для этого используют кнопки специальной панели инструментов Изображение.
Рисунок 5 - Настройка изображения
Задание: Задайте подходящий масштаб для работы. Измените границы области изображение так, чтобы отсканированный документ просматривался во всю ширину.
Кнопки панели инструментов Изображение соответствуют различным типам блоков.
Блоки выделяются прямоугольными рамками различных цветов. Чтобы выделить блок необходимо:
1. Выбрать соответствующую кнопку панели инструментов;
2. Протягиванием определить границы блока.
Анализ макета страницы - выполняет автоматическое разбиение на блоки.
Выделить зону распознавания - позволяет выбрать щелчком мыши тот или иной блок, если автоматическое разбиение на блоки уже выполнено, и определить зону для автоматического разбиения методом протягивания, если оно ещё не выполнено.
Выделить блок Текст. Удаление блока. Выделить блок Таблица. Выделить блок Картинка. Ластик - удаляет фрагмент отсканированного документа. Обрезка - позволяет вырезать любой фрагмент документа.
Подобные документы
Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Операционная система Windows, офисные приложения, такие как Microsoft Word, Microsoft Excel, ABBY FineReader. Глобальные компьютерные сети.
реферат [52,3 K], добавлен 16.11.2003Использование мастеров Word. Сохранение, закрытие, создание, редактирование документа. Ввод, добавление нового, удаление, выделение, копирование, выравнивание и перемещение текста. Проверка, печать документа. Дополнительные возможности. Создание таблицы.
контрольная работа [137,9 K], добавлен 01.06.2008Ход и порядок работы с пакетом ABBYY FineReader 9.0 Professional Edition. Сохранение во внешние редакторы и форматы. Первая система с открытым ключом - система Диффи-Хеллмана. Одностороння функция с "лазейкой" и шифр RSA. Элементы теории чисел.
курсовая работа [1,9 M], добавлен 23.03.2012Функции текстового редактора как программы для работы с текстом. Использование редактора MS Word в научной деятельности исследователя-ономаста. Технология распознавания текста и организация работы с программой FineReader. Системы распознавания речи.
реферат [979,3 K], добавлен 16.10.2013Системы счисления: понятие и содержание, классификация и типы, отличительные свойства и принципы. Перевод чисел из одной системы счисления в другую, виды программного обеспечения. Возможности программы сканирования и распознавания текста Fine Reader.
контрольная работа [37,2 K], добавлен 15.12.2013Основные функции текстового процессора Word. Создание документа Word. Использование шаблонов документов. Удаление, копирование и перемещение текста. Сохранение, закрытие и открытие документа. Изменение шрифтов, выравнивание текста и использование стилей.
курсовая работа [71,6 K], добавлен 17.08.2011Условия применения и технические требования для работы программно-аппаратной платформы. Система распознавания лиц VOCORD Face Control. Система распознавания текста ABBYY FineReader. Алгоритмы и методы, применяемые в программе. Алгоритм хеширования MD5.
дипломная работа [1,8 M], добавлен 19.01.2017Создание, сохранение документа MS Word, форматирование его по заданным требованиям, выполнение основных действий с файлами. Редактирование текста. Работа с объектами в MS Word: с формулами, рисунками, таблицами. Работа с несколькими открытыми документами.
лабораторная работа [25,6 K], добавлен 16.11.2008Работа в окне документа. Ввод текста. Вставка и удаление текста. Отмена результатов выполненных действий. Перемещение и копирование текста методом "перетащить-оставить". Форматирование текста. Сохранение документа. Шаг вперед: смена регистра.
лабораторная работа [220,9 K], добавлен 10.03.2007