Распознавание индивидуальных характеристик написания гласных букв, ъ, ь, ё

Программы для проведения компьютерного анализа рукописного материала, исполненного испытуемым, с целью обнаружения фрагментов письменной речи. Распознавание рукописного текста и преобразование его в цифровой. Определение характера человека по почерку.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 13.01.2012
Размер файла 2,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

«Распознавание индивидуальных характеристик написания гласных букв, Ъ, Ь, Ё»

1. Обзор аналогов

Приложение «Каллиграф» предназначено для проведения компьютерного анализа рукописного материала, исполненного испытуемым, с целью обнаружения фрагментов письменной речи (в дальнейшем по тексту - письма), отвечающих повышенному эмоциональному напряжению пишущего.

Программа классификации фрагментов письма вместе с методикой интерпретации эмоционального напряжения человека по почерку (во время начертания им рукописного текста по заданной схеме изложения) и последующей графической обработке образа почерка представляет собой «детектор лжи по письму».

Приложение позволяет осуществить подготовку материалов тестирования, сбор и обработку письменной (исполненной рукой автора) речи. Принцип обработки основан на автоматическом анализе графических образов почерка, полученных воспроизведением отсканированных листов рукописи. Полученные с помощью сканера материалы вводятся в компьютер в виде графических файлов, которые затем подлежат сегментации элементов письма (детекции строк, слов, предлогов) и измерению совокупности графических признаков, описывающих психоэмоциональное напряжение пишущего.

Анализу могут подлежать как рукописи, составленные в произвольном изложении материала, например, объяснительные или информационные письма, так и резюме, заполненные пишущим по заданному шаблону как последовательность абзацев - фрагментов изложения по пунктам тестируемой тематики или под диктовку.

Анализ рукописи (резюме) позволяет установить степень отклонений почерка от каллиграфического образца (отсюда происходит название приложения - «Каллиграф»), поскольку каждое относительное отклонение позволяет выявить специфические признаки эмоционального напряжения при начертании букв и слов пишущим.

Выходные результаты: В качестве выходных данных анализа письма представляется формализованное заключение. Заключение содержит описание особенностей личности автора письма и результаты классификации всех содержащихся в нем тематических абзацев.

Цифровая ручка от Logitech

Распознает рукописный текст и преобразовывать его в цифровой. Новая модель отличается улучшенным распознаванием рукописного текста.

Кроме этого, была добавлена команда для быстрого преобразования заметок в документ Microsoft Word. Программное обеспечение, которое поставляется вместе с устройством, является обучаемым, то есть, чем больше вы работаете с цифровой ручкой, тем меньше ошибок она допускает при преобразовании текста. Есть также возможность составления собственного словаря и быстрой отсылки заметок по почте.

Как и прежде, для использования цифровой ручки необходима специальная бумага, которая идет в комплекте с устройством. Она тоже была улучшена, и теперь пользователь может использовать для заметок всю ее поверхность.

«ABBYY FineReader Рукопись»

Система «ABBYY FineReader Рукопись» предназначена для offline-распознавания рукопечатных и печатных форм различного типа, включая даже те формы, которые изначально не были предназначены для машинной обработки.

Система обладает возможностью распознавания печатных текстов на 50 языках и рукопечатных текстов на шести языках. Благодаря различным методам удаления изображения формы помимо традиционных цветных и растровых форм «FineReader Рукопись» может распознавать информацию и с черно-белых форм с различными типами разметки полей.

Программа позволяет осуществлять ввод форм различной степени сложности, включая многостраничные формы. Масштабируемость системы делает ее пригодной для ввода практически любых объемов информации - от простейших систем для ввода сотен документов в день и до комплексов из десятков компьютеров для ввода сотен тысяч документов ежедневно.

Повышенная точность объясняется автоматическим контролем результатов распознавания на основе проверок по словарям и базам данных. Программа автоматически проверяет корректность результатов распознавания по базам данных, словарям, с помощью перекрестных проверок полей, проверок сумм, форматов дат и т.д. Открытый интерфейс позволяет пользователю создавать собственные правила автоматического контроля.

Система Cognitive Forms

В системе Cognitive Forms реализована так называемая трехуровневая технология распознавания:

1. Распознавание отдельного символа. Здесь применяется комбинация нескольких методов распознавания (композитивный метод):

· нейротехнологии;

· структурный метод (скелетон);

· древовидное распознавание;

· метод, базирующийся на кластерном анализе (событийное распознавание).

2. Распознавание поля знаков (методы распознавания базируются на варианте 1 и на методах динамического программирования).

3. Лингвистическая поддержка. Включает в себя словарную обработку, микролингвистику и частотный словарь. Данный уровень необходим для повышения точности распознавания. Часть полей бланка поддерживается специальными словарями. Например, результат распознавания поля «имя» может быть скорректирован с использованием словаря имен, в цифровом поле не может появиться буква, и наоборот.

Таким образом, на первом этапе система распознает структуру документа (линии разграфки и текст), затем анализирует расположение его полей (символы, совокупности символов) и, наконец, проводит лингвистическую обработку результатов распознавания.

Процесс работы с Cognitive Forms осуществляется следующим образом. Оператор на станции сканирования помещает пачку документов в устройство автоматической подачи сканера (как правило, это высокопроизводительный сканер Kodak, Banctech, Bell+Howell, Hewlett-Packard, Fujitsu). По нажатию клавиши запускается процесс потокового сканирования документов.

Подсистема распознавания - Cognitive FormReader- в автоматическом режиме управляет распознаванием и контекстной проверкой правильности распознавания.

На станции визуального контроля (модуль редактирования Cognitive FormEditor) оператор имеет возможность визуально контролировать и редактировать распознанные поля форм перед экспортом в базу данных.

В подсистеме создания описания форм (Cognitive FormDesigner) создается компьютерное описание обрабатываемых форм, используемое на всех этапах процесса ввода - от распознавания до экспорта в базу данных.

Подсистема экспорта результатов формирует текстовое представление документа перед его записью в базу данных, с окончательной проверкой на допустимость значений экспортируемых данных. Регистрация записи осуществляется пользователем после ввода и проверки определенного количества документов.

Программа «Тайны почерка»

Программа «Тайны почерка» предоставляет возможность определить характер человека по его почерку. Особенностью технологии анализирования является то, что программа может определить скрытые черты характера, которые трудно обнаружить при внешнем осмотре.

Возможности системы: Программа выдает информацию о характере человека, почерк которого анализируется. Точность анализа довольно высока. В итоге, появляется анализ почерка, объёмом в лист A4.

Программа была разработана для массового применения. То есть для рядовых пользователей, которым интересна наука графология. А начиная с третьей платформы, система разрабатывается и для использования в обучении (для тех, кто учится на графолога), использования в кадровых отделах (в основном мелких фирм, которым не выгодно и не нужно содержать графолога) для тех, кому нужно получить дополнительную информацию во время тестирования (например, для составления новой методики тестирования).

MyScript Studio

программа почерк распознавание характер

MyScript Studio - решение для оцифровки документов и заметок, созданных «от руки». Программа будет полезна всем деловым людям, менеджерам, журналистам, и всем остальным, кто часто делает рукописные заметки. При помощи этой программы вы сможете быстро перевести в электронную форму все ваши заметки, записи и рукописные документы, распознать текст и организовать электронный архив.

Система распознавания рукописного ввода Paragon PenReader

При распознавании слов программа использует интегрированную архитектуру словаря, который поддерживает распознавание, как словосочетаний, так и отдельных букв, цифр и стандартных символов. Слова, не содержащиеся во встроенном словаре (фамилии, сокращения, аббревиатуры) можно вводить в специальном режиме, предназначенном для раздельного написания, при котором проверка орфографии отключается, либо добавлять в словарь прямо во время письма.

Критерии сравнения:

¦ Способ получения текста

¦ Способ анализа

¦ Необходимость дополнительного оборудования

¦ Выходной результат

Название программы

Способ получения текста

Способ анализа текста

Дополнительное оборудование

Выходной результат

«Каллиграф»

Сканирование рукописного текста

Измерение совокупности графических признаков.

Сканер

Описание особенностей личности автора письма.

«Цифровая ручка от Logitech»

Online написание текста на специальной бумаге

Неизвестен

Сама цифровая ручка, специальная бумага

Цифровой текст

«ABBYY FineReader Рукопись»

Обрабатывается уже готовое изображение с текстом

Проверка по словарям и базам данных

Не требуется.

Цифровой текст

«Система Cognitive Forms»

Сканирование текста

Трехуровневая технология распознавания

Сканер с автоматической подачей

Цифровой текст

«Тайны почерка»

Неизвестно

Неизвестно

Неизвестно

Информация о характере человека

«MyScript Studio»

Обрабатывается уже готовое изображение с текстом

Неизвестно

Не требуется

Цифровой текст

«Paragon PenReader»

Online написание текста на экране КПК

Проверка по словарю

Не требуется

Цифровой текст

Вывод: наиболее удачной программой в данной области можно считать программу «Каллиграф», так как она не требует особого оборудования, например как цифровая ручка, и из всех рассмотренных программ только она проводит анализ рукописного текста с эталонным, что означает рассмотрение всех отклонений почерка от образца.

2. Описание предметной области и объекта проектирования

Описание надсистемы

Программа определения индивидуальных характеристик букв может применяться для:

§ определения характера человека (удобно при приеме человека на работу),

§ судебно-почерковедческой экспертизы.

Описание объекта проектирования как системы

Система распознавания индивидуальных характеристик написания гласных букв представляет собой целостную совокупность элементов, но при этом ее можно разделить на элементы. Между этими элементами можно проследить устойчивые связи, превосходящие по силе связи с элементами, не входящими в систему. В системе наблюдается организация.

Описание подсистем

Система будет состоять из трех подсистем:

§ Первая: распознавание рукописного текста (уже полученного в графическом формате).

§ Вторая: сравнение букв с буквами в базе.

§ Третья: вывод результата сравнения.

Система распознает буквы по индивидуальным характеристикам, таким как: строчный / надстрочный / подстрочный элемент, криволинейный / прямолинейный элемент, а также по количеству элементов.

Прямолинейные элементы делятся на горизонтальные и вертикальные, криволинейые - на левоокружные и правоокружные.

Криволинейные элементы делятся на завершенные (круги и петли) и незавершенные (дуги).

Элементы, имеющие круговую, овальную (или полуовальную) форму, делятся на левые, правые, верхние, нижние (в зависимости от расположения по отношению к условному центру).

Также будут распознаваться дополнительные элементы (если они есть). Но, при их отсутствии, система должна без проблем распознать букву.

Разные люди пишут одни и те же буквы по разному, и система должна распознать их. Например, представлен один из вариантов написания буквы «А».

Маленькая буква «а» состоит из 2-х элементов:

1 - овальный элемент, 2 - прямоугольный элемент с заключительным дуговым штрихом(а)

Большая буква «А» состоит из 3-х элементов:

1 - наклонный(прямолинейный) элемент с начальной точкой (а), 2 - прямоугольный элемент с заключитеельным дуговым штрихом (б), 3 - соединительный элемент

Рассмотрим также написание буквы «Е»:

Маленькая буква «е» состоит из 2-х элементов:

1 - полуовальный элемент, имеющий петлевую часть (а), 2 - заключительный дуговой штрих (б)

Большая буква «Е» состоит из 2-х элементов:

1 - верхний полуовальный элемент с начальной точкой (а), 2 - нижний полуовальный элемент с заключительным дуговым штрихом (б)

Написание буквы «ё» состоит из 2-х элементов:

1 - полуовальный (строчный) элемент, имеющий петлевую часть (а) и заключительный дуговой штрих (б), 2 - надстрочный элемент

Написание буквы «ь» состоит из прямолинейного элемента с малым овалом:

Написание буквы «ъ» состоит из 2-х элементов:

Описание поведения системы

В дальнейшем система сможет также распознавать гласные буквы, а так же способы соединения букв в словах.

Размещено на Allbest.ru


Подобные документы

  • Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.

    презентация [855,2 K], добавлен 20.12.2011

  • Эффективность применения объектного подхода для программных систем. Детальное проектирование и реализация системы, реализующей процессы создания и взаимодействия объектов. Распознавание компьютером печатных букв с помощью многослойной нейронной сети.

    курсовая работа [38,0 K], добавлен 09.03.2009

  • Распознавание текста на изображениях как очень важная задача, имеющая множество практических приложений. Особенности архитектуры интегрированной системы получения текстовой информации из изображений. Общая характеристика методов выделения текста.

    курсовая работа [1,7 M], добавлен 12.06.2016

  • Обзор существующих алгоритмов для обнаружения лиц. Выравнивание лица с помощью разнообразных фильтров. Использование каскадного классификатора Хаара для поиска лиц на изображении. Распознавание лиц людей с использованием локальных бинарных шаблонов.

    дипломная работа [332,4 K], добавлен 30.09.2016

  • Распознавание образов как раздел кибернетики, развивающий теоретические основы и методы классификации и идентификации предметов. Знакомство с принципом действия сканирующих устройств. Анализ особенностей преобразования документа в электронный вид.

    презентация [160,1 K], добавлен 06.01.2014

  • Анализ нейронных сетей и выбор их разновидностей. Модель многослойного персептрона с обучением по методу обратного распространения ошибки. Проектирование библиотеки классов для реализации нейросети и тестовой программы, описание тестирующей программы.

    курсовая работа [515,4 K], добавлен 19.06.2010

  • Проектирование приложения на языке С# в среде Microsoft Visual Studio 2008: составление алгоритмов сегментации текста документа и распознавания слова "Указ" в нем, создание архитектуры и интерфейса программного обеспечения, описание разработанных классов.

    курсовая работа [2,4 M], добавлен 05.01.2011

  • Принципы и система распознавание образов. Программное средство и пользовательский интерфейс. Теория нейронных сетей. Тривиальный алгоритм распознавания. Нейронные сети высокого порядка. Подготовка и нормализация данных. Самоорганизующиеся сети Кохонена.

    курсовая работа [2,6 M], добавлен 29.04.2009

  • Рассмотрение программных продуктов, обеспечивающих решение задач по распознаванию образов. Видеопотоки от камер видеонаблюдения. Изменение размера и формата представления кадра. Отслеживание движения объекта в кадре. Распознавание номеров автотранспорта.

    лабораторная работа [1,4 M], добавлен 28.11.2021

  • Как работает система оптического распознавания. Деление текста на символы. Образ страницы и распознавание по шаблонам, особенности коррекции ошибок. Увеличение скорости бесклавиатурного ввода документов в технологиях электронного документооборота.

    контрольная работа [15,6 K], добавлен 29.04.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.