Применение методов машинного обучения в анализе почерка для выявления психофизиологических свойств личности

Исследование системы, которая предназначена для решения задач, связанных с графологическим анализом для предсказания и прогнозирования характеристик личности. Анализ таких признаков, как размер букв, наклон букв и слов, базовая линия и их классификация.

Рубрика Психология
Вид статья
Язык русский
Дата добавления 24.02.2019
Размер файла 2,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ В АНАЛИЗЕ ПОЧЕРКА ДЛЯ ВЫЯВЛЕНИЯ ПСИХОФИЗИОЛОГИЧЕСКИХ СВОЙСТВ ЛИЧНОСТИ

Дружинина Н.А.,

Репинский В.Н.

В статье проводится исследование системы, которая предназначена для решения задач, связанных с графологическим анализом для предсказания и прогнозирования характеристик личности. Основное внимание уделяется признакам, таким как размер букв, наклон букв и слов, базовая линия и их классификация. Работа выполнена в рамках курсового проекта по дисциплине «Machine learning».

Анализ почерка - это трудоемкий и сложный процесс, предназначен для определения психофизиологических свойств личности и прогнозирования его поведения. Может потребоваться несколько часов или даже дней, чтобы проанализировать страницу рукописного текста, в зависимости от детализации и полноты требуемого отчета. Для каждого почерка необходимо провести серию различных оценок, которые включают в себя такие факторы как размер букв, наклон букв и слов, исходный уровень, давление пера, расстояние между буквами и расстояние между словами в документе, в связи с этим возникла необходимость компьютеризации анализа почерка.

По сравнению с методом ручного анализа рукописного текста, автоматический анализ почерка более быстрый и точный. Уровень точности анализа почерка полностью зависит от знаний и опыта графолога, в автоматическом методе прогнозирования анализа почерка применяют три основных этапа: предварительная обработка, извлечение объектов и классификация.

Детально опишем этапы и их последовательность действий:

1. получение рукописных изображений

2. предварительная обработка почерка изображения

3. сегментация почерка изображения

4. выделение признаков

5. обучение и тестирование

6. результаты и обсуждение

Этап 1. Получение базы данных изображений рукописного текста

В этом исследовании используются 100 образцов изображений рукописных текстов разных людей. Каждому человеку было предложено написать текстовый документ из простых 70-80 слов, образцы были написаны на обычной нелинованной бумаге без каких-либо полей, далее были собраны в базу данных путем сканирования.

Этап 2. Предварительная обработка почерка изображения

На этапе предварительной обработки изображения рукописного текста происходит удаление шума путем применения локального порога и последующего изменения размера выборки до правильной ориентации. Предварительная обработка включает в себя открытие цифрового изображения, а затем его сглаживание. Открытие удаляет ненужные символы, знаки в цифровом документе. Следующий процесс заключается в сегментировании цифрового документа, таких как сегменты слов, сегменты букв и сегменты линий. На рис. 1 показана сегментация слов в документе.

Размещено на http://www.allbest.ru/

Рис. 1 - Сегментация слов в документе

Этап 3. Сегментация почерка изображений

В сегментировании изображения рукописного текста почерк сегментируется на три разных типа: сегментация слов, сегментация букв и сегментация строк, каждая из которых используется для различной обработки.

1. Сегментация слов

Этот процесс используется для сегментации слов в цифровом документе рукописного текста для расчета функций, связанных со словами, указывающими на склонность к критике и аргументации.

2. Сегментация букв

Здесь сегментация выполняется на каждой букве слова в цифровом документе рукописного текста каждого человека. Эта сегментация используется при вычислении признаков, связанных с буквой для прогнозирования личности. Сегментация букв используется для вычисления различных наклонов в буквах, указывающих на открытость чувств.

3. Сегментация строк

Сегментация линии используется для определения исходных характеристик, чтобы судить об эмоциональной стабильности и диспозициях личности в начале письма. Затем сегментированное изображение обрабатывается для математического вычисления численных значений для классификации личности по психологическим факторам.

Этап 4. Выделение признаков

Извлечение функций - это метод уменьшения размерности из высокоразмерных входных данных. Эти уменьшенные выходные данные представляют собой преобразование входных данных с высоким размером, представленных как вектор признаков.

Признак 1. Размер букв

Размер букв в документе представляет собой желание автора быть замеченным. Крупный почерк указывает на то, что автор хочет сказать «заметьте меня», в случае размера мелкого почерка автор менее желателен, чтобы его заметили. Средний размер почерка указывает на желание быть вписанным в окружающий мир. Буквы делятся на три зоны: нижний регистр или зона (например, д, y), верхний регистр или зона (например, б, в), средний регистр или зона (например, a, c, e). Рис 2, объясняет это более наглядно.

Рис. 2 - Структурные элементы почерка [2, 18 c.] а - нижняя зона; б - средняя зона; в - верхняя зона; г - верхняя петля; д - начальный штрих; е - конечный штрих; ж - нижняя граница строки; з - интервал между словами; и - база строки; к - межбуквенный интервал; л - нижняя петля

Признак 2. Наклон слов и букв

Наклон в почерке указывает на эмоциональные взаимодействия личности. Существует три класса наклона: правый наклон, левый наклон и вертикальный.

Рис. 3 - определение наклона букв

Признак 3. Базовая линия

Базовая линия - это функция, которая раскрывает большое количество информации относительно характера личности. Базовая линия в почерке - это воображаемая линия, вдоль которой человек выравнивает написанные им буквы и слова. Базовая линия отвечает за эмоциональную стабильность, личность оценивают по исходному уровню в почерке, как показано на рис.4

Рис. 4 - определение базовой линии

Этап 5. Обучение и тестирование

Используемый в исследовании классификатор - метод опорных векторов, позволяет добиться высоких результатов с большей точностью при помощи анализа данных и распознавания шаблонов.

Для оценки эффективности используется тестовая выборка, состоящая из 30% от исходной, примеры из тестовой выборки не пересекаются с примерами из обучающей выборки. Для определения точности классификации, необходимо выполнить сравнение полученного значения класса нейронной сети с тестовым набором. Для тестирования классификации используется функция «predict»[2].

На рис. 5 изображен образец исследуемого почерка по признакам (размер букв, наклон и базовая линия).

Рис. 5 - Образец исследуемого почерка

В проведенном эксперименте использовались две трети образцов данных почерка и их психологические результаты для изучения системы, оставшаяся третья часть образцов данных почерка проверялась на точность. В таблице 1 показаны критерии классификации стилей написания, точность обучения и полученное значение по признакам исследуемого образца.

Таблица 1 - результаты работы

Признаки

Критерии классификации

Полученное значение

Точность

1.

Размер букв

очень большой; большой; средний; маленький; очень маленький.

3, 4152 мм большой

74, 8%

2.

Наклон букв

правый наклон: и > и0 левый наклон: и < и0 вертикальный почерк: и = и0

109є

правый наклон

68, 3%

3.

Базовая линия

строка, поднимается вверх: и > 0 строка, спускается вниз: и < 0 прямая линия: и = 0

Строка, спускается вниз

71, 9%

В общем случае точность классификации может повыситься с помощью увеличения размера обучающей выборки. Рассматриваемая автоматическая система может быть расширена дополнительными признаками и использоваться для обнаружения заболеваний, таких как болезнь Паркинсона, через изменение характеристик, полученных в течение определенного периода времени. Кроме того, система может использоваться в аутентичности документа и выявлении подделки, так как фальсификатор никогда не сможет полностью воспроизвести все оригинальные черты личности.

буква личность графологический

Список используемой литературы и источников

1. Л.И. Воронова, В.И. Воронов. Machine Learning: Регрессионные методы интеллектуального анализа данных: учебное пособие - МТУСИ, 2017 - 81 с.

2. Чернов Ю.Г. Анализ почерка в работе с кадрами, 2011 - 464 с.

3. Andrew Ng Machine Learning - https://www.coursera.org/learn/machinelearning

4. Champa H N, K R AnandaKumar, “ Rule Based Approach for Personality Prediction Through Handwriting Analysis”, 2nd International Conference on Biomedical Informatics and Signal processing, organized by Sai„s BioSciences Research Institute Pvt. Ltd., 2013

5. Hua Hu, Jing Ye, Chunlai Chai, “A Talent Classification Method Based on SVM”, International Symposium on Intelligent Ubiquitous Computing and Education 2009 - 163 с.

6. Champa H. N., Dr. K. R. AnandaKumar, “Artificial Neural Network for Human Bahavior Prediction through Handwriting Analysis”, International Journal of Computer Applications (0975-8887) Volume 2 - No.2, May 2015.

Размещено на Allbest.ru


Подобные документы

  • Вопросы общефилософской теории общения. Исследование системы коммуникативных характеристик человека. Основы интегральных понятий, изучающих систему свойств личности. Коммуникативный потенциал личности, система свойств, обеспечивающих успешное общение.

    реферат [37,2 K], добавлен 04.05.2009

  • Теоретический анализ связи уровня стрессоустойчивости, психофизиологических особенностей личности и профессионального стажа людей, работающих на вредном производстве. Исследование зависимости стрессоустойчивости, психофизиологических особенностей мужчин.

    дипломная работа [246,1 K], добавлен 25.12.2003

  • Обусловленность зависимости почерка от личностных особенностей. Развитие графологии как науки. Эксперимент по выявлению корреляционной взаимосвязи между чертами личности разных типов и характеристиками почерка. Разработка методики, сфера применения.

    статья [15,5 K], добавлен 07.02.2010

  • Модели науки о человеке. Исследование онтогенеза индивидуальности по Ананьеву. Изучение комплекса коррелируемых свойств индивида. Психические процессы и свойства личности. Динамика психофизиологических функций и структура органических потребностей.

    презентация [578,0 K], добавлен 09.05.2016

  • Исследование почерка с помощью необходимых методик и особенности его связи с психомоторными качествами. Обработка полученных результатов. Выявление взаимосвязи между темпераментом и почерком личности. Анализ полученных данных, формулирование выводов.

    научная работа [1,5 M], добавлен 05.08.2014

  • Определение понятия "личность". Характеристика основных свойств личности. Особенности системы ее направленности. Сущность методов психологического изучения личности, анализ ее структуры. Определение понятий "способности" и "задатки", их отличия.

    контрольная работа [43,8 K], добавлен 10.09.2011

  • Понятие волевых свойств личности, их основная характеристика. Основные методы изучения волевых свойств личности. Самостоятельность, решительность, настойчивость, упорство, выдержка и самообладание человека. Эмпирическое исследование особенностей воли.

    курсовая работа [246,6 K], добавлен 22.01.2016

  • Коротка історія та основні напрямки в графології. Загальні ознаки почерку. Написання букв, їх форма і розмір, розподіл по зонам. Про що говорить нахил букв. Відстань між рядками та їх розташування. Відступ від краю аркуша. Графологія та почеркознавство.

    контрольная работа [853,2 K], добавлен 09.09.2014

  • Актуальность психографологии в современной криминалистике. История развития графологии, ее практическое применение, преимущества и особенности. Правила проведения анализа почерка. Взаимосвязь черт характера и темперамента личности с особенностями почерка.

    презентация [3,6 M], добавлен 08.10.2014

  • Рассмотрение идеи гуманизма как основы современной педагогики. Исследование роли обучения в развитии личности. Закономерности психического развития личности; гармоничность жизни человека. "Золотое сечение" и гармонические пропорции в личности и ее жизни.

    курсовая работа [58,2 K], добавлен 11.04.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.