Аналіз та дослідження основних методів розпізнавання обличчя

Опис базового процесу розпізнавання обличчя. Суть методів гнучкого порівняння на графах; головних компонент, штучної нейронної мережи, інтегрального представлення зображення за ознаками Хаара. Виявлення переваг та недоліків досліджуваних алгоритмів.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 26.10.2020
Размер файла 717,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Аналіз та дослідження основних методів розпізнавання обличчя

Сосновський В.А., Хлевний А.О., к.т.н. Київський національний університет ім. Тараса Шевченка

Анотація

В статті розглядаються основні методи розпізнавання обличчя, що використовуються для ідентифікації особи. У роботі описується базовий процес розпізнавання обличчя, а також проводиться огляд переваг та недоліків найбільш популярних алгоритмів розпізнавання обличчя. На основі зібраних даних проводиться порівняльний аналіз методів, а також робляться висновки з приводу перспективних напрямків подальших досліджень у даній сфері.

Ключові слова: розпізнавання обличчя, алгоритм, ключові точки, точність.

Аннотация

В статье рассматриваются основные методы распознавания лица, что используются для идентификации человека. В работе описывается базовый процесс распознавания лица, а также проводится рассмотрение преимуществ и недостатков наиболее популярных алгоритмов распознавания лица. На основании собранных данных проводится сравнительный анализ методов, а также делаются выводы относительно перспективных направлений дальнейших исследований.

Ключевые слова: распознавание лица, алгоритм, ключевые точки, точность.

Abstract

The article deals with the main methods of face recognition, that are used to identify the person. The study describes the basic process of face recognition, and conducts the review of the advantages and disadvantages of the most popular algorithms for face recognition. Based on received results the comparative analysis of the methods is conducted and conclusions about the most perspective directions of studies in this scope are made.

Key words: face recognition, algorithm, key points, accuracy.

Постановка наукової проблеми. В наш час все більш широке поширення набувають біометричні системи ідентифікації людини. Традиційні системи ідентифікації вимагають знання пароля, наявності ключа, ідентифікаційної картки або іншого ідентифікує документа, який можна забути, втратити або підробити. На відміну від них біометричні системи ґрунтуються на унікальних біологічних характеристиках людини, які важко підробити і які однозначно визначають конкретну людину.Метою даної статті є дослідження та аналіз переваг та недоліків основних методів розпізнавання обличчя людини методами комп'ютерного зору. Таке завдання найчастіше зустрічається у обставинах, коли необхідно швидко та точно визначити особу людини, зіставивши її з існуючою базою даних людей. Це широко використовується у таких сферах, як правоохоронна, банківська, служби безпеки компаній та безліч інших. Наприклад, банкомата і термінали видачі готівки. Програмне забезпечення може швидко перевірити особу клієнта. Після дозволу клієнта банкомат або термінал робить знімок людини. Програмне забезпечення створює відбиток особи, що захищає клієнта від крадіжки особистих даних і шахрайських транзакцій, після чого видає готівку тільки після успішної авторизації користувача.

На сьогодні існує велика кількість математичних методів, котрі використовують для розпізнавання обличчя. Більшість з них є дуже чутливими до вхідних даних, що робить їх непридатними для деяких задач. Тому проблема вибору правильного методу розпізнавання обличчя є критично. У роботі порівнюються основні методи розпізнавання обличчя, що дає змогу обрати необхідний метод відповідно до поставлених задач.

Методи розпізнавання обличчя. Незважаючи на велику різноманітність алгоритмів, можна виділити загальну структуру процесу розпізнавання обличчя (див. рис.1)[1].

На першому етапі проводиться виявлення і локалізація обличчя на зображенні [6]. На етапі розпізнавання проводиться вирівнювання зображення обличчя (геометричне та яскравістне), обчислення ознак і безпосередньо розпізнавання - порівняння обчислених ознак із закладеними в базу даних еталонами. Основною відмінністю всіх представлених алгоритмів буде обчислення ознак і порівняння їх сукупностей між собою.

Рис. 1. Загальний процес обробки зображення обличчя при розпізнаванні

Метод гнучкого порівняння на графах. Метод полягає в еластичному зіставленні графів, що описують зображення обличь. У методі гнучкого порівняння на графах обличчя представляється у вигляді графа, вершини якого розташовані на ключових точках обличчя, таких як контури голови, губ, носи і їх крайніх точках, тобто зі зваженими вершинами і ребрами(див.рис. 2).

Рис. 2. Еластичний граф, що покриває зображення обличчя (граф на основі прямокутної сітки)

Кожна грань позначена відстанями між її вершинами. В момент розпізнавання один з графів, який називається - еталонним, залишається незмінним проте інший деформується з ціллю якомога кращої підгонки до першого [9]. У подібних системах розпізнавання графи можуть являти собою як прямокутну сітку, так і структуру, утворену характерними (антропометричними) точками особи(див. рис. 3).

Рис. 3. Еластичний граф, що покриває зображення обличчя(граф на основі антропометричних точок обличчя)

Для обчислення значення ознак у вершинах графа часто користуються комплексними значеннями фільтрів Габора або їх упорядкованих наборів - Габоровскіх вейвлет (строї Габора), які обчислюються в певній локальній області вершини графа локально завдяки згортці значень яскравості пікселів з фільтрами Габора[5].

Також відповідно ребра графа зважуються відстанями між суміжними вершинами. Різниця відстані між графами визначається за допомогою певної цінової функції деформації, що враховує деякі значення, а саме: відмінність між значеннями ознак, обчисленими в вершинах і ступінь деформації ребер графа.

Процес деформації графа відбувається завдяки почерговому зміщенню кожної з вершин графа на певну відстань у відповідно певних напрямках щодо її вихідного розташування і вибору такої її позиції, при якій різниця між значеннями ознак у вершині деформованого графа і відповідної їй вершині еталонного графа буде найменшою. Даний процес відбувається до того моменту часу, поки не буде відомо мінімальне розходження між ознаками деформованого і еталонного графів. Процедура виконується з усіма обличчями, які закладені в базу даних системи, тому швидкість роботи даного методу за таким алгоритмом зростає пропорційно розміру бази даних з особами.

Можна виділити наступні переваги [7]:

• досить висока точність при розпізнаванні (~ 90%);

• стійкість до зміни ракурсу (до 30 °);

• вплив таких чинників як зміна міміки на точність розпізнавання невелика.

Також можна виділити наступні недоліки:

• внаслідок того, що по черзі виконується обчислення з кожним обличчям з бази даних - складність обчислення;

• пряма залежність часу роботи від кількості обличь в базі, що при великому обсязі останньої може викликати затримки.

Нейронні мережі. Штучна нейронна мережа - це математична модель, принципи пристрою якої відповідають таким у біологічних нейронних мереж, утворених нервовими клітинами живого організму[8].

Найбільш поширений варіант - багатошаровий перцептрон, що дозволяє класифікувати подане на вхід зображення відповідно до попередніх налаштувань мережі [4]. Приклад схеми багатошарового перцептрона представлений на рис 4.

Вхідний сигнал в таких мережах поширюється в прямому напрямку, від шару до шару. Багатошаровий перцептрон в загальному представленні складається з наступних елементів [3]:

• безлічі вхідних вузлів, які утворюють вхідний шар;

• одного або декількох прихованих шарів обчислювальних нейронів;

Рис. 4 Схема багатошарового перцептрона

• одного вихідного шару нейронів.

Можна виділити наступні переваги:

• точність розпізнавання > 90%, стійкість до шумів вхідних даних;

• висока, в порівнянні з іншими розглянутими алгоритмами, швидкість роботи внаслідок розпаралелювання процесу.

Також можна виділити наступні недоліки:

• при розпізнаванні образів відсутня масштабованості;

• особливістю архітектури нейронних мереж є те, що кількість класів, які може розпізнати мережу, задається ще на етапі ініціалізації(тобто для додавання зображення нової людини до вже наявними даними потрібно заново налаштовувати і проводити навчання мереж).

Алгоритм Віоли-Джонса. В основу методу покладені: інтегральне представлення зображення за ознаками Хаара, побудова класифікатора на основі алгоритму адаптивного підсилювання і спосіб комбінування класифікаторів в каскадну структуру пікселів з прямокутних регіонів[10]. На рис.5 показано чотири різних типи ознак. Величина кожної ознаки обчислюється як сума пікселів в білих прямокутниках, з якої віднімається сума пікселів в чорних областях.

Даний метод демонструє високу ефективність при вирішенні завдання пошуку об'єктів на зображеннях і відеопослідовністях в режимі реального часу.

Рис.5. Типи ознакХаара

Алгоритм Віоли-Джонса має низьку ймовірність помилкового виявлення обличчя. Метод дозволяє виявляти обличчя при спостереженні його під кутом до 30°. Точність ідентифікації може досягати значень понад 90%[11]. Метод був розроблений в 2001 році, має велику кількість реалізацій і широко застосовується на практиці, як простий і ефективний. Алгоритм Віоли-Джонса має реалізацію в вільно розповсюджуваної бібліотеці OpenCV, що дозволяє використовувати його в розробці систем відеоспостереження.

Можна виділити наступні переваги[2]:

• низький відсоток помилкових спрацьовувань в порівнянні з іншими розглянутими алгоритмами;

• висока швидкість виявлення;

• простота програмної реалізації (завдяки штатним засобам бібліотеки комп'ютерного зору OpenCV).

Також можна виділити наступні недоліки:

• тривалий час навчання алгоритму. В ході навчання алгоритму необхідно проаналізувати велику кількість тестових зображень;

• алгоритм не дає спрацьовування при повороті особи на кут більше 30 градусів

• алгоритм не стійкий до сильного освітлення або затемнення зображень.

Метод головних компонент. Одним з найбільш відомих і опрацьованих є метод головних компонент (principal component analysis, PCA), заснований на перетворенні Карунена-Лоєва. Метод головних компонент являє собою спосіб зменшення розмірності даних при втраті найменшої кількості інформації, тобто для стиснення інформації без істотних втрат інформативності [7]. Метод головних компонент є статистичним і оперує не зображеннями, а векторами в лінійному просторі. Процес обчислення головних компонент зводиться до обчислення власних векторів і власних значень коваріаційної матриці вихідних даних або до сингулярного розкладання матриці даних.

Суть методу головних компонент зводиться до наступного. Вхідні вектори являють собою відцентровані і приведені до єдиного масштабу зображення обличь. Спочатку весь навчальний набір обличь перетворюється в одну загальну матрицю даних, де кожен рядок являє собою один екземпляр зображення обличчя, розкладеного у рядок.

Тобто відбувається лінійне ортогональне перетворення вхідного вектора X розмірності N у вихідний вектор Y розмірності M, N. Матриця X складається з усіх прикладів зображень навчального набору[12](див. рис.6).

Рис. 6. Перетворення навчального набору обличь в одну загальну матрицю X

За допомогою обчислених раніше матриць вхідне зображення розкладається на набір лінійних коефіцієнтів, що називаються головними компонентами. Сума N перших головних компонент, помножених на відповідні власні вектори, є апроксимацією зображення порядку N.

Для кожного зображення обличчя обчислюються його головні компоненти. Зазвичай береться від 55 до 200 головних компонент. Інші компоненти кодують дрібні відмінності між обличчями і шум. В цілому процес розпізнавання полягає в порівнянні головних компонент невідомого зображення з компонентами всіх інших зображень, тобто з бази даних (або тренувального набору) вибираються зображення-кандидати, що мають найменшу відстань від вхідного (невідомого) зображення.

У випадках, коли на зображенні присутні значні зміни в рівні освітленості або виразі обличчя, ефективність методу значно знижується.

Можна виділити наступні переваги:

• більш низьке споживання пам'яті при роботі в порівнянні з іншими алгоритмами;

• простий процес додавання нових еталонних обличь до вже навченого алгоритму;

• збереження і пошук зображень у великих базах даних.

Також можна виділити наступні недоліки:

• велика, в порівнянні з конкурентами, чутливість до освітленості, міміки і куту повороту голови;

• більш суворі вимоги до якості навчальних зображень в порівнянні з іншими розглянутими алгоритмами.

Результати порівняння алгоритмів розпізнавання обличь. Результати проведеного дослідження наведено у таблиці 1.

Таблиця 1. Порівняння алгоритмів розпізнавання обличь.

Критерій метод

Точність розпізнання

Стійкість до змін емоційного виразу обличчя та освітлення

Швидке розпізнання

Складність обчислення

Швидке додавання нової особи для розпізнання

Метод еластичного порівняння на графах

~90%

+

++

+

Метод головних компонент

~90%

+

+

+

Нейронні мережі

>90%

+

+

+

-

Алгоритм Віоли- Джонса

~90%

+

+

+

Кожен алгоритм має певні недоліки та переваги. Вибір та застосування в першу чергу залежить від конкретної ситуації при якій буде використовуватись розпізнання.

Метод гнучкого порівняння на графах має великий час розпізнавання і обчислювальну складність. Метод головних компонент має більшу, в порівнянні з іншими варіантами, чутливість до змін міміки, що впливає на точність розпізнавання.

Було виявлено такі основні проблеми в досліджуваних алгоритмах: недостатність світла та нахил голови. Таким чином, з огляду на те, що найбільш важливими характеристиками систем виявлення є швидкість і точність виявлення, актуальною є задача розробки і впровадження нових, більш швидких і точних алгоритмів, здатних виявити обличчя людини, нахилене під довільним кутом в площині зображення. Важливим недоліком сучасних систем розпізнавання обличчя є недостатня ефективність виділення ознак особи присутньої на зображенні, підвищити яку можна за рахунок використання методів теорії штучних нейронних мереж та глибинного навчання.

розпізнавання обличчя граф алгоритм

Література

1. Галатенко В.А. Идентификация и аутентификация, управление доступом лекция из курса «Основы информационной безопасности». - Интернет Университет Информационных Технологий, 2010г

2. Мищенкова Е.С. Сравнительный анализ алгоритмов распознавания лиц // Вестник Волгоградского государственного университета. Серия 9: Исследования молодых ученых. 2013. №11. С. 74-77.

3. Многослойный персептрон

4. Основные концепции нейронных сетей / КалланР.: Пер. с англ. - М.: Изд-кий дом Вильямс, 2001. - 291с.

5. Основы теории распознавания образов / Э.А. Патрик.; Пер. с англ. В.М. Баронкина, Б.А. Смиренина, Ю.С. Шинакова. - М.: Изд-во Советское радио, 1980. - 407с.

6. Тихонов И.А. Информативные параметры биометрической аутентификации пользователей информационных систем 2010. № 9. C. 26-32.

7. Упекая О.К. Исследование алгоритмов распознавания лиц / О.К. Упекая, А.Ю. Лошманов // Научнотехническое творчество аспирантов и студентов: материалы всероссийской научно-технической конференции студентов и аспирантов. Комсомольск-на-Амуре, 09-20 апреля 2018г.: в 2 ч. - 2018. - 4.2. - С. 245-247.

8. Rowley H. Neural Network-based Face Detection / H. Rowley, S. Baluja, T. Kanade // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1998. - Vol. 20. - P. 22-38.

9. Timo Ahonen, Abdenour Hadid, Matti Pietikainen. Face recognition with local binary patterns. In Computer vision- eccv 2004, pages 469-481. Springer, 2004

10. Viola P., Jones M.J. Robust real-time face detection. International Journal of Computer Vision, vol. 57, no. 2, 2004, pp. 137-154.

11. Viola P. Rapid object detection using a boosted cascade of simple features / P. Viola // IEEE Conf. on Computer Vision and Pattern Recognition. - Kauai, Hawaii, USA, 2001. - V. 1. - P. 511-518.

12. Yang M. Recent Advances in Face Detection / M. Yang // Tutorial of The IEEE International Conference on Pattern Recognition. - Cambridge (United Kingdom), 2004. - 93 p.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.