DEEP LEARNING EN EL RECONOCIMIENTO FACIAL

Juan David Trujillo SuarezTrabajo19 de Agosto de 2021

5.660 Palabras (23 Páginas)148 Visitas

Página 1 de 23

DEEP LEARNING EN EL RECONOCIMIENTO FACIAL.

Autor

Juan David Trujillo Suarez

Tutor

Ferley Medina Rojas

Universidad Surcolombiana, Ingeniería de Software.

u20172161632@usco.edu.co

Resumen — El reconocimiento facial es una aplicación de la vision artificial la cual busca identificar una persona en una imagen digital, esto es posible mediante la aplicación de una serie de técnicas para extraer características claves del sujeto en la imagen y compararlas con una base de datos. En este artículo se propone encontrar y utilizar los dos algoritmos de Deep learning más populares y eficaces para el reconocimiento facial de la actualidad. Estos fueron el Algoritmo clasificador en Cascada de Haar y el modelo VGG16 para redes neuronales convolucionales.

Inicialmente haciendo uso de únicamente el Algoritmo Clasificador de Haar se obtuvo una precisión por debajo del 50%, pero, una vez implementado el modelo VGG16 en conjunto con este se alcanzó una precisión por encima de la esperada con un valor de 97.67%.

Abstract — Facial recognition is an application of artificial vision which seeks to identify a person in a digital image, this by applying techniques to extract key characteristics of the subject in the image and compare them with a database. This article proposes to find and use the two most popular and effective deep learning algorithms currently available for facial recognition. These were the Haar Cascade Classification Algorithm and the VGG16 model for convolutional neural networks.

Initially using only the Haar Classification Algorithm, a lower accuracy than expected was obtained, however, once the VGG16 model was implemented in conjunction with it, a higher accuracy than expected was achieved with a value of 97.67%.

Palabras Clave — Algoritmo clasificador de Haar, Reconocimiento facial, Redes neuronales, Vision artificial, VGG16.

Keywords — Facial recognition, Haar cascade algorithm, Machine Vision, Neural networks, VGG16.

INTRODUCCION

El reconocimiento facial es una aplicación de la Vision Artificial la cual busca identificar rostros humanos, Woodrow Wilson Bledsoe puede considerarse como el pionero de esta tecnología, ya que en 1960 realizo un sistema para clasificas los rasgos humanos a través de la tabla RAND. Esta consiste en una tabla de números aleatorios la cual utiliza simulación electrónica de una ruleta conectada a un ordenador. Para realizar la detección facial se utilizaba un lápiz óptico y unas coordenadas para situar los ojos, la nariz o la boca de las personas de forma precisa, sin embargo, este proceso era un procedimiento muy manual. Una década después surgió la aplicación de marcadores faciales, estructurado por Goldstein, Harmon y Lesk estos situaron 21 marcadores subjetivos específicos, este proceso al igual que el de Bledsoe era muy manual.

En el 2001, nace el Viola-Jones Object Detection Framework, el cual propone algoritmos para detectar objetos dentro de las imágenes (entre estos rostros humanos) los cuales más adelante fueron utilizados para la detección de rostros de forma satisfactoria. Dentro de este se encuentra el algoritmo clasificador de Haar, el cual mediante una imagen integral busca rasgos en los rostros humanos, estos rasgos por lo general son puntos clave en la nariz, boca y frente. En la década actual para lograr una mayor precisión a la hora de realizar la detección facial, se hizo aplicación de las redes neuronales convolucionales, esta se compone de una serie de capas las cuales cuentan por lo general con funciones de activación, perdida y optimización. El reconocimiento facial en el presente proyecto fue posible aplicando en conjunto las técnicas de Viola-Jones y las redes neuronales convolucionales.

Para aplicar estos algoritmos se hizo uso adicionalmente del modelo VGG16 para redes neuronales convolucionales, este modelo se utilizó al ser uno de los más precisos a la hora de hacer el reconocimiento facial. En el presente artículo se explicarán y utilizarán en conjunto los algoritmos mencionados anteriormente.

ESTADO DEL ARTE

A. Alta precisión usando clasificador en cascada.

Preeti Singh y Mukesh Tripathi (2013) abarcaron el problema de la detección facial en imágenes con fondos simples y complejos, las cuales con el uso del clasificador haar cascade lograron realizar tareas de reconocimiento facial. Se establece dicho algoritmo como uno de los más rápidos y seguros para tareas de Vision Artificial, ya que se basa en reconocer características de Haar, estas características se empiezan analizando en la imagen desde la esquina superior izquierda hasta la esquina inferior derecha. Los experimentos se hicieron con una base de datos de Rostros Indios (IFD por sus siglas en ingles) y con un dataset de Caltech. Todas las imágenes

presentes fueron de la parte frontal del rostro. Además de esto, utilizaron OpenCV para implementar el clasificador. Como resultados obtuvieron un 100% de precisión con la base de datos de rostros Indios y 93.24% de precisión con el dataset de Caltech.

B. Automatización de verificación de asistencia a el trabajo.

J. G. RoshanTharanga, S. M. S. C. Samarakoon, T. A. P. Karunarathne 2, K. L. P. M. Liyanage, M. P. A. W. Gamage, D. Perera (2013) plantearon en este proyecto una solución a una empresa, la cual requería conocer y mantener un registro organizado de la asistencia al trabajo, todo esto fue posible mediante el uso de Reconocimiento Facial en tiempo real. Para esto fue implementado el algoritmo para detectar rasgos faciales conocido como Haar Cascade al ser uno de los más simples y rápidos para realizar tareas de reconocimiento facial manteniendo su alta precisión a pesar de su rapidez de cálculo. Para este sistema se basaron en computación en la web, ya que de esta forma se estarían descargando y subiendo datos óptimamente a la base de datos, el proceso que realizaba la aplicación resumidamente consistía en lo siguiente: Se captaba el fotograma a través de la cámara, este fotograma debía ser analizado para detectar las caras inicialmente, para luego esta ser comparada en tiempo real con los datos ya entrenados almacenados en la nube, los cuales se encontraban guardados en una base de datos, la cual para ser ingresada se ejecutaban sentencias SQL, para luego comparar cada imagen e identificar al empleado determinado, finalmente se devolvía un estado de asistencia en la pantalla y se mostraban los detalles del empleado en ella.

Reconocimiento facial en tiempo real utilizando los algoritmos LBPH y el algoritmo de Viola y Jones.

Suma S L (2018) implemento un algoritmo de reconocimiento facial en tiempo real utilizando un Histograma de patrón binario lineal y el algoritmo de Viola Jones. Este método consistía en la fusión y reconocimiento de la comunicación. La extracción de características faciales mediante la técnica LBPH y clasificadores euclidianos utilizados para la detección facial. Este trabajo obtuvo un rango de precisión de entre 85% a 95%, este dependiendo de la luminosidad, casos en los que se presentan gemelos, personas con vello facial y/o personas utilizando anteojos.

Clasificador en cascada de haar combinado con emparejamiento de bordes.

Souhail Guennouni implementó en el 2017 un sistema de detección de rostros agrupando métodos como “Haar Cascade Classifier” y emparejamiento de bordes. El algoritmo de emparejamiento de bordes y la selección de características similares a las de Haar, combinadas con clasificadores de Haar son las dos técnicas utilizadas en este sistema. Este algoritmo produce un mejor emparejamiento, pero la velocidad de detección es comparativamente menor.

E. CNN para el reconocimiento facial.

[5]V. Mohanraj, S. Sibí, y V. Viadehi (2019) plantearon un reconocimiento facial basado en un conjunto de redes neuronales convolucionales (ECNN). El modelo propuesto aborda los desafíos de la expresión facial, el envejecimiento, la baja resolución y las variaciones de pose. El modelo ECNN propuesto supera a los modelos de vanguardia existentes, como los modelos Inception-v3, VGG16, VGG19, Xception y ResNet50 CNN con una precisión de rango 5 de 97.12% en el conjunto de datos de Web Face y 100% en el conjunto de datos de cara de YouTube.

F. Vision artificial y reconocimiento de patrones.

Puspita Majumdar, Akshay Agarwal, Richa Singh y Mayank Vatsa (2019) realizaron la investigación que propone un ataque parcial de manipulación de la cara, donde las regiones faciales se reemplazan o transforman para generar muestras manipuladas. Experimentos de verificación de rostros realizados con dos sistemas de estos de última generación, VGG-Face y OpenFace en el conjunto de datos CMU-MultiPIE indican la vulnerabilidad de estos sistemas ante el ataque. Además, se propone una red de detección de manipulación de cara parcial (PFTD) para la detección del ataque propuesto. La red captura las inconsistencias entre las imágenes originales y manipuladas combinando la información en bruto y de alta frecuencia de las imágenes de entrada para la detección de imágenes manipuladas. La red propuesta supera el rendimiento de las redes neuronales profundas de línea de base existentes para la detección de imágenes manipuladas.

G. Reconocimiento de genero a través del reconocimiento facial.

S. Mittal y S. Mittal (2019) exploran una solución basada en el aprendizaje profundo para la detección automática de género a partir de imágenes faciales de un conjunto de datos bien equilibrado. La solución implica un marco de aprendizaje de transferencia donde el conocimiento se reutiliza a partir de un modelo de aprendizaje profundo que funcionó óptimamente en la tarea de clasificación de otro dominio. Se investiga la reutilización de Visual Geometry Group-16 (VGG16), un modelo de red neuronal convolucional (CNN) que se entrena previamente en un gran conjunto de datos de imágenes naturales. El ajuste fino de un segmento de la CNN en el conjunto de datos de tamaño moderado produce un mejor rendimiento que el obtenido de los enfoques de vanguardia cuando se implementa en el conjunto de datos público LFW-Gender.

H. Modelo de aprendizaje profundo para el reconocimiento facial en un entorno sin restricciones.

Moghekar, Rajeshwar; Ahuja, Saching (2019) utilizan un subconjunto de la base de datos Indian Movies Face (IMFDB) que tiene una colección de imágenes de caras recuperadas de películas / videos de actores que varían en términos de desenfoque, pose, ruido e iluminación. Ellos se centran en el uso de modelos de aprendizaje profundo previamente entrenados y aplican el aprendizaje por transferencia a las características extraídas de las capas CNN. Los resultados

muestran que la precisión es de 99.89 usando CNN como extractor de funciones y 96.3 cuando se ajusta el VGG-Face.

MARCO TEÓRICO

En el proyecto fueron utilizados algoritmos de vision artificial para poder trabajar detección de objetos, específicamente detección y clasificación de rostros humanos. Para esto fue necesario implementar el Algoritmo Clasificador de Haar y el modelo VGG16 para Redes Neuronales Convolucionales, estos serán explicados a continuación:

...

Descargar como (para miembros actualizados) txt (37 Kb) pdf (313 Kb) docx (589 Kb)

Leer 22 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com

DEEP LEARNING EN EL RECONOCIMIENTO FACIAL

INTRODUCCION