Los resultados aparecerán en el próximo número de 'Pattern Recognition Letters'

El reconocimiento facial en 3D da nuevos pasos

Investigadores del Instituto de Telecomunicaciones y Aplicaciones Multimedia (ITEAM) de la Universidad Politécnica de Valencia (UPV) están trabajando en el desarrollo de un avanzado sistema inteligente de reconocimiento facial. Sus aplicaciones son muy amplias y van desde la seguridad hasta el ámbito comercial.

El reconocimiento facial en 3D da nuevos pasos
Investigador del ITEAm trabajando con el sistema de reconocimiento

Uno de los principales retos del proyecto era mejorar el reconocimiento facial para aquellas situaciones en las que las caras no mantengan una pose frontal con respecto a la cámara. Después de casi un año de trabajo, los investigadores del ITEAM han logrado introducir esas mejoras mediante la generación de vistas virtuales frontales empleando para ello avanzados modelos 3D.

Los trabajos de la UPV han sido presentados en la última edición de la IEEE Internacional Conference on Image Processing, celebrada en San Diego (EE UU). Se trata de la conferencia más importante en el campo del Procesado de Imagen a nivel internacional. Asimismo, próximamente se publicará un artículo sobre este trabajo en la revista Pattern Recognition Letters.

“A partir de una imagen rotada de un individuo y mediante un algoritmo matemático que emplea modelos 3D de la cabeza humana, es posible obtener una vista virtual frontal de su cara, facilitando así su posterior reconocimiento”, apunta Alberto Albiol, investigador principal del proyecto. La generación sintética de la nueva pose frontal a partir del modelo 3D de la cara ha conseguido una mejora en los resultados de reconocimiento equivalente a una reducción de 10º.

Las técnicas utilizadas por los investigadores de la UPV son capaces de describir con gran detalle zonas puntuales de la imagen (por ejemplo, rasgos concretos de la cara como los ojos, nariz, boca…), a partir de los cuales el sistema procesa las tareas de reconocimiento.

Aplicaciones en seguridad y política comercial

En el ámbito de la seguridad, el sistema tiene aplicación en la ayuda de revisión de secuencias de video para la búsqueda de individuos. Según apunta Alberto Albiol, se puede diseñar una aplicación que utilice la información biométrica almacenada de cada uno de los individuos que han sido detectados a lo largo de cada secuencia para que luego, si se ha de buscar un individuo concreto, la aplicación muestre sólo aquellos instantes donde es más probable que se hubiera detectado a dicho individuo. “Esto es lo que se conoce como indexación de los videos”, apunta.

En segundo lugar, otra aplicación directa del reconocimiento de personas en materia de seguridad sería la implementación de sistemas de validación no intrusivos, es decir, que no requieren de la actuación directa del individuo que ha de validarse.

A día de hoy, la mayoría de sistemas de validación para el acceso a zonas restringidas o simplemente a cuentas en un ordenador se valen de la introducción de contraseñas o del reconocimiento de información biométrica como las huellas dactilares o la textura del iris del ojo. En este caso, la captación de imágenes faciales puede ser un complemento a la información aportada por los otros sistemas de validación, además de forma totalmente transparente al usuario.

En el ámbito comercial, el sistema desarrollado por los investigadores del ITEAM abre las puertas a una nueva forma de entender la relación entre el cliente y el establecimiento. Manteniendo la privacidad de los consumidores, y sin necesidad de obtener datos de los mismos, los establecimientos podrían ser capaces de hacer un seguimiento genérico y estadístico de la actuación de los mismos. Por ejemplo, el establecimiento podría saber la cantidad de clientes que han visitado el comercio, cuántos lo han hecho en más de una ocasión o incluso de manera más frecuente, qué secciones del establecimiento han captado más la atención del público, etc.

Funcionamiento

Para el reconocimiento, el sistema desarrollado por los investigadores de la Politécnica cruza y compara la imagen registrada por las cámaras de vídeo con una completa base de datos de caras frontales. El reconocimiento se hace con clasificadores basados en kernels, funciones matemáticas que posibilitan una mayor dimensionalidad y que, por lo tanto, facilitan la comparación e identificación de los individuos a partir de la base de datos. Este trabajo se ha desarrollado conjuntamente con el Instituto de Robótica de la Universidad Carnegie Mellon de Pittsburgh (Pensilvania, Estados Unidos).

Asimismo, los investigadores del ITEAM han implementado una serie de programas que ayudan a evaluar y ejecutar los programas de reconocimiento de forma sencilla. Para ello se han desarrollado programas que permiten el “enroll” de usuarios, es decir, obtener las características faciales, así como la búsqueda de usuarios no conocidos dentro de la base de datos. El sistema, a partir de una cara, encuentra las caras más similares dentro de la base de datos.

Según explica Alberto Albiol, los sistemas de reconocimiento dependen de un gran número de circunstancias, tales como la iluminación de la cara, la resolución de la imagen, la expresión del rostro o el aspecto variable de cada individuo. “Por ejemplo, el reconocimiento de una persona se debería conseguir incluso si ésta cambia de peinado y en unas imágenes lleva gafas mientras que en otras no”, apunta. Teniendo en cuenta estos factores, en el sistema de reconocimiento se alcanzaron para las bases de datos utilizadas resultados de acierto superiores al 90%, variando según los conjuntos analizados.

Novedad

La principal novedad en los algoritmos tanto de detección como de reconocimiento facial, consiste en la utilización de características basadas en la información de los gradientes de la imagen (características HOG). La ventaja de este tipo de características es que se ven poco afectadas frente a pequeños cambios en la escala y de iluminación.

En el sistema de detección, las características HOG se utilizan para localizar de forma precisa la posición de ambos ojos, lo cual resulta esencial para las tareas de normalización previas al reconocimiento. En el sistema de reconocimiento, las características HOG forman los nodos de los grafos que describen cada una de las caras que van a ser comparadas. Es decir, aportan la información más relevante de los puntos más característicos de una cara (ojos, boca, nariz, cejas…).

Fuente: UPV
Derechos: Creative Commons
Artículos relacionados