Improvements in pose invariance and local description for gabor-based 2d face recognition

  1. GONZÁLEZ JIMÉNEZ, DANIEL
Dirixida por:
  1. José Luis Alba Castro Director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 26 de maio de 2008

Tribunal:
  1. Nicolás Pérez de la Blanca Capilla Presidente/a
  2. Carmen García Mateo Secretaria
  3. Fernando Pérez González Vogal
  4. Jordi Vitrià Marca Vogal
  5. Manuele Bicego Vogal
Departamento:
  1. Teoría do sinal e comunicacións

Tipo: Tese

Teseo: 206124 DIALNET

Resumo

El reconocimiento automático de caracas ha atraído una gran atención debido no sólo a la gran cantidad de aplicaciones prácticas en las que se requiere la identificación de personas, sino también por el reto tecnológico que entraña: la gran variabilidad en la apariencia facial, la no linealidad de los subespacios donde residen las caras, así como la gran dimensionalidad del problema consituyen los principales obstáculos para alcanzar un sistema fiable. Para hacer frente a los problemas anteriormente citados existen dos posibles estrategias: la primera de ellas consiste en usar un espacio de características más sencillo que el original (más lineal y convexo). Este esquema generalmente conlleva dos niveles de procesado: (1) Normalización geométrica y fotométrica y (2) extracción de características robustas (como las derivadas de los filtros de Gabor). La segunda estrategia busca clasificadores que sean capaces de lidiar con la no linealidad, así como generalizar adecuadamente. Habitualmente, un algoritmo debe combinar ambas estrategias para obtener buenas prestaciones. En esta Tesis, se han tratado problemas de índole muy diversa relativos al reconocimiento de caras, proponiendo soluciones que combinan ambos esquemas, usando siempre los filtros de Gabor como motor de reconocimiento. Conjuntamente con factores como iluminación y expresión, las diferencias de pose son mayormente responsables de los grandes cambios en la apariencia facial. En esta Tesis hemos tratado el problema de la pose poroponiendo dos algoritmos que se basan en un modelo lineal bidimensional. Estas técnicas aprovechan la simetría facial para hacer frente a oclusiones debidas a la rotación de la propia cabeza y sintetizan imágenes virtuales en poses específicas usando mapeado de textura. Los sistemas propuestos obtienen resultados comparables a los conseguidos por un algoritmo tridimensional basado en Morphable Models en rotaciones de hasta 67.5º. Algunos de los sistemas de reconocimiento facial más famosos son los basados en extracción de características Gabor. Esta elección está motivada por razones biológicas así como por su óptima resolución en los dominios de espacio y frecuencia. Usando filtros de Gabor como motor de reconocimiento, hemos propuesto un método que trata de extraer caracteristicas en posiciones o regiones que de algún modo son específicas de cada individuo. Esto constituye un nuevo enfoque con respecto a los clásicos métodos que extraen características en puntos predefinidos de la cara. Siguiendo con algoritmos basados en Gabor, hemos propuesto una comparativa de diferentes técnicas para combinación de similitudes (fusión intramodal). Asimismo, se ha propuesto una evaluación de diferentes medidas de distancia para comparación de características locales de Gabor. A pesar del gran número de artículos que se han descrito utilizando filtros de Gabor para reconocimiento facial, ninguno de ellos ha propuesto (o usado) un modelo estadístico. En esta Tesis se ha estudiado la distribución marginal de coeficientes de Gabor extraídos de imágenes de caras, proponiendo el uso de la Gaussiana Generalizada para modelar el comportamiento no normal que muestran dichos coeficientes. Además, también se ha estudiado la caracterización estadistica multivariada de coeficientes de Gabor, proponiendo una nueva formulación probada con éxito en experimentos limitados. Finalmente, en esta Tesis se ha desarrollado software de seguimiento de caras. Deeste modo, hemos asentado las bases necesarias para implementar sistemas de reconocimiento facial en video. Se han obtenido resultados recientes usando este módulo de seguimiento en el contexto de reconocimiento robusto a cambios de pose en video, así como detección de asincronía entre las señales de audio y video.