Técnicas de visión artificial robustas en entornos no controlados

  1. Vázquez Fernández, Esteban
Supervised by:
  1. Fernando Martín Rodríguez Director
  2. Daniel González Jiménez Director

Defence university: Universidade de Vigo

Fecha de defensa: 12 November 2015

Committee:
  1. Enrique Cabello Pardos Chair
  2. José Luis Alba Castro Secretary
  3. Àgata Lapedriza Garcia Committee member
Department:
  1. Teoría do sinal e comunicacións

Type: Thesis

Abstract

La visión artificial es una disciplina transversal ampliamente estudiada en las últimas décadas. Los sistemas de visión artificial han sido implantados con éxito en procesos industriales tales como automatización, inspección o control de calidad, en sistemas de vigilancia o de seguridad, en procesos médicos, etc. Sus objetivos y ventajas van desde la mejora en la velocidad de los procesos a la automatización de tareas que no pueden hacerse de otro modo. Sin embargo, a día de hoy, los sistemas de adquisición y las condiciones de entorno siguen siendo un factor muy importante a la hora de marcar las limitaciones de uso del sistema. Es frecuente encontrar procesos en los que no es posible interferir, por lo que no se pueden obtener las condiciones de iluminación, espacio, ausencia de obstáculos, etc., necesarias para la implantación de un sistema de visión. En la presente Tesis Doctoral abordaremos el problema de analizar y desarrollar técnicas de visión artificial robustas capaces de funcionar en entornos no controlados. Para ello nos centraremos en varios campos de aplicación, en los que propondremos varias contribuciones con el objetivo de mejorar el rendimiento de los sistemas en entornos realistas: adquisición de imagen, lectura de texto y reconocimiento facial. En primer lugar, nos centraremos en el problema de la adquisición de imágenes de la mayor calidad posible para las posteriores etapas de procesado. Este es un aspecto fundamental para poder mejorar el rendimiento de los sistemas. Propondremos aquí un mecanismo de evaluación de calidad de imagen orientado al ajuste inicial de sistemas de adquisición para visión artificial. Este es un método que se engloba dentro de las técnicas de medida de calidad relativa de imagen. En segundo lugar, abordaremos un escenario de lectura automática de texto, orientado a la automatización en la lectura de instrumentación digital en procesos de calibración. Propondremos aquí varias contribuciones. En primer lugar presentaremos un método para la localización automática de texto en pantallas de dispositivos. A continuación pasaremos a presentar un método en el ámbito del reconocimiento de caracteres, en donde propondremos una serie de características blandas para la clasificación. Finalmente, propondremos un sistema de lectura completo (end-to-end) con el objetivo de automatizar la lectura de pantallas de dispositivos digitales, alcanzando unas prestaciones adecuadas para su uso en escenarios realistas. En tercer lugar, nos centraremos en el problema del reconocimiento facial en dispositivos móviles. El reconocimiento facial es una disciplina dentro de la visión artificial en la que se han realizado grandes avances en los últimos tiempos. Con la aparición de smartphones y tablets en los últimos cinco años, la aplicación del reconocimiento facial al control de acceso y seguridad de la información en movilidad ha cobrado un enorme interés. Estos entornos de movilidad son escenarios no controlados especialmente complejos, tanto por sus condiciones cambiantes como por sus restricciones computacionales. Propondremos aquí varias contribuciones. En primer lugar se propondrá un método de localización precisa de ojos para aplicación a reconocimiento facial en condiciones realistas. En el mismo ámbito, también se propondrán un marco de evaluación exigente que permita la comparación justa de algoritmos de localización de ojos en condiciones no controladas. A continuación, se propondrá un método de verificación de vida colaborativo para su uso como medida contra ataques de suplantación de identidad en sistemas de acceso móvil mediante reconocimiento facial. Finalmente, se realizará una evaluación de rendimiento de algoritmos de procesado en dispositivo móvil para su uso en reconocimiento facial y se propondrá un esquema de reconocimiento completo y robusto, capaz de funcionar íntegramente en el dispositivo. Finalmente, revisaremos la transferencia tecnológica alcanzada con las investigaciones realizadas y las contribuciones propuestas, mostrando así la versatilidad y aplicabilidad de los trabajos realizados en escenarios reales que van desde la automatización industrial a la seguridad en movilidad.Computer vision is a transversal discipline extensively studied in the last decades. Computer vision systems have been successfully introduced in industrial processes, such as automation, inspection or quality control, in surveillance or security processes, in medical applications, etc. Its goals and advantages range from the improvement in speed to the automation of tasks that cannot be done otherwise. However, nowadays the acquisition systems and the environment conditions are still a very important factor to set the limitations of the system use. It is common to find processes in which it is not possible to interfere, so the lighting and space conditions, absence of obstacles and other necessary conditions to introduce a computer vision system cannot be achieved. In this Thesis the problem of achieving robust computer vision techniques in uncontrolled environments will be addressed. To do so, we will focus in several application fields in which we will propose different contributions aiming to improve the performance of the systems in realistic environments. Firstly, we will focus on the acquisition stage and the problem of capturing the best image possible, for being used in the following stages. This is an essential aspect for us to be able to improve the efficiency of the systems. We will propose an image quality assessment method intended to the initial adjustment of acquisition systems. Secondly, we will address an automatic text reading scenario, focused on the automation of digital instrumentation reading in calibration processes. We will propose here several contributions. Firstly we will present a method for automatic localization of text in digital screens. Next, we will present a method in the field of character recognition, in which a series of soft features for classification will be proposed. And finally, we will propose an end-to-end reading system with the aim of automating the reading in digital devices, achieving good performance suitable for its use in real scenarios. Thirdly, we will focus on the problem of face recognition in mobile devices. Facial recognition is a computer vision discipline in which big advances have been made in the last years. The growth of the smartphone and tablet market in the last five years encouraged the interest in using face recognition for information access control and security in these devices. These mobile environments are especially complex uncontrolled scenarios, not only due to the changing conditions, but also because of the computing restrictions. Several contributions will be proposed in this area. Firstly, a precise eye localization method for facial recognition under realistic conditions will be suggested. In the same sphere, a challenging benchmark will be designed. This will allow the fair comparison between algorithms for eye localization under realistic conditions. Next, a collaborative liveness detection method for its use against identity theft attacks will be proposed. Finally, we will make a performance evaluation of facial recognition processing algorithms in mobile devices. We will propose a whole and robust recognition scheme, able to work completely embedded in the device. Finally we will review the technology transfer achieved through the research and the proposed contributions in this Thesis. We will show the versatility and applicability of the developed work in realistic scenarios, covering from industrial automation to other scenarios like mobile security.