Investigadores de la Universidad Pompeu Fabra han desarrollado un método para cartografiar la profundidad relativa, una habilidad de los animales superiores. La tecnología, ya patentada, se basa en el uso de una secuencia de imágenes o vídeo captada por una cámara.
Un equipo de la Universidad Pompeu Fabra (UPF) ha ideado un método "preciso, eficiente y robusto" –según sus creadores– para calcular un mapa de profundidad relativa a partir de una secuencia de imágenes o de vídeo capturada por una sola cámara.
La percepción en profundidad es una habilidad biológica inherente a los animales superiores. Gracias a esta capacidad podemos percibir el mundo en tres dimensiones y medir con precisión la distancia que hay entre dos objetos situados más cerca o más lejos cuando los observamos.
Ahora, una nueva tecnología ha sido desarrollada y los propietarios intelectuales del método son Felipe Calderero y Vicent Caselles, investigador y director, respectivamente, del Grupo de Investigación en Procesamiento de Imagen (GPI) del Departamento de Tecnologías de la Información y las comunicaciones ( DTIC ) de la UPF. A finales de 2012, se ha presentado la patente europea.
La metodología, que se aplica a la visión por ordenador, se basa en un modelo matemático que codifica de una manera cuantitativa las señales de percepción de profundidad a diferentes escalas, como la convexidad-concavidad, la inclusión, y las intersecciones de contornos en forma de T (T-junctions). El resultado es una interpretación consistente con la percepción que lleva a cabo el sistema visual humano.
Captar la profundidad en una escena
La relación de profundidad entre los objetos de una escena, que se suele inferir a partir de una imagen o de un vídeo captado a través de una única cámara, es relativa. Es decir, permite establecer un orden en profundidad de los objetos presentes en un determinado escenario pero no el valor exacto de esta profundidad.
Esto significa que sólo se puede concluir que un objeto está más cerca, más lejos o la misma profundidad a la cámara, pero no la posición de profundidad absoluta.
Según Calderero, "en el contexto de la visión por ordenador, el problema de la estimación de profundidad monocular –a partir de una única vista– es un problema fundamental debido al impacto que la información de profundidad relativa de la escena tendría en aplicaciones de procesamiento de imagen de alto nivel, o de carácter semántico, orientadas a la comprensión de la escena".
La importancia de esta herramienta es que permite mejorar en precisión y calidad muchas aplicaciones de procesamiento de imágenes sin comprometer su rendimiento, es decir, sin aumentar significativamente la carga computacional y el tiempo de cálculo.
Las aplicaciones, por tanto, son muy amplias. Por ejemplo, se puede usar en los ámbitos de los medios de comunicación, el entretenimiento, la seguridad, las telecomunicaciones, la detección y reconocimiento de objetos, la conversión de contenido de vídeo de 2D a 3D o en la edición de vídeo, por ejemplo.