Reconocer la voz en el control aéreo

Investigadores de la Universidad Politécnica de Madrd (UPM) han desarrollado la tecnología capaz de comprender el contenido semántico de los comandos que utilizan los controladores aéreos para dirigirse a los pilotos.

Reconocer la voz en el control aéreo
Pruebas de la arquitectura sobre SACTA. Foto: UPM.

El Grupo de Tecnología del Habla de la UPM, en colaboración con empresas del sector aeronáutico como AENA y Boeing Research Europe, ha desarrollado una tecnología que empleando técnicas de identificación del idioma, reconocimiento del habla y comprensión de la misma, permite reconocer y analizar el contenido semántico de los comandos que, por ejemplo, los controladores aéreos dirigen a los pilotos. Esta tecnología puede emplearse en los entrenamientos de controladores noveles así como en el control de misión de pequeños aviones no tripulados UAV (Unmanned Aerial Vehicle) a través de pseudo-pilotos.

Esta nueva tecnología desarrollada en la UPM permite automatizar algunas de las acciones de los controladores, por ejemplo, la introducción automática de datos en el sistema de control de tráfico aéreo SACTA (Sistema Automatizado de Control del Tránsito Aéreo), lo que les dejaría más libertad para controlar visualmente lo que ocurre en la plataforma del aeropuerto.

Para ello, en principio se identifica el idioma utilizado en la conversación. Esta identificación es necesaria en un aeropuerto internacional como Madrid Barajas, ya que en las tareas de control del tráfico aéreo se emplea tanto castellano como inglés. De hecho, estas tareas presentan una especial dificultad ya que, por lo general, los locutores no son nativos en una de las lenguas, se admite mezcla de idiomas en los saludos y, además, existe un amplio vocabulario (nombre de las compañías aéreas, alfabeto usado en la descripción de puntos estratégicos –alfa, bravo, charlie, delta, etc.-) que no se pronuncia de manera significativamente diferente en ambos idiomas.

Una vez identificado el idioma, se selecciona uno de los dos reconocedores de habla que se han diseñado para tratar cada una de las lenguas. Estos reconocedores usan modelos acústicos y de gramática específicos para control aéreo. Los modelos acústicos están especialmente preparados para tratar un habla profesional y, por lo tanto, muy rápida y difícil de entender, procesar el habla procedente de un canal tipo radio con sus ruidos y limitación de ancho de banda que produce pérdidas de parte de la información (como ocurre a través de un canal telefónico) y, por último, procesar el habla en idiomas de los cuales los locutores no son nativos y que, por lo tanto, producen una alta variabilidad global de locutor a locutor. Además, el diseño de las gramáticas ha de tener en cuenta la admisión de pequeñas variaciones respecto a la fraseología oficial existente que se producen de manera natural en el habla humana a pesar de estar tratando un entorno profesional.

El último paso del proceso es el que se dedica a comprender el contenido semántico de los comandos. Esto se consigue gracias a un sistema de procesado del lenguaje natural basado en reglas contextuales con la potencia suficiente para ir construyendo las islas de conceptos que constituyen el mensaje. Tras una preparación del formato adecuado a cada aplicación, estos conceptos (pares de atributos y sus valores correspondientes como “destino = Zurich”) constituyen la salida o el resultado ofrecido por el sistema tras su proceso.

Además de permitir optimizar o automatizar varias tareas de los controladores, esta tecnología permite la creación de pseudo-pilotos que constituirían sistemas que entenderían los comandos y se comportarían como pilotos para el entrenamiento de controladores aéreos o la comprensión de comandos de misión para el control de pequeños aviones no tripulados empleados en misiones de vigilancia y seguridad.

----------------

Referencia bibliográfica:

Ferreiros, J; San-Segundo, R; Barra, R; Perez, V. "Increasing robustness, reliability and ergonomics in speech interfaces for aerial control systems". Aerospace science and technology 13 (8): 423-430 diciembre de 2009.

Fuente: Universidad Politécnica de Madrid
Derechos: Creative Commons
Artículos relacionados