Carlos Gómez Rodríguez, un investigador de la Universidad de A Coruña, ha realizado una tesis sobre los problemas comunicacionales existentes entre los ordenadores y las personas y ha desarrollado una aplicación que permite que un ordenador realice análisis sintácticos e interprete el significado de nuestras frases, uno de los retos actuales de la lingüística computacional.
La investigación, fruto de la colaboración entre los grupos COLE de la Universidad de Vigo y el grupo LyS (Lenguaje y Sociedad de la Información) de la Universidad de A Coruña, ha sido dirigida por Manuel Vilares Ferro y Miguel Ángel Alonso Pardo.
El trabajo muestra las ventajas de aplicaciones que permitan a los computadores procesar el lenguaje humano, y estudiar el significado de nuestras frases, una de las metas de la lingüística computacional.
Carlos Gómez Rodríguez enfocó la realización de la investigación, que lleva el título de Parsing Schemata for practical text analysis, hacia el análisis sintáctico, es decir, la forma en que todas sus partes se relacionan entre sí, y constituyen un todo coherente y con significado.
Aunque, como defiende Gómez Rodríguez, "hay muy pocos programas que sean capaces de comprender cualquier texto en un idioma, ya existen aplicaciones prácticas que pueden extraer información específica de un texto y obtener al mesno una comprensión parcial".
En el supuesto de que comenzaran a desarrollarse programas capaces de procesar un análisis sintáctico de una oración, los ordenadores podrían responder a las preguntas que se les haga.
El trabajo se dividió en tres partes. En la primera se presenta un compilador que sirve para obtener de forma automática analizadores sintácticos a partir de una especificación lógica de su funcionamiento. La segunda parte afronta la cuestión de como construir analizadores robustos, capaces de procesar lenguaje humano con errores.
La última parte de la investigación se centra en los analizadores sintácticos de dependencias, que describen la sintaxis de una frase mediante las relaciones entre sus palabras, en lugar de dividirlas en partes.
Así, la investigación presenta varios analizadores de sintaxis nuevos, muy útiles para procesar lenguas donde las palabras no son tan rígidas como, por ejemplo, las del inglés.
Ahora Gómez Rodríguez probará estos avances en los sistemas que está desarrollando el grupo COLE y LyS, para estructurar y procesar información en español de los archivos estatales y de las descripciones zoológicas y botánicas que realizan los biólogos del Consejo Superior de Investigaciones Científicas.