Investigadores de la Universidad Pompeu Fabra han desarrollado un método automático para identificar el lenguaje satírico en los mensajes de Twitter. El sistema utiliza un modelo computacional para analizar las propiedades de las palabras.
En la tradición del periodismo satírico, para explicar los hechos en tono de humor es habitual que los contenidos recurran a la sátira. También a ella recurren los textos en los que la ficción se presenta como realidad a través de la exageración, el absurdo o la parodia. En este tipo de acto comunicativo el objetivo no es solo meramente informar, sino criticar o denunciar.
Ahora, los científicos Francesco Barbieri, Francesco Ronzano y Horacio Saggion de la Universidad Pompeu Fabra (UPF) han desarrollado un sistema de clasificación capaz de distinguir en las redes sociales los tuits satíricos y no satíricos en lengua castellana. Además, detecta este tipo de lenguaje independientemente de la cuenta de Twitter que lo origina.
Para conseguirlo, los autores, del Grupo de Investigación en Procesamiento del Lenguaje Natural (TALN) en el Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, han desarrollado un método basado en un modelo computacional que sirve para analizar las propiedades de las palabras.
El estudio lo han publicado en la revista Procesamiento del Lenguaje Natural y ha recibido el premio al mejor artículo en la última edición del congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN2015), celebrado en Alicante del 16 al 18 de septiembre.
El modelo computacional utilizado ahora es una extensión de otro publicado en 2014 por los propios autores, destinado a la detección de la ironía en las redes sociales.
El estudio del sarcasmo, el humor, la ironía y la subjetividad en los textos "es de gran importancia para el desarrollo de los sistemas de comprensión del lenguaje y para la comunicación hombre-máquina ", resalta Saggion, por lo que constituye una de las líneas de investigación del grupo TALN.
Referencia bibliográfica:
Francesco Barbieri, Francesco Ronzano, Horacio Saggion."Is this Tweet Satirical? A Computational Approach for Satire Detection in Spanish", Procesamiento del Lenguaje Natural, Revista nº 55: pp 135-142, septiembre de 2015.