Un sistema rastrea las opiniones de los internautas en la web

Investigadores de las universidades de Jaén, Sevilla y Alicante han desarrollado una plataforma que monitoriza la opinión de los usuarios de Twitter y otras aplicaciones sociales de internet. Esta herramienta se basa en tecnologías del lenguaje humano y puede ayudar a instituciones o empresas a tomar decisiones estratégicas.

Fundación Descubre

18/2/2014 10:49 CEST

Los investigadores han creado ATTOS, esta plataforma de monitorización de la Web 2.0. / Fotolia

Un equipo del grupo de Sistemas Inteligentes de Acceso a la Información (SINAI) de la Universidad de Jaén, junto con las universidades de Sevilla y Alicante , ha desarrollado una plataforma de monitorización de opinión en la web basada en Tecnologías del Lenguaje Humano (TLH).

“Esto implica que el sistema es capaz de procesar de manera automática el lenguaje. No resulta una tarea fácil, porque la plataforma debe comprender lo que lee y detectar la ambigüedad o la ironía, pero tiene la capacidad automática de discernir si un fragmento de texto expresa un sentimiento positivo o negativo”, aclara el responsable de la investigación Luis Alfonso Ureña, de la Universidad de Jaén.

La plataforma discierne de forma automática si un texto expresa un sentimiento positivo o negativo

Los investigadores han creado ATTOS, esta plataforma de monitorización de la Web 2.0 que genera información sobre tendencias de opinión relacionadas con un tema. Los expertos han identificado dos posibles escenarios donde aplicar su sistema para tomar decisiones: el análisis de mercados y el turismo. De hecho, el sistema podría ayudar a instituciones o empresas a tomar decisiones estratégicas.

“Nuestro sistema podría responder a qué se está opinando sobre un nuevo producto disponible en el mercado o cuál es la evolución de esa opinión, si existen diferencias de opinión en distintas regiones del país. En cuanto al turismo, detectaría cuál es la imagen que tienen de una ciudad sus visitantes o cuál es la opinión sobre la oferta hostelera”, apunta el investigador.

Algunas de las técnicas se han aplicado para analizar y clasificar opiniones positivas, negativas o neutras de los usuarios de Twitter, según un estudio que publica la revista Computer Speech and Language.

A la dificultad de detectar los matices de la lengua, se suma la multitud de canales estudiados. "La Web 2.0 y los medios sociales posibilitan que cualquier usuario pueda publicar sus propios contenidos, con su propio punto de vista sobre un tema. En estos nuevos canales de información predomina el lenguaje espontáneo, como son los diferentes registros de uso con diferentes grados de formalidad/informalidad”, explica el investigador.

Por eso, el análisis comienza seleccionando las fuentes donde reside la opinión, como foros o medios sociales. Procesan una ingente cantidad de datos no estructurados. De esta forma, disponen de un gran volumen de información digital en el que se combinan múltiples lenguas y registros de uso con diferentes grados de formalidad (formal/informal) y especialización, emitidos desde diferentes actitudes subjetivas y desde diferentes situaciones de espacio y tiempo.

Sistemas inteligentes para el ánalisis

“Todo ello debe ser analizado y comprendido por sistemas inteligentes, teniendo en cuenta parámetros como la intensidad de la opinión, ubicación geográfica y perfil de usuario, entre otros factores, para su adecuada explotación por organizaciones y particulares”, indica el investigador. A continuación seleccionan los textos relevantes y construyen colecciones de datos para evaluar los sentimientos de forma automática.

La creciente presencia de opiniones en internet conlleva que cada vez es mayor el número de usuarios que consultan información sobre un determinado servicio, producto, empresa o persona. “Nos fiamos más de los comentarios de los usuarios que los de una agencia de viajes, por ejemplo, porque se acercan más a la realidad que la fuente más institucional”, reconoce Ureña.

Según exponen las investigadores, se crea así una comunidad generadora de información constituida tanto por personas anónimas como por personalidades, instituciones y empresas de todo tipo que han adoptado estas formas de comunicación con objetivos claros que van más allá del simple entretenimiento.

Referencia Bibliográfica:

Montejo-Raez, A ; Martinez-Camara, E; Martin-Valdivia, MT ;Urena-Lopez, LA . "Ranked Word Net graph for Sentiment Polarity Classification in Twitter". Computer Speech and Language, enero de 2014.

Fuente: Fundación Descubre

Derechos: Creative Commons

Claves