Investigadores de la Universidad Politécnica de Madrid han desarrollado un modelo que recomienda contenidos audiovisuales a cada cliente según su consumo y las características propias de las imágenes. Aunque el espectador no sea consciente de ello, aspectos como el ritmo narrativo, el movimiento de la cámara o la fotografía de la película son relevantes en sus preferencias.
La gran cantidad de información de internet, televisión y otros medios a menudo hace que el usuario tenga dificultad para obtener aquellos contenidos que son de su interés. Ahora investigadores de la Universidad Politécnica de Madrid (UPM), en colaboración con empresas del sector audiovisual, han ideado una herramienta para facilitar esta selección.
El grupo G@TV de la ETSI de Telecomunicación de la UPM ha desarrollado un modelo que ofrece recomendaciones sin necesidad de solicitar al usuario valoraciones explícitas y sin molestarlo en su visualización y disfrute del contenido.
Hasta ahora los sistemas de recomendación tradicionales emplean técnicas semánticas, recomendando productos definidos por temas o etiquetas similares a los que ya interesan al usuario, o algoritmos que aprovechan la inteligencia colectiva de un conjunto grande de usuarios, de tal forma que se recomienda a una persona aquello que gusta a otras personas con preferencias parecidas.
El nuevo modelo va más allá de este paradigma. Incorpora otras características de cuya influencia el usuario no siempre es consciente y que, por esta razón, no han sido utilizadas hasta el momento en este tipo de sistemas.
Los investigadores han profundizado en el análisis de características audiovisuales que resultan influyentes para los usuarios y han demostrado que algunas de ellas, que sirven para determinar tendencias estéticas y que habitualmente pasan desapercibidas, resultan decisivas a la hora de definir los gustos de un usuario.
Escenas, cámara e iluminación
Por ejemplo, han comprobado que en una película la información relativa al ritmo narrativo –duración de planos, escenas y secuencias–, al movimiento –de la cámara o del contenido del cuadro– o a la naturaleza de la imagen –luminosidad, color, texturas, cantidad de información…– es muy relevante a la hora de catalogar las preferencias de cada uno.
De forma análoga, los investigadores han analizado imágenes utilizando un subconjunto de los descriptores considerados en el caso de los vídeos.
Para la validación de este modelo de influencia se ha utilizado una base de datos con 70.000 usuarios y cerca de un millón de valoraciones sobre un conjunto de 200 películas cuyas características fueron previamente extraídas. Su precisión, según las conclusiones de los investigadores, es la mayor alcanzada hasta el momento.
Estos descriptores, una vez normalizados y procesados, y generando a partir de ellos los datos estadísticos adecuados, permiten caracterizar formalmente los contenidos y averiguar el grado de influencia que tienen en cada persona y la manera en que condicionan sus preferencias.
El modelo ha sido desarrollado y validado en diversos sistemas reales, partiendo de investigaciones en proyectos Europeos –como ARENA–, y luego directamente enmarcados en diferentes proyectos nacionales y aplicado a varios escenarios: escenario televisivo generalista –3SME–, escenario web aplicado a buscadores –Buscamedia–, escenario híbrido televisivo y web aplicado a los juegos olímpicos –JOI– y otros de consumo audiovisual multiplataforma –Mireia–.
Los autores destacan que el 'recomendador' no se alimenta de preferencias declaradas a priori de forma explícita por el usuario, sino que éstas van cambiando dinámicamente según sus tendencias de consumo.
Para ello, se ha creado un modelo probabilístico que infiere los gustos empleando técnicas de inteligencia artificial. Este se ha validado realizando pruebas con usuarios reales, cuyo consumo televisivo fue analizado durante un tiempo determinado y contrastado con encuestas que se les realizaron posteriormente.
Después de analizar estadísticamente los resultados y su relación con las distintas categorías de contenidos, se ha demostrado que los métodos implícitos que parten de la información de consumo resultan más fiables que las valoraciones explícitas, dado que las medidas son objetivas y de este modo se elimina un cierto condicionamiento social y cultural que afectaba a algunos tipos específicos de contenidos.
Una vez que se caracterizan las preferencias de los usuarios y la naturaleza de los contenidos, se generan nuevas recomendaciones explotando esta información.
De cara al desarrollo de esta fase del sistema de recomendación, fueron importantes las conclusiones obtenidas del estudio de la influencia de las características estéticas, y se determinó la necesidad de crear sistemas estadísticos personalizados, de tal forma que los criterios para la recomendación cambian para cada usuario de acuerdo con la diferente influencia de estas características.
Los resultados revelan que algunos usuarios muestran una sensibilidad especial a ciertas características, especialmente relacionadas con el ritmo de montaje o con el movimiento de la cámara.
El algoritmo de recomendación fundamenta su éxito en utilizar la información que el usuario no es consciente que sabe, pero que determina una especial afinidad estética con determinados contenidos audiovisuales.
Referencia bibliográfica:
F. Sánchez, M. Barrilero, S. Uribe, F. Álvarez, A. Tena y J. M. Menéndez. "Social and Content Hybrid Image Recommender System for Mobile Social Networks". Mobile Networks and Applications 17 (6): 782-795, 2012.
F. Sánchez, M. Alduán, F. Álvarez, J. M. Menéndez, O. Báez. "Recommender System for Sport Videos Based on User Audiovisual Consumption". IEEE Transactions on Multimedia 14 (6): 1546-1557, 2012.