Investigadores de la la Universidad Rovira i Virgili están coordinando un proyecto europeo cuyo objetivo ha sido desarrollar una herramienta que agilice y abarate la gestión de un gran volumen de datos en empresas. La aplicación permite manejar desde un panel de control el almacenamiento, la compresión o encriptación de la información y diversos aspectos de computación, como el tratamiento de los datos para su uso práctico o predictivo.
Un equipo del departamento de Ingeniería Informática y Matemáticas de la la Universidad Rovira i Virgili (URV) coordina un proyecto de investigación que tiene como finalidad desarrollar una herramienta que ayude a las empresas a gestionar un gran volumen de datos.
Desde un panel de control, la aplicación permite a las empresas controlar el almacenamiento, la compresión o encriptación de la información y diversos aspectos de computación, como el tratamiento de los datos para su uso práctico o predictivo, según los investigadores.
Las empresas e instituciones generan cada día más información digital, y se prevé que en los próximos años esta se multiplique. Por este motivo, una de las necesidades primordiales de los grupos que utilizan un gran volumen de datos (big data) es lograr una gestión eficiente y económica de toda esta información.
El investigador Pedro García López, líder del grupo de la URV, es el coordinador del proyecto europeo IOStack (Software Defined Storage for Big Data). Se trata de un programa informático que permite al usuario controlar virtualmente un centro de datos desde una aplicación centralizada, que se presenta en forma de panel de control.
Reducción de costes
Los objetivos de esta investigación son reducir los costes de la gestión de la información y que el administrador de un centro de datos pueda operar de forma fácil, cómoda y flexible para organizar la transferencia, el almacenamiento, el acceso y el uso de la información.
Para hacerlo posible, los investigadores han desarrollado un software que incorpora algunas funciones complejas configuradas para que el usuario solo tenga que decidir qué quiere hacer y dar la orden para que se lleve a cabo la acción programada. La idea es que se puedan predefinir instrucciones para automatizar procesos. Es decir, la aplicación trabaja como si se tratara del nuevo fenómeno tecnológico basado en 'recetas' If This Then That, que ejecuta una acción cuando se dan unas condiciones determinadas.
Un ejemplo de estas 'recetas' podría ser que cada vez que se transfieren datos de un determinado tipo (de un cliente específico o de unas características concretas, por ejemplo) a las unidades de almacenamiento, estos tengan prioridad en la banda ancha de entrada frente al resto de la información que se está introduciendo al mismo tiempo y, además, se compriman y se encripten para que tengan un mayor grado de protección.
Este software permite activar todas aquellas funciones que se configuren, como replicar la información para que tenga una copia paralela, comprimir y reducir el peso de los datos, acceder y buscar, visualizar qué datos entran, cambiar las prioridades de transferencia, etc. Todo se puede ver y resolver desde el panel de control, que ofrece un gráfico visual en tiempo real para que el usuario pueda identificar más fácilmente qué está pasando.
Los programas de gestión masiva de datos están dominados por empresas estadounidenses, como el sistema IOFlow de Microsoft Research. IOStack sería la primera propuesta europea en este ámbito.
Uno de los socios del proyecto es la empresa catalana Applus + IDIADA, que ha puesto sobre la mesa sus necesidades respecto al almacenamiento de datos y ha aportado información para que sirva de ejemplo para desarrollar IOStack.
IDIADA genera muchos datos, tanto documentos derivados de las homologaciones de coches y de las ITV de vehículos como la información que registra de las pruebas denominadas crash test (simulaciones para comprobar la afectación de un impacto a los vehículos que se están diseñando), que permiten conocer cómo se rompe o cómo queda perjudicada cada pieza con mucho detalle.
Este gran volumen de información altamente confidencial que debe guardarse supone un gasto muy elevado para la empresa, ya que se ve obligada a adquirir nuevas unidades de almacenamiento constantemente. Una herramienta como IOStack es una solución para IDIADA, porque le permitirá gestionar de forma eficiente estos datos masivos.
Digitalizar la sociedad y gestionar esos datos de forma eficiente es uno de los objetivos de gobiernos y administraciones como la Comisión Europea, que prevé invertir unos 2.000 millones de euros para adecuar la infraestructura necesaria para crear una nube abierta de la ciencia de aquí al 2020, de modo que los datos que generan las investigaciones que financian estén almacenadas y se puedan compartir y reutilizar.
El proyecto IOStack, que finalizará en 2017, tiene un coste de 3,3 millones de euros y está íntegramente financiado por el programa Horizon 2020 de la Comisión Europea. Los socios de la URV en esta investigación son el Centro Nacional de Supercomputación de Barcelona, la empresa catalana IDIADA, IBM Israel Science & Technology (Israel), Eurocom (Francia), Mpstor (Irlanda), GridPocket (Francia) y Arctur (Eslovenia).
Referencia bibliográfica:
Gracia-Tinedo, R., Garcia-Lopez, P., Sanchez-Artigas, M., Sampe, J., Moatti, Y., Rom, E., Naor, D., Nou, R., Cortes, T., Oppermann, W. and Michiardi, P. (2016). IOStack: Software-Defined Object Storage. IEEE Internet Computing, 20(3), pp.10-18. DOI: 10.1109/MIC.2016.46