Investigadores de la Universidad Politécnica de Madrid han desarrollado un software que permite homogeneizar y compartir datos clínicos y genómicos entre instituciones sanitarias europeas. La herramienta puede ayudar a mejorar la prevención, el diagnóstico y las terapias de distintas enfermedades.
El Grupo de Informática Biomédica de la Universidad Politécnica de Madrid (UPM) ha desarrollado un software, llamado Semantic Interoperability Layer (SIL), que utiliza terminologías estándar como un vehículo para armonizar las heterogeneidades de diferentes fuentes de datos e integrar los datos clínicos y 'ómicos' (aquellos derivados de las tecnologías ómicas, como la genómica, la transcriptómica, la proteómica, etc.). De esta forma se puede mejorar la prevención, el diagnóstico y las terapias de distintas enfermedades, entre ellas, el cáncer de mama.
La introducción de datos ómicos como parte de las pruebas utilizadas en la práctica clínica actual ha creado una gran estratificación de los pacientes basada en sus perfiles genéticos. Hace años se podían conseguir dentro de un mismo hospital o centro de salud los pacientes necesarios para llevar a cabo un ensayo clínico, sin embargo hoy en día la obtención de una cohorte mínima de pacientes para un estudio de este tipo obliga a involucrar frecuentemente a distintos hospitales de diferentes regiones o países.
En este contexto, el intercambio de datos entre distintos centros es complicado, no sólo por aspectos legales, sino también por aspectos técnicos. Los datos requeridos para los estudios, se almacenan en cada hospital, e incluso en cada departamento dentro de un hospital, en sistemas de información heterogéneos que siguen diferentes formatos y están codificados en distintas terminologías médicas e idiomas.
El Grupo de Informática Biomédica (GIB) ha estado involucrado durante los últimos años en la creación de métodos de integración de datos clínicos y genéticos de fuentes heterogéneas. Con el objetivo de lograr un acceso homogéneo a la información clínico-genómica han desarrollado SIL, una capa de software basada en terminologías y estándares biomédicos que es capaz de ofrecer un acceso homogéneo a los datos.
El investigador Raúl Alonso, uno de los miembros del GIB, explica en qué consiste SIL: “Se compone de cuatro partes principales: un modelo de datos común (Common Data Model) capaz de enlazarse de una manera estándar con los sistemas de información de los hospitales; un vocabulario común (Core Dataset) para la codificación de la información y datos provenientes de los distintos hospitales; un enlace automático (Terminology Binding) entre el modelo de datos común y el vocabulario; y una serie de servicios para acceder y administrar la información almacenada”.
Datos normalizados
Las principales novedades de esta capa de interoperabilidad es que los datos no son sólo traducidos al vocabulario común, sino que son además normalizados. De tal manera que si, por ejemplo, en un hospital existe un diagnóstico de ‘neoplasia de las vías respiratorias’, se almacene de una manera equiparable con otros diagnósticos más específicos o similares provenientes de otros hospitales, como podrían ser ‘adenocarcinoma primario de lóbulo inferior de pulmón derecho’ o ‘tumor maligno de los bronquios’.
Adicionalmente, la capa de interoperabilidad es capaz de almacenar datos de pruebas genéticas en el mismo almacén de datos que los datos clínicos, de manera que toda la información pueda ser guardada y consultada de una forma homogénea.
Esta capa de interoperabilidad ha sido probada con datos reales de hospitales de España, Alemania, Bélgica, Holanda y Reino Unido dentro de la colaboración en varios proyectos nacionales e internacionales. El trabajo, llevado a cabo en la ETSI Informáticos de la UPM, ha sido publicado en varias revistas científicas internacionales, siendo una de estas publicaciones seleccionada por la International Medical Informatics Association (IMIA) para su libro Annual IMIA Yearbook of Medical Informatics como una de las investigaciones más relevantes del año en el área.
Referencia bibliográfica:
Raúl Alonso Calvo, Sergio Paraíso Medina, David Pérez-Rey a, Enrique Alonso Oset, Ruud van Stiphout, Sheng Yu, Marian Taylor, Francesca Buffa, Carlos Fernández-Lozano. "A semantic interoperability approach to support integration of gene expression and clinical data in breast cancer". Computers in Biology and Medicine 77: 179-186, agosto 2017.