La Universidad Pontificia de Salamanca y el Centro de Investigación del Cáncer (perteneciente al Consejo Superior de Investigaciones Científicas, CSIC, y a la Universidad de Salamanca) se han embarcado en un proyecto conjunto para avanzar en el estudio de tumores. Esta colaboración entre un equipo de expertos informáticos y un grupo vinculado a la investigación biomolecular tiene como propósito desarrollar nuevas herramientas tecnológicas para analizar los adenocarcinomas, un tipo de tumores muy frecuente. En concreto, el objetivo es identificar los genes causales, los responsables del desarrollo de la enfermedad.
Un aspecto muy importante de este proyecto es la participación del Club de Innovación de la Universidad Pontificia, una iniciativa que lleva años implicando a los estudiantes de Informática en la realización de proyectos tecnológicos novedosos y que ahora incorpora esta rama bioinformática, que tiene la virtud de intentar formar a alumnos en una disciplina con mucho futuro, pero carente de expertos.
“En los actuales estudios de Genómica somos capaces de ver el estado de miles de genes en muestras de pacientes, así que nos interesa encontrar los genes directores del proceso biológico que estamos observando, lo que llamamos genes causales”, explica a DiCYT Javier de las Rivas, director del Grupo de Investigación en Bioinformática del Centro del Cáncer.
Existen distintos modos de buscar esos genes causales y uno de ellos es utilizar algoritmos o “estrategias informático-matemáticas en las cuales tienes que analizar muchas variables para desentrañar cuál es el gen causal y distinguirlo del que sólo es acompañante del proceso”, comenta el experto.
En particular, este proyecto se quiere centrar en los adenocarcinomas, un tipo de tumor muy frecuente que se corresponde con buena parte de los cánceres de pulmón, colon, próstata o mama, es decir, muchos de los más prevalentes. “El origen de los adenocarcinomas está en el epitelio, una superficie de tejido biológico que está en contacto con factores ambientales que lo modifican”, indica De las Rivas. En el caso de un cáncer de pulmón puede ser el tabaco y en el de colon, la dieta, pero realmente cuando surge un tumor se desconoce su origen concreto, por eso, los científicos se han fijado en esta patología.
“Tenemos biochips que miden las señales de miles de genes a la vez en una muestra de un paciente. Estas señales no las puede ver el ojo humano, hay que analizarlas matemáticamente”, apunta Javier de las Rivas. Esa es la clave y el punto de partida del trabajo de estos investigadores. “Queremos establecer modos y procedimientos de análisis que actualmente no están claros: no hay en la literatura científica una respuesta clara sobre cómo encuentrar los genes causales a partir de datos de biochips”, agrega.
De esta forma, “somos capaces de medir el estado de miles de genes en biopsias de los pacientes. Lo que queremos es aplicar algoritmos que analicen muchas variables (multivariantes) para ver qué genes son los directores del proceso tumoral. Entre los miles de genes solo unos pocos son genes directores, los otros se llaman acompañantes y no causan el proceso biológico. En un estudio de múltiples variables, hay formas de ver cuál es la variable causal a partir de unos datos, pero esto requiere análisis matemáticos sofisticados”, comenta.
La necesidad de incluir la Informática en este campo se debe a que “la Medicina actual está proporcionando una cantidad ingente de datos, antes medía un parámetro y ahora estamos midiendo miles de parámetros. Esto proporciona muchísima información, pero es difícil de analizar”, indica el científico.
Análisis masivo
Dicho de otra manera, “antes un biólogo diseñaba sus experimentos y era capaz de analizar los resultados, pero ahora hay técnicas muy potentes que estudian muchas variables simultáneamente, esos datos son complejos, incluyen mucho ruido y es difícil encontrar información que realmente sea útil”, comenta Manuel Martín-Merino, informático y responsable del proyecto por parte de la Universidad Pontificia. Por eso, hay que “diseñar algoritmos que permitan encontrar esa información” y después diseñar herramientas informáticas que permitan analizar cantidades masivas de datos.
Para iniciar la investigación, lo primero es comprobar en la literatura científica qué están haciendo otros grupos de investigación del mundo. “Los problemas suelen ser el coste computacional excesivo y la incapacidad de encontrar relaciones entre más de dos o tres variables. Por eso, hay que mejorar los algoritmos existentes y esto motiva nuevas líneas de investigación”, indica el profesor de la Pontificia.
Establecer las relaciones entre los genes tiene ciertas semejanzas con las redes sociales de internet, comentan los científicos, es decir, cada gen se relaciona con un determinado grupo de genes y esto se representa gráficamente con una serie de puntos y líneas que los conectan en los que se observa que algunos tienen un papel más importante porque actúan como un nodo de comunicación. Desentrañar todas esas relaciones es clave para concer el papel de cada uno de ellos en el desarrollo de la enfermedad.