Descubren fallos en las secuencias genéticas del coronavirus en la mayor base de datos mundial

Un estudio del CSIC ha hallado ‘artefactos’ en el ciclo de las deleciones del virus que provoca la covid-19, lo que podría afectar a la infección y la respuesta inmunológica a las vacunas.

Descubren fallos en las secuencias genéticas del coronavirus en la mayor base de datos mundial
Nueva perspectiva sobre la capacidad del virus SARS-CoV-2 para mutar e infectar a seres humanos. / CSIC

El equipo multidisciplinar liderado por el Instituto de Biología Integrativa de Sistemas del CSIC y la Universitat de València investigan una nueva hipótesis sobre la capacidad del virus SARS-CoV-2 para mutar e infectar a seres humanos.

Tras revisar la base de datos genéticos del virus más empleada en la pandemia, la GISAID, los científicos encontraron ‘falsos positivos’ en su capacidad de reparación de las deleciones, un proceso que restaura partes del genoma del virus y que afecta a su capacidad para replicarse o evitar al sistema inmunológico.

El trabajo, publicado en la revista Virus Evolution, describe una hipótesis sobre cambios genéticos raros en la proteína de la espícula del SARS-CoV-2, empleada para infectar las células.

En concreto, la investigación se centró en los llamados eventos de reparación de las deleciones en esta proteína, donde el virus parece corregir su genoma.

Después de realizar un minado de datos masivo en GISAID, descubrieron que varios de los hallazgos iniciales se debieron a errores de procesamiento de datos en las bases genéticas.

Encontraron ‘falsos positivos’ en la capacidad reparación de las deleciones del SARS-CoV-2, un proceso que restaura partes del genoma del virus 

Los métodos informáticos empleados para analizar las secuencias virales indujeron equivocaciones y generaron la impresión de que el virus estaba reparando sus mutaciones con mayor regularidad.

Al comparar estos datos con la información obtenida de la secuenciación de genomas —lecturas de secuenciación—, el equipo logró obtener una visión más realista de los cambios genéticos que sufre el virus.

Menos del 60 % de eventos confirmados

“Utilizando el repositorio de secuencias genéticas GISAID estimamos una frecuencia muy alta de estos eventos de reparación de deleciones que se espera que sean raros”, explica la investigadora del CSIC y líder del estudio, Mireia Coscollá Devís.

El equipo observó que las series de la base de datos estaban procesadas por cada laboratorio de forma diferente y que contenían muchos falsos positivos. Aunque en determinados casos pudieron confirmar que se trataba de un fenómeno real, la mayoría se debían al procesamiento de las secuencias.

La investigación puso de relieve la importancia de examinar los datos genéticos con el objetivo de evitar conclusiones erróneas

“Vimos que menos del 60 % de los eventos de reparación de deleciones se podían confirmar. Aunque no hemos podido cuantificarlo exactamente para todos, podemos comparar las proporciones del marcador en varias bases de datos, y vemos que la diferencia es de 5 a 51 veces menos frecuente de lo que aparecía en las bases de datos procesadas”, calcula la investigadora del CSIC.

Pese a que estos eventos de reparación son poco comunes, el estudio evidenció que, cuando ocurren, pueden afectar de forma sutil al comportamiento del virus.

“Por ejemplo, ciertas reparaciones pueden modificar la forma en que el virus ingresa a las células o influye en la respuesta a los anticuerpos generados por la vacunación”, asegura Coscollá, algo que el equipo de investigación demostró mediante experimentos in vitro.

De esta forma, la investigación puso de relieve la importancia de examinar los datos genéticos con el objetivo de evitar conclusiones erróneas, según cuenta la investigadora.

Intercambio de datos para una mejor respuesta

La Organización Mundial de la Salud (OMS) recomienda una política de intercambio de datos genómicos de patógenos para proteger la salud pública.

España no tiene una recopilación central de datos de secuencias de patógenos humanos, animales y ambientales, como tampoco una política para el intercambio de datos

Sin embargo, en España no existe una recopilación central de datos de secuencias de patógenos humanos, animales y ambientales, como tampoco existe una política para el intercambio de datos anónimos entre entidades de salud y científicas.

Esto dificulta el seguimiento y la respuesta a las enfermedades infecciosas, además de la resistencia a los antimicrobianos, destacan los científicos.

Referencia:

Miguel Álvarez-Herrera. et al. Genome data artifacts and functional studies of deletion repair in the BA.1 SARS-CoV-2 spike proteinVirus Evolution, 2025.

Fuente:
CSIC
Derechos: Creative Commons.
Artículos relacionados