Un estudio a gran escala secuencia el genoma de 2.504 personas de todo el mundo

El proyecto 1.000 Genomas ha llegado a su fase final. Dos estudios publicados en la revista Nature, uno de ellos con participación española, proporcionan una visión completa de la variación genética humana en poblaciones de los cinco continentes.

Un estudio a gran escala secuencia el genoma de 2.504 personas de todo el mundo
Este megaproyecto ha secuenciado el genoma de 2.504 individuos de 26 poblaciones humanas de todo el mundo. / Pixabay

La fase final del proyecto internacional 1000 Genomas (1000GP), que tiene como objetivo principal catalogar la variación genética en la especie humana,ha concluido con dos estudios publicados en la revista Nature.

En el primero de ellos se ha secuenciado el genoma de 2.504 individuos de 26 poblaciones humanas de todo el mundo. Este trabajo, en el que participan investigadores de las universidades de Barcelona y Salamanca, describe un catálogo de 84,7 millones de variantes que amplía en un 40% el número de las ya conocidas del genoma humano.

El segundo trabajo analiza ocho clases principales de variaciones estructurales en el mismo grupo de personas. Los datos de este proyecto son de libre acceso.

Según sus observaciones, cada persona participante en la investigación (sanas y mayores de edad) es portadora de 150 a 180 variantes que provocan la finalización prematura de proteínas y de 24 a 30 variantes implicadas en enfermedades raras.

El proyecto también ha contribuido a caracterizar la historia y la demografía de las poblaciones humanas ancestrales. Así, por ejemplo, se ha confirmado el origen demográfico común de todos los humanos hace entre 150.000 y 200.000 años, así como el posterior cuello de botella que sufrieron las poblaciones europeas, asiáticas y americanas, que se estima que las condujo a tener tamaños efectivos inferiores a los 1.500 individuos hace entre unos 15.000 y 20.000 años.

Se ha confirmado el origen demográfico común de todos los humanos hace entre 150.000 y 200.000 años

Un mapa de la variación genética en humanos a gran escala

El proyecto 1000 Genomas está impulsado por un consorcio internacional en el que participan instituciones de gran prestigio, como el Centro de Genética Humana Wellcome Trust (Reino Unido), la Universidad de Oxford (Reino Unido), la Universidad de Harvard (EE UU), el Instituto Broad de MIT y Harvard (EE UU), la Universidad de Washington (EE UU) y el Instituto Max Planck de Genética Molecular (Alemania).

Tal como explica Marc Via, investigador del departamento de Psiquiatría y Psicobiología Clínica y del Instituto de Investigación en Cerebro, Cognición y Conducta (IR3C) de la Universidad de Barcelona, que ha colaborado en el diseño muestral de esta investigación, "el proyecto 1000 Genomas ha sido el primero que ha abordado la caracterización de la variabilidad en el genoma de poblaciones de todo el mundo a gran escala".

Marc Via, del departamento de Psiquiatría y Psicobiología Clínica y del Instituto de Investigación en Cerebro, Cognición y Conducta (IR3C) de la Universidad de Barcelona. / UB

Hasta el momento, los estudios se habían centrado en la secuenciación de genomas de individuos puntuales, pero no se tenía conocimiento sobre cómo es la variabilidad normal a nivel poblacional. "Esta visión a escala mundial que tiene el proyecto lo hace único incluso en comparación con otros muy ambiciosos más recientes", puntualiza Via.

La mayor parte de la variación genética en el mundo entre los seres humanos se produce en las poblaciones subsaharianas

Los científicos confirmaron que la mayor parte de la variación genética en el mundo entre los seres humanos se produce en las poblaciones subsaharianas. "Las personas de ascendencia africana tienden a tener niveles más altos de diversidad genética que los individuos con ascendencia no africana. Este hallazgo refleja nuestra herencia ancestral común, ya que la especie humana se originó en África. En algún momento en el pasado remoto, un número relativamente pequeño de seres humanos emigraron de África y se extendieron por todo el mundo. Sin embargo, como el número de migrantes que salieron de África fue relativamente pequeño, portaron solo una fracción de las variantes genéticas existentes", apunta a Sinc Adam Auton, coautor del estudio en el Albert Einstein College of Medicine.

A partir de los resultados, los expertos del proyecto también han podido estimar en 4 o 5 millones el número de variantes en las que cada genoma individual difiere de la secuencia de referencia del genoma humano. Aunque la mayoría de variantes identificadas son raras (con frecuencias inferiores al 0,5%), la mayoría de variantes identificadas en el genoma de cada individuo son comunes (frecuencia superior al 5%).

"El Proyecto 1000 Genomas ha mejorado radicalmente nuestra comprensión sobre la variación genética humana. Ha creado un recurso público que describe el alcance y la diversidad de la variación genética en todo el mundo. Con estos datos, podemos entender qué genes generalmente difieren entre los individuos y que son básicamente los mismos", añade Auton.

"El Proyecto 1000 Genomas ha mejorado radicalmente nuestra comprensión sobre la variación genética humana", dice Auton

Aplicando las tecnologías de secuenciación de nueva generación

El desarrollo y accesibilidad de las tecnologías de secuenciación de nueva generación (NGS), que permiten estudiar todas las posiciones del genoma e identificar todas las variantes genéticas —desde polimorfismos de nucleótido simple (SNPs) hasta grandes duplicaciones de regiones cromosómicas—, ha sido un factor clave en el proyecto 1000 Genomas.

"Incluso, han permitido ampliar el número de genomas analizados más allá de 1000 (el número inicial previsto y que da nombre al proyecto)", explica Marc Via. "Así pues, el proyecto ha secuenciado cada base de los genomas completos de los 2.504 participantes una media de entre 7 y 8 veces, y su exoma (las regiones codificantes para proteínas y de otras moléculas), una media de 75 veces. Esta resolución permite estimar que más del 99% de los SNPs que se presentan con una frecuencia del 1% o superior han sido identificados".

Además, el proyecto ha incluido una parte importante de diseño de nuevos métodos estadísticos y algoritmos informáticos para gestionar la gran cantidad de información que se genera en este tipo de estudios, estableciendo nuevos estándares para la comunidad científica.

"Por ejemplo, se ha podido analizar el papel que ha tenido la selección natural en procesos recientes de adaptación a ambientes locales y se han detectado nuevos genes potencialmente bajo selección natural, aunque también se ha observado que no son muy habituales los fenómenos de selección natural fuerte en la evolución reciente de las poblaciones humanas", detalla Marc Via.

"Se ha podido analizar el papel que ha tenido la selección natural en procesos recientes de adaptación a ambientes locales", detalla Marc Via

Factores potenciales de riesgo de enfermedades

El segundo estudio ha observado agrupaciones inesperadas de variantes estructurales para algunos genes, que en casi todas las personas muestran diferentes variantes a gran escala. "Los ejemplos más notables son los factores de riesgo para los trastornos del desarrollo neurológico, incluidos los trastornos del espectro autista (como el gen Grid2 por ejemplo)", asegura a Sinc Jan Korbel, del Laboratorio Europeo de Biología Molecular y coautor de la investigación.

Una implicación importante de este estudio es que una gran cantidad de variación estructural natural ocurre en estas regiones, y no que cada variante estructural causa la enfermedad. "Los datos generados por el Proyecto 1000 Genomas se pueden utilizar ahora para distinguir mejor entre la variación genética patógena y no patógena", subraya Korbel.

Este es el primer estudio que realiza un análisis combinado de ocho clases de variaciones estructurales del genoma. Un hallazgo notable es que estas variantes de gran escala se producen con frecuencia en las regiones vinculadas a enfermedades, "lo que implica que son probablemente los factores de riesgo comunes de las enfermedades", concluye el científico.

Conocimiento al alcance de la comunidad científica internacional

El proyecto, que ha establecido un marco de referencia general —inexistente hasta ahora— de cómo es la variación en nuestro genoma en poblaciones de diferentes continentes, pone al alcance de los investigadores de todo el mundo un panel de referencia de la variación genética humana, especialmente de la común y de la poco frecuente, que permite aumentar la resolución de los estudios que analizan la asociación entre variantes genéticas y enfermedades complejas.

"El proyecto como tal se da por finalizado con esta fase. La información genómica, así como la disponibilidad de material biológico (células o ADN) de todos los individuos participantes en el proyecto seguirá al alcance de la comunidad científica de forma indefinida", concluye el profesor Via.

Referencias bibliográficas:

A global reference for human genetic variation Nature 526,68–74, 30 de septiembre de 2015 doi:10.1038/nature15393

An integrated map of structural variation in 2,504 human genomes Nature 526, 75 - 81 30 de septiembre de 201 doi:10.1038/nature15394

Fuente: Universidad de Barcelona / SINC
Derechos: Creative Commons
Artículos relacionados