La ruta que condujo al pangenoma
El desciframiento del genoma humano, uno de los avances científicos más notables de la historia, motivó la búsqueda de una colección más completa de secuencias que represente la diversidad de la especie.
Se construyó a partir de los glóbulos blancos de una veintena de donantes anónimos de Estados Unidos utilizando como base la muestra codificada de solo uno de ellos. La primera secuenciación del genoma humano fue el resultado de diez años de trabajo de más de tres mil científicos pertenecientes a 20 institutos de seis países. Un esfuerzo que se propuso revolucionar el diagnóstico, prevención y tratamiento de las enfermedades.
Así se logró identificar y mapear la totalidad de los genes estableciendo un marco de referencia.
Pese a que la humanidad comparte cerca de un 99% de la secuencia genética, es en el 1% restante donde radican las diferencias. Un solo genoma de referencia no puede mostrar esa diversidad. Esta premisa fue la que impulsó la búsqueda del pangenoma.
Secuencia completa
El 26 de junio de 2000 no es cualquier día para la ciencia. Luego de una década de estudios, dos equipos de investigación, uno público y otro privado, comunicaron en conferencia de prensa que habían logrado decodificar el ADN humano. Tras la noticia estaba el Proyecto Genoma Humano, liderado por el doctor Francis Collins, y la empresa Celera Genomics de Rockville, Estados Unidos, representada por el biólogo Craig Venter.
Se abrió una nueva etapa en la historia de la medicina. El hallazgo del 97% del código prometía esperanzadores avances en el desarrollo de pruebas para predecir o diagnosticar enfermedades y el diseño de fármacos personalizados, además de la comprensión del fenotipo y la posibilidad de realizar intervenciones mediante terapia génica y clonaciones terapéuticas para generar células o tejidos de reemplazo.
Pero existía un importante sesgo: como se recreó a partir de la información de una sola persona, el mapa de referencia no estaba completo. El Proyecto Genoma Humano continuó su trabajo hasta el 14 de abril de 2003. Concretó importantes avances e incorporó al análisis el ADN de más individuos, todos de origen europeo. ¿Qué se consiguió? Principalmente el desarrollo de terapias oncológicas y exámenes para predecir condiciones hereditarias como la enfermedad de Huntington. Sin embargo, no todos los vacíos se llenaron.
El 31 de marzo de 2022 se materializó un nuevo hito. En un artículo publicado por la revista Science [1], científicos pertenecientes al consorcio T2T (Telomere to Telomere) confirmaron que, tras encontrar las partes faltantes en la cadena, por primera vez la secuencia estaba completa.
Hasta entonces, el genoma de referencia humano cubría solo su fracción eucromática dejando sin terminar importantes regiones heterocromáticas. “En este estudio presentamos una secuencia de 3.055 millones de pares de bases, que incluye ensamblajes sin espacios para todos los cromosomas excepto el Y. Se corrigieron errores en las referencias anteriores y se introdujeron casi 200 millones de pares de bases de secuencia que contienen 1.956 predicciones de genes, 99 de los cuales se prevé codifican proteínas”, detallaron sus autores.
Las regiones completas incluyeron todas las matrices de satélites centroméricos, las duplicaciones segmentarias recientes y los brazos cortos de los cinco cromosomas acrocéntricos, desbloqueando zonas complejas del genoma para estudios funcionales y de variación.
El siguiente paso
Con este conocimiento disponible surgió un nuevo objetivo: “la siguiente fase es pensar en la referencia del genoma de la humanidad. Estamos en una profunda transición, el inicio de una era en la que eventualmente capturaremos la diversidad humana de forma no sesgada”, comentaba en 2022 David Haussler, director del Instituto de Genómica de la Universidad de California Santa Cruz en Estados Unidos.
Ese deseo se convirtió en realidad. En un artículo publicado en Nature [2], científicos presentaron el pangenoma, mapa actualizado de todo el ADN humano y la base, se asegura, de un revolucionario proceso de transformación de las investigaciones médicas.
Contiene 47 ensamblajes diploides en fases de una cohorte de individuos de diversas partes del mundo y con ancestros diferentes (africanos, americanos, asiáticos y europeos). Estos cubren más de 99% de la secuencia esperada en cada genoma y tienen el mismo porcentaje de precisión a nivel estructural y de pares de bases.
Según los investigadores, miembros del Consorcio de Referencia del Pangenoma Humano, no solo será una herramienta para encontrar el origen de las enfermedades congénitas, también podría arrojar luz sobre el nacimiento de la especie.
¿Qué es?
De acuerdo con el biólogo y divulgador científico, Álvaro Bayón, “si el genoma es el conjunto de genes que presenta un individuo, el pangenoma es la totalidad que conforma un linaje, es decir, la unión de los genomas de los organismos que pertenecen a un grupo biológico dado. Con ello es posible comprender la gran diversidad genómica en la humanidad y permite comparaciones mucho más acertadas”.
Según el coautor de la investigación, Santiago Marco Sola, “desde que se publicó el borrador del primer genoma humano, múltiples proyectos han trabajado en mejorar su calidad e ir completando esta referencia. Sin embargo, una versión única y lineal no representa correctamente la diversidad de nuestra especie, ya que existen múltiples variantes que no son comunes a todas las personas”.
El académico de la Universidad Autónoma de Barcelona en España explica que “la solución fue modelar una referencia no lineal con las variaciones genómicas que existen en la población considerando la diversidad de nuestra especie. El pangenoma utiliza una estructura de grafo o diagrama para encontrar las que se dan en diferentes individuos”.
“Con el desarrollo de algoritmos y softwares de alto rendimiento, se ha sacado a la luz más de 100 millones de nuevas bases y ha destapado nuevos alelos en regiones estructuralmente complejas que hasta ahora no figuraban”, se detalla en Nature Biotechnology [3].
Mayor comprensión
Constituye el punto de inicio de nuevos estudios de asociación de genes y enfermedades en todas las poblaciones. Sus descubridores creen que este mapa actualizado extenderá los alcances de la investigación a las regiones más repetitivas y variadas, al convertirse en el recurso de vanguardia en biomedicina.
Para ampliar el conocimiento, el Consorcio del Pangenoma Humano trabaja actualmente en la secuenciación de uno compuesto por 100 genomas humanos diversos. El objetivo es llegar a una muestra de 350 a mediados de 2024.
“Esta referencia nos permitirá representar decenas de miles de nuevas variantes en regiones que antes eran inaccesibles. Mejoraremos la comprensión del vínculo entre los genes y los rasgos de la enfermedad, dando un renovado impulso a la investigación clínica”, destaca Wen-Wei Liao, coautor y académico de la Universidad de Yale en Estados Unidos.
Los adelantos en este campo acercan la consolidación de la medicina genómica y la reducción de las disparidades en salud, gracias al desarrollo de fármacos y tratamientos para un rango mucho más amplio de personas. Pero no solo eso: conoceremos mejor qué nos hace diferentes unos de otros, la identidad de nuestra especie y posiblemente algunas claves del proceso evolutivo de la humanidad.
Referencias
[1] Nurk S, Koren S, Rhie A, Rautiainen M, et al. The complete sequence of a human genome. Science. 2022 Apr;376(6588):44-53.
[2] Liao WW, Asri M, Ebler J, Doerr D, et al. A draft human pangenome reference. Nature. 2023 May;617(7960):312-324.
[3] Hickey G, Monlong J, Ebler J, Novak AM, et al. Pangenome graph construction from genome alignments with Minigraph-Cactus. Nat Biotechnol. 2023 May 10.
Por Óscar Ferrari Gutiérrez