Le génome humain complet : 20 ans après, où en sommes-nous vraiment ?

En l'an 2000, Bill Clinton annonçait la détermination de la séquence complète de l'ADN humain. Vingt ans plus tard, les avancées en biotechnologie et bioinformatique comblent les lacunes du projet Génome humain, le plus ambitieux de la biologie.

Ce projet international, qui a mobilisé dix ans de recherche et environ 3 milliards de dollars (équivalent actuel), a révolutionné les sciences biomédicales. Lorsque l'ovule et le spermatozoïde fusionnent, l'ADN parental forme un génome unique, même chez les jumeaux identiques. Chez les humains, il s'agit d'environ 6 milliards de paires de bases (A, T, G, C), réparties sur 23 paires de chromosomes nucléaires, plus l'ADN mitochondrial hérité de la mère.

Parmi ces 6 milliards de bases, environ 20 000 à 25 000 gènes codent pour des protéines, tandis que le reste inclut des régions régulatrices et des séquences non codantes, dont certaines d'utilité encore mystérieuse. Le séquençage détermine l'ordre des bases, suivi d'un assemblage bioinformatique. En 2000, deux efforts parallèles – le consortium public et Celera Genomics – ont livré des drafts quasi simultanés.

Le génome humain complet : 20 ans après, où en sommes-nous vraiment ?

Ces 20 000-25 000 gènes ne représentent que 1-2 % du génome. Les régions répétitives, comme les centromères (milieu des chromosomes) ou télomères (extrémités), posaient problème en raison de leurs répétitions massives, rendant l'assemblage ardu. Les duplications segmentaires compliquaient aussi la localisation précise des fragments.

Incomplet et imprécis au départ

Le draft de 2000 couvrait 90 % du génome, laissant 150 000 lacunes et une erreur toutes les 1 000 bases. Mélange d'ADN de plusieurs donneurs, il ne distinguait pas les haplotypes maternel et paternel. Malgré ces failles, il a servi de référence, améliorée itérativement (ex. : GRCh38 en 2013 avec 350 lacunes restantes).

La microscopie révélait déjà des anomalies comme la trisomie 21 (syndrome de Down). Aujourd'hui, le séquençage NGS (depuis 2007) analyse des centaines de milliers de génomes, identifiant variantes liées à la taille, Alzheimer ou surdité, aidant diagnostics et thérapies.

Une biotechnologie révolutionnée

Les technologies de longue lecture (ex. : PacBio, Oxford Nanopore) lisent des fragments de millions de bases, facilitant l'assemblage des régions répétitives. En 2022, le consortium Telomere-to-Telomere (T2T) a publié le premier génome humain complet (CHM13, lignée haploïde hydatiforme), chromosome par chromosome, telomere à telomere, ne laissant qu'un petit fragment répétitif non résolu sur cinq chromosomes.

La diversité humaine au cœur des défis

Aucun génome unique ne représente l'humanité : deux génomes diffèrent de 0,6 % (3 millions de variants petits, 25 000 structuraux). Le T2T pave la voie aux pangénomes, collections de centaines de génomes diversifiés, analysés via bioinformatique avancée (génomes graphiques).

L'ADN humain réserve encore ses secrets, mais avec ces progrès, la génétique et la médecine personnalisée progressent à grands pas.

[]

La science face au bon sens : une relation complexe et nuancée Les faits scientifiques les plus amusants de 2020 : joie et découvertes en pleine pandémie

Carte génétique de la "plante ressuscitante" Xerophyta viscosa dévoilée

Nanorobot en ADN : un tri précis des molécules à l'échelle nanométrique

Les organes sur puce : une alternative révolutionnaire aux tests sur animaux ?

Recon 2 : La carte exhaustive du métabolisme humain par des experts internationaux

Le rôle crucial des traditions socioculturelles dans la lutte contre Ebola

Bruce McCandless, pionnier de la sortie spatiale libre, nous a quittés à 80 ans