En l'an 2000, Bill Clinton annonçait la détermination de la séquence complète de l'ADN humain. Vingt ans plus tard, les avancées en biotechnologie et bioinformatique comblent les lacunes du projet Génome humain, le plus ambitieux de la biologie.
Ce projet international, qui a mobilisé dix ans de recherche et environ 3 milliards de dollars (équivalent actuel), a révolutionné les sciences biomédicales. Lorsque l'ovule et le spermatozoïde fusionnent, l'ADN parental forme un génome unique, même chez les jumeaux identiques. Chez les humains, il s'agit d'environ 6 milliards de paires de bases (A, T, G, C), réparties sur 23 paires de chromosomes nucléaires, plus l'ADN mitochondrial hérité de la mère.
Parmi ces 6 milliards de bases, environ 20 000 à 25 000 gènes codent pour des protéines, tandis que le reste inclut des régions régulatrices et des séquences non codantes, dont certaines d'utilité encore mystérieuse. Le séquençage détermine l'ordre des bases, suivi d'un assemblage bioinformatique. En 2000, deux efforts parallèles – le consortium public et Celera Genomics – ont livré des drafts quasi simultanés.

Ces 20 000-25 000 gènes ne représentent que 1-2 % du génome. Les régions répétitives, comme les centromères (milieu des chromosomes) ou télomères (extrémités), posaient problème en raison de leurs répétitions massives, rendant l'assemblage ardu. Les duplications segmentaires compliquaient aussi la localisation précise des fragments.
Le draft de 2000 couvrait 90 % du génome, laissant 150 000 lacunes et une erreur toutes les 1 000 bases. Mélange d'ADN de plusieurs donneurs, il ne distinguait pas les haplotypes maternel et paternel. Malgré ces failles, il a servi de référence, améliorée itérativement (ex. : GRCh38 en 2013 avec 350 lacunes restantes).

La microscopie révélait déjà des anomalies comme la trisomie 21 (syndrome de Down). Aujourd'hui, le séquençage NGS (depuis 2007) analyse des centaines de milliers de génomes, identifiant variantes liées à la taille, Alzheimer ou surdité, aidant diagnostics et thérapies.
Les technologies de longue lecture (ex. : PacBio, Oxford Nanopore) lisent des fragments de millions de bases, facilitant l'assemblage des régions répétitives. En 2022, le consortium Telomere-to-Telomere (T2T) a publié le premier génome humain complet (CHM13, lignée haploïde hydatiforme), chromosome par chromosome, telomere à telomere, ne laissant qu'un petit fragment répétitif non résolu sur cinq chromosomes.

Aucun génome unique ne représente l'humanité : deux génomes diffèrent de 0,6 % (3 millions de variants petits, 25 000 structuraux). Le T2T pave la voie aux pangénomes, collections de centaines de génomes diversifiés, analysés via bioinformatique avancée (génomes graphiques).
L'ADN humain réserve encore ses secrets, mais avec ces progrès, la génétique et la médecine personnalisée progressent à grands pas.
