FRFAM.COM >> Science >> sciences naturelles

Connaissons-nous l'ADN humain complet ?

En l'an 2000, il a été annoncé que l'ADN humain complet avait été déterminé. Mais était-ce vraiment le cas ? Vingt ans plus tard, les dernières techniques biotechnologiques et bioinformatiques corrigent les failles du projet le plus ambitieux en biologie.

En l'an 2000, le président américain Bill Clinton a annoncé que les scientifiques avaient déterminé pour la première fois l'intégralité du code ADN humain. Tous les morceaux d'ADN d'un être vivant ensemble s'appellent le génome, et ce projet ambitieux était le projet du génome humain. Ce travail a nécessité dix ans de coopération internationale et un coût total de 5 milliards de dollars (ajusté en fonction de l'inflation), et cela en valait la peine. Ce projet a eu un impact énorme pour les sciences biomédicales.

Lorsque l'ovule et le spermatozoïde fusionnent, l'ADN de nos parents se réunit pour créer une nouvelle combinaison unique qui n'a jamais existé auparavant et ne sera jamais après nous. Même l'ADN de vrais jumeaux n'est pas tout à fait le même. Parce que nous obtenons un ensemble d'ADN des deux parents, nous avons presque tout dupliqué, à l'exception que la plupart des hommes ont 1 chromosome X et 1 Y et nous obtenons uniquement l'ADN dans les mitochondries, les usines énergétiques de la cellule, de notre mère. .

L'ADN est constitué de longues chaînes de quatre "lettres" biochimiques :les molécules adénine (A), thymine (T), guanine (G) et cytosine (C). Le génome humain est un total de 2x 3 milliards de lettres d'ADN et contient environ 2x 44000 gènes. Un gène est un morceau d'ADN qui est transcrit par la cellule en une molécule d'ARN. L'ARN est quelque peu similaire à l'ADN, mais l'ADN reste stocké en toute sécurité dans le noyau de la cellule tandis que l'ARN fait le travail de maintien de la cellule. Dans 20 000 de nos gènes, cet ARN contient les instructions pour fabriquer une protéine, le reste fait simplement son travail en tant qu'ARN. Tout ce qui fait ou fait une cellule ou un organe est stocké quelque part dans ces 6 milliards de molécules A, T, G ou C, et à moins que quelque chose ne tourne vraiment mal, cela forme un être humain complet.

Connaissons-nous l ADN humain complet ?

Ces 44 000 gènes ne représentent ensemble que 5 % de l'ADN complet. Pour le reste, il y a aussi des éléments qui sont importants pour savoir quand, combien et quel type d'ARN est produit. Et puis il y a des pièces dont on ne connaît pas l'utilité, ni la certitude qu'elles aient une fonction. Peut-être qu'ils font du stop avec le reste de notre ADN. Le processus de détermination de l'ordre des lettres d'ADN s'appelle le séquençage, et cela implique beaucoup de biotechnologie difficile. Après le séquençage, les fragments d'ADN lus doivent être mélangés avec un logiciel de bioinformatique, et ce processus est appelé assemblage. Pour le génome humain, le séquençage et l'assemblage sont devenus une compétition, car à la fois une collaboration internationale entre des universités et la société Celera étaient intéressées. Au final, les deux ont été terminés presque en même temps.

Incomplet et pas tout à fait correct

Mais ont-ils déterminé l'intégralité de l'ADN une fois le projet terminé ? Non en fait non. Les parties vraiment difficiles, ensemble environ 10%, ont été largement infructueuses. Il s'agit principalement de pièces dans lesquelles le même fragment d'ADN est très souvent répété successivement, rendant le puzzle quasiment impossible à reconstituer correctement lors de l'assemblage. Par exemple, au milieu de chaque chromosome, le centromère, se trouve une étendue de millions de lettres dans laquelle un fragment spécifique de 170 lettres est très souvent répété presque à l'identique. Également aux extrémités des chromosomes, ce qu'on appelle le télomère, se trouvent des morceaux d'ADN gênants. Les longs morceaux d'ADN (au moins 10 000 lettres, souvent des millions) qui se trouvent à différents endroits du génome sont également problématiques. C'est ce qu'on appelle une duplication segmentaire. Il est difficile de savoir exactement où appartient un fragment particulier, ou combien de fois il existe réellement. Heureusement, relativement peu de gènes peuvent être trouvés dans ces pièces, mais ils ne sont donc pas sans importance. De plus, de nouveaux gènes peuvent souvent apparaître ici, dont certains sont uniques à l'homme. Peut-être que l'information génétique qui nous donne un cerveau aussi exceptionnel est cachée quelque part dans les régions les plus ennuyeuses du génome.

Connaissons-nous l ADN humain complet ?

Nous savons depuis longtemps grâce à la recherche microscopique que l'ADN humain est constitué de 23 paires de chromosomes dans le noyau cellulaire (23 de l'ovule de votre mère et 23 du sperme de votre père). Le morceau d'ADN dans les mitochondries est très court et peu complexe et donc peu important dans ce contexte. De grandes erreurs génétiques pouvaient déjà être détectées au microscope, comme un chromosome 21 supplémentaire dans le syndrome de Down ou l'échange d'un morceau d'ADN entre les chromosomes 9 et 22, ce qui peut entraîner une leucémie.

Mais il n'a pas réussi à faire tenir le puzzle complet lors de l'assemblage. Pas moins de 150 000 trous ont été laissés dans l'ADN, où nous ne savions pas exactement comment les pièces s'emboîtaient. Souvent, nous savions que le fragment B venait après le fragment A, mais nous ne pouvions pas déchiffrer quel était l'ADN entre ces morceaux. Il y avait aussi une mauvaise lettre moyenne toutes les mille lettres d'ADN dans cette première version, ce qui fait beaucoup d'erreurs. L'ADN de plusieurs individus a également été utilisé, faisant du génome un mélange. Il était également souvent impossible de voir clairement la différence entre le chromosome reçu de la mère et du père. Et là où il y avait des différences entre les deux, l'un était choisi au hasard ou des erreurs étaient commises. Enfin, il y a aussi des endroits dans ce premier génome humain où une variante très rare se produit, et à peu près tout le monde que vous rencontrez a une lettre d'ADN différente à cet endroit. Cela cause aussi des problèmes.

Le génome humain était donc incomplet et incorrect. Depuis la première publication, avec l'aide d'une biotechnologie toujours meilleure, une nouvelle version est régulièrement publiée, dans laquelle les erreurs ont été corrigées et les lacunes comblées. Dans la version actuelle, à partir de 2013, il y a (seulement) 350 trous. Mais malgré tous les défauts de ce génome humain, la biologie et la science biomédicale ont complètement changé. Des génomes ont également été compilés pour de nombreuses autres espèces animales, plantes, bactéries et virus. Désormais, le génome d'une espèce peut être utilisé comme point de référence (le génome de référence) auquel toutes les études peuvent comparer leurs résultats. De cette façon, le génome n'a pas à être réassemblé pour chaque nouvel individu.

Une meilleure biotechnologie

Ces dernières années, l'ADN de centaines de milliers de personnes, ou de morceaux de celles-ci, a été déterminé et comparé à la référence. Depuis 2007, cela est devenu de plus en plus rapide et moins cher, avec la prochaine génération de technologies de séquençage. En conséquence, de nombreuses variantes ou mutations génétiques ont été découvertes qui se sont avérées importantes pour les caractéristiques humaines, telles que la taille, mais aussi pour des maladies telles que la maladie d'Alzheimer, la progeria ou la surdité. Cela conduit à un meilleur diagnostic et à une meilleure compréhension de ce qui se passe exactement avec une telle condition. Si nous comprenons mieux la maladie de cette manière, cela peut à nouveau contribuer à trouver une thérapie.

La biotechnologie n'est pas restée immobile ces dernières années, et il existe maintenant des méthodes pour lire des morceaux d'ADN beaucoup plus longs en une seule fois, ce qui rend le puzzle beaucoup plus facile. Avec les technologies de séquençage plus longues, les morceaux d'ADN très répétitifs ne sont plus un problème aussi insurmontable. Récemment, une collaboration de plusieurs instituts de recherche a pour la première fois confondu l'ensemble de l'ADN humain, en un seul morceau pour presque tous les chromosomes. Ils s'appellent eux-mêmes le consortium telomere-to-telomere et leur objectif est d'assembler l'ADN en un seul morceau d'un télomère à l'autre. Cet exploit utilise les dernières technologies de séquençage et un logiciel spécialement conçu, suivi de la mise en place manuelle des dernières pièces du puzzle. Les chercheurs doivent démêler un dernier morceau d'ADN répétitif, sur l'extrémité courte des chromosomes 13, 14, 15, 21 et 22, puis le premier génome complet est un fait. Cela peut recevoir beaucoup moins d'attention qu'en l'an 2000, mais c'est et reste une étape importante.

Une astuce pratique a été utilisée dans ce projet. CHM13 a été utilisé comme source d'ADN, des cellules de laboratoire dans lesquelles deux copies presque identiques des chromosomes du père sont présentes en raison d'une erreur biologique après la fécondation et plus d'ADN de la mère. C'est ce qu'on appelle une «taupe hydatiforme» et n'est pas viable. Puisqu'il n'y a pas d'ADN de la mère, le puzzle redevient un peu plus simple, car il n'y a plus de variation entre les chromosomes. Alors maintenant, vingt ans plus tard, nous avons enfin un génome entièrement humain.

Connaissons-nous l ADN humain complet ?

Diversité humaine

Mais le plus gros problème qui reste est qu'on ne rassemble en fait qu'un seul génome humain. L'ADN est un peu différent chez toutes les personnes et il n'y a rien de tel que le génome humain. Le génome de deux personnes au hasard est à environ 99,4% le même, mais dans ce 0,6% il y a environ 3 millions de petites différences (d'une ou quelques lettres d'ADN) et 25 000 grandes différences. Ces différences majeures sont généralement des changements entre 50 et 500 lettres, mais parfois aussi des millions de lettres d'ADN. Comment étudiez-vous un morceau de l'ADN d'une personne si le génome de référence n'a pas ce morceau ou est très différent à cet endroit ?

Pour apporter également une réponse à ce problème, des génomes parfaits de plusieurs centaines de personnes d'origines diverses seront également compilés dans les années à venir. De cette façon, une grande partie de la diversité génétique est cartographiée. On ne parle alors plus de génome humain de référence, mais de pangénome humain :une collection de nombreux génomes qui ensemble sont représentatifs de la diversité humaine. Dans une prochaine étape, les nouveaux résultats génétiques peuvent non seulement être comparés à un génome de référence, mais l'ensemble du pangénome peut être utilisé. Évidemment, cela signifie qu'il y a un besoin soudain de nouveaux logiciels pour permettre la comparaison des données de séquençage avec tous ces génomes et en tirer des conclusions médicalement significatives. C'est le domaine de la bioinformatique, et ces innovations peuvent prendre la forme de soi-disant génomes graphiques être. Cela implique de travailler avec un enchevêtrement de différents génomes de référence parallèles, avec de la place pour une petite et une grande diversité génétique. Pour de nouveaux résultats génétiques, il est alors possible de rechercher quelle route dans cet enchevêtrement correspond le mieux à cet individu.

L'ADN humain n'a pas encore livré tous ses secrets, et il reste encore beaucoup à découvrir pour de nombreuses maladies génétiques. Mais avec les améliorations de notre génome de référence, des technologies de séquençage plus précises et plus longues et des algorithmes bioinformatiques puissants, il sera très intéressant dans les années à venir.

Connaissons-nous l ADN humain complet ?
[]