FRFAM.COM >> Science >> Technologie

Comment les mathématiques révolutionnent la lutte contre les virus pathogènes

Imaginez : une nouvelle maladie virale hautement contagieuse émerge quelque part dans le monde. S'agit-il d'une variante d'Ebola, du VIH ou de Zika ? Quelle est sa vitesse de mutation ? Son origine ? Son mode de transmission ? Y a-t-il des porteurs asymptomatiques ? Quels axes prometteurs pour un vaccin ou un médicament ?

Pour répondre à ces questions cruciales, il est essentiel de cartographier rapidement la composition génétique complète du virus. Cette tâche est bien plus ardue avec les virus qu'avec les génomes d'animaux ou de plantes, car les virus mutent à une vitesse fulgurante. Chez un seul patient, plusieurs souches peuvent déjà apparaître au cours de la maladie.

Jasmijn Baaijens, aujourd'hui postdoctorante à la Harvard Medical School de Boston après avoir obtenu son doctorat en septembre au CWI (Center for Mathematics and Computer Science) d'Amsterdam, a développé des algorithmes innovants pour analyser l'ADN viral. « J'ai entrepris cette recherche car ces algorithmes m'attiraient énormément, explique-t-elle. C'était aussi d'actualité avec l'épidémie d'Ebola en Afrique de l'Ouest à l'époque. »

Assembler un génome viral est comparable à un puzzle complexe. Contrairement aux génomes humains, animaux ou végétaux – où l'ADN est stable et des génomes de référence existent –, les virus manquent souvent de tels repères. On découpe d'abord l'ADN en petits fragments (les reads) à l'aide d'enzymes. Ces fragments partiellement superposés sont lisibles, mais il faut ensuite les reconstituer, parfois à partir de milliers ou millions de pièces, sans image de référence : c'est l'assemblage de novo.

Comment les mathématiques révolutionnent la lutte contre les virus pathogènes

Ce défi est un pur problème mathématique : on dispose de fragments d'environ 1 000 lettres (codées par A, C, G, T). Les superpositions permettent de déduire l'ordre. Par exemple, si un read se termine par …GTTAGCT et un autre commence par AGCTAGC…, ils s'emboîtent ainsi : …GTTAGCTAGC…. Un algorithme efficace assemble alors l'ensemble.

Les erreurs et mutations

En pratique, des complications surgissent : les séquenceurs commettent des erreurs (« fautes d'orthographe »), et les génomes viraux d'un échantillon sanguin peuvent inclure des souches mutées. Si deux fragments de 10 000 lettres diffèrent de quatre positions, s'agit-il d'erreurs ou de variantes distinctes ?

Dans sa thèse, Baaijens propose des algorithmes basés sur la théorie des graphes – des réseaux de nœuds – pour trancher plus précisément et rapidement. Elle utilise des graphes de chevauchement, une approche revitalisée pour les petits génomes viraux grâce à ses optimisations. Précédemment trop coûteuse pour les grands génomes comme le humain, elle est désormais viable.

Comment les mathématiques révolutionnent la lutte contre les virus pathogènes

Illustration : Principe du graphe de chevauchement. Les fragments uniques (nœuds) sont reliés si leurs extrémités se chevauchent d'au moins deux lettres. Un chemin traversant tous les nœuds reconstitue le génome original, ici ATGCCTATAAGATGGCTTAAA.

Son algorithme SAVAGE (Strain Aware VirAl Genome assEmbler) assemble le génome viral avec ses variantes et leurs abondances relatives, surpassant les outils existants sur des données réelles.

Contrairement à de nombreuses recherches, ce travail résout un problème majeur : l'assemblage de novo complet d'un génome viral et de ses souches.

Vidéo YouTube sur les graphes de chevauchement

Des améliorations sont possibles, comme gérer les répétitions plus longues que les reads, créant des cycles dans le graphe – un défi non encore résolu. SAVAGE s'applique aussi aux génomes tumoraux en mutation rapide, aidant à personnaliser chimiothérapie ou immunothérapie.

Open source

Les chercheurs médicaux peuvent désormais intégrer cet outil open source, téléchargeable gratuitement. Baaijens : « Il est prêt pour un usage recherche, mais perfectionnable. J'ai collaboré avec des experts du VIH pour l'adapter à leurs besoins. » À Boston, elle s'attaque désormais aux génomes bactériens, plus vastes mais similaires.


[]